基于突变检测的技术融合前沿及其演进分析*
——以生物芯片专利为例
2021-07-20王康陈悦
王 康 陈 悦
(大连理工大学 科学学与科技管理研究所暨 WISE 实验室 大连 116024)
0 引 言
在科技创新驱动经济社会发展的大趋势下,发展前沿技术无疑成为各国的发展战略。当今以科技为基础的创新,不独限于单一学科基础的前沿技术领域,而且要着眼于当代各门学科及其前沿技术交叉融合的新态势。国内外研究表明,与全新的知识发现相比,通过创新现有知识间连接关系的融合性技术构成了突破性技术创新的主体[1]。美国的NBIC会聚技术研究计划、欧盟委员会的技术融合政策、韩国的“国家技术融合发展的基本原则”等都提供了生动的案例。随着科学技术的迅猛发展,学科间交叉渗透加强,技术联系愈发紧密,一种技术的突破往往依赖于其他学科技术的支持,现有技术间的融合成为技术创新的重要形式。
目前学界对技术融合的认识尚不一致,如Rosenberg[2]认为技术融合是具有共同目标的技术领域合作解决行业技术障碍以实现技术创新的过程;Kodama[3]认为技术融合包括不同知识系统、不同领域和不同研究方向的概念融合;Adner等[4]认为技术融合是不同技术轨道的整合所导致的不同技术元素整合的过程;汤文仙[5]提出技术融合的实质过程是技术在不同产业间扩散的结果。虽然关于技术融合的论述稍有差异,但其实质内涵均一致,即技术融合是各领域内或领域间不同技术的重组,这种重组不是简单的技术叠加,而是关键技术的有机结合,用于实现新技术的创新和颠覆性技术的突破。
为测度潜在的技术融合,利用专利数据分析共同专利申请、交叉和共类以及专利引文中的知识溢出成为热点[6]。专利引用过程中伴随着技术的流动,Kim等[7]通过引文网络展示了技术汇聚的动态过程;No等[8]基于引文分析进行技术融合演化路径识别以及技术跨学科融合评估;翟东升等[9]通过分析专利引用网络中的知识流,识别技术融合创新的轨道与强度。上述研究能够很好地反映专利的技术融合过程,但是由于专利引用所具有的时滞性,使分析出的结果难以及时反映最新技术融合过程。
基于专利分类号共现关系形成的共类矩阵能够有效地进行技术融合研究,共类标签包括国际专利分类号、美国专利分类号、德温特专利分类号、德温特专利手工代码等多种知识单元,主要以知识图谱、共类网络指标、以及在共类基础上衍生的各种测算指标来呈现和测度技术融合。此外,周磊等[10]通过将共类矩阵转化为表征知识创造和技术应用指向性的技术知识流(TKF)矩阵,进而表征技术知识流动特征,他还在共类基础上通过加权关联规则探测技术融合,进一步揭示了技术融合的深层关联与规律[11]。
专利共类矩阵在数据获取性、时效性等方面存在优势,是研究技术融合的科学方法工具。本文基于专利共类的思想,将每条专利IPC代码进行排列组合,然后利用突变检测算法对组合的IPC技术对进行探测,检测近十年生物芯片领域因技术融合而形成的前沿,并按技术融合突发权重排序分析技术融合前沿的持续演化状态,为生物芯片技术领域政策制定、产业布局以及技术创新发展提供参考。
1 研究方法
本文的技术融合分析是基于专利4位IPC代码的共类分析,两个或多个IPC的组合共现可以视为融合技术[12]。技术融合关系的突变是指,特定时间内多种技术突然大量同时出现在新申请的专利中。具体分析过程包含三个步骤(图1),即识别技术融合形式、测度技术融合突变和预测技术融合前沿和发展趋势。
图1 基于突变检测的技术融合前沿及其演进分析框架
1.1识别技术融合形式首先提取原始数据集IPC及其对应的时间属性,然后将各专利的IPC进行排列组合,以此表示技术之间的融合。如某篇专利P标有{A;B;C;D}四个IPC,那么在二元组状态下,专利P表征了{A;B}、{A;C}、{A;D}、{B;C}、{B;D}和{C;D}六种形式的技术融合,在三元组状态下,专利P表征了{A;B;C}、{A;B;D}和{B;C;D}三种形式的技术融合,在四元组状态下,则表征了{A;B;C;D}一种形式的技术融合。从二元组(共现关系)逐级扩展到多元组能够详细的描述技术融合,突出不同组合下的技术融合重点。
图2 生物芯片专利年度趋势图
1.2测度技术融合突变采用Kleinberg[13]提出的突变检测算法对不同状态下的IPC组合进行测度。该算法关注相对增长率突然变化的词,更关注研究领域内高活跃度和有潜在影响研究热点的因素,有助于发现推动学科(或主题)研究发展中的微观因素,广泛应用于论文中主题前沿探测[14-15]、重要文献探测[16],专利技术前沿探测[17]。本文首次将其用于两个和多个技术相互融合关系突然变化的探测,即分析对象由技术个体转变为技术组合,计算技术融合关系从非突发状态跃迁到突发状态的成本。由于IPC分类号未能很好地区分具体技术领域,因此采用世界产权组织( WIPO)发布的ISI- OST-INPI分类体系,该体系能将IPC分类号对应到35个不同的技术领域,便于技术融合的分析。基于公式(1)计算技术融合的突现度,在某种意义上,突现度越大,突现的可信度越高[18]。因此,将突现度应用于IPC组合,可根据该数值判断技术融合前沿的强度和可信度。
(1)
其中,dt表示第t批数据的专利量, 有rt篇专利含有考察话题。
图3 IPC共现规模分布
1.3预测技术前沿和发展趋势当前技术前沿往往是多学科和多种技术融合而成,因而技术融合的突变也映射着技术前沿的生成。综合技术融合突现度和不同时间段技术融合频次,分析技术融合的不同演进状态,据此展示技术前沿及其发展趋势。
2 实证研究
2.1数据收集生物芯片技术是通过缩微技术,根据分子间特异性相互作用的原理,将生命科学领域中不连续的分析过程集成于硅芯片或玻璃芯片表面的微型生物化学分析系统,以实现对细胞、蛋白质、基因及其它生物组分的准确、快速、大信息量的检测。根据芯片上固化的生物材料,可以将生物芯片划分为基因芯片、蛋白质芯片、多糖芯片和神经元芯片。
综合考虑查全率与查准率,参照已有研究[19]制定检索策略“TI = biochip or TI = microarray or TI = microfluidic or TI = 'lab on chip' or TI = bioMEMS”,以在德温特专利数据库中检索到的7283条生物芯片专利(2010- 2019年)构建基础专利数据集。专利数量在2010-2015年期间保持稳定,2016年开始呈现增长趋势(图2)。近年来随着技术的不断发展,生物医疗行业正朝着个性化医疗方向发展,生物芯片技术在全球范围内迎来了黄金发展期,广泛应用到即时诊断、新药研制和精准医疗等领域。2016年7月28日,国务院印发了《“十三五”国家科技创新规划》,明确提出“体外诊断产品要突破微流控芯片、单分子检测等关键技术,开发全自动核酸检测系统等重大产品,研发一批重大疾病早期诊断和精确治疗诊断试剂以及适合基层医疗机构的高精度诊断产品。”
2.2技术融合探测与趋势追踪在由7283条生物芯片构成的初始数据集中,有4889条专利具有两个或两个以上的IPC分类号,其中2574条专利具有三个或三个以上的IPC,有1346条专利具有四个或四个以上的IPC分类号,其技术融合规模见图3。本文主要对二元、三元技术融合前沿进行探测。
2.2.1 技术融合探测 提取IPC分类号,抽取出2912对二元组技术和8300对三元组技术,经突变度计算,探测到35对突现二元组技术(突现阈值为2.7),38组突现三元组技术(突现度阈值为2.6),其中存在16组已在二元组部分出现过的技术融合(由两个同域技术与另一领域技术相融合),我们在此仅分析均包含三种不同技术的22组技术融合(表1)。最值得关注的是最近三年发生在“通用化学或物理实验室设备”(B大部)与“利用各种方法测试分析材料技术”(G大部)(b01l<>g01n,69.3676)之间的融合,其次是“组合化学;化合物库”(C大部)与“利用各种方法测试分析材料技术”相融合(G大部)(c40b<>g01n,18.8591),以及同属C大部下的“酶学或微生物学装置”与“组合化学;化合物库”技术融合(c12m<>c40b,14.0675)。依据ISI-OST-INPI技术分类标准,上述融合涉及“化学工程”与“测量技术”“测量技术”与“有机精细化学”和“有机精细化学”与“生物技术”的融合,涵盖化工和仪表两大产业领域。
表1 生物芯片技术融合前沿探测
依据突变术语的突变年限(表1),可将生物芯片技术融合前沿的发展划分成三个阶段。前期(2010-2012年),在二元组融合中以B、C大部内部和B-C-G大部之间的技术融合为主,同时涉及B-F和F-G大部之间的融合。具体主要是“生物技术”与“有机精细化学”(占比26.67%),“化学工程”与“微结构与纳米技术”(占比20%),“有机精细化学”与“测量技术”(占比13.33%)的技术融合,涉及化学、仪表和机械工程领域,而技术融合突变主要集中于化学领域,具体集中于生物技术与有机精细化学的融合。在3元组融合中涉及B-C-F-G大部之间的技术融合,以“生物技术-有机精细化学-测量”的技术融合为主(占比44.44%),其次是“化学工程-有机精细化学-测量”(占比22.22%),此外还包括“化学工程-生物技术-测量”“微结构与纳米技术-机械部件-测量”,“化学工程-生物技术-有机精细化学”的技术融合(各占比11.11%)。三元组以“化学”与“仪表”之间的融合为主,同时涉及“化学”领域内部融合和“化学”“机械工程”和“仪表”三个领域之间的融合。
中期(2013-2015年),在二元组融合中以B-C大部之间的技术融合为主,同时涉及C-G、B-F大部之间和F、B、C大部内部的技术融合。具体主要是“化学工程”与“生物技术”(占比27.27%),“微结构与纳米技术”与“生物技术”(占比18.18%),同前期一样,涉及化学、仪表和机械工程产业。与前期相比,尽管中期突现出的技术融合完全不同于前期,但所有的技术均在前期出现过;而且,化学的内部融合及其与机械工程之间的融合比例提升,与仪表融合比例下降,仪表与机械工程领域融合在中期并未突现,新突现了机械工程的内部融合。在三元组融合中大部之间的融合更加广泛,包括A、B、C、F、G,以“化学工程”为中介技术,与“微结构与纳米技术、生物技术”“生物技术、测量”“其他专用机械、测量”“其他专用机械、微结构与纳米技术”“发动机、泵、涡轮机、机械部件”“医疗技术、测量”技术相融合,此外还包括微结构与纳米技术、生物技术、测量三者之间的融合。该阶段产业领域融合以化学和机械工程、化学和仪表之间的融合为主,同时涉及化学的内部融合。
近期(2016-2019年),在二元组融合中技术融合涉及大部增多,包含A-G,A-B,B-G大部之间以及A、G、D、C大部内部的技术融合,突现出一些新的技术融合,如“高分子化学,聚合物技术” 与“中西药品”“医疗技术”“光学”“纺织和造纸机” 之间的技术融合。其中医药成为重要的融合技术,如“中西药品”与“测量技术”“中西药品”与“化学工程”“医疗技术”与“测量技术”“医疗技术”与“化学工程”以及“中西药品”内部都突显出融合态势。此外还突现了“测量技术”与“光学”“化学工程”与“测量技术”“其他专用机械”与“高分子化学,聚合物”“纺织和造纸机”之间和内部等在前期和中期未出现的技术融合。在三元组融合中跨部融合更加广泛,并出现了一个新的H01J分类号(对应电子仪器、电气工程、电子能源技术)。以“测量”为中介技术,与“中西药品,生物技术”“中西药品,化学工程”技术相融合,此外还包括中期突现过的技术融合组“化学工程、微结构与纳米技术、生物技术”以及该阶段新突现的“化学工程,测量,电子仪器、电气工程、电子能源”。与前期和中期相比,近期生物芯片表现出更广泛的技术融合,由以“化学”领域内部融合为主向“化学”与“仪表”两个领域之间融合为主转变,同时新突现了“电气工程”领域,形成“化学、仪表、电气工程”三个领域之间的融合。此外,与医药技术的融合成为亮点。
综上,近十年生物芯片技术融合涉及技术广泛,对探测出的二元、三元技术组进行统计,共包含15种技术,分别是化学工程(42)、生物技术(41)、测量(28)、微结构与纳米技术(23)、有机精细化学(17)、其他专用机械(9)、中西药品(7)、发动机、泵、涡轮机(4)、机械部件(4)、医疗技术(3)、纺织和造纸机(2)、电子仪器、电气工程、电子能源(1)、高分子化学,聚合物(1)、光学(1)、表面技术,涂层(1)。由此可见,与生物芯片技术不断融合的化学工程、生物技术、测量、微结构与纳米技术和有机精细化学技术,除测量属于仪表领域外,其余均属于化学领域。而这些技术亦是生物芯片领域的通用技术,故可得出技术融合前沿大多发生在该领域通用技术之间的相互融合,这种类型的融合会促进技术循序渐进的进步,对于颠覆性技术的出现仍需要该领域加大与其他领域技术的交叉融合。
2.2.2 突现技术融合持续态势 突现是用来判断可能成长为研究前沿或热点的指标,但能否真正成为研究前沿还需要进一步的检测,即它能否吸引足够的研究者,是否具有一定的频次增长速度[15]。依此,提取出二元组和三元组中高突现度的前十五对技术融合组,并跟踪其突发年限对应的频次来进一步分析其演化状态及趋势(表2)。依据谱系聚类算法,选择离差平方和方法将通过欧式距离和Z-Score标准化后的数据进行聚类,最终将多元技术融合划分为五种类型,即核心型、经典型、饱和型、发展型和突发型,具体含义和解释见表3。
表2 生物芯片领域高突现权重技术融合组
续表2 生物芯片领域高突现权重技术融合组
表3 突变技术融合类型及解释
a.核心型。核心发展型突现的技术融合只包括(b01l<>g01n)一对,融合突现度最大,频次自2010年至今均排名第一,属于高频焦点技术融合对,是当前生物芯片领域基于融合的创新热点,处于核心地位。上述两种技术为设备和方法层面的融合,属于生物芯片领域的共性技术。
近年来微流控、微阵列等芯片技术得到快速发展。微流控技术从最初的单一功能的流体控制器件发展到了现在的多功能集成、应用非常广泛的微流控芯片技术,相比于传统方法,微流控技术具有体积小、检测速度快、试剂用量小、成本低、多功能集成、通量高等特点。微阵列技术是人类基因组计划的逐步实施和分子生物学的迅猛发展及运用的产物,融微电子学、生命科学、计算机科学和光电化学为一体,在原来核酸杂交的基础上发展起来的一项新技术,它是第三次革命(基因组革命)中的主要技术之一。随着生物芯片技术的不断发展,其在分析化学、医学诊断、细胞筛选、基因分析、药物输运等领域得到了广泛应用,相关专利大量涌现。
b.经典型。经典发展型突现的技术融合具有早期融合频次较高、融合突现度较大,虽近期融合频次有所下降,但仍保持一定规模的特点,此类融合表示相对成熟的融合,其将检测分析方法与组合化学、化合物库相融合。生物芯片的本质是将命科学领域中不连续的分析过程集成于硅芯片或玻璃芯片表面的微型生物化学分析系统,以实现对细胞、蛋白质、基因、糖类及其它生物组分的准确、快速、大信息量的检测。因此上述突变的技术融合是研究生物芯片领域的经典话题。
c.饱和型。饱和型的技术融合具有早期融合频次较高,随着时间的发展频次逐渐降低并有消失趋势的特点。早期的融合热点主要集中于对酶、核酸、糖类及其衍生物、核苷、核苷酸、核酸、微生物的测定或检验,随着技术的发展,该类研究已逐渐饱和,相关技术也已成熟,生物芯片融合热点已经转移。
d.发展型与突发型。此聚类主要包括两种类型:发展型和突发型。发展型具有近几年融合频次上升或先降后升的趋势。该类技术融合将生物芯片分析方法与医学领域融合,用于医学和药物的诊断和鉴定,如利用DNA芯片可以寻找基因与疾病的相关性,从而研制出相应的药物,提出新的治疗方法;女性在妊娠早期用DNA芯片做基因诊断,可以避免许多遗传疾病的发生;2018年由清华大学、解放军总医院和北京博奥生物共同开发的“遗传性耳聋基因诊断芯片”项目获得年度国家技术发明奖二等奖,发明了多重等位基因特异性扩增及通用芯片技术和世界第1款遗传性耳聋基因检测芯片,能够检测先天性耳聋、药物性耳聋、大前庭导水管综合征相关的耳聋基因位点,且研制出全套适合大规模筛查的配套仪器及整体解决方案等。
突发型技术融合突发时间多处于中后期,一般突发时长延续两年且没有持续到近期,突发期间融合频次不高且变化范围较小。该类技术融合在过去所处时间内具有成为融合前沿的特点,但从整体来看不属于目前的融合前沿。除已有技术之间的融合外,该类突现出h01j(放电管或放电灯)技术,与b01l(通用化学或物理实验室设备)和g01n(利用不同方法测试分析不同材料)技术相融合,值得进一步关注。
3 结 语
技术融合是技术产生的重要根源,也是技术的重要特征,布莱恩·阿瑟(W.Brian Arthur)[20]认为已有技术的新组合在很大程度上能够解释技术(包括不连续技术)是如何产生的。本文从技术融合的角度出发,通过对专利分类号排列组合构造二元和三元技术组,创造性的将突变算法用于生物芯片专利技术融合前沿的探测,可对该领域近十年技术融合前沿演化路径和未来融合趋势有一个系统的认识。基于突变检测的技术融合前沿及其演进方法具有较强的领域适应性,扩展了技术融合研究的视角,丰富了技术前沿探测的方法库,能够帮助相关人员对目标技术领域的技术融合前沿演化路径有一个系统的认识。今后可从技术融合视角出发,将该方法用于各个领域的国际专利分类号、德温特分类代码、德温特手工代码、专利共被引等方面的融合测度。