基于专利引用变化的颠覆性技术识别研究*
2022-01-28王玉奇
王 康 陈 悦 王玉奇 宋 超
(大连理工大学科学学与科技管理研究所暨 WISE 实验室 大连 116024)
0 引 言
世界新一轮科技革命为颠覆性技术涌现创造了新的机遇,推进颠覆性技术发展已成为大国博弈的战略选择[1]。党的“十九大”报告明确提出要加快建设创新型国家,突出关键共性技术、前沿引领技术、现代工程技术和颠覆性技术创新。
颠覆性技术创新会促使技术发展方向,甚至是技术范式的变革,目前国内外对颠覆性技术的认识尚不统一。概念提出者克里斯坦森(Clayton M. Christensen,1952-2020)[2]认为颠覆性技术是从低端或边缘市场切入,以简单、方便、便宜为初始阶段特征,随着性能与功能的不断改进与完善,最终取代已有技术的技术。美国国防高级研究计划局(DARPA)认为颠覆性技术是“可改变游戏规则”的新技术。中国工程院重大咨询项目“工程科技颠覆性技术战略研究”项目组强调作为国家战略研究对象的颠覆性技术,重点指对经济社会发展和国家战略安全具有全局性、根本性、革命性重大影响的、无法仅由市场自由决定、需要由国家战略引领进行发展的战略新技术[3]。虽然当下对颠覆性技术存在不同的认识,但具有的共识是:颠覆性技术强调的是效果[4-5],即对现状产生根本性、革命性的颠覆,颠覆性技术与渐进性技术相比,在形态上更具有超越性和突变性,在效能上更具备革命性和破坏性[6],其不仅仅局限于低端市场,在中端、高端市场均有可能产生颠覆性技术。
根据上述颠覆性技术的论述可知其对国家的科技水平和民众的生活水平均有可能产生质的飞跃,如果能够通过一定的方法对未来有可能带来颠覆性效果的技术能有提前的预判,将是意义重大的。目前常用的识别方法可归纳为四类,即以专家为核心的识别方法、以科学论文和专利数据为核心的识别方法、以技术演化规律为核心的方法和以模型为核心的识别方法。颠覆性技术识别是一项复杂的系统工程,没有一定的知识储备很难完成此类工作,往往需要各个领域的专家共同参与进来,群策群力,以专家为核心的识别方法主要包括德尔菲法、问卷调查法、技术定义法、情景分析法、技术路线图等。此类识别方法广泛受到各种颠覆性技术研究机构、智库、信息咨询公司的青睐,同时也有部分学者对其进行了研究,如李晓龙[7]以国网为研究对象,利用德尔菲法和决策与实验室方法对颠覆性创新技术及其影响因素进行分析。Borup[8]、Carlsen[9]基于调查方法和德尔菲法构建技术路线图来评估颠覆性技术。但智钢等[10]利用德尔菲法筛选出2035年我国环境工程科技发展的关键技术、共性技术和颠覆性技术以及它们的实现时间、发展水平与制约因素。但是,专家判断是主观的,且随着技术的不断扩散和创新周期的缩短,这些以专家为中心的方法变得既费时又费力[11]。为避免专家主观判断的局限性,通过挖掘科学论文和专利数据中的潜在关系以识别颠覆性技术表现出其客观性的一面,主要包括文献计量、专利计量与文本挖掘3种方式。文献计量方面:石慧等[12]利用陈超美基于中介中心性和突变性而设计的Sigma指数来识别潜在颠覆性技术;Jia等[13]将高频和突发值相结合用于衡量技术突破性指标,识别颠覆性技术。专利计量方面:颠覆性创新通常通过“前向引用”(后续专利对焦点专利进行的现有技术引用)的数量来衡量[14],较高的引用次数表明专利代表了一项技术突破[15]。Kaplan等[16]和马荣康等[17]将专利中每年被引用数占前5%的专利作为颠覆性技术发明;Momeni等[18]从专利引用网络中抽取主路径作为颠覆性技术识别的基础,但是该方法对于非主路径上的技术无法有效识别。文本挖掘方面:Kim[19]利用LDA主题模型识别出新能源领域的颠覆性技术;赵格[20]利用LDA主题模型提取3D打印领域的主题,并结合专利3年引用率、专利平均独立权利要求和文献增长率指标识别颠覆性技术;黄鲁成等[21]通过语义分析提取专利信息的“属性”和“技术方案”的SOM语义结构,并基于物种入侵模型判断某技术的颠覆性强度。技术的发展变化具有自身的规律性,因而通过发现技术在演化过程中的非线性跳跃从宏观上可以识别颠覆性技术,常用的方法有TRIZ、技术生命周期、技术轨道和S曲线等方法[22]。TRIZ方面:孙建广等[23]基于TRIZ进化法则构建了新市场破坏创新和低端破坏创新的详细实现模型,之后其又基于技术进化理论提出突变性技术进化分支事前产生方法[24];平恩顺等[25]将TRIZ理论应用于新产品开发的模糊前端阶段,建立了机械产品突破性创新设想产生过程模型。技术生命周期、技术轨道和S曲线方面:张奔[26]通过对比国内外高速铁路轨道技术生命周期特征,得出通过Logistic模型的多重S型曲线之间的重叠区域能够识别技术发生颠覆的时间点,之后其又用Gompertz方程进行技术生命周期的S型曲线拟合,并将曲线上前10%~37%阶段的专利作为技术跃迁专利[27]。数学建模通常是进行预测的重要方法手段,在颠覆性技术识别方面的模型方法较广泛,如Adner[28]提出基于用户需求构建量化分析模型识别颠覆性技术发生作用的条件;Sood[29]提出技术颠覆性风险模型,利用风险系数预测颠覆性技术的出现,Muller等[30]利用此模型识别电池领域的颠覆性技术;Linton[31]将巴斯扩散模型引入颠覆性技术识别领域,Ganguly[32]在其提出的四个颠覆性技术测量指标之一的用户技术采用率使用巴斯创新扩散模型测度。
上述方法对颠覆性技术识别提供了可行思路,但是却缺少从颠覆性技术最本质的特征“颠覆”的角度去识别的相关研究。蒲慕明院士认为“重要的突破性科研创新不是无中生有的,而是在目前科学领域的基础上,对现有的理论和技术有大幅度革新”[33],从而引领科学向新的方向发展。颠覆性技术能够加速科技文献(包括科学论文和技术专利)的老化速度,消减其生命力,关联到科技文献的引用关系上,就表现为当具有颠覆性意义的某篇科技文献出现时,科研人员对之前该类研究的科技文献关注热情骤减,转而开始频繁引用具有颠覆性意义的科技文献[11-12]。基于此,本文提出一种通过测度专利引用目标的变化来识别颠覆性技术的新方法,其核心思想是一项专利的公开是导致其引用的专利影响力骤减的原因,表现为自身影响力快速攀升,即新技术的发明使旧技术过时,则将该专利所代表的技术识别为颠覆性技术。
1 基于引用变化测度的颠覆性技术识别方法
颠覆性技术在技术创新发展过程中具有引领作用,它的出现会备受关注,同时会使之前的同类技术“黯然失色”。即某项专利公开后,其影响力快速提升,而其所引用的专利影响力随之下降。新技术的发明使之前的技术趋于过时,表明该项新技术具有为后续技术发展奠定基础或具有转变技术发展方向的特征,使后续研发对之前技术专利的使用逐渐失去热情。
本文将具备上述特征的专利所表征的技术称为颠覆性技术(Ta),理论模型见图1a。本研究用专利来表征技术,技术知识的扩散表征为专利间的引用行为。通常情况下,颠覆性技术(Ta)的出现并不会导致被颠覆技术(如Tb)立即过时,反映到专利引用中就会出现Pb仍会被其他专利引用(如、Pe、Ph)(见图1b)。因此,我们有必要设计一个能够从专利引用变化的角度来反映技术颠覆性程度的指标(DTIa)。
图1 基于专利引用变化的颠覆性技术识别原理解析模型
我们从两个方面来考虑某专利与其引用专利之间被引频次的差距。首先,考虑某专利与其最高频被引专利之间的引用频次差值,即若Pa表征颠覆性技术(Ta),则Pa的被引频次(CPa)要大于自Pa公开后其引用专利(Pai)的最高被引频次,差值越大,则Ta越具颠覆性;其次,考虑某专利与其引用专利整体之间被引频次差值,由于专利引用频次分布存在长尾现象,因而本文选择加权平均数来作为引用专利整体的被引频次代表值,即若Pa表征颠覆性技术(Ta),则Pa的被引频次要大于自Pa公开后其引用所有专利整体的被引频次加权平均值,差值越大,则Ta越具颠覆性。最后,为消除不同专利之间被引频次差异,将被测度专利的被引频次作为分母进行标准化。某技术的颠覆性(DTIa)的测度方法见公式(1),DTIa值越大表明技术颠覆性越强。其中i为专利Pa引用的专利数量。
(1)
2 实证研究
2.1语音识别发展现状语音识别是计算机科学和计算语言学的一个跨学科子领域,近年来随着深度学习和大数据技术的发展,智能语音在理论研究和商业化应用两方面均取得了颠覆性的成效。语音识别程序(G10L-015/22)和语音-正文识别系统(G10L-015/26)成为近十年增长最为迅速的技术领域,随着语音识别技术的细分,语音识别(G10L-015/00)呈现下降趋势(见图2a)。语音识别技术研发力量的全球分布不均,主要力量集中在中国大陆(6923项专利)、美国(6423项专利)、日本(5052项专利)和韩国(2615项专利),这四个国家在2001-2020年公开的专利占比92%(见图2b)。
(注:本文研究的数据是来源于德温特专利数据库( DII)的22832条语音识别技术专利( 检索策略:TS=("speech recogni*" OR "voice recogni*" OR "speech to text") and IP =(G10L*),时间跨度为2001-2020年)
2.2颠覆性技术识别颠覆性技术往往是另辟蹊径的技术,传统的专利时序引用网络或技术主路径在颠覆性技术识别的效果方面欠佳,本文利用第1部分提出的方法,通过计算每个专利的颠覆性指标DTI值进行颠覆性技术识别。依据DTI值排序的前20个专利中(见表1),属于美国的有17项、德国1项、韩国1项、日本1项,专利内容涉及算法、技术和应用三个方面。具体而言,算法包括,隐马尔可夫模型和深度递归神经网络;技术包括噪音识别、语音纠正、语音评估和语音对话分析);应用包括无线通信、照明、车辆导航、银行认证注册、电子设备、在线实时通信系统等方面)。
表1 语音识别领域DTI值排名前20位的专利信息
由于越早识别出颠覆性技术越具有政策性意义,因而技术显现出颠覆性迹象的时间也应该成为颠覆性技术识别过程中要着重关注的要素。本文所考虑的“时间”是指具有颠覆性特征的技术专利被引用的时间,图3a显示了前5个专利的被引趋势,同时我们利用每个专利的加权平均被引时间(WT,公式(2))绘制二维坐标图,横坐标为专利被引时间加权平均数(WT),纵坐标为专利颠覆性程度(DTI),圆圈表示专利被引频次。综合图3a和图3b,我们选择6个典型专利进行剖析,这些专利在颠覆性程度和被引时间上更具优势,各专利技术优势见表2。
图3 语音识别领域DTI值排名前20位的专利分布
(2)
其中i为专利P的被引用年份,CPi为专利P在i年被引频次。
表2 颠覆性专利优势介绍
专利号介绍优势颠覆方式EP1104155-A2通过在移动设备用户和网络语音识别服务器系统之间建立语音通道来访问语音识别服务①处理和存储容量有限的移动设备用户可以使用运行在远程服务器设备上功能齐全的语音识别应用程序来增强标准设备的用户界面;②语音识别应用程序为用户提供了具有大词汇量和个性化词典的多种语言词典,同时由于语音识别应用程序没有存储在移动设备上,因此对移动设备的单位成本几乎没有影响;③用户同时使用语音识别服务和本地用户界面(例如电话键盘),从而为用户提供最大的灵活性应用性颠覆US2005080632-A1一种用于在车辆导航系统中为语音识别提供加权语法①根据地理信息计算与令牌相对应的权重并接收与令牌相对应的地理信息,实现可靠、准确的语音识别;②该专利提供了一种在语音识别中利用位置信息的增强的语音识别系统应用性颠覆US7418392-B1;US2009043580-A1一种照明元件(如声控灯或小夜灯)的语音识别系统①具有与控制器耦合的语音合成器,语音合成器耦合到控制器以生成合成语音,其中控制器根据从识别器接收到的识别结果和传感器的输出来改变照明元件的功率;②该技术能够降低语音识别器的错误触发率,易于通过语音命令控制设备应用性颠覆US7720683-B1一种用于玩具、电子学习辅助设备和消费电子产品的语音识别操作的方法①能够通过交互式修改语音表示(修改系统使用的语音识别参数和资源)来提高识别设备的性能;②该装置具有诸如使用廉价的口语短语、占用资源少、独立于说话者、不需要对识别集中的每个短语的大量记录进行训练就可实现、允许设计者控制和最小化硬件实现识别器所需的计算资源等优势应用性颠覆US9263036-B1基于深度递归神经网络的语音识别系统①具有在计算机上实现的深度递归神经网络(RNN),以及由长短时记忆递归神经网络实现的多个递归隐藏层;②该系统提供了一组更丰富的可能性来组合来自网络的信息,以提高通用性;③该系统对RNN进行正则化以获得更好的性能;④该系统减少了传输参数所需的信息量算法性颠覆
3 结果验证
3.1基于同族专利的国家技术实力验证尽管中国的语音识别专利数量在2016年的年申请量超过美国,且专利总量目前也跃居世界第一位(图4b),但识别出的颠覆性技术仍多来自美国(17/20),毫无疑问,美国仍在语音识别领域位于技术制高点。颠覆性技术往往具有很强的市场应用价值,为占领海外市场,大量企业争相进行海外布局,国家间技术实力的比较可用同族专利信息进行挖掘。
同族专利是指同一发明思想,但内容有所修改或变动的一族申请,用不同文种,向多国递交,从而公开或批准的一族专利[13]。一个国家对某项技术的全球布局可以通过同族专利分析得以深刻解析。通过分析同族专利在国家和区域的分布状况,可以预测未来可能的市场分布,还可以在国家层面上了解竞争状况以及技术在国际上的竞争力[14]。在同族专利中最早优先权的专利文献称为基本专利,基本专利所属国家称为专利优先权国家,往往也是技术创新的来源国[15]。基于此,我们构建专利优先权国家与同族专利申请国家关系矩阵并可视化(图4a,其中节点大小表示连出度,线条粗细表示布局专利数量)。在语音识别技术专利的全球布局中,美国(US)、日本(JP)、韩国(KR)、中国(CN)、澳大利亚(AU)、德国(DE)和法国(FR)位于网络中心位置,是专利布局的活跃国家。其中美国在专利布局网络中发挥着最重要的专利信息资源的控制作用,它向日本、中国、韩国、德国等国家广泛布局语音识别专利,同时也吸引着上述国家的专利布局。需要指出的是,世界知识产权组织(WO)和欧洲专利局(EP)为国际专利组织,拥有众多成员国,接收来自世界各地的大量专利。
为进一步深入挖掘国家或地区的海外布局力和市场吸引力,我们借鉴并改进陈悦等[16]提出的专利海外输出率和海外专利接受率指标,构建海外布局能力指标(TO)和市场吸引能力指标(MI),其中TO表示在其他国家或地区布局专利、抢占市场的能力(见公式(3));MI表示吸引其他国家或地区专利布局的能力(见公式(4))。
(3)
其中Pi为i国或地区所发明的专利数,Pi→j为i国或地区向j国或地区布局的专利数量,Pi↔j为i国家或地区和j国家或地区互相布局的专利数量。
颠覆性技术不仅体现在技术本身的先进性,还体现在其市场竞争力。在以专利布局能力(TO)和市场吸引力(MI)为横纵坐标的图4b中显示,中国大陆发明专利总量已位居第一,但海外布局能力在专利数量最多的前十个国家或地区(发明专利数大于100)中最弱,仅占自身发明专利的10.1%,因而中国大陆语音识别技术在海外国家或地区布局中仍存在短板。然而,中国大陆市场吸引力排名第2(除世界知识产权和欧洲专利局两个国际组织外),这意味着中国大陆在语音识别领域具有广阔的应用市场,广泛吸引海外国家或地区进行技术布局,这同时也警醒我们需要对竞争对手进行识别与关注,防止海外国家或地区的技术封锁。我国台湾地区发明专利不多,但海外国家或地区布局能力较强,在语音识别领域具有一定的技术竞争力。法国、英国和德国等国家专利虽然不多,但海外布局能力最强,占70%以上,属于典型的技术输出强国,技术实力强,市场化进程快。日本和韩国的海外布局能力也大于市场吸引力,两国主要在美国进行海外市场开拓(图4a)。美国的专利数量仅次于中国,但其市场吸引力和海外布局力均大于中国,在全球语音识别领域以其为枢纽进行的技术流动最为频繁,体现其在语音识别领域的发展较为成熟,既掌握较为雄厚的技术基础,也具有广阔的市场环境。上述结论支撑了本文识别出来的颠覆性技术多来源于美国这一事实。
图4 语音识别领域专利布局情况
3.2基于问卷调查的颠覆性技术验证语音识别离我们每个人的生活非常近,我们每天都可能使用诸如手机语音助手、车载语音识别控制系统、智能对话查询系统、智能语音问答系统等语音识别技术与产品。为验证识别出来的专利技术是否真的具备颠覆性,笔者利用问卷调查法对识别出的结果进行验证。问卷使用5级量表,技术颠覆性程度分别为:非常低、较低、一般、较高、非常高5个级别。各受访者依据自身知识或经验对上述6件专利进行评价。为便于评价标准一致,我们要求受访者依据技术颠覆性进行判断,为防止概念混淆不清,首先在问卷开头解释颠覆性指标的具体含义,即该项专利所代表的技术已经或未来可能在语音识别技术性能或具体应用上产生的突破程度。共收集问卷38份,其中有效问卷38份,受访者硕士及以上学历37人。统计结果见图5。
图5 专利颠覆性评分结果
注:柱形图从上到下依次为颠覆性非常高、颠覆性较高、颠覆性一般、颠覆性较低、颠覆性非常低。
根据统计结果可知本文提出的方法较为合理,在选取的6个典型专利中每个专利均有50%以上的人认为技术颠覆性处于较高水平。其中专利US9263036-B1有82%的比例被评为颠覆性水平较高,但其被引频次只有22次,如果仅通过高被引专利是无法捕捉到该专利的。其次US2005080632-A1也有76%的比例被评为颠覆性较高水平。综合问卷调查的结果,较为理想地验证了本文提出的颠覆性技术识别方法的可行性与有效性。
4 结 语
颠覆性技术被视为“改变游戏规则(另辟蹊径)”和“重塑未来格局”的革命性力量,对人类社会有广泛且深刻的影响。我国正处于由大变强实现民族复兴的关键时期,尤其是2020年初因Covid-19全球爆发而引起的世界格局变化,使得加强颠覆性技术创新对我国实现关键核心技术自主可控,提升科技创新质量,实现跨越式发展,掌握未来发展和大国博弈的战略主动尤为重要。本文根据技术发展的客观规律,从引用目标的变化角度构建颠覆性指标DTI来识别颠覆性技术,同时根据高DTI值专利被引的平均加权时间展示颠覆性技术的新颖性,并以德温特专利数据库中2001-2020年间语音识别领域专利数据进行验证,确定EP1104155-A2、US2005080632-A1、US7418392-B1、US2009043580-A1、US7720683-B1、US9263036-B1等专利极具颠覆性,涉及交互式语音修改、深度递归神经网络和语音识别技术在无线通信系统、车辆导航系统、照明元件等中的应用,其中专利US9263036-B1最具新颖性,代表着当下最热门的颠覆性技术方向,值得进一步关注。
本文所提出的方法是基于专利引用关系构建的,仅能够对有专利引文的专利所代表的技术进行颠覆性测度和识别,尚不能识别无引文的专利技术。另外,由于专利引用具有一定的滞后性,对最新发表尚未被引的专利技术也无法进行颠覆性识别,需要进一步研究。