APP下载

大数据视角下技术机会分析研究综述

2023-11-13李姝影胡正银刘春江

科技管理研究 2023年18期
关键词:机会专利分析

李姝影,胡正银,隗 玲,刘春江,方 曙

(1.中国科学院成都文献情报中心,四川成都 610044;2.山西财经大学信息学院,山西太原 030092)

随着技术与环境的快速发展,新行业和新市场竞争加剧,新兴科学与技术不断涌现,许多大学、研究机构和商业情报机构都在跟踪、监测和预测新兴技术,探索识别潜在的技术机会[1]。技术机会发现(technology opportunity discovery,TOD)的主要目的是减少技术快速转型、市场动荡或客户需求变化等环境因素造成的不确定性[2],这些不确定性产生的根本原因在于掌控的信息量与智能决策所需的信息量之间的差异[3],适时高效的动向监测、高质量的技术机会情报分析能够缩小其中的差距,更快地探索与发现技术机会以支撑战略规划。当前基于专家知识与经验的趋势预测已不足以应对海量信息时代的挑战,数据驱动的大数据分析方法在挖掘和分析定量数据的同时,提出客观性数据分析结论供专家进行判断,在一定程度上弥补了以专家预测为基础方法的主观性缺陷和知识限制[4]。国内外学者围绕技术机会分析展开了大量研究工作,呼吁采取具体的方法来减少技术机会分析(technology opportunity analysis,TOA)所需的时间和成本。在此背景下,本研究检索和梳理近5 年国内外大数据视角下的技术机会分析文献,按照文献分析框架进行系统筛选、分类与解读,总结归纳当前的技术机会内涵、热点应用场景和分析方法。

1 技术机会内涵

学者们将降低技术不确定性的活动称为技术机会发现,通过技术机会发现可获得新兴技术、研发创新启示、技术改进、竞争优势等。技术机会的概念天然就具有创新的特色。Schwartz[5]最早提出技术创新机会(technology innovation opportunity,TIO),从产业创新视角分析产业发生根本转变的前瞻性核心技术。除了变革性创新外,技术机会也包含渐进性创新,例如对现有技术的特征和性能方面的改进以及某特定技术融入现有其他技术的可能性[6]。从产业的角度看,技术机会发现可从科学知识的进步、产业外的技术进步和产业内的技术反馈3 个源头识别[7],其表征具有多样性。技术机会发现可以是与技术相关的客体,如技术所具有的潜力或具有可能性的技术[8];也可以是与人类相关的活动,如“推断可能的技术形态或技术发展点”[9],以及“为识别现有技术的新应用或预测新技术而进行的活动”[10],这类活动关注探索技术所具有的潜力,或识别具有潜在影响力的技术以及对于机会的战略性利用。更多时候,技术机会发现体现为技术客体与人类活动的综合体。技术客体又可以进行细分,如技术空白点、融合技术、新兴技术以及具有技术前景的面向客户技术[11]。

国内外学者在研究探索的过程中进一步拓展和丰富技术机会内涵(见表1),可以大致归纳为技术空白机会(代表性文献如文献[12]至文献[18])、科学技术机会(代表性文献如文献[19]和文献[20])、技术组合/融合机会(代表性文献如文献[21]至文献[24])。

表1 国内外关于技术机会内涵主要研究状况

2 文献检索与分析框架

基于Web of Science(WoS)平台和中国知网(CNKI)中文期刊数据库,利用关键词和被引主题进行检索,其中文献分析过程借鉴了Pittaway 等[25]的做法,具体步骤见表2。

表2 文献来源与分析步骤

3 大数据视角下的技术机会分析

大数据视角下的技术机会常 常由知识元素结构表示,通过提取知识元素排列组合为某种结构,基于前人经验将具有显著特征的特定知识元素或空间位置表示和定义为技术机会。以下分别从应用场景和分析方法两个角度对技术机会分析研究进行分析总结。

3.1 应用场景

通过对文献的内容分析,大致可以将大数据视角下的技术机会分析应用场景分为技术层面、企业层面、科学技术层面和产业层面4 类(见图1)。

图1 大数据视角下技术机会分析热点应用场景

3.1.1 技术层面

技术层 面的技术机会分析是面向特定技术领域内识别具有潜在价值的技术应用机会的过程,其中主要的热点方向包括:

(1)识别特定技术领域具有未来潜力的组合/融合技术。组合/融合技术概念源于技术组合进化和知识组合理论,是指对知识或技术元素进行组合/融合的过程,既包括探索尚未出现的新的知识元素组合,也包括对现有知识元素的重用/开发/组合/融合[26],是对现有技术不同创新模式的突破[27]。常见的思路是从现有技术中提取具有一定特征或可能形成技术机会的知识要素进行判断、组合、表示、排序、解读,将技术发展过程中的性能改进、技术组合、技术汇聚/融合作为技术机会形成的重要途径。翟东升等[28]构建了技术融合演化分析识别技术机会分析的框架:宏观层面对参与融合的技术密集度、内聚性和聚类程度进行网络指标分析;中观层面对技术领域在融合发展过程中的功能演变进行考察;微观层面对推动本领域技术融合以及不同技术领域之间交叉渗透的重要技术节点进行分析。随着技术融合成为一种主流的创新趋势,以往基于回顾性视角衡量融合程度和监测融合趋势的研究将逐渐转向面向未来视角技术组合/融合机会的预测,研究重点也从特定技术领域知识、技术、市场和产业会聚现象的演化扩展到与异构技术领域相融合的不同于现有技术领域的技术机会。

(2)识别特定技术领域内现有技术尚未涉猎技术空白。技术空白指的是尚未申请专利/未被开发且具有发展潜力的空白点,体现为远离大部分数据的离群点、异常点[11]。针对空白区域、离群点、异常点隐含的创新信息挖掘,近期Lee 等[29]主要是研究探索评估技术发展路径的风险与机会,邢冬梅[30]指出找到最佳技术机会与可能受制于人的限制,唐恒等[31]探究如何甄选“卡脖子”技术短板甄选,研究的重点从基于定量方法揭示各种空白区域转向评估技术空白的可行性。

(3)识别特定技术领域内未来可能突显的新技术形态或新兴技术。这类技术指的是近期成为关注焦点的技术或有可能带来重大影响的技术(包括热点新兴技术、萌芽新兴技术和联合新兴技术),具有快速增速、高新颖度/新兴技术、高不确定性/模糊性以及高市场潜力的特征。早期定量方法主要综合运用技术监测、文献计量学和社会网络分析对新兴技术热点进行识别,例如从引文分析构建的时间序列专利[32],以及文献网络的比较,而定性方法主要是通过专家调查或小组讨论识别新兴技术。近期研究主要利用知识元素的特征来识别趋势性知识元素潜在的技术机会,例如,李欣等[33]结合SAO结构的语义分析和李乾瑞等[34]利用技术路线图识别新兴技术的发展过程张振刚等[35]基于SAO 结构分析知识网络的动态演化过程以揭示知识元素间进行组合的轨迹和趋势,以及姜照华等[36]结合专利引文分析、语义TRIZ 和文本挖掘等识别出在一定的阈值下的若干科技领域形成的主流群落和热点领域。

3.1.2 科学技术层面

科学技术层面的技术机会分析主要是识别潜在的科学技术关联机会,尤其是由科学进步推动的新技术机会。其主要原理是科技知识融合滋养了探索新技术机会的过程。例如,专利数据与学术或产品知识的整合可能会导致更多的科学或市场相关机会的发现,因为科学知识为技术知识边缘提供了基础,Glänzel 等[37]就曾在研究中证实来自技术知识的反馈刺激能够催化科学知识的持续发展。

科学技术层面的研究相对较少,普遍是将学术研究和工业研发相似度较低的集群主题认定为科学进步和技术创新的潜在机会。常见的分析思路有两类:一是通过比较同一个技术领域内科学和技术之间的差异、相互作用等关系发现潜在的技术机会[38],例如,某些论文的研究主题还没有被广泛用于技术开发,通过比较科技集群之间的差异发现潜在的技术机会。二是基于论文参考文献中的引文信息和专利信息,构建科学技术引文网络,基于专利和论文之间的引用等关系来确定技术机会[20]。

3.1.3 企业层面

企业层面的技术机会分析指的是在企业现有技术和产品基础上扩展的技术或产品机会,使企业在快速变化的环境中及早发现威胁或机会。从企业发展的角度看,Lee 等[39]将企业的技术机会分为两大类:一是企业从技术和产业角度看某一特定技术领域尚未开发或有开发前景的技术和产品;二是从企业现有技术和产品中发现适用的技术机会。在此基础上,Yoon 等[40]主要研究和梳理了4 种企业技术机会分析路径:(1)探索企业所处技术领域现有技术的改进/升级过程,例如,利用现有的近红外技术开发远红外技术;(2)探索企业现有技术可应用于各个领域的潜在产品的过程,例如近红外技术可用于烤面包机和低频按摩器的研发;(3)在各个产品领域发现对企业现有产品进行改进的潜在产品的过程,例如,公司可以通过改进现有电加热器来开发红外加热器;(4)探索各个技术领域的潜在技术可用于企业现有产品改进的过程,例如,公司可以引入气体警报技术来改进现有的电加热器。而Cho等[10]基于中小企业技术机会调查总结了9 种类型企业技术机会,其中拓展市场的技术机会最多,应用多样化和创造市场类技术机会次之。

从文献利用和数据挖掘的角度看,企业层面技术机会发现的主要思路是,利用技术或产品之间的语义功能相似度来界定企业之间现有技术或产品技术能力差异,以减少异构技术之间的不确定性,衍生出潜在技术机会。目前的研究方向主要涉及产品/技术研发、布局、预警及中小企业等多个主题。

(1)技术布局。冯立杰等[41]利用多维技术创新地图的功能-行为-结构(function-behaviorstructure,FBS)模型解构现有技术,为企业精准开展技术创新活动提供决策参考。许学国等[42]基于生成式拓扑映射(generative topographic mapping,GTM)方法识别技术创新机会,帮助企业进行技术布局。

(2)产品/技术研发。韩晓彤等[43]构建申请相关度和失效相关测度模型以识别企业竞争对手的研发方向。Shi 等[44]基于LOF 算法和文本挖掘方法识别目标企业与识别潜在的研发机会。冯立杰等[45]利用多维技术创新地图分析面向低端市场用户需求的技术机会识别路径,为后发企业产品研发提供参考。Lee 等[46]基于Word2vec 技术和文本挖掘确定企业根据其技术能力可能采用的新产品领域。

(3)领域技术发现/预警。Park 等[47]通过对企业技术组合进行协同过滤,为目标企业推荐定制应用技术机会。Shin 等[48]基于关联规则挖掘识别与企业内部能力相适应的新技术领域。Choi 等[2]利用序列模式挖掘,通过关注目标企业重点技术领域的动态变化来识别不确定性较小的技术机会。黄鲁成等[49]结合异常检测和专利市场价值评价识别目标技术领域具有潜在技术机会的异常专利。

(4)中小企业。Lee 等[50]基于技术功效和SAO 两阶段分析方法,研究中小企业在能力和资源受限的情况下识别技术机会的方法、制定中小企业技术战略。

总体上来说,基于文献静态的角度分析动态变化中的技术能力与技术机会的相关研究具有滞后性,多源异构数据为专利技术机会分析提供了动态、实时、多元化研究视角;其次,国内学者对企业层面的应用场景关注较少,聚焦在宏观的技术布局与预警上,而微观上支撑企业实际需求的技术机会分析较少,尤其缺乏对中小企业的技术机会分析,未来将更倾向于帮助中小企业评估与利用技术机会[20],而国内企业技术机会应用场景还有待拓展与完善。

3.1.4 产业层面

考虑到新技术开发和商业化应用存在的不确定性和高风险,研究识别技术在产业层面尚未开发的 机会对于产业技术创新有积极的影响。与其他应用场景相比,产业层面技术机会分析的研究稍显不足。相关研究方向主要有:(1)技术商业化机会。钱越等[51]基于专利数据和商业数据,从技术成熟度、技术机会和技术竞争环境构建技术商业化潜力评价模型。李乾瑞等[52]利用模糊一致矩阵,从技术价值、经济效用、产业可行性和中国产业化潜力4 个维度对技术形态组合备选集进行综合评价和排序,以识别技术创新机会。Feng 等[53]基于技术、专利和产品信息探索潜在可持续的商业模式/机会。(2)供需对接。武玉英等[54]通过挖掘专利转让加权网络主体信息及结构特征预测技术交易机会。何喜军等[55]基于科技主体的专利技术交易网络预测科技主体间的专利技术交易机会。He 等[56]提出基于SAO 语义分析的技术需求潜在热点识别模型以促进技术供求的有效对接。

3.2 分析方法

前人开发出多种TOA 模型和方法,大部分可以归纳为四步:获取数据、构建知识结构、技术机会表示界定以及评估和解读有前景的技术机会,这些步骤涉及数据源选择、知识组织、机会表示、技术评价以及专家参与等多要素,每个要素都有可能影响机会分析的潜在价值。大数据视角下的技术机会分析方法仍然遵循这些步骤(见图2),其中关于前三步的创新成果较为丰硕。如:第1 步分析多源异构数据以论文、专利、WordNet 数据库、维基百科、网络评论等多源、非结构化数据为来源,由单一外部特征向融合科技文献内外部多个特征发展[57];第2 步中知识组织通常利用SAO 结构(代表性文献如文献[58]至文献[61])或文本挖掘抽取与表示技术文档,利用知识抽取、语义计算等挖掘技术趋势和机会,专利技术特征和语义关系抽取的自动化、准确率、细粒度有显著提升;第3 步中候选技术的确定则通过技术组件与效果重新组合匹配来获得新的技术方案和启发,技术及功能等形态信息更加细化,降维方法上的改进更加多元化。

图2 大数据视角下技术机会分析步骤

大数据视角下的技术机会分析方法包含了图书情报、数学、计算机、网络等多个专业领域的内容,根据文献发表时间和数据处理量级(见图3),经过文献阅读后分析筛选了其中比较新兴的研究方向,包括异常检测、机器学习、链路预测及SAO 语义分析4 类。

图3 大数据视角下技术机会分析方法

3.2.1 异常检测

异常检 测,又称离群点识别,通常指发现与其他实体不同或偏离数据集的对象[62]。利用该类方法进行技术机会发现,就是要识别与大部分主流技术显著不同的专利,将其视为新技术的起源和弱信号。主要思路是,利用异常检测算法对数据进行筛选检测,筛选出专利异常点,通过人工或指标判别的方式分析是否具有发展前景的技术形态或技术发展点。目前主要算法包括基于LOF、K-means、基于密度的聚类算法(density-based spatial clustering of applications with noise,DBSCAN)以及组合方式的异常检测算法。

Yoon 等[18]将离群点检测用于专利语义分析来识别新的技术机会,识别出的离群专利可以作为评估可能的新技术机会领域的起点。Lee 等[63]通过文本挖掘来抽取用途关键词特征和局部离群因子,以此衡量 机会的新颖程度。Rodriguez 等[64]认为离群专利具有3 个特征:不与其他专利高度聚类、引文网络中节点中心度低以及与网络中其他专利的相似度低,并在此基础上提出了面向专利引文网络中的离群点排名方法。翟东升等[65]通过构建相似度矩阵进行多维尺度分析,基于多种异常检测算法组合识别潜在的技术机会专利,结合TRIZ 方法挖掘出技术机会。李登杰[66]基于专利相异距离降维及可视化,利用4种异常检测算法对专利数据集进行异常检测,筛选出每个异常检测算法下的异常专利点,最终生成异常专利集。Zhang 等[67]研究边缘属性并提出了离群节点识别算法,认为通过分析离群节点和边缘的真实性,能够揭示出图的潜在结构与属性,具有巨大应用潜力。在此基础上,Kim 等[68]基于引文网络中边缘离群点识别不同技术领域融合产生的潜在创新机会,认为边缘异常点是引文网络中重要的中心连接,在这些专利的协同组合中可能出现新的机会。Wang 等[69]提出了基于角度的异常检测算法(anglebased outlier detection,ABOD),作为一种新颖的检测统计方法用于确定高维空间中的离群专利。

现有研究的经验显示,异常检测算法优于其他类似算法,可以识别具有任何形状的自然聚类,过滤掉局部的异常值,且其近年来数据处理量有较大的提升,与其他文本挖掘方法相结合的复合型方法不断扩展。

3.2.2 机器学习

机器学习方法是算法经过训练,从过去的经验中学习和预测未来并作出相应的决策[70]。整理技术机会分析文献中涉及的机器学习方法,包括生成式拓扑映射(generative topographic mapping,GTM)、隐含狄利克雷分布(latent dirichlet allocation,LDA)、深度学习、关联规则、协同过滤、多维尺度分析(multidimensional scaling,MDS)、神经网络等,如图4 所示。

图4 主要的机器学习方法

早期对机器学习的相关算法原理大致可以分为:(1)自组织特征映射(self-organizing mapping/selforganizing feature mapping,SOM/SOFM),即利用已训练的无监督学习以产生低维(二维),可以将专利之间复杂关系和技术进步的动态模式可视化[71]。该方法基于无监督学习神经网络形成目标网络节点,但对技术要求较高,不能逆向解释映射。(2)采用基于特征向量算法的主成分分析(PCA),减少关键字向量的数量,使其适用于二维地图。它可以用更少的变量解释更多的原始变量,但可视化程度有限,不能进行预测。Aaldering 等[72]提出了一种结合主成分分析和协同过滤,推荐未开发的并购机会。(3)GTM 是一种利用贝叶斯理论将多维数据空间映射到低维潜在空间的概率方法,主要是将潜在空间映射到数据空间的过程。Yoon 等[73]将形态分析和GTM 相结合来识别技术配置,并将收集到的专利信息可视化,确定必要的技术和潜在的合作伙伴。吴菲菲等[74]提出了采用GTM 来帮助识别3D 生物打印技术的专利空白点。GTM 方法可以减少人工干预,使结果具有可解读的空间,实现反向解释,也可以形成客观的网络节点来帮助解决分类、聚类和可视化的问题,但对参数设置比较敏感、技术要求较高,需要专业技术人员的经验,结果因人而异。

近5 年该领域的研究与应用逐渐丰富,数据处理量也上升到了万级和百万级。李冬梅等[75]采用马尔科夫区制转换(Markov regime-switching,MRS)方法,通过刻画半导体行业专利时序数据的动态变化路径,分析该领域出现技术机会的时间窗口。周雷等[76]基于词典和相似度的命名实体识别、基于模式的关系抽取以及基于机器学习的信息过滤几项技术以实现高效的技术机会监测。Kim 等[77]提出基于语义专利主题分析自动生成专利开发地图,将每件专利构建一个术语向量,基于LDA 主题模型识别专利的技术分类,对语义和引文相似进行敏感分析,以便对专利间的路径进行可视化。Seo 等[78]利用文本挖掘从专利数据库中提取产品信息,基于关联规则挖掘生成产品关联规则,通过衡量产品机会的潜在价值,从企业内部产品组合中识别产品机会。Yoon 等[79]结合GTM 和链接预测对专利信息可视化来进行技术机会分析。包清临等[80]采用概率潜在语义分析(PLSA)算法,结合文本挖掘、MapReduce 计算框架和熵权-TOPSIS 法,构建三维的专利预测模型以挖掘潜在的技术机会。Shen 等[81]采用文本挖掘和任意导向投影聚类(ORCLUS)算法对重要科技主题进行聚类,利用TF-IDF 向量的余弦相似度来检测聚类科学领域与技术领域之间的语义相似度,以识别潜在的科学进步或技术商业化机会。Feng 等[53]收集与产品相关的专利文献,利用LDA 主题模型识别商业主题,基于GTM 识别技术空白和技术驱动的商业机会,并进行动态评估和排序。Teng 等[82]采用自然语言处理方法对专利文本进行预处理,利用监督机器学习方法将文本表示为关键词向量并进行K-means 聚类,通过GTM 将专利在二维空间可视化,以确定未来的研发战略。许学国等[42]基于Bert-LSTM 文本分类模型对论文及专利数据的主题识别,利用自然语言处理(natural language processing,NLP)识别出不同研究领域的关键技术词,基于GTM 算法绘制技术地图,通过对空白新兴技术点逆向映射进而实现对技术创新机会的有效识别。吴一平等[83]基于产品在线评论、论文、科技报告、专家知识等数据源,提出一种融合评论主题识别与技术属性多维度分析的技术机会发现方法,基于并行潜在狄利克雷分布模型(parallel latent Dirichlet allocation,PLDA)识别筛选新兴重点技术评论主题,通过相关性计算分布得到与评论相关和与新兴重点技术评论主题相关的技术属性。分析产品重要技术属性的特征情况,最终识别出蕴含在评论文本中的新兴技术机会。

总而言之,机器学习与技术机会分析的研究应用是算法经过调试与训练后,从过去的经验中学习和预测未来,从而为决策提供基础。从效果来看,不仅可以高效地处理大量数据(数据来源多元化,数据量上升至万级、百万级),还可将专利之间复杂的关系和技术进步的动态模式可视化(技术机会监测、专利研发路径可视化、专利机会预测、动态评估排序等);另外,通过将多维数据空间降维,可以提高对数据分析结果的分类、聚类能力,并增强结果可解释性。因此,机器学习与技术机会分析具有广阔的应用前景。

3.2.3 链路预测

链路预测是一种检测当前网络中缺失的链路并预测未来网络中新的链路的技术,可引入多种算法以解决链路预测中针对不同类型网络(异构和二模)和链路(多关系、活跃/不活跃、出现/消失)的预测问题,主要分为4 种类型。链路预测在技术机会分析中的原理是通过现有技术网络的结构、节点和边的相关信息,识别预测网络可能产生链接的节点,包括时间和空间上的未知链接(missing links)和未来链接(future links),即视为技术机会。Yoon 等[42]利用链路预测界定和选择领域技术机会,并用技术空白的后续填补情况来验证方法的有效性。翟东升等[24]基于国际专利分类表(IPC)建立引用网络,将IPC 之间的新引用或增强引用作为知识流动形式的领域技术机会,计算特征指标、训练基于SVM 的未来链接预测模型,以及计算网络节点带权特征指标,利用线性回归获得连接边权的预测模型,分别预测可能首次出现的技术流动与未来会更深度融合的技术。Yoon 等[79]对生物技术和信息技术领域分别建立专利引用网络,利用有向网络链路预测潜在的技术知识流动(TKFs),将潜在的增加和新出现的知识流动视为融合技术机会。

总的来说,链路预测在技术机会分析中的应用是通过分析现有技术网络的结构和相关信息(节点对之间的相似性、拓扑特征、语义特征、属性特征等),构建连接边权预测模型,识别可能产生连接的节点(时间与空间),并将这些连接视为技术机会。链路预测在界定和选择领域技术机会方面的研究不断增多,但仍需要进行多领域验证和理论体系的深入研究。

3.2.4 SAO 语义分析

SAO 语义分析是一种基于TRIZ 的面向事实的建模技术,在技术机会分析中的应用较多。该类方法利用从科技文本中提取SAO 结构识别相关的技术元素及其关系,基于SAO 结构相似度或SAO 的专利相似度分析知识之间的语义链接,聚类识别空白点、离群专利等技术机会。后期学者们在SAO 结构单元的基础上进一步提出了SAO 结构链,即将多个SAO结构关联形成语义链条,获取特定技术领域部件/技术/材料/性能的层级关系,挖掘潜在的技术关联以识别出技术机会。近年来的研究提升了技术信息挖掘的细粒度,将SAO 与其他专利挖掘方法更紧密地结合:(1)SAO 与形态分析相结合,如Wang 等[84]利用SAO 结构描述技术组件之间的结构关系,基于形态分析构建了基于SAO 的技术组件和属性的关系矩阵;(2)SAO 与TRIZ 相结合,如Kim 等[85]在SAOx 中提取动名词形式以获取技术目标和效果,引入439 个TRIZ 工程参数和技术术语来表示SAO;(3)SAO 与技术路线图相结合,如李乾瑞等[34]引入SAO 结构“问题—动作—解决方案”识别问题与技术方案对,以揭示新材料、新技术或新技术组合,利用技术路线图展示技术方案演化路径;(4)SAO与功效分析相结合,如Wang 等[84]通过形态矩阵中的两种SAO 结构分别形成技术构成和技术属性,建立技术功效矩阵来确定满足市场需求的技术方案。

4 结论及展望

数据驱动的技术机会分析可以高效地从大量数据中识别创新机会,为技术进步与企业发展赋能。通过系统地梳理国内外相关研究工作可见,现有技术机会发现与识别方法正在借助大数据分析方法的优势形成一套系统、规范化的研究范式。具体而言:

从研究对象来说,专利技术创新机会的内涵日益丰富,不再局限于热点、空白点、孤立点、离群点等单一的界定方式,其知识表示方法在融入技术创新需求中逐步完善与拓展。首先,技术机会在知识元素结构提取的基础上以一个或多个显著特征组合来表示或定义,技术空白点、技术差距、孤立点、离群专利、共现网络、新链路等特征来自研究人员或专家过去的经验,并作为区分机会和非机会的过滤器[1],专利技术创新机会的内涵已拓展到组合/融合技术、未来可能突显的新技术形态或新兴技术、“卡脖子”技术、颠覆性技术等相关领域。其次,大数据分析能集成数据挖掘、机器学习、自然语言处理、信息检索和知识管理等方法,从非结构化或半结构化文本中快速、大量、有效地提取重要的、隐藏的、先前未知的可能有用的知识,也将进一步拓展知识表示方法的创新。

从数据源来说,多源异构数据为专利技术机会分析提供了动态、实时、多元化研究视角,应用场景从回顾性的趋势监测转向未来需求的技术预测与风险评估,支撑产业和企业实际需求的研究较少。不同的信息源揭示技术发展的不同阶段信息,单一或同类型数据源分析已不能满足当前研究的需求,多源异构信息源的处理、序化、关联和融合分析均依赖大数据分析方法的支撑。大多数技术机会分析采用的是能够揭示技术信息的专利作为信息源,也有一些研究将专利与论文、产品评论、WordNet 数据库、维基百科等多源数据相结合,未来的突破将聚焦在多源异构信息深度融合分析的技术上。其次,目前大部分研究是将技术发展过程中的性能改进、技术组合、技术汇聚/融合作为技术机会形成的重要途径,从特定技术领域知识、技术、市场和产业现象演化出发拓展,以往基于回顾性的趋势监测已逐渐转向面向未来需求的技术预测与风险评估,包括预测新兴技术、评估技术发展路径的风险与机会、研发和产品开发的优先级等。其中,国内学者对中观技术层面的应用场景关注较多,聚焦在技术布局与预警上,对于支撑产业和企业实际需求的技术机会分析较少。

从分析方法来说,组合运用文献计量、社会网络分析与大数据分析,方法创新由单一特征的同质网络向融合特征的异构网络发展,所挖掘的技术细粒度越来越高。早期定量分析方法主要综合运用技术监测、文献计量学和社会网络分析来识别趋势性知识元素潜在的技术机会(若干科技领域形成的主流群落、热点领域、空白区域等)。例如,基于文本特征的相似性构建映射关系,可视化展示新颖性或尚未被现有专利占据的技术空白点,方法改进集中在主成分分析、自组织特征图和拓扑映射等降维方法上。其次,混合型专利挖掘方法显著提升了专利技术挖掘的细粒度,例如,语义TRIZ、形态分析、技术路线图、技术功效分析等多种方法相结合,将多个知识结构关联形成语义链条,获取特定技术领域部件/技术/材料/性能的层级关系,挖掘丰富的技术信息与潜在的关联以识别出技术机会。基于形态分析或语义TRIZ 重新改进或组合技术形态,利用SAO 结构或机器学习方法抽取与表示技术文档,通过实现与技术组件与效果重新组合匹配,获得新的技术方案和启发。随着文本挖掘、自然语言处理技术的发展和成熟,基于多源数据内外部特征的知识融合方法还有待完善。

技术机会分析的理论研究与实践应用已经取得显著成效,但是,现有的技术机会分析文献在分析思路、效果和技术细节等方面仍然存在一定的局限性:

(1)现有方法对于关键技术性能的识别仍依赖专家,由于性能指标之间的因果关系不明,专家需要对不相关的技术机会、不重要的技术性能指标以及不可行的研发方法进行审查与过滤,但由于验证困难,大多数方法都没有对技术机会进行充分说明和解释,因此,研究结果的可靠性仍然不确定,在实践中也无法产生具体可行的研发想法。

(2)专利技术创新机会内涵不仅涉及技术本身,更是由基础研究为产业创新提供知识基础、产业应用反馈刺激催生基础研究的进步,是科技知识融合滋养了探索新技术机会的过程,但现有方法主要将技术机会的分析对象限定为“空白”“离群”“异常”或“相似”等显著特征的知识结构子集,无意中过滤掉某些候选技术,很可能潜在地缩小了隐性关联的技术机会空间。此外,现有基于经验将具有某些显著特征的特定知识元素或空白、离群等空间位置表征为技术机会,缺少对技术创新主体的外在需求和技术机会内在本质的研究,所识别的技术机会与经济和产业急需解决的科技问题联系薄弱。

(3)目前方法侧重于宏观、中观层面较为粗略的技术领域机会探测,支撑产业和企业实际需求的专利技术机会分析研究较少,从科学到技术、技术到产业的机会分析链条还不完善。同时,现有方法创新以单一外部特征同质网络为主,基于融合特征的多源异构网络分析方法还有待突破。

在技术机会分析研究领域,未来将延续大数据驱动赋能技术发展的趋势:(1)专利技术机会分析内涵、研究内容随现实需求拓展、深化;(2)聚焦在多源异构信息深度融合分析的技术上,以便充分利用多源信息的多维性和功能的多元化;(3)开发“规则+统计+知识库+交互”大数据智能创新工具。在综合应用各类方法提高定量分析效度的基础上,结合专家专业知识完善技术机会对象特征、性能指标,从而更深入地揭示技术机会细节,更好地支撑企业甚至国家的科技战略规划。

猜你喜欢

机会专利分析
专利
隐蔽失效适航要求符合性验证分析
给进步一个机会
发明与专利
最后的机会
电力系统不平衡分析
给彼此多一次相爱的机会
没机会下手
电力系统及其自动化发展趋势分析
专利