基于DEMATEL 专利模型的技术影响关系研究
2021-01-11李小春
周 洪,梁 希,魏 凤,李小春
(1.中国科学院武汉文献情报中心,湖北武汉 430071;2.湖北省科技大数据重点实验室,湖北武汉 430071;3.爱丁堡大学商学院,英国爱丁堡 EH8 9JS;4 中科院武汉岩土力学研究所,湖北武汉 430071)
任何技术都不是孤立的,总是同其他技术存在着相互作用、相互依存的影响关系,进而形成技术体系。通过这种技术影响关系,一种技术类型的变化会导致相关技术类型的链式变化,从而推动技术体系或技术领域的发展和演化[1]。因此,开展技术影响关系的研究十分必要。通过探讨技术间的相互影响关系、挖掘技术发展模式和规则,有利于发现技术或产品的新机会、支撑技术研发政策和计划的制定[2-3]。
专利文献作为技术信息的有效载体,包含大量的技术知识[4],是研究技术影响关系的重要切入点。目前,国内外学者基于专利文献,开展技术交叉影响的研究日益兴盛,并取得较为丰硕的成果,相关方法主要集中在专利引文分析、交叉影响分析等。引文分析是了解专利技术间的依存关系和相互作用、识别知识流动和发展轨迹的常用方法。Park 等[5]使用专利引文网络,识别建筑信息模型的技术结构和知识流特征;Lee 等[6]使用美国专利引用信息,构建移动生态系统中技术知识流的网络结构;杨中楷等[7]基于专利引文网络对不同技术领域间的关系进行考察,通过追踪不同技术领域间的专利知识流动展现网络的宏观特征。然而,引文分析存在一些缺点,如引用和被引用专利间的平均时间太长[8];引文分析仅考虑个别专利之间的引用关系,难以从技术领域角度确定技术相关性和特征、引用容易受到人为主观决策的影响[9],申请人和审查员由于受自身属性限制和外部环境约束,分别具有不同的引证动机,造成专利引证行为和结果迥异等[10]。为了解决引文分析限制,研究人员也尝试使用其他专利信息分析技术关系,如共引分析、共词分析和关键词向量分析等[11-15]。然而这些方法仍存在缺点,如共引分析中仍存在时滞问题,共词分析、关键词向量分析需要对技术进行定性判断。
交叉影响分析(cross-impact analysis,CIA)可以定量分析技术之间的交叉影响,确定专利技术间的核心技术和相互关系[16]。它基于专利的共同分类特征,如国际专利分类(IPC),而不是根据个别专利开展分析,并且不存在时滞问题。交叉影响法的概念最早由Gordon 等[17]提出,根据事件间的相互作用来修正未来事件的估计概率[18],对事物发展前景进行预测,并经过许多研究人员的改进,如基于模糊逻辑的交叉影响模型、比较交叉影响指数确定关系特征、层次分析法和交叉影响法结合来预测概率等[19-21]。Choi 等[16]最早提出将交叉影响法应用到专利数据,研究技术之间的影响关系,并应用了关联规则的思想提取对象关系。马荣康等[22]使用Choi 等的方法,构建了不同纳米技术领域交互影响模式的分析框架,并利用社会网络理论中的“核心一边缘”模型分析纳米技术交互影响网络。黄斌等[23]针对Choi 等的方法存在的不足,开展了判断影响类型、定量划分技术对影响关系、分析单个技术影响的研究,并对汇聚技术的汇聚趋势开展了实证研究[24]。Jun 等[25-27]提出了分析IPC 分类号的关联规则和映射方法,并使用搜索的数据库技术专利文档进行实验,并将关联规则挖掘结合自组织映射来预测图像和视频技术的空白技术,结合时间序列来预测生物技术。Kim 等人[28]提出了关联规则挖掘结合分析网络过程(ANP)来寻找技术间的相互作用。然而,上述研究往往侧重于研究技术之间的直接影响关系,较少考虑技术之间的间接影响关系;同时,上述研究只考虑了技术之间的单一关系,没有充分考虑某个具体技术在技术体系中的作用,以及整体影响情况。
针对目前的研究现状,本文提出一种基于DEMATEL 模型的技术影响关系研究方法,可以识别技术间的直接影响关系和间接影响关系,还可以展示单个技术在技术体系中的位置和作用,从而全面了解专利技术间的交叉影响和内部结构,以期为技术影响关系提供一种新的视角和方法。
1 DEMATEL 专利模型的构建
1.1 构建直接影响矩阵
通常,一项技术与两项或多项技术有关。就专利而言,一项专利可能具有两项或多项权利要求,每个权利要求都被分配了一个分类,因此专利可以具有多个专利分类号。专利是根据与特定行业或具有相似功能、用途或结构的主题相关的技术进行分类的,每个专利都可以代表一种单独的技术。与之前的研究相同,本文假设每个IPC 分类号都代表一种技术,技术之间的影响可以从专利的这种特征中得出。
本文使用Choi 等[16]提出的专利交叉影响分析法,来构建技术直接影响关系矩阵。交叉影响分析法可以看作是关联规则挖掘(Association Rule Mining,ARM)在专利分析中的应用。关联规则挖掘(Association Rule Mining,ARM)由Agrawal 等[29]提出,通过找出数据项的共现模式来生成不同项之间的关联规则,已广泛应用于零售、金融、医学、互联网等多个领域[30-33]。本文定义IPC 分类号(技术)i对IPC 分类号(技术)j的影响关系为:
1.2 构建综合影响矩阵
在技术直接影响关系矩阵的基础上,使用决策试验和评价实验室(Decision-Making and Trial Evaluation Laboratory,DEMATEL)模型,分析技术间的直接影响关系和间接影响关系。DEMATEL 由Gabus 等[34]提出,运用矩阵计算工具与图表相结合,对系统中的各因素的影响程度进行分析,已运用于技术选择、关键因素识别等[35-38]。该方法可以对各因素的影响程度进行定量排序,按照相关指标分类,还充分考虑了各因素间的因果关系。
其中I为单位矩阵,的逆矩阵,通常采用LU 分解法求解逆矩阵。中的,表示技术i受到技术j的综合影响大小。
1.3 构建技术交叉影响图谱
其中D为T的各行矩阵的值之和,表示各行对应技术对所有其他技术的综合影响值,即影响度;R为T的各列的值之和,表示各列对应技术受到所有其他各技术的综合影响值,即被影响度。
综合考虑技术的影响度和被影响度,确定系统因素的中心度向量Z和原因度向量Y。
中心度反映的是该技术在整个系统中的地位与作用,中心度的值越大,说明该技术在整个系统中的作用越大。原因度反映技术是原因因素还是结果因素,当原因度为正值时,表示该技术主要影响其他技术,是施予影响的技术;当原因度为负值时,表示该技术主要受其他技术影响,是受影响技术。
考虑技术的中心度和原因度,以及技术综合影响矩阵,可以构建技术交叉影响图谱,直观展示出技术的交叉影响关系,反映出单个技术在技术体系中的位置和作用,并有助于识别关键的专利技术。其中,节点代表技术,节点间存在有向箭头,反映技术对其它技术的影响度以及被影响度。技术交叉影响图谱的横坐标为中心度,纵坐标为原因度,根据中心度、原因度的均值,可以将技术分为四个象限。第I 象限的技术为“高—高”型技术,中心度、原因度都较高,在整个技术中作用较大,且较大程度影响其他技术,可以认为是重要基础技术;第II象限的技术为“低—高”技术,中心度较低、原因度较高,在整个技术中作用较小,且影响其他技术,可以认为是一般技术;第III 象限的技术为“低—低”技术,中心度、原因度都较低,在整个技术中作用不大,且受其他技术影响,可以认为是边缘技术;第IV 象限的技术为“高—低”技术,中心度较高、原因度较低,在整个技术中作用较大,且受其他技术影响较大。
2 实证研究
地质建模技术是多学科交叉的技术,运用计算机技术,将空间信息管理、地质解释、空间分析和预测、地学统计、实体内容分析以及图形可视化等工具结合起来,用于地质分析。目前,我国在工程实践中,地质建模大多引进国外软件和技术,国产软件和技术与国外尚存在不小的差距,相关核心技术的缺乏将严重制约我国石油、天然气、页岩气和二氧化碳封存等领域的发展。本研究以地质建模技术领域为研究技术领域,开展基于DEMATEL 专利模型的技术影响关系的实证研究
2.1 数据来源和处理
本文选择汤森路透集团的德温特创新索引(Derwent Innovations Index,DII)专利数据库作为检索数据库。在相关文献调研和专家咨询的基础上,通过综合考虑技术领域关键词和IPC 分类号,设定检索策略。时间跨度为1970—2019 年,数据检索时间为2019 年12 月31 日。通过检索和清洗,得到地质建模技术相关专利(族)811 件。本文利用Thomson Data Analyzer、Aureka、excel、Rstudio 等工具对专利文献进行数据挖掘和分析。
国际专利分类号(IPC)包含了专利的技术信息,通过对地质建模技术相关专利进行基于IPC 小组的统计分析,可以了解、分析地质建模技术专利主要涉及的技术领域和技术重点等。地质建模技术主要涉及IPC 小组318 个,其中包含20 件以上专利的IPC 小组共计20 个,如表1 所示。
表1 IPC 分类小组的前20 专利技术领域
地质建模技术主要集中在以下方向:(1)地质勘测方法和数据收集,例如地球物理中地震数据的处理、综合技术手段进行勘探或探测、地震、声学、光学外的方法勘探或探测等;(2)电数字数据处理,例如计算机辅助设计、专门适用于特定应用的数字计算或数据处理的设备或方法等;(3)地质建模设计和数据处理方法,例如用于计算机制图的3D 地理建模等;(4)地质建模设备,例如用于特定的过程、系统或设备的模拟计算机、用于分布网络的模拟计算机;(5)土层或岩石的钻进。
2.2 技术影响矩阵构建
本文应用专利交叉影响分析法,创建技术类之间的直接影响矩阵。为了获得有意义的关联规则,本文将最小支持度设置为2%,最小影响关系设置为10%,同时设置提升度以避免无效规则。通过ARM生成关联规则,得到直接影响矩阵,如表2 所示。
表2 地质建模技术直接影响矩阵
根据地质建模技术直接影响矩阵,构建地质建模技术直接影响关系图,如图1 所示。图中节点代表技术,节点大小代表专利数量,专利数量越多则节点越大;带箭头的边表示技术影响关系,箭头方向表示技术影响方向,边的颜色越深表明影响越大。
图1 地质建模技术直接影响关系
生成的直接影响矩阵解释了技术间的直接影响关系,但无法解释技术间的间接影响关系,例如没有考虑F12 通过F8 间接对F7 产生的影响。本文使用DEMATEL来探索技术间的直接影响和间接影响。通过对直接影响关系矩阵迭代,得到综合影响矩阵,如表3 所示。
表3 地质建模技术综合影响矩阵
2.3 技术交叉影响图谱
通过DEMATEL 方法,得到各技术的影响度、被影响度、中心度和原因度,如表4 所示。中心度反应技术位置,即技术在整个系统中的作用;原因度反应技术的影响,是主要影响其他技术还是受其他技术影响。
表4 地质建模各技术的影响度、被影响度、原因度、中心度
从中心度指标排序来看,其大小依次为用于特定的过程、系统或设备的模拟计算机、综合技术手段进行勘探或探测、地球物理中地震数据的处理、地震、声学、光学外的方法勘探或探测、其他地球物理测量技术、地震或声学的分析。其中,用于特定的过程、系统或设备的模拟计算机是最重要的技术,属于地质建模设备方面;综合技术手段进行勘探或探测、地球物理中地震数据的处理、地震、声学、光学外的方法勘探或探测等多项重要技术,属于地质勘测方法和数据收集方面,需要重点关注。
从原因度指标排序来看,地震、声学、光学外的方法勘探或探测、地震或声学的勘探或探测、测量钻孔或井、专门适用于特定应用的数字计算或数据处理的设备或方法等技术的结果为正数,作为原因因素对其他技术产生影响;计算机辅助设计、地球物理中地震数据的处理、地震或声学的分析等技术的结果为负数,作为结果因素,受到其他技术的影响。
通过中心度、原因度,构建地质建模技术象限图,如图2 所示。第I 象限的技术为“高—高”型技术,包括综合技术手段进行勘探或探测、用于特定的过程、系统或设备的模拟计算机、专门适用于特定应用的数字计算或数据处理的设备或方法、地震、声学、光学外的方法勘探或探测,是重要基础技术,在地质建模中技术作用较大,且对其他技术影响也较大;第II 象限的技术为“低—高”技术,包括地震或声学的勘探或探测、测量钻孔或井,是一般技术;第III 象限的技术为“低—低”技术,包括用于计算机制图的3D 地理建模、测试井壁的性质;地层测试;专用于地表钻进或钻井以便取得表土或井中液体试样的方法或设备,属于边缘技术;第Ⅳ象限的技术为“高—低”,包括计算机辅助设计、地球物理中地震数据的处理、其他地球物理测量技术、地震或声学的分析,在整个技术中作用较大,且受其他技术影响较大。
图2 地质建模技术象限图
通过考虑各技术的中心度和原因度,以及技术间的综合影响关系,构建地质建模技术的技术交叉影响图谱,如图3 所示。横坐标为中心度,纵坐标为原因度,节点为技术,带箭头的连线表示综合影响关系。技术交叉影响图谱反映出单个技术在技术体系中的位置和作用,以及技术间的交叉影响关系。例如,地震、声学、光学外的方法勘探或探测技术位于第一象限,是地质建模中技术中的重要基础技术,作用较大,并且影响着计算机辅助设计、其他地球物理测量技术、综合技术手段进行勘探或探测、用于特定的过程、系统或设备的模拟计算机、专门适用于特定应用的数字计算或数据处理的设备或方法等技术。
图3 地质建模技术的技术交叉影响图谱
研发机构可以结合技术的位置和作用确定研发重点,参考技术交叉影响关系制定具有针对性的技术研发策略。在实证研究案例中,综合技术手段进行勘探或探测、用于特定的过程、系统或设备的模拟计算机、地震、声学、光学外的方法勘探或探测技术是需要重点关注的基础技术,这些技术对计算机辅助设计、地球物理中地震数据的处理、其他地球物理测量技术、专门适用于特定应用的数字计算或数据处理的设备或方法等产生较大影响;地球物理中地震数据的处理、其他地球物理测量技术也需要重点关注,主要受到地震或声学的分析、综合技术手段进行勘探或探测、用于特定的过程、系统或设备的模拟计算机等技术的影响。
3 结语
目前研究主要通过引文分析、交叉影响分析来识别技术影响关系,往往侧重于直接影响关系,较少考虑间接影响关系和综合影响关系,也没有充分考虑技术在技术体系中的作用和整体影响情况。针对目前研究中的不足,本文提出一种基于DEMATEL模型的技术影响关系研究方法,使用专利信息衡量技术影响的程度,通过专利分析技术提取所需技术要素,结合交叉影响分析方法研究了技术间的直接影响关系,利用DEMATEL 模型识别技术间的综合影响关系,并结合中心度、原因度构建技术交叉影响图谱,进行技术影响关系的深入识别。
该方法有助于发现大量专利文献数据中有价值的技术模式或规则,理清技术的中心位置和相互影响,也有助于研发机构制定具有针对性的技术研发策略。本文还以地质建模领域为例进行了实证研究,利用交叉影响分析、DEMATEL 模型等技术方法构建了技术交叉影响图谱,识别出技术影响关系,证明了这种方法在技术评估中的可行性与有效性。
但是,本研究有一些局限性。首先,本文使用交叉影响分析方法构建直接影响矩阵,使用专利的IPC 分类号代表技术,通过专利文献中共同出现IPC分类号来衡量技术关系,可能存在技术定义不明确、衡量技术关系不清楚的难题。其次,技术关系研究应该涵盖多种技术的大量技术文档,本研究只使用了专利数据,存在研究范围的局限性。鉴于本文的局限与不足,下一步研究可考虑扩大技术文档来源,综合分析论文、专利和标准等文献数据,在更深层次上研究技术之间的关系。