新兴技术创新机会识别方法研究
2018-12-20李乾瑞郭俊芳朱东华
李乾瑞,郭俊芳,朱东华
(1. 北京理工大学 管理与经济学院,北京 100081; 2.北京理工大学 信息与电子学院,北京 100081)
一、引言
当前,技术创新已经成为我国提升核心竞争力、建设创新型国家的根本选择。企业作为技术创新的主体,如何在新兴技术产业研发与应用中占得先机,实现弯道超车,对于企业乃至国家推动创新发展,赢得发展主动权具有重要的战略意义,已成为当前研究的热点。为此,本文尝试深入文本层面对新兴技术专利数据进行挖掘,分析新兴技术演化路径并识别未来可能的技术机会,这对于企业推进技术创新和研发决策具有重要的理论研究价值和现实指导意义。
SAO (subject-action-object, 简称SAO) 语义分析方法作为一种新兴的研究方法。2004年,由Verbilsky将其引入到TRIZ理论中,并结合文献计量方法提出了“语义TRIZ”模型[1]。该方法作为语义TRIZ的核心技术,在国内相关研究较少。其主要强调“关键概念”,在提取文本信息中“主语-谓语-宾语”结构的基础上,通过分析独立词组Subject(S)和Object(O)及其附近动作Action(A)的语义,来识别独立词组之间的关系。其中,如果主语S和宾语O代表系统的组件,A可以用来描述这些组件如何实现功能[2-3]。同时,如果谓语A和宾语O组合起来形成作用概念,代表需要解决的问题,那么主语S往往代表解决该问题的技术方案[4],这样SAO结构就能形成一个问题-解决方案模式,进而反映文档中特定的关键发现。
相比于传统的基于关键词的分析方法,SAO分析方法保留了关键词之间的语义关系,能更深入地剖析独立词组间的内在联系,在一定程度上确实能够挖掘出文献计量、引文分析等常用文献分析方法所忽视的信息,为学者提供技术研究、关系识别、趋势预测和相似度测量方面更详尽和准确的信息。因此,SAO方法可以很好地用于识别关键问题的解决方案。当前,该方法主要应用于技术机会识别和专利相似度分析[5]。技术机会识别方面,Janghyeok等提出了从专利信息中自动识别TRIZ趋势的方法[6];Sungchul等利用专利的SAO结构来进行技术规划[7];JoséM等将技术挖掘方法和语义TRIZ方法相结合,实现了技术趋势的快速甄别[8];郭俊芳等将SAO结构分析引入到技术路线图的构建中来识别技术机会[9]。专利相似度分析方面,Sternitzke等运用SAO结构测量专利文档的相似度,并将该方法与文献计量方法、共引用分析、共词分析和自引用关联四种方法进行了对比[10];Janghyeok等通过计算专利的SAO结构相似性来探讨专利的相似性,进而通过专利语义网络来识别技术发展趋势[11];Gerken等提出了基于SAO分析的高创新度发明识别方法[12];Janghyeok等利用专利SAO结构构建动态专利地图来识别技术竞争趋势[13];Park等利用SAO结构计算语义相似性,并结合语义TRIZ的“Reason For Jump”原理识别了可进行技术转移的潜力专利[14]。
为此,本文提出运用SAO语义分析模型来开展解决新兴技术产业重大研究问题的技术方案识别研究,并以染料敏化太阳能电池(DSSCs)技术为实证案例,证实了该方法的可行性和有效性。
二、基于SAO方法的技术机会分析模型
为有效识别未来有潜力的技术创新方案,发现技术机会,本文从领域关键问题出发,深入文本信息内部,引入SAO结构中的“问题-动作-解决方案”模式,提出了基于SAO语义挖掘的关键问题-解决方案演化路径识别模型。该模型层层深入,首先,在识别关键问题的基础上,通过主谓宾关系,识别关键问题解决方案。其次,为进一步辨析未来有潜力的技术创新方案,将技术路线图思想引入,通过展现技术方案的演化脉络及关联的方式,识别技术机会。该模型包括识别热点技术问题、挖掘面向问题的技术解决方案、追踪技术解决方案演化路径、识别创新解决方案和技术机会四个步骤,具体流程如图1所示。
(一)识别关键问题
本部分采用文献计量法进行技术领域关键词识别和统计,通过词性标记识别出可能的领域热点问题或主要研究目标(后文称“关键问题”),再结合市场调研和专家智慧对现有关键问题集进行修正,该过程将文本挖掘结果和专家智慧相结合,二者互补。文本挖掘分析结果一方面可以降低对领域专家的素质要求和依赖性;另一方面,还可以弥补专家未考虑到,而潜在在数据背后的关键研究问题。本研究中识别关键问题的过程如图2所示,其中关键词识别和热点问题分析采用VantagePoint 软件实现,具体过程如下。
图1 基于SAO语义分析方法的技术机会分析方法框架
1.制定检索策略并获取数据,构建领域数据集。确定研究主题,选择合适的期刊数据库作为数据源,制定检索策略并下载,旨在获取所有与研究主题相关的期刊数据集,构建专题数据库(TD)。
2.分析数据并确定领域热点研究问题。考虑到标题和摘要是文章的两个核心部分,包含了文章的主要内容及创新点。因此,本文选择领域数据的标题和摘要进行文本信息提取。首先,借助Search Technology公司的VantagePoint软件进行自然语言处理,提取领域高频词,并通过数据清洗得到领域研究热点词汇集。其次,依据热点词汇的词性和语义,人工识别表征技术问题或目标的关键词,在结合专家知识的基础上确定领域研究的热点问题(P1,P2,P3,……),并分别以关键词集(PK11, PK12; PK21, PK22, PK23; ……)来体现。
3.基于关键词集构建各热点研究问题的子数据集(PD1,PD2,PD3, ……)。本步骤的主要目的是为每个关键问题筛选出对应的文献集。具体做法是将关键问题的各种表达形式作为检索策略,筛选数据,进而构建各研究问题的子数据集。通过对数据集的分类,一方面,可以有效地减少不相关数据,降低SAO结构提取的数据量,提高分析效率;另一方面,可以通过关键词识别的方式,将与热点研究问题无关的记录去掉,提高技术方案获取的准确性,增强可行性。
(二)挖掘面向问题的技术解决方案
本部分的目的是通过SAO语义挖掘方法识别问题-技术方案对,进而为技术方案演化路径提供数据支持。面向问题的技术方案可以是新材料、新技术或新技术组合等。技术方案识别主要包括两个步骤。
1.提取SAO结构。在识别出领域关键问题集的基础上,借用Stanford Parser软件从文献集中提取SAO结构,其中,S和O提取效果的好坏直接影响后续的分析。SAO结构的提取可以借助Stanford Parser软件和Goldfire软件,经使用证实:Stanford Parser软件部分功能是免费开放的,可以辅助识别句法结构,但开放软件不能直接实现SAO结构提取;Goldfire软件可以提取SAO结构并开展进一步的分析,但缺点是提取的SAO结构不能导出,并且SAO结构提取准确性有待考证。因此,本文采用团队自行研发的SAO结构提取软件,该软件实现了词组的提取。在提取SAO结构的基础上,借助实验室团队开发的thesaurus进行同义词和同义SAO结构合并(Zhang和Guo, 2013),最后对SAO结构进行人工核实。
2.识别技术方案并进行分类。在问题-解决方案模型中,问题确定后,AO就是固定的,因此重点是识别对应的S来确定关键问题对应的核心技术点。具体基于SAO结构识别核心技术点的过程如图3所示。在识别技术方案的基础上,本文建立技术方案对应文献集,尝试基于文献关键词共现确定文献聚类,进而得到技术方案类别。在结合方案聚类结果和技术背景知识的情况下,实现对技术方案的分类。
图2 识别关键问题的方法流程
图3 基于SAO语义分析的技术方案识别
(三)追踪技术方案演化路径
在识别出问题-解决方案对的基础上,本部分进一步识别技术方案间的演化关系,并利用技术路线图方法将技术演化路径可视化。
1.确定技术演化路线图的形式并定义节点。新技术、新材料或新方法都可以称为面向问题的解决方案。考虑到不同的技术方案是作用于不同的产品部件,为更好地展示技术方案类别及关系,本文的技术演化路线图的形式为:横坐标是时间,纵坐标是技术方案的类别,每个节点是各技术方案。由于此处技术方案是通过SAO三元组进行识别的,所以技术方案往往是能代表完整语义的词组或短语组合。具体该技术路线图的形式如图4所示。
2.确定各节点的位置,分析节点间的演化关系,最终完成技术方案演化路线图的绘制。技术路线图绘制的主要内容包括;节点的内容及位置、节点间的关系确定。技术路线图的节点是面向特定问题的各技术解决方案,节点的横坐标是由该技术方案所在文献发表的时间确定,纵坐标是由该技术方案所属技术类别来确定。节点间的演化关系是依据文献摘要中提取的SAO结构语义来判断。如果文中提到技术方案2是在前人技术方案1的基础上(依据参考文献)提出来的,则技术方案2和1之间有有向连线;如果技术方案2是在多个技术方案基础上提出来的,则选择离其最近的同技术类别的技术方案进行连线;如果文中并未提到其他技术方案,则该技术方案与其他技术方案没有连线(如图4所示,红色圈中的节点即为此类技术方案)。最后,我们借助专家知识,进一步对技术方案间的演化关系进行修正与补充。
(四)识别创新解决方案和技术机会
面向问题的技术方案演化路线图直观地展示了技术方案的演化路径及功能类别,对技术研发人员和企业决策者宏观把握问题-解决方案发展脉络具有重要意义。面向问题的技术方案演化路线图主要回答以下几类问题。
1.特定技术领域核心的研究问题/技术目标有哪些?
2.解决特定问题的技术方案有哪些?各技术方案是作用于何部件?技术方案间是如何演化的?
3.技术方案是什么时间由哪些国家的学者提出的?不同国家研究重点及趋势如何?等问题。
三、实证研究——以染料敏化太阳能电池技术为例
染料敏化太阳能电池技术作为第三代太阳能电池,由于其原材料丰富、低制造成本和制作工艺简单等优势,成为未来有潜力的新兴技术。因此,本文选择DSSCs技术开展实证研究,分析结果对新能源领域的技术研发规划和产业政策制定具有重要意义。
(一)数据准备与关键问题识别
1.本文以Alan Porter教授等学者所构建的DSSCs技术领域的检索策略为依据[15],基于研究技术发展路径的实际需要,选择基础研究数据库SCI-Expanded作为数据源,数据检索年份跨度为1981-2014年,文献类型为Article,共得到期刊文献有效数据7884条。
2.运用Search Technology公司的Vantage Point软件对数据进行关键词提取,发现排名前四的问题类关键词及其词频为:Conversion efficiency (551);LOW-COST (315);PHOTOVOLTAIC PERFORMANCE (143);STABILITY (111)。本实证部分选择conversion efficiency作为领域关键问题,分析与挖掘提升DSSCs电池转化效率的各技术方案。
(二)提取SAO 结构并识别问题-解决方案
1.利用Stanford parser 软件对7884篇文章进行SAO 结构提取,通过固定SAO结构中AO(提高转化效率)的方式,筛选得到303条SAO结构,经人工修正后最终得到有效SAO结构227条,具体SAO结构筛选过程见表1。其中,SAO结构中的O为conversion efficiency,A为编号5中的动词,该动词列表是在Stanford Parser软件词性标记的基础上,提取并统计词性为VB/VBN/VBZ/ VBD/VBG,且能表达转化效率提升含义的动词。
图4 面向问题的技术方案演化路线图的形式
编号SAO结构筛选过程数量1下载到的期刊文献78842包含conversion efficiency的文献30563提取SAO结构,筛选包含conversion efficiency的SAO结构37204筛选代表电池整体转化效率的SAO结构(包含overall conversion efficiency、cell conversion efficiency、photoelec-tric conversion efficiency)4055筛选问题为“提升转化效率的SAO结构(action(A)为Improve、enhance、increase、achieve、yield、found、reveal、a-chieve、attain、provide、obtain、exhibit、result in)3036修正(人工合并相近SAO结构)227
2.在步骤1得到的227条SAO结构(如表2 所示)的基础上,通过分析与“AO”结构串连接的“S”,可以得到提升电池转化效率的关键技术(或技术解决方案)。
3.通过对227条SAO结构进行分析得到提升电池转化效率的技术方案。而调研发现:DSSCs包含半导体光阳极、染料敏化剂、电解质溶液、对电极四个部件,故依据非正式专家意见和聚类分析结果,我们最终将关键技术方案按所属部件进行分类。鉴于关于半导体光阳极的研究较多,我们结合调研结果和专家知识,进一步将半导体光阳极单独进行分析,并从对光阳极的改进方式入手,将提升电池转化效率的技术方案划分为表面处理、复合结构、掺杂技术、改变微观结构、TiO2制备方法和新材料研发六大类,具体见表3所示。此处,技术方案分类有助于决策者直观地看出各技术方案所属部件及采用的改进方式,更好地理清各技术方案间的关系和脉络,支持决策。
(三)识别提升电池转化效率的技术方案演化路径
为进一步分析提高DSSCs光电转化效率的各技术解决方案,了解解决方案随时间的演化过程及关系等,作者引入技术路线图的概念,按照上表3的技术方案分类及对应的SAO结构,构建关键问题-核心解决方案的技术路线图,进而更加直观、深入的分析和识别新兴技术的发展路径。本部分仅选取部件光阳极为例,展示核心部件的技术方案演化路径,如图5所示。其中,各节点的形状代表国家,不同的节点形状表示该技术方案是由不同国家的学者提出来的。
表2 提升DSSCs整体转化效率问题的SAO结构示例(8/227)
表3 关键技术方案分类表
光阳极材料作为影响DSSCs电池转化效率的重要组成,相关学者围绕光阳极开展的研究较多。我们分别对表面处理、复合结构、掺杂技术、改变微观结构、新材料研发五类技术进行单独分析(图5),可以发现如下五条路径。
1.表面处理方式:表面处理是提升电池光电转化效率的有效方式。因此,许多研究学者开展表面处理相关的研究来进行光阳极薄膜性能的改进。具体包括:treating TiO2with pyridine derivatives, “TiCl4,”“metal hydroxide,”和“3-aminopro pyltrime thoxy silane (APTS)等。当然,一些新的混合物,如“TiCl4”“Nb2O5”“MgO”“HCL”“g-C3N4”等,也可用来对TiO2薄膜进行表面处理来提升TiO2薄膜的性能。
2.TiO2复合结构:包覆结构在提高光阳极材料性能方面显现出明显的优势,包括:CaCO3、SiO2包覆TiO2结构等。具体的研究演化路径如下:bilayer nonporous(2001)TiO2nanorod (2004)rough TiO2spheres(2007)Surface-passivated TiO2nanotube arrays(2008)LbL technique(2009)TiO2-B NBs(2010)BTs and PCTs nanotube arrays(2010)TiO2-NSs/graphene(2011)。
3.改变TiO2微观结构来提升电池光电转化效率:与复合结构相类似,改变TiO2微观结构也可以影响电池整体效率。TiO2的微观结构包括TiO2颗粒大小、厚度、性质和孔隙度等。为提高电子传输寿命,减少载流子复合,纳米管阵列、纳米线阵列等一维传输结构渐渐受到各国学者瞩目。
4.在TiO2薄膜中掺杂其他物质进行光阳极薄膜性能改良:运用掺杂技术改进TiO2薄膜来提升电池转化效率的研究较多。385篇文献中都提到了TiO2掺杂技术,其中166篇文献提到了提升电池转化效率。总体来说,用于掺杂的材料包括离子、原子和半导体化合物,如:Ag-TiO2、ZnO coated TiO2nanoparticles、Nd-doped TiO2、La-doped TiO2、N-doped TiO2、BaCO3-modified TiO2、N-F-doped TiO2electrode、Mg-doped ZnO、 Zn,N-TiO2、Second metal oxide (MgO, ZnO, Al2O3, or NiO) doping technology等。
基于路径④,我们可以发现一些新的解决方案往往是多种方法的综合。例如:Zn-N-doped TiO2electrodes (2011) 是在 N-doped TiO2(2009)的基础上再掺杂Zn;ZnO nanorod arrays with Al3+(2013) 是Al3+-doped TiO2和改变TiO2微观结构两种方式的结合。此种将多种技术改进方法相结合实现互补也是未来技术发展的趋势。
5.除了TiO2光阳极以外,ZnO、Al2O3、Nb2O5、SnO2、NiO等其他宽带隙半导体光阳极材料也引起学者重视,成为未来替代TiO2的选择。为进一步提升电池转化效率性能,学者在新材料的基础上,进一步通过改变材料结构和使用掺杂技术等来实现性能的提升,这些技术方案包括:ZnO coated with Ga, sheet-sphere ZnO, ring-and flower-structured ZnO, hierarchical ZnO nanorod, and hierarchical ZnO nanourchin等。其他技术方案包括用SnO2film treated with water vapor, using tri-layer film structure, Al2O3/NiO, aluminum oxide, graphene composite material, hierarchical SnO2and composite material做光阳极等。
(四)基于技术方案演化路线图的技术机会分析
1.提升电池转化效率的技术方案分析
半导体光阳极材料是各国学者研究的重点,其中运用掺杂技术改进TiO2薄膜改进的研究较多。包括:ZnO coated nanoparticles、Nd-dopedTiO2、La-doped TiO2、N-doped TiO2、Zn,N-TiO2、second metal oxide (MgO, ZnO, Al2O3, or NiO)等。除掺杂技术外,为提高电子传输寿命,减少载流子复合,纳米管阵列、纳米线阵列等一维传输结构也渐渐受到各国学者瞩目。同时,包覆结构也显现出其明显的优势,如CaCO3、SiO2包覆 TiO2结构等。除了TiO2光阳极以外,ZnO、Nb2O5、SnO2等其他宽带隙半导体光阳极材料也引起学者重视,成为未来替代TiO2的选择。
2.不同国家研究重点及趋势分析
各国研究者就电池转化效率问题开展了大量研究,半导体光阳极材料的选择和处理是影响电池转化效率的重要因素,主要国家集中在中国、韩国、美国、日本、台湾地区等。其中,2005年前,太阳能电池的研究还较少,处于起步阶段;瑞士、美国、日本和以色列等国专家从不同的角度,提出了提升电池转化效率的技术解决方案,主要包括:通过改变TiO2薄膜的结构和管长壁厚等、掺杂Sn/Zn氧化物等、TiCl4表面处理等来提升光阳极的电子收集和传递能力,进而提升电池转化效率,具体方案包括:10-25 nm in thickness、ZnO coated TiO2nanoparticles、SnO2/TiO2composite cell、TiCl4treatment等。从2006年开始,围绕太阳能电池转化效率的研究逐渐增多,对半导体光阳极材料的选择与处理也多样化,主要以中国和韩国的学者为主,其次是日本、台湾地区、美国等。中国也正是从2006年开始对DSSCs的研究逐渐增多,成为DSSCs研究的主力,中国学者发表的文献数量占DSSCs领域总文献数量的近26%,在提高电池转化效率研究方面占总量的近一半。
以上分析结论,作者通过对DSSCs领域的文献综述阅读和2015-2018年的文献数据两种方式进行了验证,实证结果中对技术方案及其演化路径的宏观分析与判断基本符合领域实际,故验证了本文分析方法的可行性和有效性。
图5 光阳极提升电池转化效率的技术演化路径图
四、结论
本文以语义TRIZ 理论为指导,在提取文献标题及摘要中的SAO结构的基础上,识别解决新兴技术产业重大研究问题的技术方案。同时,借助非正式专家意见对技术方案进行功能属性划分,并结合技术出现时间,构建了纵坐标为不同部件技术解决方案的技术演化路径图,进而来识别解决领域关键问题的各技术方案及其关联关系和演化路径。最后,作者将该方法应用于DSSCs进行了实证探索,证实了该方法的可行性和有效性。
该方法主要具备两大优势,在方法层面,将SAO结构分析创新性地引入到技术演化路径识别当中,依靠SAO结构在主-谓-宾关联度揭示方面的优势,实现了问题和解决方案的对应识别,弥补了基于关键词等常用文献分析方法的不足,可为解决发明问题和深层了解技术解决方案演化情况等提供有效的数据支持。此外,本文虽仅选取一个技术领域为例开展实证研究,但本文提出的方法模型在不同的技术领域同样适用。在实际应用层面,该方法不仅能为决策者提供某一问题的具体解决方案及演化路径,也能提供各解决方案之间的关联关系和各主要国家的技术研发重点及研究趋势,这对未来推进新兴技术产业突破、指导企业技术创新及研发决策等具有重要意义。
然而,本文方法也存在一定的局限性。一方面,该研究仅针对特定关键问题来进行挖掘,无法反映技术发展的全貌同时,SAO结构提取的准确性和规模直接影响到技术发展路径识别的准确性和可信性。另一方面,虽然摘要被认为是整篇文章中最具代表性和价值的部分,但由于简短并不能完整反映整篇文章使用的所有技术和解决的所有问题,如果对全文进行SAO 结构提取,所得结果亦将更具说服力。这些都是未来有待进一步深入研究和改进的问题。