APP下载

需求和技术联合驱动的技术机会分析*

2022-10-19刘招斌黄晓明梁剑平

情报杂志 2022年10期
关键词:权重机会区块

刘招斌 杨 辰 黄晓明 马 建 梁剑平

(1.香港城市大学商学院 香港 999077;2.深圳大学管理学院 深圳 518000;3.中山大学管理学院 广州 510000)

0 引 言

技术机会分析 (Technology Opportunity Analysis, TOA) 是通过文献计量和技术检测的方式挖掘科研文献去获得技术知识[1],从而在特定领域实现技术的进步[2],是国家获取国际技术竞争优势的重要手段。为了抢占技术竞争的先机,科技部于2021年8月19日向各有关单位和科研人员征集颠覆性技术研发方向[3]。2020年,中国研究与试验发展 (R&D) 经费投入总量突破2.4万亿元,约为美国的54%,是日本的2.1倍,稳居世界第二[4]。然而,当前的TOA策略很难辨别出一项颠覆性技术中的各个子技术的实际发展情况,进而影响了各级基金评审对各个子技术的经费分配决策,造成研发经费的浪费,最终不利于国家获取未来的技术竞争优势。

当前TOA的策略主要有两种:技术驱动策略 (Technology-driven Strategy, TDS) 和市场驱动策略 (Market-driven Strategy, MDS) 。目前大部分研究所采用的策略是TDS,而少量研究采用MDS。TDS通过分析专利摘要及专利引用网络去寻求新的技术机会,MDS从用户评论[5]及产品[6]出发去寻求新的技术以满足市场新的需求[7]。MDS本质是需求驱动策略。然而,这两种方法都存在一定的局限性,TDS缺乏需求预测导向而无法有效识别出符合国家未来发展需求的技术机会,MDS容易忽视新兴的技术机会。随着技术发展得越来越快,“文化堕距”现象出现了,即是制度、文化、人的感知跟不上技术的发展[8]。当“文化堕距”发生时,成熟的技术已经被用于大量产品而大规模生产,新兴技术则被用于少量产品而鲜为人知,导致市场所感知的技术是成熟的技术,而容易忽略掉最新的技术发展。MDS不利于国家识别新兴技术以获取未来的技术竞争优势。

为了克服两种策略的不足,本研究提出了需求和技术联合驱动策略(Market and Technology Driven Strategy, MTDS),结合专家法和隐含狄利克雷分布 (Latent Dirichlet Allocation, LDA)去分析前沿政策文本及海量专利信息。MTDS一共有三个模块:需求驱动模块、技术驱动模块和技术机会识别模块。在需求驱动模块,利用专家知识去抽取各个子技术和子应用需求;在技术驱动模块,利用LDA去分析专利文本;在技术机会识别模块,计算了各个子技术和子应用的权重分布并根据阈值识别出了新兴子技术。期间,把专家知识融入到LDA计算的过程和结果之中,通过专家知识修正LDA的偏差。本研究还通过区块链技术的案例分析,验证了提出的策略的可行性,并为各级基金评审的区块链研发经费分配决策提供了相关建议。

1 TOA方法回顾

在早期,文献计量更多地被用于TOA[9-11]。也有研究采用比较传统的调查数据和深度访谈数据进行机会分析[12]。随着文献数量的迅速增加和文本处理技术的发展,越来越多的NLP技术以及机器学习算法被用到TOA中,如领域知识网络[13]、异常检测 (LOF)[14]、生成地形图[15]、链路预测[6]、LDA[16]、SAO[17]等。此外,有学者还利用深度学习算法进行技术机会发现[18-20]。

不同的方法各有优缺点。其中,LDA主题模型是一种能够有效挖掘和发现文本数据中潜在主题的非监督学习方法[21]。LDA利用概率模型将文档向量化,然后采用词袋模型进行主题聚类或文本分类,可以有效地从海量文本信息中挖掘隐藏主题[22]。此外,由于LDA识别出来的每个主题的概率分布不同, 概率较高的主题是文档集的核心主题,概率较低的主题是文档集中的边缘主题或者新兴主题[23]。因此,LDA适合于海量文本的主题挖掘,并且LDA识别的主题概率分布适合于核心主题以及新兴主题的识别。因为LDA的优势,近年来,LDA被越来越多国内外的学者用于技术主题识别和机会分析当中。因此,本研究也将利用LDA进行技术机会分析。

此外,作为一种非监督机器学习算法,LDA的可控程度较低。如果仅仅依靠机器学习而忽略专家知识的融入,那么结果将缺乏专业知识[16],导致所预见的未来技术不准确。Kim等认为专家的参与可以更好地解决缺乏预见性的问题[24]。为了解决LDA的误差问题,周源等 把专家知识融入到LDA的分析当中,最后成功地识别了机器人技术的未来发展机会[16]。因此,本研究将结合专家法和LDA进行技术机会识别。

2 方法设计

2.1 MTDS

本研究设计了MTDS去分析技术机会。由图1可以看出,该模型主要由3个模块组成,分别是:需求驱动模块、技术驱动模块和技术机会识别模块。过往研究主要将技术机会界定为纯粹的技术发展的可能性。而Tihanyi等认为在对技术机会进行界定的时候,除了技术因素,还应该把市场因素也考虑进去,市场因素指的是市场对技术创新的可接受的范围[25]。吕一博等认为技术机会可由技术领域和市场领域共同推动[26]。为此,本研究将技术机会定义为技术和应用两个方面的可能性。其中,应用指的是技术的应用场景。

图1 MTDS模型

在需求驱动模块中,将从技术发展政策中获取技术需求和应用需求。

在技术驱动模块中,将从所有专利数据中抽取技术主题以及从企业参与研发的专利中抽取应用主题。一般来说,学校研发的专利需要经历专利转移的过程,转化到企业后才能进行生产,而企业参与研发的专利,包括企业研发以及校企合作研发的专利,可能直接就用于企业生产。因此,为了更准确地评估技术的应用情况,本研究将企业参与研发的专利进行应用主题的挖掘。而对于技术主题,则将采用所有相关的专利进行挖掘。

在技术机会识别模块中,将识别出新兴技术和新兴应用,并将其作为技术机会。

2.2 MTDS的优势

MTDS可以弥补TDS缺乏需求预测导向的问题。技术发展政策是由诸多专家学者、企业领袖等参与制定,因此政策本身就具有比较强的未来导向。政策内容即为国家未来技术发展的需求。

MTDS可以弥补MDS 容易忽视新兴技术的问题。技术发展政策尽可能囊括了各项子技术。但是现实中的这些子技术的发展速度是不一样的,有相对成熟的,也有新兴的。然而,国家的科研经费有限,如果把政策指定的所有子技术都作为技术机会,那么基金评审可能因为“文化堕距”的感知问题把更多经费分配给相对成熟的子技术,导致新兴子技术得不到充分的发展。为此,本研究还将通过回顾专利数据的方式了解各个子技术的实际发展情况,最后识别出新兴子技术。

2.3 MTDS的方法架构

从图2可知,执行MTDS一共有7个步骤:第一,收集技术发展政策以及对应技术的专利信息;第二,利用专家知识去解读技术发展政策并梳理出技术和应用需求;第三,筛选出企业参与研发的专利;第四,结合专家知识,分别对所有专利摘要和企业参与研发的专利摘要进行LDA主题抽取;第五,利用专家知识分别给子技术和子应用主题进行命名;第六,结合技术需求和技术主题,计算出技术需求里每个子技术的权重。其中,技术需求里的部分子技术可能不会出现在技术主题中。根据主题概率分布法[23],这些未出现的子技术是新兴的,其对应主题概率很低,从而导致在有限的主题数目挖掘中这些新兴主题没有出现。因此,本研究将此部分的子技术的权重近似为0,应用主题同理。第七,利用专家知识为权重序列设定一个阈值,然后根据阈值筛选出新兴技术和新兴应用。

图2 MTDS方法架构

3 案例研究:区块链技术

案例研究具有一定的科学性和合理性,被广泛应用于TOA方法的验证。因此,本研究将做一个区块链纵向案例研究,并把国家自然科学基金委资助的区块链基金项目作为新兴技术机会的有效性和可行性的证明。

3.1 区块链技术

作为一个颠覆性技术,区块链技术受到国家的高度重视,出台了很多区块链政策,基金委资助了很多区块链研发基金,知识库出现了很多区块链专利,为分析新兴子技术和子应用提供了恰当的场景。

3.2 专家知识小组的组建

本研究一共邀请了3名研究区块链技术的在读博士生为本研究提供专家知识。其中,有两个资讯系统系的在读博士,还有一个计算机科学系的在读博士。

3.3 收集数据与筛选

本研究在中国知网 (CNKI)上检索专利,以“区块链”作为关键词进行主题搜索。截止到2021年8月29日,一共获得30 783条区块链技术相关的中国专利,其中,一共筛选出24 354条公司参与研发的专利。

以2020年5月6日教育部办公厅印发的《高等学校区块链技术创新行动计划》(以下简称《行动计划》)的通知这一技术发展政策作为本研究的政策依据。

本研究还梳理了2016-2019年国家自然科学基金委公布的有关区块链研究的基金项目,包括面上项目(19项)和青年科学基金项目(13项)。

3.4 梳理政策需求

《行动计划》主要囊括了两种需求:核心技术攻关需求和应用示范需求, 如表1所示。经过专家的解读和梳理,核心技术攻关需求一共有8大类,每一类下又有若干子技术,总共23个子技术,应用示范需求一共有9个。

表1 政策需求清单

3.5 主题提取与命名

本研究用LDA进行主题提取。为了确定主题的数目,采用Perplexity指标和专家知识相结合的办法去确定。Perplexity是一种广泛使用的性能度量,可以有效地描述语言模型的预测质量[27]。基于当前政策需求中各个子技术和应用的数目,专家建议将主题数的上限设置为30个。然后让模型自动生成1个主题到30个主题。当Perplexity值最小时,其对应的主题数量最佳。

图3 主题数与Perplexity的关系-所有的专利

由图3可知,LDA对所有专利进行主题抽取,当主题数为30个时,Perplexity值最小。经过专家的识别和命名,本研究一共从这30个主题中识别出了在核心技术攻关需求里的16个子技术 (技术主题),如表2所示。其中,核心技术攻关需求里另外的7个子技术未能被LDA从所有专利中挖掘出来,如表3所示。

图4 主题数与Perplexity的关系-企业参与研发的专利

由图4可知,LDA对企业参与研发的专利进行主题抽取,当主题数为29个时,Perplexity值最小。经过专家的识别和命名,本研究一共从这29个主题中识别出了应用示范需求的6个应用场景 (应用主题),如表2所示。而应用示范需求里另外的3个应用场景未能被LDA从专利中挖掘出来,如表3所示。

表2 被LDA识别的子技术和应用

表3 未被LDA识别的子技术和应用

3.6 计算归一化权重

对核心技术攻关需求里的23个子技术进行权重计算。对于被LDA挖掘出来的16个子技术,本研究利用LDA模型进行权重预测,然后计算每个子技术的累加权重,最后做归一化处理,每个子技术的累加权重除以总的专利数30 783。对于尚未被LDA挖出来的7个子技术,根据主题概率分布法的假设,这7个子技术因为在专利集中出现的概率极低,所以在30个主题挖掘中没有出现。因此,本研究将这7个子技术的概率近似为0,结果如图5所示。

图5 核心技术攻关需求里23个子技术对应的归一化权重

同理,对应用示范需求里的9个应用场景进行权重计算,结果如图6所示。

图6 应用示范需求里9个应用场景对应的归一化权重

3.7 筛选新兴技术和新兴应用

根据专家的建议及主题概率分布[23],本研究定义中位数为技术机会识别的阈值。

首先,筛选新兴技术。核心技术攻关需求一共23个子技术,按照权重从大到小的顺序排列,中位数为第12个子技术对应的权重,即是基于区块链与软件定义网络的信任交互技术(1.579%),那么排在该子技术后面的技术就是新兴技术。

同理,筛选新兴应用。应用示范需求一共9个应用场景,按照权重从大到小顺序排列,中位数为第5个应用场景对应的权重,即是区块链在分布式能源交易中的应用研究(1.285%),那么排在该应用场景后面的应用就是新兴应用。

筛选出来的新兴技术和新兴应用如表4所示。

表4 新兴技术和新兴应用

3.8 有效性分析与验证

政策内容是有效的和可操作的。通过梳理区块链政策丛,本研究发现当前很多政策文件虽然都提到了区块链,但是都只是倡议发展区块链,并未对发展区块链的方向进行描述,本研究并不能从大部分政策中梳理出实际有效的技术和应用需求。而《行动计划》则充分全面地讨论了区块链技术所涉及诸多子技术和应用场景,因此,《行动计划》内容是有效的和可操作的。

研究结果是有效的。2016-2019年资助的大部分基金项目属于本研究中定义的相对成熟的技术研究,包括面向高吞吐处理的区块链数据管理、安全可扩展可插拔区块链共识机制研究、基于DAG结构的高吞吐区块链构建方法研究、面向区块链系统隐私保护的关键密码技术研究等。有极个别项目属于本研究定义的新兴技术研究项目,比如面向区块链智能合约漏洞自动检测与修复的符号逻辑建模与推理 (执行时间从2020-01至2023-12)。同时,大部分应用也属于本研究所定义的相对成熟的应用,包括基于区块链的数字资产复杂交易中相关密码协议研究、区块链赋能的下一代智能电网主动能量体社群P2P交易行为建模、规则设计与复杂性分析、基于区块链的供应链产品质量提升策略优化与协调等。而扶贫是中国社会近年来的新兴问题,区块链在扶贫领域的应用是新兴的方向,但目前尚未在区块链基金项目体现出来。由此可见,2016-2019年赞助的基金项目的分布与本研究所发现的主题分布大致是相同的。本研究所发现的个别新兴技术也开始被基金评审开始意识到,并在未来几年内给予资助。因此,本研究建议各级基金评审可以考虑把研发经费向未被关注的新兴技术和新兴应用上倾斜。

4 结 语

技术机会分析对于国家获取未来的技术竞争优势具有重大战略意义。为了保证国家未来的技术竞争优势,国家投入了大量的研发经费去资助符合国家未来发展需求的新兴技术的研发。为此,各级基金评审需要基于技术机会去合理地分配研发经费。然而,当前的两种TOA策略很难辨别出一项颠覆性技术中的各个子技术的实际发展情况,不利于各级基金评审做出有效的分配决策。为此,本研究提出了MTDS。MTDS结合专家法和LDA去分析前沿技术政策文本和海量的专利信息。最后,本研究对区块链技术做了案例研究,成功验证了MTDS的可行性。MTDS既可以弥补TDS缺乏需求预测导向的问题,又可以弥补MDS 容易忽视新兴技术的问题,进而更好地帮助各级基金评审做出技术研发基金分配决策。同时,MTDS能够拓展到多个颠覆性技术领域的新兴子技术的机会识别,具有重要的理论及应用价值。

当然,本研究存在一定的局限性。基于数据的局限性,本研究尚无法处理专利时延性问题。为了增加结论的科学性和准确性,未来的研究将增加数据内容,将专利时效考虑其中,从而更好地找到新兴技术机会。

猜你喜欢

权重机会区块
权重望寡:如何化解低地位领导的补偿性辱虐管理行为?*
权重常思“浮名轻”
给进步一个机会
《红楼梦》的数字化述评——兼及区块链的启示
区块链助跑财资管理
最后的机会
一场区块链引发的全民狂欢
区块链助力企业创新
为党督政勤履职 代民行权重担当
给彼此多一次相爱的机会