APP下载

基于多维属性动态变化特征的新兴技术识别研究

2022-06-07杨中楷

情报学报 2022年5期
关键词:新颖性纳米研究

李 昌,杨中楷,董 坤

(1.大连理工大学科学学与科技管理研究所,大连 116024;2.山东理工大学信息管理研究院,淄博 255049)

1 引 言

当前新一轮科技革命风起云涌,尤其是新兴技术可能会改变已有产业的发展形态,创造出新兴行业,并催生出一系列新的发展模式,对加强科技战略规划、占领科技制高点、支撑科研前瞻布局等具有重要作用。但随着技术演变速度和复杂性不断提升、技术之间交叉性与相互依赖性不断增强[1],新兴技术识别越来越难,因而如何在复杂繁多又彼此交织的技术中识别出新兴技术就显得尤为迫切。

当前新兴技术识别主要包括定性研究和定量研究。定性研究主要利用德尔菲法、专家头脑风暴法等进行人工识别,正确率较高,但信息的爆发式增长,使人工识别难度越来越高。随着计算机技术的不断发展,利用机器学习识别新兴技术的方法得到快速发展。定量研究主要包括技术主题识别和识别指标构建两个步骤。其中技术主题识别主要包括网络关系识别和文本挖掘识别,前者是利用引文关系识别相似内容[2],后者是利用能表征文本含义的特征词进行聚类/分类识别[3]。其中LDA(latent Dirich‐let allocation)主题模型[4]因能在语义层面上解释及分析主题分布,被广泛应用,并在后期得到了诸多改善。例如,考虑SAO(subject-action-object)结构词[5]和考虑技术背景[6]的WI-LDA(word IPC-LDA)等。识别指标构建主要针对新兴技术主题的新颖性和增长性特征[7],新颖性主要利用主题中文献[8]或单词[9]出现时间来表征,增长性主要利用主题内文献的数量[10]、(结构)词[11]、作者(专利权人)、权利要求等数量变化表示,或利用网络中一些关系指标如中介中心度、PageRank[12]、聚类系数[13]等表征。此外,部分学者还从多源数据[14]、构建属性综合评价和决策系统[15]、机器学习[16]和动态监测成长阶段[17]等角度进行识别。

现有研究在新兴技术识别方面已取得一定成果,但还存在以下不足:①技术识别精确度不足。新兴技术本身并不成熟,文档与新兴特征词数量较少,当前研究利用高频词识别遗漏了较多体现新兴技术的技术词;识别过程中技术词缺乏语义信息,同时存在语义粒度较粗且无法直观读取、难以解读、同化技术主题和低频词弱技术主题识别率较低等问题。技术主题识别是新兴技术识别的第一步,至关重要,技术主题识别误差大降低了识别的效率和准确性。②指标单一,覆盖面不够完整。当前研究主要考虑新颖性和增长性两个指标,忽略了其他属性,难以全面反映,准确性不足;且指标得到简化,新颖性研究集中在时间的新颖,忽略技术内容创新性,增长性主要从数量的宏观角度进行测量,无法深入文本内部微观技术词层面。③当前对技术的识别通常是静态分析,缺少时间因素,无法从属性动态变化特征的角度识别。④因定义和属性的不明确,当前所建立的指标与定义、属性之间缺乏关联解释,导致方法层面的改进效果总是欠佳[1],有些“舍本逐末”。

基于上述不足,本研究首先明确了新兴技术定义和识别的技术原理、属性及其属性的动态变化特征,为识别奠定理论基础,之后提出MWI-LDA(multiple word IPC-LDA)模型以提升技术主题识别效率和准确性,依据新兴技术的多维属性在时间上的变化,构建基于多维属性动态变化特征的新兴技术识别框架,以期改进当前研究中的不足,实现新兴技术的高效、准确识别。最后以纳米医学为例进行实证研究,验证了本方法的可行性和有效性。

2 新兴技术识别方法的理论基础

2.1 基本定义

新兴技术是2000年宾夕法尼亚大学沃顿商学院在著作Wharton on Mana gin g Emergin g Tech nolo gies中首次提出的,至今没有公认的定义和属性。新兴技术有广义和狭义之分,广义上较广泛认可的是罗托洛(D.Rotolo)在2015年给出的定义[18],“具有高新颖性且相对快速发展的技术,在出现阶段具有无序性和模糊性,可能会对社会经济产生重大影响”,代表一个技术领域,凸显出潜在的技术和经济价值。狭义与广义新兴技术之间有一些重叠[19],但略有区别。狭义新兴技术是用特征关键词组成的主题领域表征刚出现并正在发展的技术[20],是新的分支技术领域[21]。狭义新兴技术与广义新兴技术相比,更多体现在技术价值上,在识别粒度上,狭义新兴技术更细化,在不考虑经济因素和识别粒度时两者基本对等。本研究所述的新兴技术是狭义上的新兴技术。上述观点虽然得到了认可,但仍有以下不足:①当前定义主要针对“新”和“兴”两个角度进行定义,忽略了其他属性,也没有充分阐述两者的具体含义;②主要从静态角度对新兴技术进行定义,缺失技术随时间不断发展变化的过程。

针对当前研究现状和不足,本研究从时间、技术两个角度对新兴技术进行定义:新兴技术是利用特征关键词表征的新技术领域,在某一时间段内,该技术足够新颖并能对其他技术产生带动促进作用,具有较大关注度,在整个发展历程中,研究内容朝有序方向快速、连贯发展。

技术有层级结构,具有递归性[22],即技术由不同等级的技术构建而成。例如,纳米技术包括纳米医学技术,而纳米医学技术又包括干细胞纳米技术等。但是到目前为止,并没有一个明确的划分标准,需要依据需求合理选择,主题层次的技术颗粒度较细,相对于粗粒度的技术能在科技管理部门和科研工作者需要时提供细致的参考。因此,本研究选择主题级别的技术。

2.2 识别的技术原理及属性动态变化特征归纳

本研究中的属性是新兴技术固有的性质,随时间推移属性强弱发生变化,但属性不会消失;特征是其区别于其他技术的特点,特征源于属性,是属性的外在具象,动态变化特征是随时间推移,新兴技术相对于其他技术,其属性在强弱上的独特变化。当前新兴技术识别研究主要考虑新兴技术的“新”与“兴”作为其属性特征,侧重于技术的新颖和快速发展的特点。依据其定义,这些属性不足以表征新兴技术的全貌,因此部分学者又总结了如一致性、影响性、无序性[18]等属性,但也存在属性与新兴技术指标之间逻辑对应关系不清晰的问题。因此,本节尝试厘清新兴技术识别的技术原理、属性及其动态变化特征。

阿奇舒勒的技术进化论[23]被称为三大进化论之一,是针对技术普遍规律的总结,包括“技术系统的S曲线进化法则”和“子系统不均衡法则”等八大技术系统进化法则。新兴技术作为一种技术系统,应遵循这些法则,同时依据矛盾的普遍性和特殊性以及共性与个性之间辩证统一关系,新兴技术遵循技术的普遍规律,又应具有自己独特特征。融合新兴技术的共性与个性规律结合定义和本研究目的从研究时间、演化轨迹等5个方面对新兴技术的识别原理和属性进行分析归纳。

依据“向微观级和场的应用进化法则”,技术系统倾向于从宏观到微观的转化,其研究范围不断扩大的同时研究内容不断深化,凸显技术的发展过程,与本研究探索不同时间段新兴技术属性变化的目的相契合,新兴技术的研究强度、研究时间和研究方向遵循上述法则。演化轨迹遵循技术系统客观进化模式的定律,成长阶段遵循“S曲线进化法则”。以下在遵循上述定律/法则的基础上对新兴技术识别的技术原理进行分析。

(1)从研究强度上:新知识产生以后,在相当一段时间内不会被注意[24],即在出现初期受到的关注度较低,研究的内容范围以及对其他专利的带动促进作用相对较小,由于新兴技术具有“兴”的特征,相对于其他技术,其发展迅速,关注度增强速度更快,对促进后续专利产生和发展的持续带动作用提升更快速。

(2)从研究时间上:具有时间、内容的新颖,在新兴技术出现的时间段t内,其出现的时间晚于其他技术,在t+1时间段,时间上的新不再凸显,但新兴技术相对于其他技术发展速度快,新内容不断涌现,随时间变化其内容深化、扩展速度更快。

(3)从研究方向上:技术初期内部研究方向模糊,依据“香农信息论”,其内部的无序性较大,更倾向于无序,随时间的推移,相对于其他技术内部无序性迅速降低,呈现更快速从无序到有序、从模糊到明确的发展状态。

(4)从演化轨迹上:新兴技术的发展是原有技术重组再造的结果[25],发展过程中知识的发展和重组相伴而生,形成技术轨道[22],根源于新兴技术知识的更新[26],具有积累和演化的特性,在一定时空内其发展具有“惯性”和“方向锁定”的特征[15],相对于其他技术,新兴技术研究的内容一直被继承,研究不会在较长时间内停滞,具有更强的一致性和持久性。

(5)从成长阶段上:相对于其他技术,新兴技术只涉及婴儿期和成长期,因为一旦进入成熟期就会成为广泛研究的热门技术。

综上,从5个方面阐述新兴技术识别的技术原理,并在此基础上借鉴前人研究总结出5条属性:新颖性(研究方向角度)、关注性和引领性(研究强度角度)、传承性(演化轨迹角度)、无序性(研究方向角度)。新兴技术在不同的时间片段上应该满足以上所有属性,且所有属性都是相对的概念,即在某一时间段内新兴技术与其他技术相比以上属性较为明显。依据“子系统不均衡进化法则”,不同技术具有不同的发展时间线,并非同步发展,同时本研究定义了均值线,均值线是所有技术的属性均值,用来判定新兴技术研究水平高低。结合上述识别的技术原理和属性得到各属性在时间维度上的变化特征,如图1所示。

图1 属性的动态变化特征

3 新兴技术的识别方法建构

依据上述的技术原理和属性的动态变化特征,本研究提出基于多维属性动态变化特征的新兴技术识别方法,主要研究思路如图2所示,共分3个步骤:

图2 研究思路

Step1.数据获取与预处理。设立检索式获取原始数据,然后对数据进行预处理,包括数据清洗和过滤,以及MWI结构词的构建和时间切片。

Step2.技术演化网络构建。利用MWI-LDA模型识别技术主题,计算不同切片之间主题的相似度,并判断相邻技术主题的关系,构建技术演化网络。

Step3.基于多维属性动态变化特征的指标体系构建。依据连贯性、新颖性、关注性、引领性和无序性5个属性在时间维度上的变化特征构建指标体系,识别新兴技术。

3.1 MWI-LDA主题模型构建

借鉴以往研究,本研究利用主题模型识别技术主题,并依据新兴技术的属性特征构建了MWILDA主题模型。该模型是对WI-LDA主题模型[6]的改进,WI-LDA主题模型是为技术词赋予IPC语义背景,但是赋予主IPC号,忽略了副IPC的作用。专利中副IPC号代表着专利涉及的可能技术方向,MWI-LDA主题模型不仅考虑了专利主IPC同时还考虑了专利的副IPC。实现专利中每一个IPC到每个技术词的映射,使每一个技术词在同一个专利中具有不同的技术背景,丰富、精准了技术词含义,同时增加了专利中技术词数量,提高了语义表达能力,缓解数据稀疏问题,一定程度增强了专利与具有丰富含义重要低频词的共现,同时过滤掉高频词,以提高新兴技术识别的精准度。MWI-LDA主题模型核心思想是:一篇文章的每一个MWI词汇都是以一定的概率选择了某个主题,并且这个主题以一定概率选择了某个MWI词汇。具体模型原理如图3所示。

图3 MWI-LDA主题模型

在图3中,空心区域表示隐含变量;实心区域是可观察到的变量,即MWI技术词;实心方块是专利i中的IPC向技术词的映射。其中,D和Nd分别表示语料库中文档和词的数量,K表示主题个数。主题模型生成过程与WI-LDA主题模型类似,此处不再赘述。一篇文档的生成,每一个结构词/词组出现的概率为

3.2 多维属性动态变化特征的指标体系构建

依据新兴技术的属性动态变化特征构建指标体系,包括传承性、新颖性、关注性、引领性、无序性在时间维度上的动态变化特征。在3.1节识别出技术主题后,先依据传承性识别技术演化路径,再计算演化路径上技术主题的新颖性、关注性、引领性和无序性属性的变化识别新兴技术,具体模型示意图如图4所示。

图4 多维属性动态变化特征的新兴技术识别模型示意图

科学合理的指标选取是实现新兴技术识别的关键前提。为了提高分析的权威与客观性,减少人工干预的随意性,在指标选取方面遵循能最大限度体现属性的含义,且客观、定量的获取原则。通过文献调研总结,最终选取了各属性的指标,具体如表1所示。其中被引有正向和负向被引,本研究认为不论是哪一种都能为后续研究提供了一定的参考和借鉴。

表1 属性表征指标

同时为了便于观察对比,本研究把技术的属性指标与所在时间阶段内所有技术属性指标的均值进行比较,形成属性指标指数。

3.2.1 继承性指数的构建

潜在新兴技术产生有两种方式,一是在过去某个时间点突然产生,并在后续演化中不断被继承(突继技术);一种是现有技术分化/分裂而来,并在后续发展中不断被继承(分继技术)。技术随时间的推移会产生一条条技术演化路径,具体如图5所示。另外,突继技术的产生并不是完全与原有技术脱离,只是与原有技术关系较弱。

图5 技术演化路径识别网络

演化关系主要包括主题之间的继承与分化关系,这种关系可以通过相似度来衡量[27]。其中,继承是同一技术在不同时间的具象,从知识流动视角看,知识随时间在不断发展、变化,同一技术在不同时间内,知识会有变化;同样,分化是上一阶段的知识扩散到下一阶段的其他技术之中,由此产生了关系。本研究借鉴文献[29]的方法,利用相邻时间段内技术之间的余弦值相似度来衡量,相似度越高,说明关系越强,具体公式为

其中,A和B表示两个不同时间段技术分别对应的向量。

3.2.2 新颖性指数的构建

新颖性主要是从时间和内容两个维度来测算的。其中,时间新颖性(TNk)考虑的是技术出现的时间,时间越晚,代表新颖性越高;内容新颖(CNk)考虑的是技术的研究领域,研究领域扩展速度越快,表示内容新颖性越高。两者分别用技术内文本出现的平均时间、IPC类别和数量增长率指标来表示。具体新颖性指数公式为

3.2.3 关注性指数构建

关注性主要考虑主题内文本数量和文本属于技术的概率两个方面,文本数量越多和文本属于技术的概率越大,认为其关注性越大。具体关注性指数(TI)公式为

3.2.4 引领性指数的构建

本研究采用技术文本的被引来表示,技术内文本平均被引越高,发挥的引领作用就越大。具体引领性指数(CI)公式为

其中,表示技术主题(k)内文本(i)的被引数量(c);n表示文本数量。

3.2.5 无序性指数构建

无序性主要测算技术研究方向的模糊性,主要利用词对距离和信息熵(H)两个指标。其中,词之间的距离测算先利用word2vec得到词的语义向量,再利用余弦相似度得到词对距离,信息熵和词对距越大,说明无序性越大。具体无序性指数(UI)公式为

4 新兴技术识别的实证研究

4.1 数据获取与预处理

为验证上述新兴技术识别方法的可行性和有效性,本研究选择纳米医学领域专利进行实证研究。以智慧芽为数据源,首先在文献调研与专家知识的基础上,确定检索式:TA:(nanomedicine*OR nano‐drug*OR nanomaterial drug*OR nano-drug*OR nano medicine*OR nano drug*),检索包括中、美、欧、日、韩等116个国家和地区的数据;检索时间为2020年9月28日,时间跨度为2005—2019年;剔除重复和不符合规范专利后,检索结果为8443件。划分数据集时借鉴文献[30]中“固定时间窗”的方法,结合不同年份的数据量,最后确定每3年为一个时间窗,最后划分为2005-2007、2008-2010、2011-2013、2014-2016、2017-2019共5个数据集,分别包含专利644、987、1525、2353、2934件。

之后对检索得到的数据集进行数据预处理,主要内容为将获取的发明名称与摘要进行合并、分词、名词提取和停用词去除[31],同时利用Python编程实现专利文本中IPC到技术词的映射,并依据“二八准则”过滤掉前20%的高频结构词。本研究经过试验发现,当IPC为小组时最后识别结果较优,所以选择IPC小组作为语义背景,为下一步新兴技术识别奠定数据基础。

4.2 新兴技术识别过程

4.2.1 MWI-LDA主题识别

在利用MWI-LDA模型识别之前,本研究利用肘拐点法确定主题数目。肘拐点法是计算集群内所有数据点到中心之间距离的平方误差总和(sum of squared error,SSE),也称为困惑度,一般选取困惑度畸变程度最大点作为最优主题数。通过计算确定5个时间段数据集的最优主题数分别为5、7、9、13、19,具体的困惑度如图6所示。

图6 主题困惑度计算结果

本实验参数具体设置如下:α(document-topic associations)=50/K(K为主题数),β(topic-term associ‐ations)=0.1,迭代次数为2000。

4.2.2 多维属性指标计算

按照上文提出的传承性指数,对各数据集进行继承性计算,依据公式(1)得到相邻时期主题的相似度值。主题之间继承与分化关系确定需要判断相似度阈值[30],阈值大小与不同领域以及设置的时间窗长短有关,机械地设定一个固定阈值并不可取[32],可采用人工可调节的方式进行设置。借鉴文献[33]的方法,通过实验测试并讨论,发现当分化与继承关系的最小相似度值分别为0.2与0.5时,效果较好。依据识别的关系得到技术演化网络,如图7所示,依据连贯性判断规则,最后得到11条技术演化路径。

图7 技术演化网络

依据得到的技术演化路径进行不同时间轴上新颖性、关注性、引领性和无序性的计算,结果如表2所示。

表2 多维属性值动态变化结果

4.3 识别结果分析

依据识别指标体系中各指标随时间的变化情况,得到3T0→4T10→5T1、3T5→4T8→5T13和4T7→5T4共3条符合条件的新兴技术演化路径。在技术内容确定上,本研究对技术演化路径每个时间段的技术词和整个演化过程进行分析,以确定具体的研究内容及其具体演变内容,各技术演化路径在不同时间阶段上的代表性结构词分布如表3所示。以下主要以3T0→4T10→5T1为例对其时间线上的演化内容作具体分析。

表3 技术演化路径在不同时间段的技术特征词分布

3T0→4T10→5T1是干细胞纳米技术,即利用纳米粒子促使干细胞产生和标记干细胞用于疾病治疗的技术。从内容演化来看,在2011—2013年时间段,技术主要集中在利用信号去追踪和指导干细胞开发的方法或者解决方案上;在2014—2016年时间段,出现了诱导干细胞的产生或利用核酸等聚合物作为载体提高干细胞产生效率的研究;在2017—2019年时间段,技术内容研究的重点转向疾病的预防、评估治疗效果以及检测。

4.4 验 证

4.4.1 效果验证

2016年,来自全球64个大学或科研机构的86名纳米生物学领域的顶尖学者在著名的纳米类期刊A C S Nano上发表题为“Diverse Applications of Nano‐medicine”的综述文章[34],引用796篇文献,全面总结概述了当前纳米医学技术的研究现状和最新进展,截止到2021年6月1日,被引用536次。该文献较为准确、客观地展现了当前纳米医学领域的新兴技术。为了验证科学性和完整性,本研究以该综述为主,以2017-2019数据集部分涉及纳米医学新兴技术论述的文献为辅进行验证。

通过对比,发现本研究识别的结果与专家所述现状有殊途同归之处。在技术方面,专家认为干细胞纳米技术作为新兴的交叉技术,在疾病治疗和再生医学应用领域具有潜力[35];纳米造影剂技术是纳米医学领域研究的重点和未来临床应用中最有希望的候选者,主要研究涉及纳米材料的研发、试剂的制备和与检测有关的仪器;纳米癌治疗技术被认为是纳米医学中最有前途的治疗策略,具有巨大的发展潜力[36],当前集中在先进疗法药物的安全性[37]、有效性和纳米材料研制上[38]。本研究识别的结果与专家所述现状也有不同之处。专家认为“吸入性纳米药物递送”是治疗全身和肺部疾病的新兴领域。“吸入性纳米药物递送”属于纳米药物递送技术,指纳米材料承载药物到达指定位置,是纳米药物在人体发挥作用的基础[39],此技术应用比较宽泛。识别出的新兴技术内均涉及delivery、medicine等技术词,该技术能够融入3个技术之中。

此外,本研究查找了2005—2019年资助涉及3个技术的国家自然科学基金的数量和金额(题目中分别含有“纳米与干细胞”“纳米与造影剂”“纳米与癌”)。从图8可以看出,3个技术在资助数量和资助金额上整体呈上升趋势。其中,“纳米干细胞技术”与“纳米造影剂技术”在2010年之前数量和金额较少,增长速度慢,处于婴儿期;技术不断沉淀逐渐形成清晰的技术领域,2011年之后增长速度加快,且资助布局在不断扩大,形成清晰的技术领域,进入成长期;“纳米癌治疗技术”资助的数量和金额相对较少,相对于前两个技术出现较晚,但2014年有一个明显的上升拐点,且不断上升,当前正处于婴儿期,预计后期增长速度会不断加快。整体情况与本研究识别的技术发展情况大致相契合。

图8 国家自然科学基金项目资助的数量与金额

4.4.2 对比验证

本研究在上文文献综述基础上结合具有普遍性的识别框架[20],提取一种常用的新兴技术识别方法:利用LDA主题模型识别技术,使用新颖性指标找到新兴技术;其中新颖性是利用技术内专利申请的时间均值来表示的,时间越晚,新颖度越高。利用与本研究相同的数据与处理方法通过计算得到新颖度,结果如表4所示。

表4 技术分布及其新颖度

通过对比发现,本研究提出的方法优势主要体现在三个方面:①MWI-LDA主题模型降低了技术识别难度,LDA主题模型得出的结果因一词多义现象导致主题解读困难,例如,material在B82Y30/00下是纳米复合材料,在C01G53/04下则是氧化物或者是氢氧化物材料;而MWI-LDA则考虑了此方面,降低了技术识别的难度;②动态呈现技术在不同时间段下的内容及其发展情况;③提高了识别的准确度,本研究对新颖度最高的3个技术进行解读分析,发现topic_7为纳米癌治疗技术,topic_5是纳米药物制备技术,topic_9为DNA纳米技术,其中只有topic_7识别正确;同时发现topic_2涉及纳米造影剂技术的内容,但其新颖度却排在第6位,且没有识别出纳米干细胞技术,相比而言,本研究提出方法识别的结果更符合现实情况。

综上,本研究识别的新兴技术与当前纳米医学领域的新兴研究相匹配,技术具体研究内容也与现实技术内容基本吻合,通过专家意见与国家自然科学基金资助数量和金额对识别的结果进行旁证,并与普遍的方法进行对比分析,证明本研究新构建的主题模型和识别方法的可行性与有效性。同时发现能够细粒度地展现技术内容的演化,例如,干细胞纳米技术呈现为从开始的干细胞开发到提升生产效率,最后涉及技术应用,能够动态、细粒度识别研究内容和发展过程。

5 结论与不足

本研究提出了基于新兴技术属性在时间线上的强弱变化识别新兴技术的新方法。首先,界定了具体定义,明确了新兴技术的新颖性、继承性、关注性、引领性和无序性5个属性;其次,依据属性在时间轴上的变化特征构建指标体系识别新兴技术;最后,对纳米医学领域进行验证的结果表明,本研究提出的方法能有效识别新兴技术,有助于分析新兴技术现状和推演技术发展态势,能够为科技管理部门和科研人员在需要新兴技术研判时提供有效的决策数据支持,辅助把握新兴技术及其未来走向,尤其随着技术交叉越来越普遍,可为科研人员快速了解其他领域提供方法支撑。

该研究的贡献有两点。第一,在理论上,界定了新兴技术的定义和属性特征,一定程度上解决了指标与新兴技术属性之间缺乏关联的问题,可为后续相关研究提供理论基础支撑。第二,在方法上,①提供了一种新兴技术识别的新方法,加入时间线、基于多维属性动态变化特征的研究思路也可以用到其他领域(如技术机会识别和前沿技术识别等);②依据属性从数量的宏观角度和文本内部技术词的微观角度构建了多维属性指标,改善了已有研究指标单一的不足;③针对当前主题模型存在的不足,构建了MWI-LDA主题模型,能够完善技术词语义,提升主题可解释性,提高新兴技术识别的准确率。

本研究尚存在一些不足。首先,MWI-LDA模型虽然提高了技术主题识别率,但其运算矩阵过大,如何在提高技术识别率的同时缩短运算时间,是未来继续改进的方向;其次,未来发展态势是新兴技术识别的重要后续研究,虽然本研究利用演化做了尝试,但如何针对性地提出解决方法是后续研究的方向之一;最后,发明名称和摘要之间合理的权重是提高准确率的一个方面,如何为其赋予权重也是后续研究方向之一。

猜你喜欢

新颖性纳米研究
学术文本词汇功能识别
——在论文新颖性度量上的应用
再也不怕打针的纳米微针
FMS与YBT相关性的实证研究
神奇纳米纸
辽代千人邑研究述论
外观新颖性对消费者购买意愿的影响:自我建构与产品类型的调节效应
视错觉在平面设计中的应用与研究
EMA伺服控制系统研究
日本计划将新颖性宽限期延长至12个月
新颖性推定规则