APP下载

基于专利信息的脑电图技术成熟度及技术网络分析

2016-03-21

中华医学图书情报杂志 2016年4期
关键词:共词代码聚类

脑电图(EEG)是研究脑功能的重要神经影像技术,它通过电极测量神经元兴奋时所产生的容积电流,提供全脑活动的连续性记录[1-2],为“认识脑”提供了技术手段。由于具有无创性、简单便携、费用低廉等特点,EEG被广泛应用于脑部疾病的检查与诊断。

专利文献是重要技术情报来源,适宜作为技术评估研究的数据源,为测度技术发展态势、研究布局和热点主题提供参考。本文综合运用技术成熟度、多元统计分析和社会网络分析理论方法,对全球EEG技术专利数据进行定性与定量分析,以期为我国神经影像学、脑认知科学领域的发展提供参考和借鉴。

1 研究方法

1.1 技术成熟度理论和方法

技术成熟度是指某一技术在发展、进化过程中所处的阶段[3]。1986年美国学者Richard Foster提出通过S曲线模型对技术成熟度进行研判。S曲线模型包含了萌芽期、成长期、成熟期以及衰退期4个阶段,是技术发展和进化所遵循的一般规律。从长期看,技术创新轨迹可以由一系列S曲线的递进构成,并可能出现两条或多条S曲线并存的情形[4]。

S曲线模型有Logistic模型、Gompertz模型等多种。本文采用Logistic模型,通过确定模型中的参数K(饱和值)、tm(反曲点)、Δt(成长时间),预测技术的成熟度。根据Logistic模型,分别以10%K、50%K和90%K作为萌芽期、成长期、成熟期和衰退期之间的临界值。

1.2 共类分析和共词分析

在专利计量中,共类分析用于探索专利所属的技术领域和主题类别,揭示特定技术领域研究内容的相互转移融合和学科领域的交叉演变模式[5]。德温特分类代码(DC)是从应用角度编制的代码体系,其专业性强、一致程度高,适用于技术共类分析。本文选取DC代码作为数据,采用共类分析方法研究技术间的网络结构。

共词分析法将数据集中的主题词作为分析对象,通过统计分析方法和社会网络分析方法,以可视化形式表示共词网络,从而确定研究主题之间的关系[6]。德温特手工代码(MC)是德温特标引人员根据专利文献的摘要和全文为专利分配的代码,用于显示专利的技术创新性及其应用[7]。本文选取MC代码作为数据,采用共词分析方法研究不同主题构成的网络结构。

1.3 聚类分析和战略坐标分析

聚类分析是将研究对象分为相对同质的类团的统计分析技术。本文选取DC代码进行聚类分析,在事先不指定聚类标准的情况下,通过代码矩阵客观地划分技术领域。在DC代码聚类基础上,对所得到的不同技术领域生成战略坐标图,表示不同聚类的关系模型和演变趋势。在战略坐标图中,横坐标表示向心度,用于衡量技术领域之间相互联系的程度;纵坐标表示密度,用于衡量技术领域内部联系的强度[8-9]。

1.4 中心性分析

中心性分析用于研究网络的结构特性以及网络中社会行动者的位置、权力和威望等属性。本文对MC代码的共词网络进行中心性分析,根据共词网络图谱和图的度数中心势、中间中心势、接近中心势等指标分析网络结构,以揭示EEG技术的整体研究态势、不同研究方向之间的关联以及热点研究主题对于整个网络的影响。其中,度数中心度用于衡量关键词的共现度数,反映其在技术融合过程中的渗透性和辐射性;中介中心度用于衡量节点在网络图谱中位置的重要性,体现了关键词在整个网络中作为媒介的连接作用和控制能力;接近中心度用于测量不同关键词之间信息传递的独立性或有效性,反映不同研究主题之间进行技术融合、知识重组的能力[10]。

2 数据来源和处理

2.1 数据来源

本文的专利数据来源于德温特专利索引数据库(Derwent Innovation Index®,DII),DII包括德温特世界专利索引(Derwent World Patents Index®)和专利引文索引(Derwent Patents Citation Index®),是世界上最全面的国际专利信息数据库。DII数据库包括化学、工程及电气和电子3个类别,收录数据年限可追溯至1963年,是专利计量分析的重要数据来源。

根据研究主题,通过《医学主题词表》(MeSH)选取检索词,设定检索式为(Topic=(Electroencephalography OR Electroencephalograph OR Electroencephalogram OR EEG)AND Indexs=(CDerwent, EDerwent, MDerwent) AND Timespan=(All years)),得到全球1965-2015年3837条专利数据,作为本文的数据样本。检索时间为2015年10月27日。

2.2 数据处理

进行专利共类、共词分析和绘制技术网络图之前,需要对DC代码、MC代码数据进行如下处理。

2.2.1 提取高频代码

为了简化统计过程,本文选取高频DC和MC代码作为研究对象。根据Donohue于1973年提出的高频词与低频词界分公式分别确定DC和MC代码界值:

式中的L1指出现一次的DC代码和MC代码的数量。利用文献处理软件BICOMB对DC和MC代码的出现频次进行统计,并根据代码界值分别提取高频代码。

2.2.2 构建共类和共词矩阵

利用BICOMB软件对所提取的高频代码分别构建专利DC代码共类矩阵和MC代码共词矩阵,并对所得矩阵进行如下处理。

2.2.2.1 构建关联强度矩阵

为消除矩阵中代码出现频次对于共类或共词强度的影响,使用Jaccard系数对共类和共词矩阵进行标准化处理,计算每一共类和共词专利对的链接强度(Linkage Strength)。X和Y两代码的Jaccard系数的计算公式如下:

2.2.2.2 构建Pearson相关系数矩阵

Pearson相关系数矩阵是对关联强度矩阵的修正,以消除共类或共词强度数据和关联强度的随机性或偶然性[11]。Pearson相关系数用于衡量两个变量是否线性相关的参数,计算公式为:

3 结果和分析

3.1 EEG技术成熟度分析

采用美国洛克菲勒大学开发的Loglet Lab 2软件对DII数据库1965-2014年EEG技术领域的累计专利授权量进行S曲线拟合和参数值估计。

在实际模拟过程中发现,EEG技术的累计专利授权量拟合成2条S曲线的效果优于拟合成1条S曲线的效果。

因此采用2条S曲线拟合结果(图1),将技术发展历程分为两个阶段分析。根据表1所列拟合参数值,分别计算2条S曲线成长期、成熟期和衰退期的起始时间(表2)。

图1 EEG技术S曲线模型

KtmΔtS260.5801981.23612.681S13033.7262020.57828.361

表2 EEG技术领域临界值

第一条S曲线累计专利授权量饱和值为261件,反曲点为1981 年,成长时间为15.2年。EEG技术第一阶段的萌芽期持续时间和成长时间分别为11年和13年;而第二阶段EEG技术蓬勃发展,累计专利授权量饱和值和成长时间分别为13 034件和28.4年,均显著提升。第二阶段的萌芽期为1991-2007年,成长期为2007-2021年,成熟期为2012-2035年,衰退期从2035年开始。当前,EEG技术仍处于成长期,距离进入成熟期尚有6年时间,未来几年的年度专利授权数量仍将持续上升,累计授权量则呈指数增长趋势。

3.2 EEG技术网络分析

3.2.1 基于专利共类的EEG技术网络分析

将高频DC代码的Pearson相关系数矩阵导入社会网络分析软件UCINET中,生成EEG技术的共类网络(图2)。由图2可知,EEG技术的36个高频DC代码主要涉及B部药物,W部通信,U部半导体和电子电路,S部仪器仪表、测量和测试以及T部计算与控制。

图2 EEG技术德温特分类代码共类网络

3.2.1.1 高频DC代码的聚类分析

利用SPSS 22.0对高频DC代码的Pearson相关系数矩阵进行系统聚类分析,选用组间链接聚类方法和平方Euclidean 距离区间度量标准,绘制出聚类树图。EEG技术可以分为7个技术领域类别:聚类1医用成像设备,包括S05电气医疗设备(3 095件)、P31诊断设备(2 710件)和T01图像处理计算机(1 689件);聚类2医用辅助器具,包括P34消毒或电疗装置与器械(493件)、A96医疗应用(184件)、P33医疗辅助装置(73件)等5类;聚类3机电和控制系统,有T06一般控制或调节系统(28件)、A85电气应用(27件)以及X12配电或控制组件(22件)等9类;聚类4电路及通信系统,有U24放大器和低功率电源(56件)、U21基本逻辑电路(52件)和W03电通信系统(26件)等5类;聚类5数据传输和控制系统,包括W01数据和电话传输系统(211件)、T04数据识别和表示技术(141件)等4类;聚类6测量仪器和装置,包括S03科学仪器(148件)、S01电变量测量仪器(136件)以及W06采用波的测量或检测装置(41件)等8类;聚类7药物测试,有B05其他有机物-芳香剂、脂肪、金属、有机化合物和混合物(42件)和B02稠杂环(20件)。

3.2.1.2 聚类的战略坐标分析

对上述7个技术领域生成战略坐标图(图3)。

从技术领域的布局来看,位于第二象限的是聚类1医用成像设备,属于发展成熟的孤立主题类别。聚类1的密度最高而向心度较低,表明聚类内部研究深入、互动活跃,但同其他聚类的交叉性薄弱。

位于第三象限的是聚类2医用辅助器具,属于即将消失的主题。聚类2的密度和向心度均较低,反映出聚类内部研究结构松散,同其他聚类关联较少,研究活跃度低、地位边缘化。

聚类3、4、5、6和7位于第四象限,属于基本主题或过渡主题,均具有较高的向心度和较低的密度,表明其可能由其他研究主题衍生,研究的成熟度不高、结构较为松散。其中,聚类4电路及通信系统和聚类7药物测试具有最大向心度,处于聚类中的核心地位,同其他聚类联系紧密,有望成为未来的研究焦点。

图3 聚类战略坐标图

3.2.2 基于关键词共词的EEG技术网络分析

3.2.2.1 网络结构分析

运用Ucinet软件生成EEG技术的共词网络(图4)。图4中一共有53个节点,每一个节点对应相应的MC代码,代表EEG技术的不同的研究主题;连线则揭示了不同MC代码之间的关联。图4还显示,EEG技术主要涉及的技术领域为S05电气医疗设备和T01图像处理计算机;此外还包括W01数据和电话传输系统,B11诊断和配方类药物和W05报警、信号、遥测和遥控装置。共词网络的度数中心势为3.327%,中间中心势为4.42%,接近中心势为23.49%。较低的度数中心势反映出共词网络的集中程度较弱,点度中心度高的MC代码渗透性、辐射性较低,说明EEG技术的研究方向较为分散;较低的中间中心势反映出网络的凝聚力较差;中介中心度高的MC代码尚未展现对网络的控制能力,显示出EEG技术研究主题的深度相对不足;较高的接近中心势反映出网络整合度较低,显示出EEG技术不同研究方向的关联较少,核心研究内容尚未形成。

3.2.2.2 研究热点分析

根据共词网络图谱,通过高频、高中心性MC代码确定EEG技术的热点研究主题。词频高低反映了关键词在技术研究中的地位和作用,中心性则用于揭示不同关键词之间的关系及其各自在网络中所具有的效应和发挥的作用。高频MC代码及标准化后的中心度数值如表3所示。

图4 EEG技术的MC代码共词网络

MC S05-D01A2Electrical diagnosis - neurological currents and signals11641.27111.42942.169T01-J06AMedical106724.45031.42952.239S05-D01Measuring and recording systems3556.55114.28644.872S05-D01A2AElectrical diagnosis - neurological currents and signals 3289.46714.28638.462electrodesT01-S03Claimed software products28820.58934.28656.452S05-D01A1Electrical diagnosis - electrocardiographs2870.1878.57136.082S05-D01AElectrical diagnosis - measuring and recording systems 2773.3868.57137.234for-bioelectric currentsS05-DElectrical diagnosis1741.45914.28642.169A12-V03C2Testing, diagnosis, pathology1482.33811.42933.019T01-N01EOn-line medicine1468.61637.14353.030

根据表3,频次最高的MC代码为S05-D01A2(电子诊断——神经电流和信号)。通过测量神经活动的电化学过程,EEG能够对全脑活动进行连续性记录,反映大脑的总体电活动。S05-D01A2的各项中心度数值均较低,显示具有较高的独立性,同其他节点关联较少,对网络的影响较弱,属于孤立的热点研究主题。同属这一主题的高频关键词为S05-D01A(电子诊断——测量和记录生物电流)。排名第2位的MC代码为T01-J06A(医学影像处理),位于共词网络的中央偏右位置。T01-J06A拥有最高的中介中心度,度数中心度与接近中心度均排名第3,表明其作为网络中的关键节点,同其他研究主题产生联系较多,发挥着桥梁和纽带作用,对网络的控制能力较强。EEG影像数据可用于分析EEG信号与不同行为状态之间的关联,在脑科学研究中意义显著。排名第4位的MC代码是S05-D01A2A(电子诊断——神经电流和信号的电极)。电极作为EEG技术的主要硬件设备,用于测量神经元活动时所释放的电位,是EEG技术的研究热点。排名S05-D01A1(电子诊断——心电图仪频次为287)排名第6位。临床上,脑电图和心电图联合常用于癫痫、手足口病等的诊断。频次排名第8、9位的分别是S05-D(电子诊断),A12-V03C2(测试、诊断和病理学)。EEG影像具有重要的临床应用价值,通过分析脑功能异常时的脑电图谱,有助于判断脑功能状况、诊断脑部疾病。排名第10位的MC代码是T01-N01E(在线医学),位于共词网络的中央偏左下位置。T01-N01E的度数中心度和接近中心度均为最高,中介中心度为5.313排名第2,表明在线医学已成为EEG领域的关键研究主题,同其他研究方向产生联系较多,对技术网络的控制能力较强。此外,S05-D01(测量和记录系统)、T01-S03(主张权利的软件产品)等也是EEG领域的热点研究主题。

4 结论

本文综合利用技术成熟度理论方法、社会网络分析和多元统计分析方法及工具,对DII数据库中收录的EEG技术相关专利文献进行实证分析的结果显示:EEG技术发展可分为1965-1990年和1991年至今2个阶段,当前EEG技术处于第二阶段的成长期,预计6年后进入成熟期,20年后进入衰退期,累计专利授权量最终将达到13 034件。EEG技术主要涉及7个主题类别,其中医用成像设备发展较为成熟,医用辅助器具将逐渐淡出研究视野,电路及通信系统和药物测试有望成为未来研究焦点。EEG技术的研究领域较为分散,研究主题的深度相对不足,不同研究方向的关联较少,核心研究内容尚未形成。现阶段的研究热点包括S05-D01A2电子诊断——神经电流和信号,T01-J06A医学影像处理,S05-D01A2A电子诊断——神经电流和信号的电极,T01-N01E在线医学等。

猜你喜欢

共词代码聚类
基于K-means聚类的车-地无线通信场强研究
创世代码
创世代码
创世代码
创世代码
基于突变检测与共词分析的深阅读新兴趋势分析
基于Matlab的共词矩阵构造
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法