APP下载

2011—2015年广东省中医药科技查新项目统计分析

2016-10-20夏能能

中国中医药图书情报 2016年4期
关键词:科技查新共词分析统计分析

夏能能

摘要:目的 了解近年广东省中医药科研项目课题申报的特点及重点领域,明确我省中医药发展方向。方法 对某查新机构2011-2015年完成的广东省中医药查新项目进行汇总,进行数量及项目委托时间分布的分析,利用ROST词频分析软件对2014-2015年的查新报告科学技术要点进行分词及词频统计,并通过Ucinet 6.587社会网络分析软件对高频中药关键词进行可视化处理。结果 2011-2015年共1279项中医药查新中,81.78%的委托出现在第一季度;2014-2015年关键词分析发现临床疗效是查新项目中最关注的问题,动物实验为应用较多的研究手段,中药为较常选择的治疗方式,中药高频词中甘草、白芍、白术等在共现网络中占据重要地位,联系较为紧密的药对有白术与茯苓、白术与甘草、甘草与党参等。结论 中医药查新委托数量集中、时间紧,应积极制订策略应对每年查新高峰;我省中医药课题申报的重点是中药或中医传统疗法的临床疗效,并较多利用动物实验进行中医药疗效机制及疾病发病机制的研究;查新项目中涉及的中药主要是补虚药(补气、补血)、泻下药、解表药,关系紧密的药对主要为补虚药的组合。

关键词:中医药;科技查新;统计分析;广东;共词分析;Ucinet

中图分类号:G252.62 文献标识码:A 文章编号:2095-5707(2016)04-0029-07

Statistical Analysis on Sci-Tech Novelty Retrieval Projects of Traditional Chinese Medicine in Guangdong Province from 2011 to 2015

XIA Neng-neng

(Guangdong Second Traditional Chinese Medicine Hospital, Guangdong Province Engineering Technology Research Institute of T.C.M, Guangzhou Guangdong 510095, China)

Abstract: Objective To investigate the features and hotspots of application of TCM scientific research in Guangdong Province; To be clear about the TCM development direction in Guangdong Province. Methods TCM novelty retrieval projects in Guangdong Province completed by certain novelty retrieval institution during 2011 to 2015 were collected for the analysis on the number and project entrustment time distribution. ROST was used to segment and conduct word frequency statistics of technical essentials in novelty retrieval reports from 2014-2015, then TCM key words with high frequency were under visualization by Ucinet 6.587. Results In the 1279 novelty retrieval projects from 2011-2015, 81.78% entrustments were applied in the first quarter; the analysis on key words from 2014-2015 displayed that clinical efficacy was topic drawing the most attention; animal experiments were frequently used research method; TCM was the normal treatment; in the TCM terms with high frequency, Glycyrrhizae Radix et Rhizoma, Paeoniae Radix alba, and Atractylodix Macrocephalae Rhizoma played important roles in the co-occurrence network, among which the closely linked pairs were Atractylodix Macrocephalae Rhizom and Poria, Atractylodix Macrocephalae Rhizom and Glycyrrhizae Radix et Rhizoma, and Glycyrrhizae Radix et Rhizoma and Codonopsis Radix. Conclusion TCM sci-tech novelty retrievals have the features of concentrated entrustment number and urgent timing, which

科技查新是在科技文献检索及科技咨询基础上发展起来的一项新型科技信息服务业务,是我国科研管理工作中不可或缺的重要环节[1]。医药卫生科技查新是医药卫生科技管理工作中的重要组成部分,具有较强的政策性、科学性和技术性,对提高医药卫生科技管理与决策的科学化、规范化水平,减少科研项目的低水平重复和科研成果评审失准,增强科技投资效益具有重要意义[2]。我国的科技查新工作最早可以追溯到1985年,至今已有20多年的历史,有关科技查新工作的学术研究也颇为丰富[3]。笔者文献调查发现,有关我国科技查新的研究报道主要以各单位科技查新项目的外部特征分析为主,如查新数量、检索文种(中文、外文)、查新目的(包括科研立项、成果鉴定、报奖、专利申请、新产品开发、技术引进)[4]及查新项目行业分类等[5-10];而从查新的项目内容进行计量分析的相关研究鲜见文献报道。本文将在查新数量等查新项目外部特征指标分析的基础上,利用查新报告中的科学技术要点提取关键词,并对这些关键词进行汇总分析,重点对2014-2015年查新项目中的高频中药关键词进行共词分析,以期了解近年广东省中医药科研项目课题研究的热点,从而明确我省中医药发展的重点领域。

1 资料与方法

1.1 数据来源

某查新机构2011-2015年所完成的广东省中医药科研立项查新申请,共计1200余项。统计时间为2016年2-3月,分析内容包括科技查新的年度及月份数量变化、关键词词频及中药高频词共词分析。为了更好地分析随时间的变化情况,本文选取2011-2015年共5年的总数据对查新数量进行分析;为了更准确地反映2014-2015年广东省中医药课题研究的热点领域,选取这2年的关键词进行分析。

1.2 数据处理方法

查新数量的数据来自历年查新登记表的记录,关键词则取自查新报告的科学技术要点的分词结果,这是因为科学技术要点是查新人员对项目主要内容(包括技术路线、实验方案、评价指标、中医治法治则、研究的疾病对象、采用的中药组方等)及其创新点进行分析提炼的结果,对这部分内容进行分词处理获得的关键词可全面反映项目的研究主题。具体方法为将2014-2015年所完成的全部中医药科技查新报告的科学技术要点内容汇总至txt文档,然后采用ROST词频分析软件对这2年共601份查新报告的科学技术要点文本进行分词处理,并进行词频统计,利用Ucinet 6.587社会网络分析软件进行共词分析。

将2014-2015年的查新报告科学技术要点汇总并进行ROST分词处理后,对于软件分词结果另外进行人工核查修正,对无法确定分割是否合理的词组,采用万方数据库、中国知识资源总库(CNKI)关键词精确检索的方式加以明确,从而确保关键词分词的准确性。例如“卒中后抑郁”是否应该分割为“卒中”及“抑郁”,关键词检索发现“卒中后抑郁”在CNKI有4000条以上的相关文献,万方数据库检索结果也超过2000条,说明该词组可作为固定搭配关键词使用,不予分割。又如“脑卒中平衡功能障碍”是否应该分割为“脑卒中”及“平衡功能障碍”,CNKI及万方数据库关键词检索词条“脑卒中平衡功能障碍”均未发现相关文献,因而对其进行了拆分处理。

2 结果与分析

2.1 查新数量分析

2011-2015年该机构完成的中医药立项查新数量统计见表1、图1。从各年度的查新数量变化可以看出,2011-2014年查新数量逐年上升,2015年有所回落,这主要是因为2015年课题申报时间后延,导致查新申请的时间变化,按往年规律应在2015年末完成的查新任务有部分移到了2016年初。科技查新是一项季节性很强的业务,查新时间与课题申报时间密切相关,这一点在各年度按季度分类汇总的查新数量统计中表现很明显。每年1~3月的查新量基本都可占据当年查新总量的80%,这是因为广东省中医药课题申报时间一般在每年第一季度。

2.2 2014-2015年查新关键词分析

2.2.1 关键词总体分析 2014-2015年关键词词频初步统计后共纳入252个,词频3672次。由于其中有部分关键词对研究目的无益,予以剔除,如“身高”“联合”“治疗”“检测”“一般情况”“研究”等。另外,有一些关键词为同义词,进行合并统计,如“临床疗效”与“疗效”,合并后采用“临床疗效”;“大鼠”“小鼠”“家兔”“动物模型”“动物实验”,合并后采用“动物实验”;“针刺”“针灸”“电针”,合并后采用“针灸”;“薏苡仁”与“苡仁”,合并后采用“薏苡仁”;“熟大黄”与“大黄”,合并后采用“大黄”;“山茱萸”与“山萸肉”,合并后采用“山茱萸”。整理后词频>10的关键词统计结果见表2。

从表2中可以看出,临床疗效是2014-2015年查新委托项目中最关注的问题,通过查看委托人查新时提交的申请书发现,“临床疗效”在治疗方法或药物疗效探讨为主题的研究中频繁出现。词频排在第二、三位的分别为“动物实验”和“中药”,说明动物实验是这些项目中较常用的研究手段,而中药则是治疗方法中最常用的方式。调查项目申报书发现,动物实验(所采用的动物模型包括大鼠、小鼠、家兔)一般用于疾病发病机制或者药物与治疗手段的疗效机制研究中,关键词“中药”的词频为143次,此外中药名称直接作为关键词也频繁出现,表2中共有39个,这是因为该查新机构所接收的查新课题以中医药领域项目申请为主,因此查新报告的主题有一定的关联度且学科较为集中。关键词中词频较高的还包括“针灸”以及穴位名称(如足三里、内关、百会)等,这是因为中医传统疗法也是中医药项目申报的重点方向,是2014-2015年中查新项目中多个课题的研究主题。另一类高频词包括“有效性”“安全性”“质量标准”“制备工艺”,这类关键词所在查新项目的主要研究内容一般为医院制剂制备、药材鉴定等。

2.2.2 中药关键词分析 由于本文所分析的查新项目多涉及中药组方,因而本节对2014-2015年查新报告中的高频中药名称关键词进行了单独统计,选取的分析对象为频次前20位的中药。对表2中的高频中药关键词进行两两配对,统计20个高频中药在近2年所有查新报告中共同出现的次数,从而构建一个20×20的共词矩阵,如表3所示。

表3中行和列上显示的数字为对应的中药共同出现的次数。例如,甘草和茯苓共同出现了29次,即29个查新项目中同时出现了甘草和茯苓;党参和桃仁共同出现了0次,即在2014-2015年的所有查新项目中,没有同时将党参和桃仁作为研究内容的项目出现。

特殊说明的是主对角线上的数值表示某一种中药出现的总次数,如甘草、茯苓、当归各自出现的总次数分别为74、58、51。由于并不存在指向关系,因而中药共词矩阵为对称矩阵,即表中各元素以主对角线为对称轴对应相等。

共词矩阵表现各关键词间共现频率的高低,为了更好地揭示关键词间联系的强弱,需把共词矩阵转换为相关矩阵。本文采用Ochiia系数进行转换,计算公式如下[11]:

相关矩阵中的数值表示对应的两关键词间的相关度,数值越大说明两词之间相关度越高、距离越近,表现在查新项目中即表示两关键词有较高几率被同时采用或作为研究对象。由于各关键词与自身相关度最高,因而主对角线上数值均为1。

为了直观地展现各中药关键词在网络中的重要性及各词之间的关联度,本文对相关矩阵用Ucinet 6.587社会网络分析软件中的Netdraw进行可视化处理,得到共现网络图,如图2所示。

前20位中药共现网络图

图中20个节点代表20个高频词,节点的大小衡量的是各词在此网络中的中间中心度(betweenness centrality),即在网络中的重要程度[13]。节点之间连线的粗细则代表两关键词间关系的强弱,实线越粗代表两词间关系越强,越细则表示两词间关系越弱[14]。图片生成时线的粗细取决于网络中药对之间两两关系的相对权重,该网络图中相对权重的取值范围为0~0.6。

从图2中可以看到,在网络中节点较大较为重要的关键词有甘草、白芍、白术、当归、茯苓、大黄、桂枝、黄芪,其中茯苓为利水渗湿药(利水消肿、安神),大黄为泻下药,桂枝为解表药(发散风寒),其余的甘草、白芍、白术、当归、黄芪均属补虚药(补气或补血);处于网络外围的黄芩、丹参、桃仁、川芎、熟地黄、山茱萸、党参等关键词节点较小,在此网络中处于不太重要的地位。根据节点间连线的粗细及线的相对权重可知,此网络中关系较为密切的节点包括白术与茯苓(相对权重为0.6,补虚、利水渗湿中药组合)、白术与甘草(相对权重0.5,补虚中药组合)、白术与党参(相对权重0.5,补虚中药组合)、甘草与党参(相对权重0.5,补虚中药组合)、熟地黄与山茱萸(相对权重0.5,补虚与收涩中药组合)等。白术与甘草为补虚补气药,茯苓为利水渗湿药,白术、茯苓临床均可用于治疗水肿、小便不利、脾虚诸证等,甘草与白术同用具有补脾益气的功效,且甘草能够调和诸药药性。在近2年的601项查新项目中白术与茯苓同时出现共30次,白术与甘草共同出现28次,而三者共同出现的查新记录有19次,如三者被用于治疗癌因性疲乏(健脾益肾方)、代谢综合征模型大鼠实验研究(健脾化痰方)、肝硬化模型大鼠实验研究(四君子汤)、抑郁症肝郁脾虚证(逍遥散)等。党参亦为补虚补气药,具有补脾肺气、补血生津的功效,考察近2年的查新项目,发现党参、白术、甘草同时用于治疗肝肾亏损脾虚瘀阻证晚期原发性肝癌(肝癌汤方)、胃肠功能障碍(温脾理气通腑汤)、糖尿病黄斑水肿等。熟地黄属补虚补血药,具有补血滋阴、益精填髓的功效,山茱萸为收涩药,具有补益肝肾,收敛固涩的功效,二者被同用于骨质疏松的实验研究(补肾活血方)、骨折的临床治疗(筋骨胶囊)、肾病综合征(肾气丸)、妊娠期糖尿病胰岛素抵抗等。

此外,线的权重与点的中间中心度并无直接联系,如山茱萸与熟地黄、桃仁与川芎间连线的权重较高均为0.5,而这些关键词的节点则相对较小。因而从图中可以较为全面直观地观察在共现网络中各词本身的重要性以及词与词之间联系的强弱。

3 讨论

3.1 积极应对查新申请的高峰期

科技查新是一项季节性很强的业务,通过查新数量分析,我们已了解到每年1-3月的查新委托量可占年度委托总量的80%左右,为查新高峰期。根据吴素坤等[15]的调查,高校查新员普遍存在任务量超负荷、查新工作分配过于集中的现象,并认为这是查新员职业倦怠的原因之一。为避免查新工作量的过度集中并确保这一时期查新的顺利进行,应积极制订应对方案。据了解,该查新机构已通过流程划分、增加临时工作人员的方式来分散压力。流程划分即由专人负责查新接待,包括现场接待、电话及邮件的应答,并在此环节对查新员进行查新任务的分配;专人负责查新科学技术要点的初步提炼,但这一步的要点总结只是作为查新员检索时的参考,具体查新点是否需要完善修改则由查新员在查新过程中操作;检索文献及撰写报告这一核心环节由专职查新员完成;查新报告的格式调整、打印、盖章及邮寄交付等,再转至下一环节处理。除此之外,查新机构还应与科研管理部门保持有效沟通,以便把握项目种类、申报时间及查新需求等情况,提早做好应对准备。

3.2 我省中医药课题申报的关注重点

根据关键词分析部分的结果可知,我省中医药课题申报项目较多关注临床疗效(包括中药治疗、中医传统疗法治疗),动物实验在疾病发病机制及疗效机理研究等,说明我省中医药相关研究中临床与科研并重,这对于促进中医药的健康发展具有重要意义。中药关键词分析发现,2014-2015年的中医药申报项目中中药以补虚药、利水渗湿药、泻下药、解表药为研究重点,药对则主要以补虚(补气)药的组合为主,这与岭南地区的气候特征以及常见病症是否有关,有待积累更全面的数据后进行进一步探讨。

参考文献

[1] 朱强,戴龙基,蔡蓉华.中文核心期刊要目总览[M].北京:北京大学出版社,2008:11.

[2] 中华人民共和国卫生部科教司,医学信息工作管理委员会.《卫生部医药卫生科技项目查新咨询暂行规定》实施细则[S].北京:卫生部医学信息工作管理委员会办公室,1997.

[3] 周金元,朱安青.我国科技查新研究论文的统计与可视化分析[J].情报科学,2010,28(7):1033-1036,1046.

[4] 张秀妮,党寒冬.2009~2012年陕西省科技信息查新中心查新项目统计分析[J].中国科技信息,2013(13):145-146.

[5] 刘淼,刘黎明,陈新胜.2004~2008年湖南省科技查新中心查新项目统计分析[J].情报探索,2010(5):79-80.

[6] 王毅.福建省2006~2008年医药卫生科技项目查新统计分析[J].医学信息,2010,23(7):2272-2275.

[7] 牛崇信,潘文,程涛,等.甘肃省中医药科技查新检索中心2008—2011年查新项目统计分析[J].西部中医药,2011,24(12):40-41.

[8] 曾强.广州中医药大学图书馆2001-2011年查新项目统计分析[J].中华医学图书情报杂志,2013,22(5):68-73.

[9] 何静,张群.教育部查新站L08 2005-2010年国内外查新及社科查新项目分析[J].新世纪图书馆,2012(1):57-59,90.

[10] 杨丽.高校图书馆科技查新项目统计分析——以广东医学院为例[J].医学信息,2013,26(12):24-25.

[11] 顾洪涛.我国高校图书馆研究热点探析——基于CNKI期刊论文关键词的共词分析[D].大连:辽宁师范大学,2014.

[12] 郭春侠,叶继元.基于共词分析的国外图书情报学研究热点[J].图书情报工作,2011,55(20):19-22.

猜你喜欢

科技查新共词分析统计分析
科技查新服务业变革优化的动力机制研究
基于德温特数据库的关键共性技术分析
国内图书馆嵌入式服务研究主题分析
科技查新领域的信息化问题研究
如何发挥新时期统计工作的作用之我见
基于文献计量分析我国生物科学素养研究状况(2001~2016年)
基于知识图谱的智慧教育研究热点与趋势分析
以统计分析为基础的房地产税收优化分析
SPSS在高校图书馆服务体系中的应用研究
浅谈医学科技查新档案信息资源的开发利用