医药专利分析领域研究热点探测及对中药专利分析的启示
2017-04-07潘玮孙伟伟张世玉王伟
潘玮+孙伟伟+张世玉+王伟
〔摘要〕中药专利是中药产业技术实力的重要体现,对其进行有效的分析和挖掘,将对政府部门、科研机构和中药企业产生重要意义。研究运用Citespace Ⅲ软件对CNKI数据库和Pubmed数据库中专利分析方法应用于医药领域的研究热点进行探测,并绘制了研究热点的时区分布和聚类分布可视化图谱。通过对研究热点的分析,发现中药专利分析研究在整个研究领域中占有重要地位。为了进一步深化和发展中药专利分析研究,一方面根据中药专利分析研究热点,对现有的中药专利分析研究进行了梳理和归纳;另一方面,参考和借鉴专利分析方法在其它医药领域的研究热点,从研究方法、研究目标和研究对象3个方面对未来中药专利分析的研究进行了展望。
〔关键词〕专利分析;研究热点;中药专利;Citespace
DOI:10.3969/j.issn.1008-0821.2017.03.026
〔中图分类号〕G25553〔文献标识码〕A〔文章编号〕1008-0821(2017)03-0148-05
〔Abstract〕Patent analysis is vital to government departments,research institutions and enterprises for the reason that patent ability is the important representative of technical strength for traditional Chinese medicine industry.Based on citespace Ⅲ,taking Pubmed and CNKI databases as data sources,this paper analyzed the research hotspots on researches of the methods of patent analysis which were used in medical fields.It is found that the study of patent analysis of traditional Chinese medicine played an important part in the whole research fields.For an intensive study,according to the information of the research hot spots which have been detected,this paper not only carried on the induction summary of existing researches,but also gave prospects of the future researches from three angles that were method,objective and object.
〔Key words〕patent analysis;research hotspots;traditional chinese medicine patent;Citespace
知識经济时代,中药产业日益重视和依赖核心技术的专利保护。截至2016年6月,在CNKI专利数据库中,以表示中药的国际专利分类号A61K36/00进行检索,共得到中药专利申请数据18万余条。因此对中药专利进行有效的分析和挖掘,将对政府部门、科研机构和中药企业产生重要意义[1]。目前已有学者对我国中药专利申请现状进行分析[2-4],以及对我国各省区之间、我国与其他国家之间的中药专利申请现状进行比较分析[5-7]。为了进一步开发出中药专利宝库的潜在价值,不仅需要对现有相关研究进行归纳,还需要对中药专利分析的研究思路和方法进行扩展。为此本研究拟对专利分析方法应用于医药领域的研究热点进行探测,通过对研究热点的分析,以期为中药专利分析的深入研究提供借鉴和参考。
1数据来源与方法
11数据来源
为了更全面的探测专利分析方法应用于医药领域的研究热点,本研究分别采集中文和英文科技文献平台的期刊文献数据进行分析。中文平台选择CNKI数据库,检索策略为:((题名=专利分析)(模糊))OR((关键词=专利分析)(模糊))OR((主题=专利分析)(精确)),专辑导航:医药卫生科技。英文平台选择Pubmed数据库,检索策略为:(patent[Title] AND analy[Title]) OR (“patent analysis”[Title/Abstract])。两数据库的检索日期均截至2016年4月,其中前者共检索得到263条文献数据,后者共检索得到286条文献数据。对得到的文献数据进行数据清洗,在剔除不相关的文献后,将筛选出的文献数据的全部题录信息存储为txt文件格式,供进一步分析使用。
12方法
运用Citespace Ⅲ软件对清洗后的数据题录信息进行分析。Citespace Ⅲ是陈超美博士开发的基于Java平台的文献信息分析及可视化软件,可用于对某一研究领域的研究热点进行探测[8]。且这种研究热点探测方法已经广泛应用于管理科学、情报学及高新技术领域[9]。
该软件探测领域研究热点的一般算法是:构建特定领域相关文献关键词共现网络,计算关键词的词频和中介中心性,并将具有较高词频和较大中介中心性的关键词,即核心关键词以聚类或时区分布等可视化的形式表现出来。由于一般情况下,关键词是文献主要内容的浓缩和提炼,因此在特定研究领域中,高频出现的关键词,可以被认为是该研究领域的研究热点;而中介中心性体现了网络中某成员连接其他成员的能力,因此高中介中心性的关键词也可被认为是该研究领域的研究热点[10]。于是通过对这两种类型关键词的识别便可实现对特定领域研究热点的探测。
2结果
21研究热点探测
运用Citespace Ⅲ软件对CNKI数据库和Pubmed数据库进行研究热点探测的具体操作为:将主题词来源(Term Source)选择为关键词(Keywords Plus),节点类型同样选择为关键词(Keyword),这将使得软件对两数据库相关文献的关键词进行统计和分析。根据两数据库相关文献的最早出版年份,将CNKI数据库和Pubmed数据库的文献数据的时区分割(Time Slicing)分别设置为2000-2016年以及1970-2016年。两数据库的单个时间分区长度(Years Per Slice)均设置为1年,每分区最多N个主题词数量(Top N Per Slice)均设置为100,这将使软件统计每一年中出现的各关键词的频次,并将每一年中出现频次排在前100位的关键词筛选出来。最终统计出的核心关键词,即该领域的研究热点如表1和表2所示。
由表1和表2可知,两数据库的研究热点既有一定的重合,又各有侧重。这说明对于专利分析方法在医药领域的应用这一研究领域,就研究热点而言,中英文文献能够形成有效的互补,因此对两数据库的探测结果进行归纳和汇总,对科研人员全面把握该领域的研究热点具有重要帮助。
在这里需要指出的是,受本研究检索策略的影响,CNKI数据库中频次前3位的关键词分别是“专利”、“专利分析”和“专利申请”,其频次分别为70、66和43次;Pubmed数据库中频次最高的关键词是“Patent Analysis”,其频次为34次。这些词虽然频次很高,但对于本研究来说,是显而易见的通用词汇,属于“干扰词”,作为研究热点无法对科研人员了解研究领域提供实际帮助。因此本研究在此及接下来的分析中将这些“干扰词”除去,从而使探测出的研究热点更有应用价值和指导意义。
22研究热点的时区分布
使用软件Time Zone功能,能够了解研究热点的时区分布,如图1和图2所示。由于两数据库包含文献的时间跨度不同,为使结果更加清晰易读,本研究将CNKI数据库的时间分区长度设置为2年,而将Pubmed数据库的时间分区长度设置为3年。通过控制阈值,在图1和图2中只有词频大于等于3的关键词才会作为研究热点展示出来,每个研究热点最左侧所占据的年份,表示其最早出现的年份,研究热点的大小与其词频的高低成正比,各研究热点之间的连线表示彼此之间存在共现关系。通过研究热点的时区分布可以看出研究热点最早出现的时间及研究热度持续的时间,此外对不同时段研究热点的探测,有助于了解整个学科的发展脉络和各个时期的不同侧重。
23研究热点的聚类分布
运用聚类算法对关键词共现网络进行聚类能够直观地展现各研究热点之间的关系。具体操作为:在之前参数的基础上,剪枝算法(Pruning)选择Pathfinder和Pruning the Merged Network,其目的是使聚类的效果更加清晰,得到的关于两数据库研究热点的聚类分布如图3和图4所示。
在图3和图4中,不同颜色相互独立的几何图形表示不同的类团。通过控制阈值,同样只有词频大于等于3的关键词才能够作为研究热点显示出来,且研究热点字体大小与其词频高低成正比。由于聚类算法的目的在于将大量数据分成不同类别,并使相同类别内的数据之间最大程度的相似,而不同类别内的数据最大程度的不同[11]。因此通过对整个研究领域的研究热点进行聚类,其效果相当于将整个研究领域划分为若干个子领域。同一类团中的研究热点更趋向于同时出现在一类研究中,因此通过对每个类团中研究热点之间关系的解读,便可以大体推测出该子领域的主要研究内容。
聚类的效果可以通过Modularity Q和Mean Silhouette两个指标衡量,前者表示各类团的模块性,取值为[0,1],值越大说明各类团越独立,聚类效果越好;后者表示类团内
各成员的同质性,取值为[-1,1],值越大说明类团内的成员越一致,聚类效果越好。对于图1和图2来说,其Modularity Q的值分别为078和084,Mean Silhouette的值分别为083和071,两指标的值均较大,说明两数据库研究热点的聚类效果均较为良好,因此聚类结果反映信息的可信度可以接受。
3对中药专利研究的启示
31现有中药专利分析研究概述
由表1和表2可知,在CNKI数据库中,研究热点“中药”、“中药复方”的词频分别为22次和10次,“中药专利”、“中药”的中介中心性分别为061和041;而在Pubmed数据库中,研究热点“Chinese Herbal Drugs”的中介中心性为005。说明在整个研究领域中,中药专利分析研究已占有一席之地,且两数据库相比,CNKI数据库中与中药专利分析相关的研究热点的出现频次和重要性程度更高。
由图1和图2可知,在CNKI数据库中,“中药专利”、“中药”、“传统药物”分别最早出现于2000年、2004年和2014年;而在Pubmed数据库中,“Chinese Herbal Drugs”最早出现于2012年。因此可以看出,自中文文献开始关注专利分析方法在医学领域中的应用起,对于中药专利分析的研究就已经开始出现,虽然在发展的过程中研究热点发生细微变化,但是研究热度始终不减。而在2012年,中药专利分析作为研究热点开始在Pubmed数据库中出现,并且伴随着中药国际影响力的日益扩大,有理由相信对于中药专利分析的研究将越来越受到国内外学者的关注,其研究成果也将进一步丰富和深入。
由图3和图4可知,在CNKI数据库中,“中药”与“天然药物”、“专利保护”以及“阿尔茨海默病”共为同一个类团,说明這4个研究热点彼此之间更趋向于同时出现;同理“中药信息学”与“中药专利”,“中药复方”与“有效专利”、“聚类分析”以及“医药知识产权”,“传统药物”与“专利计量”以及“数据库”彼此之间更趋向于同时出现。而在Pubmed数据库中“Chinese Herbal Drugs”则与“Humans”共为同一个类团。通过对上述各类团的进一步分析,本研究认为目前中药专利分析的研究主要体现在以下几个方面:
1)对中药或天然药物专利进行分析,探讨专利保护制度的误区,并提出相应的专利保护对策;
2)对治疗阿尔茨海默病的中药专利或天然药物专利进行分析,以了解专利现状;
3)运用聚类分析等文献计量方法对中药复方授权专利及有效专利进行分析,以探讨中药复方专利的用药规律、年度增长状况、区域发展方案及知识产权战略等;
4)运用专利计量方法对专利数据库中的中药专利(如细辛、红景天、党参、刺五加等)进行中药信息学分析,剖析相关中药专利的现状与发展趋势,为传统药物的开发提供参考。
32未来中药专利分析研究展望
本研究通过参考专利分析方法应用于医药领域其它方面的研究热点,对未来中药专利分析的相关研究做如下展望:
321研究方法的深入
目前中药专利分析研究的研究方法主要是聚类分析、频数分析等传统的文献计量方法。由图3和图4可知,除了传统的文献计量方法之外,表示医药领域专利分析研究方法的研究热点还包括“统计分析”、“专利地图”、“Comparative Analysis(对比分析)”、“Annotated(注释)”和“Text Mining(文本挖掘)”等。基于此,在未來的研究中,中药专利分析的研究方法可以进一步深入,如在文献计量的基础上,运用统计学方法增强分析结果的说服力;运用专利地图绘制方法,对分析结果进行可视化,以增加分析结果的可读性;运用文本挖掘方法通过语义注释构建中药本体,以揭示中药专有名词之间的语义关系,解决药物或成分等同义词的多种表达问题,从而增强分析结果的准确性;或是针对中药专利的特殊属性,运用比较分析的方法分析中药专利知识产权保护和社会需求之间的关系,并探讨由此产生的一系列法律与伦理之间关系的问题。
322研究目标的扩展
目前中药专利分析研究的研究目标主要是了解中药专利的基本现状、区域发展状况以及探讨中药专利保护制度。由图3和图4可知,表示医药领域专利分析研究目标的研究热点还包括 “专利战略”、“技术预见”、“Drug Discovery(药物发现)”、“Patent Litigation(专利诉讼)”、“Diagnosis and Therapy(诊断和治疗)”、“Key Fields Identification(主要领域识别)”等。基于此,在未来的研究中,中药专利分析的研究目标可以进一步扩展,如通过对中药专利的技术信息进行分析,服务于技术预见;通过对中药专利的申请及授权数量的区域分布、专利权人的区域分布等基本指标的分析,服务于专利战略制定的决策支持;建立中药专利相关数据的共现、共引网络,并对其进行聚类分析,从而对中药专利的主要研究领域进行识别;通过对中药专利的药物组成、功效、配伍等数据进行分析,用于新药物、新配方的发现或提升特定疾病的诊断或治疗效果;通过对中药专利的权利要求进行分析,服务于主动或被动的专利诉讼等。
323研究对象的丰富
目前中药专利分析研究的研究对象从指标特点来看,主要是对一些基本指标(如专利数量、专利权人分布等指标)进行分析;从专利类型来看,主要是对发明专利、申请专利、授权专利及有效专利进行分析;从专利内容上来看,主要是对专利说明书中的特定药物或面向特定疾病的中药专利进行分析。由图3可知,表示医药领域专利分析研究对象的研究热点还包括“技术生命周期”、“技术发展阶段”、“失效专利”、“法律状态”等。基于此,在未来的研究中,中药专利分析的研究对象可以进一步丰富,如在指标上,可以通过对中药专利技术生命周期或技术发展阶段等指标进行分析,从而实现技术预测或制定相应的专利战略;在专利类型上,可以对失效的中药专利进行分析,探讨中药失效专利的继续加工及再次利用的手段和方法;在研究内容上,可以将目光扩展到专利的权利要求书上,通过对专利法律状态的分析研究专利保护或专利诉讼等法律层面的问题。
参考文献
[1]刘海波,刘延淮.知识经济时代的中药专利资源利用[J].世界科学技术-中医药现代化,2014,(5):978.
[2]秦宇,董丽.我国中药专利申请现状分析及建议[J].中国新药杂志,2016,(8):841-845.
[3]许钧钧,张辉,唐力英,等.进入中国的复方中药专利现状分析[J].中草药,2012,(12):2321.
[4]杨旭杰,肖诗鹰.基于聚类分析的中药复方职务发明专利现状及增长路径研究[J].中国中药杂志,2012,37(17):26-29.
[5]海广范,杨俊,李生莹,等.2001-2010年北京市、上海市和广东省中药专利分析[J].中国实验方剂学杂志,2011,17(24):223.
[6]海广范,杨俊,张贺鸣,等.中国、韩国、德国、日本和美国2006-2010年中药专利比分析[J].中国实验方剂学杂志,2011,17(15):274.
[7]杨旭杰,肖诗鹰.基于聚类分析的中药复方专利区域发展研究[J].中国中药杂志,2012,37(16):2472.
[8]王霞.基于知识图谱的国际知识管理研究可视化分析[J].科技管理研究,2011,31(20):175.
[9]刘则渊,陈锐,侯海燕.科学知识图谱:方法与应用[M].北京:人民出版社,2003.
[10]邱均平,温芳芳.近五年来图书情报学研究热点与前沿的可视化分析——基于13种高影响力外文源刊的计量研究[J].中国图书馆学报,2011,37(2):51.
[11]贺玲,吴玲达,蔡益朝.数据挖掘中的聚类算法综述[J].计算机应用研究,2007,24(1):10.
(本文责任编辑:郭沫含)