APP下载

人工智能技术在药学领域的应用

2019-09-10凌曦赵志刚李新刚

中国药房 2019年4期
关键词:文献计量分析研究热点药学

凌曦 赵志刚 李新刚

中圖分类号 R-1 文献标志码 A 文章编号 1001-0408(2019)04-0433-06

DOI 10.6039/j.issn.1001-0408.2019.04.01

摘 要 目的:了解人工智能(AI)技术应用于药学领域的研究概况、热点及前沿进展,为我国相关研究的发展提供思路。方法:采用文献计量学方法,在Web of Science数据库中检索1998-2017年发表的相关期刊和会议论文(检索词为“Article”和“Proceeding Paper”);利用ISI Web of Knowledge自带的分析检索结果及创建引文报告功能,结合CiteSpace 5.2.R1软件绘制知识图谱,对目标文献进行定量统计和定性分析,对该领域研究的发文量、共被引情况、主要研究国家/地区、主要研究机构、主要研究者、研究热点及研究前沿进行归纳总结。结果:共检索得3 674篇相关文献。1998-2017年期间该领域文献数量飞速增长;美国、中国、英国和德国因发文量大而占据领先地位,但中国的国际合作明显较少,且缺乏优秀核心团队;从研究者角度看,该领域研究处于“部分集中、整体分散”的状态,缺乏团队合作。该领域的研究热点包括AI技术的重要核心(机器学习算法)以及其在药学领域的主要运用(药物发现及设计),还有疾病或不良反应诊断分级、药学模型的建立和优化、药物筛选或药效预测、药学数据库的建立等;近年来的研究前沿包括“分子对接”“机器学习”“Meta分析”“精准用药” “靶向治疗”等。结论:AI技术在药学领域的应用是一个时效性极强的热门研究领域,其应用于医药产业开发是大势所趋,而我国在该领域的研究现状与国际前沿水平仍存在一定差距。这需要我国药学工作者在做好实验研究和临床试验等基础工作的同时,加强与AI领域专家的的交流和合作,以适应AI技术与药学紧密结合发展的国际趋势。

关键词 人工智能;药学;知识图谱;可视化;文献计量分析;研究热点;研究前沿

ABSTRACT OBJECTIVE: To investigate the research status,hotspots and frontiers of the artificial intelligence (AI) technology applicated in pharmaceutical field, and to provide ideas for the development of related research in China. METHODS: Using bibliometric method, relevant journals and proceeding papers from 1998 to 2017 were searched from Web of Science database (“Article” and “Proceeding Paper” as retrieval words). Using analysis and retrieval results of ISI Web of Knowledge and its function of creating citation report, CiteSpace 5.2.R1 software was employed to draw knowledge map; quantitative statistics and qualitative analysis was conducted to summarized the research volume, co-citation, main research countries/areas, main research institutions, main researchers, research hotspots and research frontiers in this field. RESULTS: A total of 3 674 related literatures were retrieved, and the number of global published literatures in this field increased rapidly from 1998 to 2017; the dominant nations included America, China, Britain and Germany because of their large number of publications,but China showd an obvious lack of international cooperation and excellent core teams. From the researcher’s point of view, the research in this field was in a state of “partially concentrated and overall dispersed” and lacked team cooperation. The research hotspots contained important core of AI technology (machine learning algorithms) and its application in pharmaceutical field (drug discovery and design), the classification of disease or adverse drug reaction, the establishment and optimization of pharmaceutical mode, drugs screening or pharmacodynamics prediction, the estbalishment of pharmaceutical database, etc. The recent research frontiers included “molecular docking” “machine learning” “Meta analysis” “precision medicine” “targeted therapy”, etc. CONCLUSIONS: AI applicated in pharmaceutical field is a hot research field with strong timeliness, and its application in the development of pharmaceutical industry is the general trend. However, there is still a gap between the current research level in this field in China and the international frontier research. In order to adapt to the international trend of the combination of AI technology and pharmacy, pharmacists in China should strengthen their cooperation with researchers in AI fields while doing well the basic work of experimental research and clinical trials,etc.

KEYWORDS Artificial intelligence; Pharmacy; Knowledge map; Visualization; Bibliometric analysis; Research hotspots; Research frontiers

随着信息科技的高速发展,作为当今世界三大尖端技术之一的人工智能(Artificial intelligence,AI)自1956年提出以来,已获得广泛的传播和发展,并渗透于各行各业之中。2018年4月,我国教育部更是积极部署行动计划促进AI的多学科交叉融合,并计划至2020年,实现AI总体技术和应用与世界先进水平持平[1]。AI是以人类智能的相关理论为基础,运用大数据和机器学习等方法,模拟和延伸人类智能的理论、方法、技术及应用系统的一门边缘学科;其分支领域还包括数据库、数据挖掘、统计学、知识发现、模式识别、神经网络等[2],目前已被广泛应用于语言识别、智能终端、移动商务、医疗健康等诸多领域。其中,医疗健康领域目前存在优质资源不足、医疗成本高、医生培养和药品研发周期长等现实问题,因此AI技术在该领域尤其展现出巨大潜力和可观前景[3],世界范围各大科技巨头如谷歌、IBM等都争相布局AI医疗市场。

药学领域作为最早应用AI技术的医疗健康领域,在健康管理、辅助诊疗、药物挖掘、药品调配甚至临床合理用药等诸多方面,都已经实现了AI技术的广泛应用和发展。AI技术可用于完善对患者的健康风险识别(如CaféWell Health健康优化平台[4])、智能用药监测及不良反应风险评估(如计算机辅助的贝叶斯不良反应诊断系统[5])、辅助临床治疗药物检测[6]、临床用药咨询[7]、合理化药物设计(如计算机辅助药物设计[8])、提高新药研发转化效率[9]、提供新的药物靶向手段(如飞利浦“蜂群”机器人[10]),乃至于综合分析患者各类临床信息及药物经济学数据,形成科学合理的个体化处方意见[11]。基于AI技术在药学领域中的快速发展和成果转化,为深入了解其研究现状及发展趋势,本文通过检索相关文献,运用多元分时动态的可视化图谱软件CiteSpace,对全球AI技术应用于药学领域的热点研究及前沿方向等进行分析,为相关技术的研发应用提供参考。

1 资料来源

本研究数据来源于科学引文索引(Science Citation Index,SCI)网站Web of Science(简称“WOS数据库”)核心合集中的SCI-EXPANDED数据库[12],该数据库收录的文献具有高质量、低冗余、易适配的特点,广受学术界认可[13]。数据库更新时间为2018年4月9日。本研究检索策略为“TS=(("artificial intelligence" OR "machine intelligence" OR "machine learn*" OR "neurocomputing" OR "virtual assistan*" OR "robot*" OR "artificial neural network*")AND(medication* OR drug* OR pharm*))”,语种选择“English”,时间跨度为1998-2017年,限定文献类型为“Article”和“Proceeding Paper”(即期刊与会议论文)。所得文献以全记录格式进行保存。由两名研究者对文献的题目和摘要逐一阅读,排除重复、信息缺损及非相关性文献,最终保留3 674条文献记录。

2 方法

知识图谱是一门通过数据收集、信息挖掘、科学计量和图形绘制等手段来可视化地展现某个领域研究基础和前沿的现代理论[14];绘制知识图谱常用的软件包括CiteSpace、Sci2Tool、Bibexel等。其中,CiteSpace是由美国知名学者陈超美博士开发的一款信息可视化分析软件,可在权威数据库支持下分析并寻找某一学科领域的研究热点及发展趋势,是有效的知识导航工具[15]。本研究利用ISI Web of Knowledge自带的分析检索结果及创建引文报告功能,结合CiteSpace 5.2.R1软件,对目标文献进行定量统计和定性分析,对该领域研究的发文量、共被引情况、主要研究国家/地区、主要研究机构、主要研究者、研究热点及研究前沿进行归纳总结。

3 结果

3.1 AI技术应用于药学领域的研究概况

3.1.1 文献发表数量 AI技术应用于药学领域的第一篇SCI文献发表于1992年,彼时正处于AI研究的低谷期[16],故直至1997年该领域发文量仍不足50篇。1998-2017年该领域年发文量和年引文量的分布情况见图1。由图1可见,20年内该领域发文量增长了9倍之多,引文量亦逐年上升,表明这一时期AI技术应用于药学领域的研究呈现出飞速发展的态势。20世纪之后,计算机硬件技术的突破性发展促成了AI技术的革新,而后大数据和深度学习的兴起更是带动了AI领域的快速发展[17]。本研究目标文献发文量的激增也印证了AI技术应用于药学领域的研究与AI技术发展轨迹具有一致性,也提示该领域有良好的发展前景和研究价值。

3.1.2 文献共被引和知识基础分析 文献之间通过相互引证实现该领域发展的积累、连续和传承,同被一篇文献引用的关系结构可形成共被引网络图谱[18],其中的关键文献和奠基文献则构成了该领域的知识基础[19]。在CiteSpace软件中选择网络节点为“Cited Reference”,其余设置从略,结果获得AI技术与药学领域研究的共被引文献网络图谱(图2)及其時间序列分布图谱(图3)。

图2和图3中每个圆形节点代表一篇文献,节点的大小反映其被引频次的高低;节点年轮最外圈的颜色深度则表明该文献具有较高的中介中心性(中介中心性的高低代表该节点在联系整个网络中发挥的作用大小,以中心度来表示);而关键节点一般是被引频次和中心度均较高的节点,提示该文献具有重要的学术价值[20]。

图2中最大的关键节点是2011年台湾大学Chang CC发表于《ACM Transactions on Intelligent Systems and Technology》杂志上的关于支持向量机(SVM)模式识别与回归的软件一文,共被引70次,中心度为0.45。该文提出的SVM一度被认为是在深度学习出现之前机器学习最经典的算法,至今仍广泛运用于疾病诊疗、计算机辅助药物设计等医药工作中[21]。其他高影响力文献还有2009年Hall M等发表的《WEKA数据挖掘软件更新》一文,该文所涉及的软件可为循证医学、疾病诊断、药物相互作用及不良反应等提供证据支持;2012年Gaulton A等在《Nucleic Acids Research》杂志上发表了一篇文章,是關于建立ChEMBL数据库,而这一数据库通过机器采集了超过100万种生物活性物质的代谢和功能信息,为药物研发等工作提供了极大帮助;2010年Rogers D等发表的《Extended-Connectivity Fingerprints》一文更是为计算机辅助药物结构-活性设计增加了重要助力。

由图3可见,AI技术应用于药学领域的第一篇奠基性文献发表于1990年,是由Buick AR等提出的生物分析实验的方法学验证理论,该文为后期药物浓度的自动化检测提供了依据。中心度较高的知识基础性文献还包括90年代关于神经网络的著作,神经网络是仿生学派建立的机器学习算法,更是深度学习的前身。1999年Zupan J 等撰写有关神经网络在化学和药物设计中的应用,为AI在药学领域中的延伸奠定又一坚实基础。图3中还可见以2009年为界,目标文献的研究方向和主题有了较大的不同,提示2009年后该领域的研究有了突破性进展,形成了新的研究成果核心。

3.1.3 主要研究国家/地区及机构分析 将CiteSpace中节点类型设置为“国家和地区”,其余设置从略,分析获知AI技术应用于药学领域的研究共涉及60个国家/地区。不同国家/地区的研究实力不尽相同,发文量排名前10位的国家/地区的发文量及中心度见表1。由表1可见,美国在该领域的文献产量明显高于其他国家/地区,其中心度也远高于其他国家/地区,表明其与全球研究机构间联系最多,有丰富的合作关系;中国发文量位居第2位,但中心度远低于其他国家/地区,可见与其他国家/地区间的学术合作或交流较少;此外,英国、德国等欧洲国家在该领域亦发文较多且合作密切,具有较高的研究地位。

此外,将CiteSpace中节点类型设置为“机构”,其余设置从略,分析获得研究机构合作网络图谱(图4),可展示出AI技术应用于药学领域的研究核心机构及合作情况。该图谱将各机构的文献数量及发表时间通过节点年轮的大小和颜色深度直观呈现出来,字体的大小反映了该机构总发文量的多少,而节点间的连线粗细则反映了机构间合作的强度[22]。由图4可见,该研究领域影响力最大的机构为美国哈佛大学,其研究时间最早、发文量大且合作关系众多;同样具备这些特点的还包括斯坦福大学、密歇根大学、中国科学院等机构。

3.1.4 主要研究者分析 共有14 360位研究者参与了AI技术应用于药学领域的研究。将节点类型设置为“作者”,其余设置从略,通过CiteSpace绘制作者合作网络图谱(图5),可识别该领域的核心作者及其之间的合作情况[23]。该图谱中节点年轮的颜色深度及其大小反映了文献发表的时间和数量,字体的深浅也反映出作者的影响力大小。从作者角度看,该领域研究处于“部分集中、整体分散”的状态,缺乏团队合作;结合作者被引频次结果(图表从略),美国马里兰大学的Ekins S、瑞士罗氏公司的Schneider G、日本城西大学的Takayama K以及中国广西大学的Chou KC等作者发文量大且被引频次较高,在该领域具有较大影响力;西班牙圣地亚哥综合大学的Gonzalez-Diaz H发文较多、被引频次较少,但其团队合作较多,一定程度上也增强了其研究地位。

3.2 AI技术应用于药学领域的研究热点分析

关键词是作者用来高度概括核心论点的语句,其分布频次和特点可体现研究领域的总体特征、研究热点间的相互联系和发展趋势[24]。将CiteSpace中节点类型设置为“关键词”,聚类词类型设置为“名词短语”,分析获得AI技术应用于药学领域研究的关键词共现网络图谱(图6)。该图谱中三角形的大小和颜色深度代表该关键词出现的频次和时间,字体的深浅也反映了频次的高低。采用CiteSpace对关键词的出现频次进行统计分析,结果出现频次最高的关键词为“Neural network”,其次为“Machine-learning”“Discovery”“Prediction”“Classification”“Design”等(表2),分别反映了AI技术的重要核心(机器学习算法)以及其在药学领域的主要运用(药物发现及设计);其他研究热点还包括:疾病或不良反应诊断分级、药学模型的建立和优化、药物筛选或药效预测、药学数据库的建立等。中心度较高的关键词如“Discovery”“Design”,则提示有多个研究领域的研究与药物的发现或设计有关,即具有一定的学科交叉性[25]。

3.3 AI技术应用于药学领域的研究前沿进展

通过CiteSpace可以发现时间轴上频次变化率高的词汇,并将其从大量关题词中提取出来,进行膨胀词(Burst,表示某个学科中研究兴趣强度骤然增加的专业术语)检测。Burst是研究前沿留下的印记,通过分析它们可以发现该领域研究的前沿领域及发展趋势[26]。研究领域发展越迅速,其膨胀强度越高。采用CiteSpace对图6中的关题词进行Burst检测,结果共发现了103个膨胀词,可见这是一个复杂且迅速发展的领域。膨胀强度排名前4位关题词见表3。由表3可见,分子对接(Molecular docking)的膨胀强度最高。分子对接属于计算机辅助药物设计领域,有较为长久的研究历史,但近两年又一次备受关注,可能与Machine-learning(机器学习)的新进展有关;而Mass spectrometry(质谱法)和In silico(计算机生物模拟实验)则是早几年的研究热点。

采用CiteSpace将图6中关键词以时间序列图谱的形式展开(见图7)。该图谱中,关键词按出现时间的先后顺序,从左到右、从下到上排列,其字体的大小反映了关键词出现频次的高低。由图7可见,AI技术应用于药学领域在不同时期有不同的研究前沿。现时期的研究前沿包括乳腺癌、计分公式、纳米粒、数据库、定量构效关系(QSAR)模型、Meta分析等,而精准用药和靶向治疗无疑是2015年来最重要的研究前沿之一。

4 结语

笔者依据文献计量学的相关理论,借助CiteSpace可视化分析工具,以WOS数据库近20年收录的AI技术应用于药学领域的研究文献为数据来源,用知识图谱的方法直观展现并分析了该领域研究的发文量及发文时间、知识基础、研究国家/地区、研究机构、研究者、研究热点以及研究前沿。结果发现,20年来已有越来越多的国家、机构和研究者投身这一领域的研究,发表的相关文献数量增长速度越来越快,期间不乏优异的研究著作为该领域的发展打下了坚实的基础。从世界格局来看,美国、中國、英国和德国因发文量大而占据领先地位,但我国相关研究的中介中心性偏低,以我国和日本等为代表的亚洲国家与欧美国家间的学术壁垒亦确实存在,因此加强国际合作应作为我国药学研究人员在此领域发展的重要方针。美国在该领域具有压倒性的领先优势,哈佛大学、斯坦福大学和密歇根大学等高校均颇有建树,相比之下我国仅中国科学院一枝独秀,因此亟需更多优秀的国内核心团队投入该领域研究中。Ekins S、Schneider G、Takayama K以及Chou KC等都是该领域的优秀学者,但总体来看该领域仍旧缺乏团队合作。该领域的研究热点包括机器学习算法、药物发现及设计、疾病或不良反应诊断分级、药学模型的建立和优化、药物筛选或药效预测、药学数据库的建立等;近年来研究前沿包括分子对接、机器学习、乳腺癌、计分公式、纳米粒、数据库、QSAR模型、Meta分析、精准用药和靶向治疗等。

总而言之,AI是对人类思维过程的模拟,其应用于医药产业开发是大势所趋,在药学领域的研究实施和决策制定过程中可起到至关重要的作用,这不仅仅体现在计算、检测、统计、建模等弱AI技术的广泛运用,更彰显于自然语言处理、专家决策系统、医学影像识别等复杂算法的快速发展中。2018年谷歌公司表示,其AlphaFold项目可根据基因编码预测蛋白质的3D结构[27],若该技术成熟,极可能促进药物分子设计、药理毒理试验、个体化治疗等研究的突破,同时大大减少研究成本、缩短研究周期。让计算机学会“思考”并深入医药卫生科学领域,无疑是药学研究人员面临的一场重大机遇和挑战。然而我国在该领域的研究现状与国际前沿水平仍存在一定差距。这提示我国药学工作者应时刻提升自身素养,学习新的软硬件技术,在做好实验研究和临床试验等基础工作的同时,加强与AI领域专家的交流和合作,以适应AI技术与药学紧密结合发展的国际趋势。

参考文献

[ 1 ] 刘辰.国务院印发《新一代人工智能发展规划》:构筑我国人工智能发展先发优势[J].中国科技产业,2017(8):78-79.

[ 2 ] 俞祝良.人工智能技术发展概述[J].南京信息工程大学学报,2017,9(3):297-304.

[ 3 ] 孔祥溢,王任直.本期专论导读:人工智能及在医疗领域的应用[J].医学信息学杂志,2016,37(11):1-5.

[ 4 ] 任彦合.浅谈人工智能技术在医疗健康领域中的应用[J].数字通信世界,2017(12):175、226.

[ 5 ] 余江南,相秉仁,安登魁.人工智能技术在临床药学中的应用[J].药学进展,1996,20(2):65-69.

[ 6 ] 刘瑞新,陈鹏举,李学林,等.人工智能感官:药学领域的新技术[J].药物分析杂志,2017,37(4):559-567.

[ 7 ] 李建凯,李莉,焦艳红.利用“大通医药咨询软件V5.0”分析我院11 118例门诊处方[J].中国现代应用药学,2008,25(8):727-729.

[ 8 ] 刘景陶,柳耀花.计算机分子模拟技术及人工智能在药物研发中的应用[J].科技创新与应用,2018(2):46-47.

[ 9 ] 颠覆传统医疗科研:借助人工智能研发抗癌药物[J].智慧健康,2016,2(5):44-47.

[10] 飞利浦研发出“蜂群”磁性机器人,可携带药物进入人体精准治疗[J].微创医学,2017,12(1):156.

[11] 马云,夏新,刘博,等.基于临床决策支持系统与知识库的临床数据中心的研究与应用[J].中国医疗设备,2014,29(7):61-63.

[12] 刘太芳,张爱华,张营,等.基于Web of Science的国际老年人慢性病研究的可视化分析[J].现代预防医学,2017,44(3):520-524.

[13] 熊勇,罗斌圣,龙春林.基于Web of Science民族兽药学文献的可视化分析[J].中国兽药杂志,2018,52(2):62-71.

[14] SHIFFRIN RM,BÖRNER K. Mapping knowledge domains[J]. Proc Natl Acad Sci U S A,2004,101(Suppl 1):5183-5185.

[15] CHEN C. CiteSpaceⅡ:detecting and visualizing emerging trends and transient patterns in scientific literature[J]. J Ass Inf Sci Technol,2009,57(3):359-377.

[16] 徐雷.人工智能第三次浪潮以及若干认知[J].科学,2017,69(3):1-5.

[17] 余凯,贾磊,陈雨强,等.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804.

[18] 陈超美,陈悦,侯剑华,等.CiteSpace Ⅱ:科学文献中新趋势与新动态的识别与可视化[J].情报学报,2009,28(3):401-421.

[19] 赵蓉英,王菊.图书馆学知识图谱分析[J].中国图书馆学报,2011,37(2):40-50.

[20] 李成,赵军.基于Web of Science的旅游管理研究信息可视化分析[J].旅游学刊,2014,29(4):104-113.

[21] 王凯.计算辅助乙酰胆碱酯酶抑制剂的研究[D].北京:北京化工大学,2012.

[22] 冯雪,吴国春,曹玉昆.基于CiteSpace的中国生物质能源研究知识图谱分析[J].干旱区资源与环境,2018,32(1):35-42.

[23] 胡泽文,孙建军,武夷山.国内知识图谱应用研究综述[J].图书情报工作,2013,57(3):131-137.

[24] 傅柱,王曰芬,陈必坤.国内外知识流研究热点:基于词频的统计分析[J].图书馆学研究,2016(14):2-12.

[25] CHEN C. Generalised similarity analysis and pathfinder network scaling[J]. Interact Comput,1998,10(2):107- 128.

[26] 栾春娟,侯海燕,王贤文.国际科技政策研究热点与前沿的可视化分析[J].科学学研究,2009,27(2):240-243.

[27] ANDREW S,JOHN J,DEMIS H. AlphaFold:using AI for scientific discovery[EB/OL].[2018-12-02].https://deepmind.com/blog/alphafold/.

(收稿日期:2018-05-03 修回日期:2018-12-10)

(编辑:段思怡)

猜你喜欢

文献计量分析研究热点药学
西药房药学服务质量的提升路径及作用分析
皮肤科药房开展药学服务效果观察
口服中药汤剂常见不良反应及药学干预
艾滋病抗病毒治疗中开展临床药学服务的作用探讨
SCI收录上海中医药大学论文的计量分析
我国职业教育师资研究热点可视化分析
近五年我国职业教育研究热点综析及未来展望
基于知识图谱的智慧教育研究热点与趋势分析
自闭症谱系障碍儿童的教育干预
基于社会网络分析的我国微课研究探析