基于文献分析的智能医疗研究现状与展望
2019-04-27马子烨
张 敏,马子烨,谢 彤
智能医疗的相关研究起步于20世纪80年代。1980年,美国罗格斯大学计算机系的Casimir A.Kulikowski在IEEE旗下期刊上发表了Artificial-intelligencemethodsandsystemsformedicalconsultation一文,全面提出了人工智能在医疗咨询中的作用,他在该文中论述了医学界对于计算机作为辅助工具提供医学咨询的需求以及医学人工智能的目标与途径,讨论了医疗咨询过程中的决策问题以及风格,包括基于人工智能提供医疗咨询的任务、类型以及咨询方式的演变[1]。该文首次指出了医疗咨询中可以借助哪些人工智能的方法,包括语义网络、符号推理等。
2011年,美国国家科学院在“迈向精准医疗”的报告中首次详细阐述了“精准医疗”的概念[2];2015年,美国总统奥巴马提出的“精准医疗计划”的倡议,更是让“精准医疗”成为了全球医学研究、药物研发、医疗产业的热点[3]。2017年7月国务院印发的《新一代人工智能发展规划》(以下简称“《规划》”)[4]是我国在人工智能领域颁发的第一个系统部署文件,《规划》指出人工智能呈现出“深度学习、跨界融合、人机协同、群智开放和自主智能的新特点”。在精准医疗与人工智能的融合驱动下,以医疗健康大数据为基础的疾病诊疗、疾病管理以及疾病机制研究处于重要的发展时期,我国也应抓住机遇,充分研究人工智能在医疗健康领域应用的理论、方法与关键技术,让人工智能成为“精准医疗”的加速器,从而加快进入“智能医疗”时代。
从企业层面看,IBM、谷歌、微软、亚马逊、脸谱、苹果等科技巨头的人工智能之战也延续到了医疗健康领域。近几年,无论通过外部收购中小企业还是内部组建自家团队,或者与医院、医学研究机构、传统医疗企业合作,科技巨头们纷纷涉足医疗健康领域,试图用人工智能改变甚至颠覆传统的医疗健康行业[5]。我国的企业也应该及时参与到医疗健康行业的人工智能之战,找准先发优势,并尽快取得受专利权保护的技术优势。
为了全方位探讨国内外智能医疗领域的研究现状、关键技术以及前沿发展,进一步深入研究医疗大数据时代人工智能的理论与方法,探讨我国智能医疗的发展与规划,本文以“人工智能”和“智能医疗”2个核心概念为基础,对学术论文检索和专利检索结果集进行数据清洗和规范,提取关键词后,进行定量和定性分析,揭示智能医疗领域的研究现状,为学者开展研究提供参考。
1 数据来源及方法
本文对论文和专利两类数据进行分析,检索策略为“(Precision-Medic* or intelligen*-Medic* or smart-health*)AND (Artificial-Intelligen* or AI or Big-data)”。其中,以Web of Science 为数据源,共检索出3 956篇相关文献(检索时间为2019年4月25日);使用Questel公司的Orbit专利检索与分析系统,共检索出923件相关专利家族(检索时间为2019年5月14日)。
本文采用文献计量、聚类分析、专利分析等多种方法,从发展现状、研究热点、研究机构、研究趋势等方面进行全面探讨,使用的分析工具包括德温特数据分析软件(DDA)、Orbit分析工具、Tableau数据分析工具等。
2 智能医疗领域的研究现状
2.1 研究历程和阶段
智能医疗领域论文和专利的增长情况如图1所示。从学术文献的角度,智能医疗的相关研究按年代发展可划分成3个阶段。
图1 智能医疗领域论文/专利的时间分布
第一阶段:1977-1990年为萌芽发展阶段。这一阶段学界开始了对于智能医疗的讨论,但由于信息技术发展水平的限制,研究层次处于较低水平,发文数量少,每年不超过10篇,只是在理论层面进行小范围的讨论。
第二阶段:1991-2010年为起步发展阶段。这一阶段学界开始逐渐重视智能医疗的研究,发文量呈现缓慢增长趋势,1991年快速增长到29篇,此后一直稳定增长,2010年达到了近百篇,说明研究正式起步。
第三阶段:2011年至今为飞速发展阶段。这一阶段随着信息技术、大数据的迅速发展,智能医疗已经成为学界关注的热点话题,国内外均进行了大量研究,研究论文从2011年100篇左右到2018年的900多篇,国内外机构纷纷出台了一系列智能医疗建设举措,智能医疗迎来了发展的鼎盛时期。
从专利申请的角度,我们发现智能医疗的研究从一开始就表现出了与产业紧密联系的鲜明特点。随着学术研究的开展,智能医疗的产业前景迅速受到重视,并及时带动了专利申请。2014年以后,全球智能医疗专利申请量迅猛增长,学术界和产业界开始了大规模的专利布局,2018年专利家族数达到310件。可以预见,有关智能医疗的产业布局和技术保护还将继续迅猛发展下去。
2.2 主要国家或地区
智能医疗领域发文量大于100篇的国家/地区的统计结果如表1所示。
表1 智能医疗领域论文发文量>100篇的国家/地区
美国的发文量遥遥领先,达1 128篇(占28.51%);中国发文量排名第二,共546篇(占13.80%),之后是英国、印度、德国、意大利、西班牙、加拿大、法国、韩国、澳大利亚、日本,共有12个国家或地区在智能医疗领域的发文超过了100篇。
对这些国家2015-2019年的发文量的进一步分析(图2)可知,美国对智能医疗一直保持着较高的研究热度,且2017年以后其研究成果显著增加,中国近年来也保持着较为活跃的状态。值得注意的是印度和韩国,2015-2019年印度的发文量超过了英国,79.78%的论文发表在近5年,说明印度借助信息技术的优势,在智能医疗领域取得了明显进步;2015-2019年韩国的发文量超过了西班牙、加拿大、法国,且88.80%的论文发表在这5年,说明韩国近年非常重视智能医疗领域的研究,也取得了显著的成绩。
智能医疗领域发表论文最多的10个国家关注的研究热点也有所不同(表2)。美国、英国、加拿大的研究范围比较广泛,涉及所有领域;中国和印度比较类似,侧重于电信、工程、电气和电子科学;德国更侧重于放射学、核科学和医学成像、医学信息学、生物医学工程领域的研究;意大利、西班牙和法国比较相似,重点在计算机科学领域、医学信息学、生物医学工程领域;韩国的研究重点很明显在工程、电气和电子、电信领域。从总体上看,欧美国家对医疗领域的关注程度较高,亚洲国家对计算机科学和工程领域的关注度较高。
图2 2015-2019年发文量超100篇的国家或地区
专利的市场覆盖面(受保护国)分析表明,中国是智能医疗最大的市场,72.7%的专利(671件)在中国申请了保护,其次是美国(161件)和欧洲市场(149件),另外韩国、加拿大、日本、印度、澳大利亚市场也有相关的专利布局。
在智能医疗领域,中国市场目前的专利量是最多的,671件专利全部有效(其中授权143件,申请中528件),专利权人主要分布在高校和企业。中国市场专利的主要布局如图3所示。从图3可知,中国市场专利侧重于计算机技术、医疗技术、数字通信、管理信息技术方法、智能监控装置、测量装置等技术领域。
图3 中国市场专利的主要技术领域
不同国家的技术布局各有侧重点。美国市场是全球重要的技术市场,智能医疗领域的重要专利权人基本都在美国进行了专利布局。美国市场专利的主要技术领域(图4)更加侧重于计算机技术、医疗技术、生物技术、生物材料分析技术、药品、管理信息技术方法、数字通信。
图4 美国市场专利的主要技术领域
欧洲市场专利侧重于计算机技术、生物技术、药品、医疗技术、生物材料分析技术、数字通信、管理信息技术方法,韩国市场专利侧重于医疗技术、计算机技术、管理信息技术方法、数字通信、电信、生物技术,印度市场侧重于计算机技术、药品、生物技术、医疗技术、生物材料分析、数字通信、管理信息技术方法、有机精细化学、电信技领域。
2.3 优势机构及其竞争力分析
2.3.1 主要研究机构
智能医疗领域发文量达20篇及以上的研究机构共21所,如图5所示。
图5 高发文量研究机构的分布
其中美国14所、加拿大2所、中国2所、波兰1所、伊朗1所、沙特阿拉伯1所。美国在智能医疗领域的研究占有绝对优势,在众多研究机构中,斯坦福大学、哈佛大学医学院发文数量居领先地位,远超其他机构。中国的中科院排名第三,华中科技大学排名第十一(按篇数相同并列计算)。
对2017-2019年机构的发文数量进行分析(图6)发现,哈佛大学(包括哈佛大学医学院)、斯坦福大学仍处于明显领先地位,哈佛大学医学院90%的论文是在2017-2019年间发表的,约翰霍普金斯大学86%的相关论文是在2017-2019年间发表的;国内的研究机构中,中科院仍然处于领先地位,同时中国科学院大学、清华大学、北京大学的发文数量在这3年增长明显。
总体来说,2017-2019年智能医疗仍然是研究热门,美国的优势地位进一步巩固,发文量大幅度提升;中国对智能医疗的研究也在不断加强,有更多的中国高校参与到国际学术竞争中。
图6 2017-2019年发文量较高研究机构的分布
从专利角度来看,全球重要专利权利人的专利权受保护地区分布如表3所示。从表3可以看出,专利申请靠前的企业分别有:韩国的LMECA株式会社、三星电子、SYNTEKABIO公司,美国的莱斯康制药公司、CUBISME公司、SERA PROGNOSTICS公司、哥伦比亚大学,德国的西门子公司、CUREVAC公司等。
中国也有很多企业和高校申请了相关专利,但是仅有3家中国机构在中国申请专利的基础上进一步申请了WIPO专利,仅京东方科技公司在美国申请了1项专利。反观国外的公司和高校对创新技术的保护更有效,不仅在本国申请了专利保护,还就关键技术进一步申请了WIPO专利,并且在其他国家进行了专利布局,专利战略上更胜一筹。
表3 全球重要专利权利人的专利权受保护地区及专利数量分布
2.3.2 优势机构的研究方向
发文量较高的研究机构的研究方向分布如图7所示。
从图7可看出,不同的研究机构各有侧重。
美国的研究机构较多关注大数据、机器学习、算法、精准医疗、基因治疗等方面的研究,其中斯坦福大学侧重于分类、模型、数据挖掘以及卫生保健等方面的研究,哈佛大学医学院更加侧重于算法以及乳腺癌等具体疾病的研究,马萨诸塞州医院从医院的角度更加关注数据分类从而进行精准预测以及具体疾病的研究,麻省理工学院侧重于智能医疗在卫生保健以及医疗管理等方面的研究,华盛顿大学关注智能医疗的算法(即神经网络、分类预测以及智能诊断等方面的研究)。
中国的主要研究机构更侧重于中医诊断、算法加密、卷积神经网络、糖尿病等具体疾病的治疗。中科院近年来主要关注电子皮肤、应变传感器、DNA甲基化、全基因组关联分析、基因表达等领域,从基因层面进行深度研究;华中科技大学更加关注智能医疗技术相关的网络连接、物联网、云计算,侧重于智能医疗的技术基础研究。
英国的主要研究机构以牛津大学、伦敦国王学院为主,较多关注微生物分析、空间分析、算法研究。其中牛津大学更加关注算法研究和智能诊断,伦敦国王学院更加关注卫生保健和智能医疗网络搭建。
印度的主要研究机构包括塔帕大学、安那大学、韦洛尔理工大学,研究重点侧重于技术层面,重点关注算法研究,包括A-ECG、反响传播算法、M-ECG等多种算法,以及如何处理智能医疗过程中的大数据。
德国的主要研究机构以亚琛工业大学、海德堡大学、德国慕尼黑理工大学为主,重点关注医疗保险中的人机交互、医学信息系统的可用性、未来卫生保健技术的人文方面等。
3 智能医疗领域的研究热点
为全面了解智能医疗领域的研究热点,分别从论文和专利角度进行分析。
3.1 高频关键词
通过分析3 956篇论文的高频关键词,可以揭示智能医疗领域的研究热点。高频关键词如图8所示。
人工智能、神经网络、大数据是研究的基础,也是文献最集中的核心领域;分类算法、机器学习、诊断技术、精准医学、预测模型、专家系统、深度学习、算法研究、决策支持系统、SVM算法等都是目前的研究热点,同时癌症也是智能医疗重要的研究和应用领域。
923件专利家族的概念聚类如图9所示。从概念聚类可以看出研究热点与技术领域紧密联系的产业是技术创新的主要地带。主要研究集中在以下9个热点领域。医院、医疗服务和平台研究:包括云服务器、医学知识、医学诊断、临床数据、用户健康;智能诊断技术:包括治疗方案、疾病诊断、数据采集、健康管理;医疗健康数据采集技术:包括智能手机、个人健康数据、穿戴式、血糖、数据传输、医疗人员;临床数据管理研究:包括个人健康数据的收集、存储,数据库的建立;基于医学影像等的深度学习研究:包括医学影像、机器学习、深度学习、分类;智慧城市研究:包括智慧城市、智能医疗、云技术;关于癌症的基因技术:包括逻辑回归、个人基因等;卷积神经网络的算法研究:包括分类模型、卷积神经网络;医学人工智能研究:包括医学人工智能、病情、护理人员、医用吸引器。
图9 专利概念聚类
3.2 2017-2019年研究热点分析
随着互联网的发展,新一轮科技革命和产业变革席卷全球。通过对比智能医疗领域的3 956篇总发文,以及2017-2019年间的1701篇发文的关键词(主题),可挖掘出智能医疗领域的新兴研究趋势。2017-2019年期间首次出现的主题和不再使用的主题如表4所示。
表4显示,2017-2019年,在技术应用方面出现了区块链、自动分割、监督机器学习、转移学习、边缘计算、诊断成像和卷积神经网络等技术。最近十分热门的区块链技术也开始在智能医疗领域逐渐得到了应用,这些技术的出现可以为患者提供具有个性化的医疗服务;在临床应用方面,针对具体疾病的研究增多,如黄斑退化、鳞状细胞癌、脓毒症等;此外,关于卫生政策的研究也越来越受到各研究机构的关注。
也有一些主题在2017-2019年间不再被研究者提及,如人工免疫系统、多功能系统、急性腹部疼痛等常见疾病或系统疾病等,近年来的研究更关注于某一类具体的病症,知识获取、图像理解、临床决策等主题在2017-2019年的研究中未出现,在疾病诊断的分析技术层面,贝叶斯定理、分布式人工智能、句法模式识别与分析、判别分析等概念在2017-2019年的研究主题中已基本不被提及。
表4 2017-2019年首次出现和不再使用的主题
4 智能医疗领域的研究展望
智能医疗经过30年的发展,目前已经成为当下新兴的热门研究主题。在现有研究的基础上,对不同主题、不同机构、不同国家研究的新颖性、持久性以及成长性进行分析评测。可以发现该领域近年来新产生的高使用率和具有发展潜力的主题方向,也可以看到一些研究水平突出且未来也非常有竞争力的研究机构,还可以识别出智能医疗领域未来较有潜力的国家。通过利用科睿唯安公司的德温特数据分析软件(Derwent Data Analyzer,DDA)对3 956篇论文数据进行清洗,得到基于DDA分析软件中的主题新兴指数(Emergence Score)的数值,并对其进行可视化,可以预测智能医疗领域的新兴主题,如图10所示。
图10 智能医疗领域的新兴主题
从理论层面看,智能医疗领域未来的研究仍以机器学习、深度学习为基础,主要的理论探讨将集中在神经网络、数据科学、自然语言处理、物联网等方面,制定符合远程医疗、电子医疗特点的医疗卫生政策也是另一个理论研究的方向。
从应用层面看,智能医疗领域未来研究将集中在医学影像技术、虚拟现实、增强现实技术等方面,通过这些技术实现智能医疗的实时性和互操作性。有研究显示,我国人工智能技术研究特别关注在医学影像学中的应用,更侧重于聚焦视像处理、数据计算和核磁共振等分支研究[6]。这也正是智能医疗新兴应用领域的发展方向,显示了我国在该领域的活跃性。
从实践层面看,智能医疗领域将开展更多的临床试验,可能会首先关注外科手术方面的试验、日常基本护理层面的试验,以及智能慢病远程辅助诊断等方面的实践[7]。除了临床试验外,医院管理的不同应用场景也是智能医疗的发展方向,如电子病历、医院智能办公环境、远程监护与跟踪、个人健康智能管理等方向[8]。
从疾病层面看,智能医疗将重点关注癌症方面的疾病[9],前列腺癌、乳腺癌都可能是首先被关注的疾病,同时糖尿病视网膜病变也有很高的关注度,心理方面的疾病、轻度认知障碍方面的疾病也可能是未来智能医疗的研究重点。
同样,基于DDA分析软件中的机构新兴指数(Emergence Score)数值发现,从研究地区看,在未来一段时间,美国在智能医疗的研究依旧领先其他国家,具有较强的竞争力;英国、印度、中国、韩国的研究竞争力也在不断提升,彼此差距会逐渐缩小;加拿大、德国、澳大利亚紧随其后,欧洲的整体研究实力略有退步。从机构层面看,哈佛大学医学院、蔚山大学、马萨诸塞州医院、哥伦比亚大学、伊坎医学院、芝加哥大学、克利夫兰医学中心、杜克大学、渥太华大学、梅奥临床医学中心、约翰霍普金斯大学等是智能医疗研究领域未来重要的研究机构。中国的研究机构可以关注这些机构的研究方向和关注点,高校也可以与上述研究机构开展国际合作,提升国际竞争力。