基于Citespace的国内医工结合研究的可视化分析
2023-03-05艾华薛文杰武玥秦思雨蒋西然
艾华,薛文杰,武玥,秦思雨,蒋西然
中国医科大学 智能医学学院 生物医学工程教研室,辽宁 沈阳 110122
引言
随着科学技术的发展,医疗健康已成为学科交叉融合和科技创新的热门领域。现代医学的发展,离不开工程技术的推动作用,正是因为有电子和计算机技术、信号与图像处理技术、传感器技术、通信技术等工程技术与医学的紧密结合,有各种医疗设备的辅助,才有如今智慧医疗、医药全流程自动化、手术机器人等高效化、智能化的医疗模式和手段。2015年5月,国务院印发部署全面推进实施制造强国的战略文件《中国制造2025》[1],明确提出大力推动十大重点领域突破发展,其中就包括生物医药及高性能医疗器械领域。2016年10月中国中央、国务院又印发并实施了《“健康中国2030”规划纲要》[2],明确指出要推动健康科技创新。因此,推进医工结合,促进医疗健康领域的科技创新,既符合当代医学的发展趋势,更符合国家战略要求,贴合提升全民健康水平的需求。
医工结合又称医工交叉、医工协同,其最具代表性的产物是生物医学工程[3],继而拓展至医理、医管、医文等的结合。学科间的交叉渗透是科技创新的动力,又是科技发展的必然趋势。我国医工结合虽然取得一定成绩,但仍存在融合程度浅、成果转化少等问题[4]。因此,国内学者纷纷从不同的角度对医工结合的现状进行了剖析[5-9]。但是从国内中文期刊文章和国际外文期刊文章的角度进行我国医工结合研究现状和热点的挖掘还未见报道。
本研究利用Citespace软件,选取中国知网(CNKI)和Web of Science(WOS)核心合集数据库作为数据来源,对国内医工结合领域相关文献进行可视化分析,梳理国内医工结合领域的发展情况,挖掘该领域的研究热点和前沿,以期为相关研究和决策提供参考。
1 资料与方法
1.1 数据来源
本研究以CNKI和WOS核心合集数据库作为文献来源数据库。检索时间长度分别为7年和5年,终止时间均为2022年5月8日。CNKI“高级检索”中,以分类号“T”AND“R”进行检索,检索匹配方式“模糊”,共得到研究论文3.47万篇。WOS中选择“Web of Science核心合集”数据库下的“Science Citation Index Expanded(SCI-EXPANDED)-2000-至今”,以“Web of Science类别”的“Engineering,Biomedical”进行检索,去除不相关文献及非英语文献后,精炼国家/地区为“PEOPLES R CHINA”,共获取“Article”类型文献14435篇。以纯文本形式导出文献题录信息,内容为完整记录和引用的参考文献。导入Citespace中功能去重,最终分别得到3.41万和14435条数据,作为本研究分析的数据样本。
1.2 研究方法
本研究使用CiteSpace(版本号:5.8.3)知识图谱可视化分析软件对文献进行同义词合并整理后,从机构、作者、关键词及文献共被引4个维度进行分析。将CNKI和WOS检索到的结果分别以Refwork和纯文本格式导入本地,保存为“download_.txt”格式,利用CiteSpace软件将导出的文献信息进行格式转化,时间切片设为1年,设置参数并运行程序,构建相应知识图谱。
2 结果
2.1 研究机构分析
表1列出了国内研究机构医工交叉领域的国内发文情况。根据发文量可以看出,上海理工大学医疗器械与食品学院(现健康科学与工程学院)居首位,与其在生物医学工程领域的国内发文排名情况一致[10]。该学院具有鲜明的理工医结合办学特色,有“中国医疗器械工程师摇篮”的美誉。另外,从表1还可以看出,中医药领域的医工结合研究集中在成都中医药大学和中国中医科学院中医药信息研究所。虽然中医药领域医工结合相对西医难度大、发展慢[11],但是从国内发文量可以看出中医药医工结合在逐渐崭露头角。
表1 CNKI医工结合领域研究机构发文量前五名
表2列出了国内研究机构在医工交叉领域的国际发文情况。中国科学院不但发文量位居首位,而且从中心性接近0.1上可以看出,其在医工结合研究领域相对于其他机构具有更重要的作用。除中国科学院外,顺次排名前五的上海交通大学、浙江大学等均为南方高校,而且在前十五名机构中,南方高校占7个,可见国内医工结合领域地域性区别较大。另外,列表中仅有南方医科大学和首都医科大学两所医科高校,一方面可以看出两所大学通过医工结合探索“新医科”发展方面成绩斐然,另一方面也凸显了医学院校在医工结合领域整体发展的不足。
表2 WOS医工结合领域研究机构发文量前十五名
2.2 作者分析
在图1的作者合作网络图谱中,节点代表发文作者,字体大小或节点大小与发文量呈正相关,连线代表作者之间的合作;线条颜色代表作者的合作时间,粗细代表合作的次数。图1a包括607个节点,574条连线,网络密集度为0.0031;图1b包括529个节点,2153条连线,网络密集度0.0154。从图1中可以看出,医工结合领域的国内作者发文情况整体低于国际发文,且国际发文的作者在该领域普遍具有更重要的影响力(YU ZHANG、WEI WANG、JING WANG、YANG LIU、LEI WANG、WEI ZHANG中心性均在0.10以上)。国内发文作者中,最高频次(37次)作者为王伟,而国际发文作者中,YU ZHANG的频次达到105次。另外,国际发文作者间存在明显的交流合作,而国内发文作者整体分布比较分散,但也存在较为固定的合作团队,如以吕军、田国祥为中心的科研团队,以于彤、于琦为中心的科研团队,但团队之间的科研协作不足。
图1 作者合作网络图谱
2.3 关键词分析
2.3.1 关键词共现分析
关键词不但具有检索意义,更反映了文章主题,通过关键词分析,可以了解研究领域的热点问题和学科特点。关键词共现图谱的数据如表3所示,可以看出在医工结合领域的国内发文中,“深度学习”出现的频次远远高于其他关键词,“深度学习”“数据挖掘”“机器学习”和“图像分割”的中心性程度较高,且排名靠前的关键词多为工科中的计算机技术,这表明医工结合领域国内发文研究多集中于计算机科学在医学中的应用。另外,脑电与脑机接口研究以及医学材料相关的3D打印和光热治疗也属于国内发文的热点主题。国外发文中,“nanoparticle”位居首位,对应了本地数据中生物医学材料类文章居首位的情况,接下来的“model”“in vitro”“cell”“delivery”“expression”和“scaffold”更多地涉及组织工程等领域,而“classification”和“deep learning”则与国内发文一致。通过表3可以看出,深度学习是我国医工结合领域的普遍热点,这也与人工智能在医疗卫生系统的广泛应用密切相关[12-15]。
表3 CNKI关键词共现
2.3.2 关键词聚类分析
在关键词共现分析的基础上,通过LLR算法对关键词进行聚类分析,将关系紧密的关键词聚为同一类,对应聚类图谱中的1个区域,每个区域对应1个标签,标签数字越小,表示类别中包含的关键词越多。运行结果得到聚类模块值(Q值)分别为0.6005和0.4735(均大于0.3),表明聚类模块化结构显著,聚类平均轮廓值(S值)分别为0.819和0.7452(均大于0.7),表明类别内关键词联系紧密,聚类结果令人信服。由图2a可知,国内发文的研究主题集中于深度学习、区块链、脑电信号、光热治疗等,进一步说明了深度学习在医工交叉领域应用的广泛性。图2b中共有“deep learning”“bone regeneration”等5个类别,其中深度学习依然是第一大类,光热治疗与国内发文的关键词聚类类别一致。聚类标签如表4所示,其大致分为3个大方向,其中医工结合领域计算机人工智能为第一大方向,医学基础方面的医工结合研究也是比较热门的研究方向,临床应用方面以光热治疗为主,手术导航以及中医药领域的数据挖掘在国内也有一定的发文量。
表4 聚类标签列表
图2 关键词聚类图谱
2.3.3 关键词突现分析
通过Citespace的burst detection功能进行关键词的突现分析,对医工结合领域的研究前沿进行挖掘。图3a显示国内发文中,从2016年起,“模式识别”“打印技术”“手术导航”“量子点”“针灸”“超像素”“光热治疗”“数据挖掘”和“用药规律”等突现强度较高的关键词陆续出现成为研究热点,2019年12月爆发的新冠疫情使得“疫情防控”成为2020年的突现关键词,而新冠的全球性大流行使“新冠肺炎”成为2021年以来的研究前沿;“区块链”“数据增强”“语义分割”等均为2020年以来的研究热点,其中“深度学习”的突现强度最高,达到76.27。图3b显示国际发文中,2018年以来,医工结合领域以“pharmacokinetics”“schwann cell”和“fibroblast growth factor”等生物医学类为主要研究热点,而“brain modeling”“decomposition”“bio medical imaging”“heart rate variability”“mild cognitive impairment”“vessel segmentation”“mathematical model”“challenge”“ensemble learning”和“bci”等主题词成为2020年以来的研究前沿。综合图3a和图3b可知,国内发文的研究前沿主要集中于计算机人工智能在医学领域的应用,而国际发文的研究前沿则更为广泛,大致集中在脑电与脑机接口研究、信号分析与医学图像处理类研究以及人工智能类研究等领域。
图3 关键词突现分析
2.4 文献共被引分析
两篇或多篇论文同时被其他论文引证,则这两篇或多篇论文构成共被引。通过共被引分析可以获得高被引文献,更能获得关系紧密的文献。因CNKI导出的数据中不包含参考文献,故本文仅对WOS导出的数据进行共被引分析。由图4a及相应的频次排序可知,He等[16]用于图像识别的深度残差学习的文章被引频次最高(本地被引频次301次),该文章对国内医工结合领域的深度学习应用具有重要影响;而Çiçek等[17]关于3D U-Net的文章以最高的中介中心性(0.15)成为国内该领域最重要的文献;Shelhamer等[18]用于语义分割的全卷积网络具有最大的度中心性,说明该文章节点在共被引网络中具有很重要的作用。
通过将共被引文献进行聚类分析,可以了解该领域有哪些前沿的研究主题。由图4b可知,#0的聚类标签是“enhanced photodynamic therapy”,接下来的“feature fusion attention network” 和“convolutional neural network”均属于人工智能领域,其余除“ssvep-based bcis”外,均围绕临床实际应用开展研究。
时间线图按照共被引文献聚类标签进行展示,每个标签下的被引文献按照在本地数据集中的初次被引时间进行排列,默认每个年份列出被引频次最高的3篇文献。由图5可以看出,“convolutional neural network”“photothermal therapy”“low-dose CT”和“ssvep-based bcis”属于医工结合领域的经典研究主题,“orthopedic application”作为经典主题在国内呈逐渐淡化趋势,“cardiac segmentation”属于新兴研究主题,而“enhanced photodynamic therapy”“feature fusion attention network”和“rapid hemostasis”属于较新的研究主题。
图5 时间线谱图
3 讨论
医工结合有利于推动科技创新,是医学创新发展的一大方向。本研究通过文献计量学手段对国内医工结合研究的机构、作者、关键词和引文进行分析,以探索该领域的研究热点,总结研究现状,梳理未来可能的发展方向。
从国内医工结合研究的机构和作者分析来看,国际学术期刊的发文远超国内期刊发文,一方面是由于英语是科研人员国际交流的主要学术语言[19],高水平期刊多为英文期刊,另一方面也是受过去一段时间国内科研评价标准的影响,科研人员均尽力向国际期刊投稿。有研究指出,自然基金资助项目中,研究水平越高,发表中文论文的比例就越低[20],因此在该领域有影响力的作者多在国际发文,且研究方向相对国内发文更广泛,与国际医工结合广泛的研究方向更接轨;而中医药属于中国特色性领域,故该领域医工结合研究的发文多集中于国内期刊,这有助于相关科研人员进行成果交流;在机构分布上,排名靠前的科研院所大多分布于东部地区的长三角、京津冀和珠三角,凸显了东部地区国家级城市群尤其是中心城市的科研优势[21]。
从国内医工结合研究的关键词分析来看,相比于国内发文,国际发文的研究热点主题更宽泛,不再局限于人工智能、信号处理、3D打印等,而是拓展到生物材料、基因工程、细胞生物、组织工程等领域进行更深入的医工融合。关键词聚类提示医工结合研究中“深度学习”标签号最小,包含的关键词最多,当属国内最热门研究领域;生物力学、生物材料、3D打印等方法技术与临床基础的结合研究也比较多;另外,“光热治疗”作为一种综合了生物医学、物理、化学等多学科技术和理论的肿瘤治疗方法,也是国内医工结合的一大热点研究领域,大量具有独特光学特性的纳米材料得以制备并应用于肿瘤治疗研究,使安全、高效治疗肿瘤成为可能。关键词突现分析依然体现了国际发文的主题多样性,2018年以来陆续出现过持续时间较短的一些关键词,如“光热治疗”“数据挖掘”“cell proliferation”“pharmacokinetics”等,2020年以来持续至今依然受关注的关键词中,突现强度分别以“深度学习”和“brain modeling”为最高,综合来看,当下国内医工结合研究持续集中在深度学习、人工智能、医学图像处理、大脑建模、心率变异性、轻度认知障碍等领域。开发大脑记忆、视觉、空间、运动等不同功能的计算机模型,可以促进相关医学研究及临床辅助治疗。心率变异性与冠心病、糖尿病、心肌梗死、心律失常等多种疾病有关,能够评价心脏的自主神经活动,但由于机体生理功能复杂,影响因素多,该信号的分析以及临床应用面临诸多亟待解决的问题[22]。而轻度认知障碍是阿尔兹海默病的早期阶段,其早期筛查、及时干预极为重要,目前利用深度学习手段结合影像学技术进行轻度认知障碍的诊断、预测等研究也在不断深入[23]。
从国际发文的文献共被引分析来看,对国内医工结合研究具有重要影响的文献主要集中在“深度学习”领域,再次提示“深度学习”在国内医工结合领域的重要地位,不仅是人工智能领域的代表,更是大数据时代前沿的研究热点,因为其具有强大的特征提取能力,十分适合医学影像、基因组学等生物医学大数据的分析处理,而文献共被引聚类分析及时间线谱提示在卷积神经网络、光热治疗、低剂量CT、脑机接口等经典医工结合研究领域基础上,增强光动力疗法、特征融合注意力网络、心脏分割等也是国内研究人员近年关注的内容。光动力疗法是一种治疗肿瘤、增生性皮肤疾病等的新型治疗方法,精确有效、不良反应小,但光敏剂、光源等因素限制了其效果[24],因此如何对光动力增效成为很多研究人员的课题。注意力机制是深度学习领域的重要概念,引入注意力机制后,可以提升算法的准确性,改善模型的泛化能力[25]。图像分割是医学影像处理的一个重要的研究方向,已从传统的分割方法发展到了当前基于深度学习的分割方法[26]。
4 总结
本研究通过Citespace分析了国内医工结合领域的研究现状,挖掘了该领域的研究热点和前沿。研究发现:① 我国医工结合的研究成果更多地体现在国际杂志上,国内杂志发文相对较少且涉及面较窄;发文机构具有明显的地域性,除中国科学院位居首位外,南方科研院所发文情况整体高于北方;更多地集中于综合性或理工类高校,医科院校相对较少;中医药领域的医工结合研究多为国内发文,相对较弱;国际发文作者具有相对更高的影响力和更密切的交流合作。② 由关键词分析可知,深度学习是国内医工结合的一大研究热点;研究前沿集中于人工智能、信号、图像类研究,医工结合研究多集中在医学基础方面,临床应用方面以光热治疗为研究热点。③ 由文献共被引分析可知,对医工结合领域影响较大的文献集中于深度学习领域,而“convolutional neural network”“photothermal therapy”“low-dose CT”和“ssvep-based bcis”均属于医工结合领域的经典研究主题,纳米材料等的医学应用和人工智能技术在国内医工结合研究中是两大热门领域。
围绕国家发展战略需求,国内正在自上而下开展广泛的医工结合、政策引导、平台搭建、机构联合、作者合作。医工结合的概念由来已久,新技术、新方法不断为其注入新鲜血液,“新医科”“新工科”等政策机制不断推动其发展,但医工结合还有很长的路要走,希望本研究结果对未来国内医工结合研究的发展具有参考意义。