医药卫生领域数字孪生相关文献计量与知识图谱分析
2023-10-19崔钰孙彦顺于莉莉
崔钰,孙彦顺,于莉莉
1.潍坊医学院 公共卫生学院,山东 潍坊 261053;2.解放军第九六〇医院 医学数据中心,山东 济南 250031
引言
数字孪生也被称为数字双胞胎,是通过对物理实体建模与仿真,建立物理实体与虚拟实体的数据交互映射,从而以虚拟实体反映物理实体的状态[1]。美国空军研究实验室的Kobryn 和Tuegel 于2011 年3 月在一次演讲中首次明确提到了数字孪生[2]。数字孪生近年来发展迅速,已成为世界各国学术界的热点,其与其他技术相结合已应用于多个领域,如工业生产中的智能工厂、智慧城市建设、航空航天领域的安全保障、医疗领域的数字模型等[3-4]。全球医药支出预计将以每年2%~5%的速度增长,到2024 年将超过1.1 万亿美元[5],然而中国每千人执业医师仅2.31 人,且存在医疗资源分配不均衡、严重浪费等问题,因此为医疗专业人员和患者提供更有效的解决方案已经迫在眉睫[6]。数字孪生使用传感器采集物理实体的相关数据,再利用这些数据创建虚拟数字模型,并对其进行消化、分析、操作、更新和优化[7]。当数字孪生技术应用到人体时,可以通过个人的电子表现,来动态反映人体的分子状态、生理状态和生活方式,因此对医药卫生领域中数字孪生的研究具有重要意义。
文献计量学是采用数学、统计学等定量的方法分析已发表的文献数据[8]。目前,已有部分关于数字孪生的文献计量研究,但缺乏数字孪生在医疗卫生领域中较为系统、全面的文献计量学分析研究。本研究旨在根据文献计量学的基础理论和研究方法,分析医药卫生领域数字孪生相关文献的发文趋势、重要作者、合作网络和研究热点,并通过可视化图谱的方式呈现,以期为数字孪生在医药卫生方面的应用和相关科研人员的后续研究提供参考。
1 材料与方法
1.1 数据来源
本研究在中国知网、万方、维普、PubMed 和Web of Science 数据库检索医药卫生领域与数字孪生有关的文献,限制检索时间为数据库建库至2022 年10 月15 日。检索策略如下:中国知网使用高级检索,具体检索式为:“(主题=数字孪生)OR(主题=数字镜像)OR(主题=数字化映射)OR(主题=数字双胞胎)”,文献分类选择“医药卫生科技”;万方数据库采取主题检索,检索词和文献分类同中国知网的检索式;维普数据库采取题名或关键词检索,检索词和文献分类同中国知网的检索式;PubMed 数据库采取Title/Abstract 检索,检索词为“digital twin”和“digital twins”;Web of Science 检索词同PubMed 数据库检索词,文献分类选择与医药卫生相关。
1.2 筛选标准
纳入标准:文献研究内容确定与数字孪生有关且属于医药卫生领域。排除标准:① 重复的报道案例或文献;② 与主题无关的文献;③ 研究类型为通知、公告、摘要汇编等的非研究型论文。
1.3 分析方法
本研究将检索得到文献的题录导出,并利用NoteExpress(V3.0.3.6396)查重,随后按照筛选标准选出与研究有关的文献,以Refworks 形式导出。使用Excel(V16.0.15601.20148)进行文献统计,使用VOSviewer(V1.6.18)进行知识图谱分析。
1.4 规范化处理
1.4.1 机构
依据作者地址字段提取机构:① 对一级单位的下级部门不做单独统计,如Harvard Medical School 计入Harvard University;② 大学或科学院的附属机构不做单独统计,如Massachusetts General Hospital 计入Harvard University;③ 若机构挂牌/名称≥2 个,则统一整理为其中一个,如University of Paris 又称Université Paris Cité,统一整理为University of Paris。
1.4.2 关键词
将含义相同的中英文关键词合并,如将“artificial intelligence” 和“ 人工智能” 统一为“artificial intelligence”;将意思相同或相近的关键词合并,例如将“personalized therapy”“personalised medicine”和“precision medicine”统一为“personalized medicine”。
2 结果
本研究在中国知网、万方、维普、PubMed 和Web of Science 共5 个数据库中检索到文献1093 篇,经NoteExpress 去重后剩余1005 篇。对题目、关键词、摘要进行阅读筛选,剔除非研究型论文及研究主题与医药卫生领域数字孪生无关的文献,最终确定纳入研究的文献共262 篇,包括期刊论文259 篇(中文期刊论文18 篇、外文期刊论文241 篇)、中文学位论文3 篇,受数据库限制未纳入国外学位论文。
图1 文献筛选流程图
2.1 文献年代与来源分布
Grieves[9]最早提出“与物理产品等价的虚拟数字化表达”这一概念,被视为数字孪生的雏形。尹亚丽等[10]的研究发现2015 年以前有关数字孪生的研究成果很少,2016 年以后相关研究开始引起学术界的关注。医疗卫生领域中有关数字孪生的第1 篇文献的发表时间是2016 年,Yonova-Doing 等[11]应用数字孪生建模研究核性白内障;随后文献发表量呈现缓慢上升趋势,自2021 年起,文献数量激增,2021 年至2022 年10 月15 日共发表210 篇文献,占相关文献总量的80.15%,见图2。数字孪生有赖于传感器数据,在医疗卫生领域中传感器用于监视和预测患者的健康状况[12-13],2020 年是“万亿传感器世界”的首次亮相;此外,2020 年前后包括中国在内许多国家发布了有关数字孪生的指导文件和标准,这可能是2020 年以后相关研究增多的主要原因。国内的相关研究起步较晚,且研究成果较少,第1 篇中文文献发表于2020 年,是一篇针对多模态数据融合的护理信息系统的研究[14]。
图2 医药卫生领域数字孪生相关文献发表时间分布图
医疗卫生领域中有关数字孪生的259 篇期刊论文共计来源于175 种期刊。JournalofMedicalEthics是纳入文献量最多的期刊,共8 篇,占总文献量的3.1%。纳入文献量最多的前10 名期刊多为基础医学类期刊,见表1。
2.2 高贡献作者与机构
共计1306 位作者被纳入作者共现图谱分析。Twin Health 公司的Mohammed 和Shamanna 是发文最多的作者,均发表论文9 篇,同时也是与其他作者开展合作最多的,均与其他86 位作者存在合作,其研究主要是应用数字孪生技术治疗和控制糖尿病。根据普赖斯定律的计算公式:M=0.749×(Nmax)1/2(Nmax指最高产作者的发文数量,M 为该领域的核心作者发文量临界值)[15],医药卫生领域数字孪生相关文献发表数量最多的学者发文数量为9 篇,即Nmax=9,计算得M=2.247。因此,确定发文量大于2 篇的作者是该领域的核心作者,共148 位,其中17 位存在合作共线关系,共形成3 个聚类,见图3 与表2。最大的聚类共包含9 位作者,以Thajudeen为中心、Mohammed 和Shamanna 发文量最多,其研究领域一致,主要是应用数字孪生技术治疗缓解糖尿病的临床对照试验;第二大的聚类共包含6 位作者,Ashok和Shah 是该聚类团体中发文最多的作者,均发表8 篇论文,其研究主要包括对心血管疾病和糖尿病的真实世界研究和试验;第三大的聚类包含2 位作者,分别是Bhonsley 和Vadavi,分别发表5 篇、4 篇论文,其研究涉及人工智能、物联网和全身数字双胞胎技术。
表2 医药卫生领域数字孪生相关研究的活跃作者
图3 作者共现图谱
共计448 家机构被纳入机构共现图谱分析,其中230 家存在合作共现关系,共形成20 个聚类,见图4与表3。荷兰的马斯特里赫特大学是发表文献最多的机构,有9 篇论文,同时与其他机构合作最广泛,其合作机构有51 家,包括其他8 个聚类集团的核心机构,其主要研究数字孪生心脏。牛津大学所在的聚类位于整个聚类网络的中心,与其他8 个聚类集团有合作,研究内容较为多样,涉及生命历程数字双胞胎、数字孪生心脏以及数字孪生的伦理研究等。最大的聚类集团有21 家机构,以米兰理工大学为中心形成,该聚类集团的机构大多只进行内部合作,与其他聚类集团的合作较少,研究主要包括数字孪生在血管支架、临床肿瘤学以及流行病学模型中的应用等,这些机构的研究多涉及数字孪生与人工智能的结合。第二大的聚类集团有19 家机构,主要包括Siemens 公司、慕尼黑工业大学和埃尔朗根-纽伦堡大学,该聚类与格拉茨医科大学和奥克兰大学所在的聚类开展了较多合作,该聚类的主要研究是数字孪生数据的获取技术,如计算机断层扫描、心电图等。第三大的聚类集团有18 家机构,其中美国梅奥诊所和佛罗里达大学发表文献最多,研究内容主要是重症监护数字孪生模型的开发和构建,该聚类与其他聚类的合作广泛,以法国国家信息与自动化研究所为代表,其与其他8 个聚类集团的核心机构有合作关系。如图4 所示,各个聚类集团比较集中,说明现阶段大部分机构的合作对象比较局限,合作团体之间的联系较少,应进一步加强校企、校校间的国际合作交流,可以使数字孪生向更深层次发展[16]。
表3 医药卫生领域数字孪生相关研究的重要机构
图4 机构共现图谱
2.3 热门关键词与研究热点
因“数字孪生”和“digital twin”为检索文献时使用的检索词,基本所有文献的关键词都包含,没有统计分析的意义,故对其进行排除后,出现频次≥3 的关键词有94 个,共形成8 个聚类,各个聚类集合之间关联紧密;humans(人类)、artificial intelligence(人工智能)、personalized medicine(个性化医疗)、machine-learning(机器学习)是出现频次最多的关键词,分别为48、39、27、20 次,见表4、图5~6。
表4 医药卫生领域数字孪生相关研究的高频关键词
图5 关键词共现图谱
图6 关键词时间图谱
humans(人类)是出现最早的高频关键词,2017 年第一次出现;其所在的聚类是最大的聚类集合,共包含15 个关键词,出现的高频关键词还有algorithm(算法)、patient-specific modeling(个体化建模)、software(软件)等,主要涉及数字孪生的模型、建模和计算机技术的研究。
machine-learning(机器学习)是出现最晚的高频关键词,2021 年才第一次出现,此后一直受到高度关注。其所在的聚类是第二大的聚类集合之一,包含14 个关键词,高频关键词有personalized medicine(个性化医疗)、machine-learning(机器学习)、health care(医疗保健)、digital health(数字健康)。刘晓冰等[16]研究发现,自2018 年起数字孪生相关的研究多与机器学习、人工智能等技术方法结合,在医药卫生领域数字孪生与机器学习、人工智能等技术方法结合是目前的研究热点。2015 年欧盟PerMed 项目组发布《塑造欧洲的个性化医疗愿景》,推动了欧盟个性化医疗的实施[17],同年我国召开精准医学专家研讨会[18],提出了中国版精准医疗计划,数字孪生技术有助于为患者打造一套建立在数据基础上的最佳治疗方案,推动个性化医疗的发展。
数字孪生与新一代信息技术的深度融合是数字孪生技术的研究热点和未来发展方向[16],本研究发现这也是医药卫生领域数字孪生相关研究的热点,涉及的关键词包括big data(大数据)、artificial intelligence(人工智能)、machine-learning(机器学习)等。
有关数学和计算机建模方法的关键词包括agent based modeling(代理建模)、multi-scale modeling(多尺度建模)、finite element method(有限元法)等。目前数字孪生技术与其他新兴数字研究方式相结合的方法备受学术界关注,且推动了数字医学的整体发展。
与数字成像技术有关的关键词较多,包括tomography、X-ray computed(X 射线计算机断层扫描)、MRI(核磁共振成像)、CT(计算机断层扫描)、imaging、three-dimensional(三维成像)、ECG(心电图)等,可见数字孪生与数字成像技术的结合是研究热点之一,陈珊珊等[19]认为数字孪生技术有助于推动智能医学影像实验室的发展。
与骨骼有关的部分关键词也引起了一定关注,包括bone(骨)、spinal metastasis(脊柱转移)、vertebral fracture(脊柱骨折)等。数字孪生在与信息物理融合系统[20]相关的骨骼建模和生物动力学中的应用受到关注,2022 年前后有关数字孪生的椎体形成技术也引起了一定关注[21]。
3 讨论与总结
本研究分析了医药卫生领域中与数字孪生相关的262 篇文献,系统全面地为相关科研学者阐述了目前医药卫生领域有关数字孪生研究的现状、重要作者和机构、合作网络、研究热点等方面的发展趋势,发现总体上文献发表量呈现上升趋势,且2021年起文献数量增长迅速。Mohammed、Shamanna、Mohamed、Ashok 和Shah 等学者及其所在的团队对数字孪生在医药卫生领域的研究贡献较大,Mohammed 和Shamanna 在应用数字孪生技术治疗缓解糖尿病的研究中贡献突出;马斯特里赫特大学、伦敦国王学院、牛津大学和巴黎大学是发表文献最多的机构,不同机构的研究内容差异较大,大多数机构的合作对象较为局限,缺乏大规模合作,已有部分校企之间存在合作,但仍需加强。数字孪生与大数据、机器学习、人工智能等新兴技术以及其他数学和计算机建模方法的结合是医药卫生领域有关数字孪生的研究热点,基于数字孪生技术的个性化医疗、数字成像技术、骨骼建模和生物动力学研究也受到较多的关注。就目前的技术而言,建立一个充分、完整的人类数字孪生可能远非现实,然而,能够镜像人类的一小部分,例如细胞受体甚至一些亚细胞器,仍可以将现代医学推向一个全新的水平[22]。事实上,许多研究计划通过收集健康个体和患者的分子、基因组和其他大数据,为构建数字人类孪生奠定基础[23]。
总体上,目前医药卫生领域对数字孪生的关注度较高,对数字孪生技术的应用尚且有限,但其发展前景值得期待。可以预见的是,结合数据、知识和算法的数字孪生将彻底改变医疗卫生科技的发展。由于数字孪生是近年来的新兴技术,医药卫生领域的相关研究有限,本研究仅纳入了262 篇文献,文献数量较少,且受限于国外学位论文的获取途径,本研究未纳入国外学位论文,这是主要不足之处,但本研究的文献计量分析结果可为未来医药卫生领域有关数字孪生的理论研究与应用探索提供参考与借鉴。