基于文献计量学的虚拟现实和人工智能在医学教育中的应用
2023-06-06吕萍萍
封 纯,吕萍萍,金 敏
(1.浙江大学医学院附属第二医院生殖医学科,浙江 杭州 310018;2.浙江大学医学院附属妇产科医院IVF实验室,浙江 杭州 310006)
虚拟现实(virtual reality,VR)是一种基于交互式三维可视化的通信界面,它允许用户与模拟现实世界的不同感官输入进行交互和集成,1991年首次引入外科手术教学[1],现广泛用于医学解剖、手术操作培训、情景模拟、虚拟课堂、虚拟实验室、远程医疗教育等[2-3],有助于激发学习兴趣,提高教学质量[4-6],促进跨专业教育的发展[7]。人工智能(artificial intelligence,AI)是处理计算机模拟智能行为的一个计算机科学分支[8],目前AI已应用于医学教育领域[9],辅助临床思维培养和训练[10],协助医学考试测评[11]。当下,VR与AI在医学教育领域的应用处于快速发展阶段,但在我国起步较晚,有必要借鉴吸收国际先进经验。本研究采用文献计量学方法,深入了解该领域的发展趋势和结构模式,探讨其主要贡献及影响其发展的科学领域,从而分析国内外VR &AI在医学教育中应用的差距,探索未来研究方向。
1 资料和方法
1.1 数据来源及检索策略
英文文献来自Web of Science 核心合集(Web of Science Core Collection,WoSCC),中文文献来自中国知网(China National Knowledge Infrastructure,CNKI),WoSCC和CNKI是使用最广泛的英文和中文科学文献数据库。在WoSCC中采用主题词检索,检索策略:(“virtual reality” OR “artificial intelligence”) AND (education OR teach*) AND (medicine OR medical),限制语言为英语。在CNKI中采用主题词检索,检索策略:(虚拟现实 OR人工智能) AND 教育 AND 医学,限制语言为中文。二者均选择时间跨度:2002年1月1日—2021年12月31日;文献类型:论文或综述论文。数据在2022年7月24日收集,排除重复的文献及与主题不相关的文献,以文本文件格式提取数据集中所有文献的数据字段。
1.2 研究方法与研究工具
采用HistCite分析发表文献的国家/地区,并分析其主要机构,其中CNKI数据采用VOSviewer分析。利用CiteSpace进行期刊dual-map分析,探索施引期刊和被引期刊之间的引文关系。采用pajek领域叠加工具包生成在全球科学覆盖图中的位置并使用 VOSviewer 可视化。利用VOSviewer对共关键词网络进行分析,得到研究的主题聚类和趋势。应用CitNetExplorer构建直接引文网络,展示文献聚类和研究进展。最后,对结果进行解释(见图1)。
图1 VR &AI在国外和国内医学教育领域应用的文献计量分析流程图
2 结果
2.1 论文产出比较分析
自2002-2021年共20年间,WoSCC中发表文献1 747篇,CNKI中发表文献359篇 。如图2A所示,WoSCC中每篇文献的相关作者、杂志、关键词数量均多于CNKI中的文献,WoSCC对照CNKI中平均每篇论文作者数量分别为4.6,3.0人,杂志数量分别为0.4,0.5本,关键词数量分别为1.8,2.0个。VR &AI在医学教育领域的应用在2017年后快速增长,尤其在WoSCC数据库中2019年后每年发文量增长均在50%左右(见图2B)。在CNKI数据库中,2017—2021年这5年中发文量占总发文量的近70%,在WoSCC数据库中也占到了65%以上,近3年即2019—2021年占50%以上(见图2C)。
图2 VR &AI在国内外医学教育领域的应用的文献信息及发文量A.文献数据基本信息。B.每年发文量。C.累计发文量。
国家/地区排名中,美国研究人员发表的论文数量最多(n=645),其次是英国(n=246)和加拿大(n=183),见表1。总被引频次(total citation score,TCS)和平均被引频次(average citation score,ACS)是衡量论文影响力的指标。美国(TCS=21 160)的总被引频次最高,其次是加拿大(TCS=6 706)和英国(TCS=6 673)。每篇论文被引频次加拿大(ACS=36.64)排名第一,其次是美国(ACS=32.81)和荷兰(ACS=30.31)。中国总发文量排名第五,但总被引频次不高,尤其是平均被引频次较低,ACS=30.31。在机构排名中,多伦多大学发文量63篇排名第一,其次是哈佛大学(n=43)和哥本哈根大学(n=34)。多伦多大学的总被引频次和平均被引频次均位居第一。中国机构排名未进入前十。
表1 VR &AI在医学教育领域应用研究中发文量最多的10个国家/地区和机构
2.1.3 期刊产出分布
使用VOSviewer获得排名靠前的高产与高被引期刊(见表2)。国外的文献主要发表在“医学、临床医学”类型的期刊上,“Anatomical Sciences Education”“Journal of Surgical Education”和“Surgical Endoscopy and Other Interventional Techniques”是排名前三的期刊。主要引用的文献来自“健康、护理、医学”和“心理、教育、社会”领域,“Surgical Endoscopy and Other Interventional Techniques”“Anatomical Sciences Education”和“Educational Media International”是引用量排名前三的期刊。而我国的文献则主要发表在医学教育相关的期刊上,《中国医学教育技术》《中国高等医学教育》和《继续医学教育》是发文量排名前三的期刊,临床医学专业期刊较少。
表2 VR &AI在国内外医学教育领域应用研究的高产和高被引杂志
论文发表于WoS中248个期刊分类中的135个类别(图3),其中发表文献最多的分类为手术、教育科学学科、卫生保健及科学服务、放射学、核医学、医学影像学、普通内科医学、教育研究、医学信息学、临床神经病学、和泌尿外科及肾脏内科。全球科学覆盖图可分为五个聚类:#1 生物学和医学、#2 化学和物理学、#3 生态和环境科技、#4 工程和数学、#5 心理学和社会科学[12]。VR &AI在医学教育领域应用研究的论文主要发表于#1生物学和医学和#5心理学和社会科学。
图3 VR &AI在医学教育领域应用研究在全球学科覆盖图中的定位
双图叠加在全球期刊科学地图上展示施引期刊和被引期刊的分布,以及它们之间的引文链接。在图4中,左侧椭圆的大小显示施引期刊的论文和作者数量,右侧显示被引期刊的被引频次。线条的粗细与Z分数的引用频率成正比,表示分析中科学领域之间的联系强度。VR &AI在医学教育领域应用研究有2种主流引用路径,即主要发表在“医学、临床医学”类型的期刊上,主要引用 “健康、护理、医学”(Z分数=10.04)和“心理、教育、社会” (Z分数=2.21),与“系统、计算、计算机”关系并不密切。
图4 VR &AI在医学教育领域应用研究的双图叠加左侧为施引领域,右侧为被引领域;映射了324种施引期刊和16 602种被引期刊。
2.2 研究热点分析
用VOSviewer创建关键词共现网络,在WoSCC数据库中,5 663个关键词中出现频率≥5的有464个,在CNKI数据库中,716个关键词中出现频次≥5的有33个,选择出现频率≥5的关键词构建关键词共现网络(图5),出现频率最高的关键词列于表3。
表3 VR &AI在医学教育领域应用研究的前20个关键词
WoSCC数据分为3个聚类(图5A)。聚类1为VR在医学各学科的应用,包含180个关键词,位于图谱右侧,平均出版年份最早,包含虚拟现实、增强现实、手术、模型、技能、培训、模拟、住院医师、学习曲线等关键词,覆盖关节镜、支气管镜、内窥镜、腹腔镜、心肺复苏、妇产科学、放射介入、眼科学、泌尿外科等学科。聚类2为VR与医学教育,包含105个关键词,平均出版年份较新,包含医学教育、模型、3D打印、解剖教学、计算机辅助、住院医师教育、手术模拟等。聚类3为AI与医学教育,包含179个关键词,位于图谱左下方,平均出版年份最新,近年来热度较高,包含人工智能、机器学习、医学教育、分类、深度学习、决策、大数据、放射学、远程医疗。CNKI数据主要分为2类(图5B),聚类1为VR与医学教育,位于图谱左下方,平均出版年份较老,高频关键词包括医学教育、虚拟现实、虚拟手术、虚拟实验室、增强现实等。聚类2为AI与医学教育,位于图谱右上方,平均出版年份较新,包含人工智能、教学改革、智能医学等。
2.3 研究的演变
根据施引论文的本地引文创建直接引文网络,通过引文链接展示研究的演变。每个节点代表施引论文,标签为第一作者的姓氏,连线代表每篇施引论文之间的引文关系。前50篇被引用的VR &AI在医学教育领域应用研究论文(表4)的直接引用情况见图6A,文献可分为4个聚类。聚类1“VR与外科手术教育”包含489篇文献,出现时间较早,2016年后无文献发表(图6B)。聚类2“VR与解剖学教育”包含384篇文献(图6C),聚类3“VR与模拟在医学教育中的应用”包含103篇文献(图6D),聚类2和聚类3出现时间早,持续时间长,在2019年后明显减少。聚类4“AI与医学教育”包含101篇文献,在2018年出现并大量爆发,是最为活跃的研究领域(图6E)。
表4 VR &AI在医学教育领域应用研究引用排名前10的论文
图6 VR &AI在医学教育领域应用研究的直接引文网络A.被引用次数最多的前 50 篇论文的直接引文网络。B.VR与外科手术教育。C. VR与解剖学教育。D. VR与模拟在医学教育中的应用。E. AI与医学教育。
3 讨论
近20年来医学教育领域中VR &AI的应用在国内外均持续增长,2017年增长加速,国内外发文量的一半以上均发表于近3年。2017年论文数量的增加更多源自AI研究,究其原因,近年来各国都看到了AI在自然科学领域的巨大潜力,加速布局AI研究,2015年美国发布“美国国家创新战略”将与AI密切相关的精密医疗、卫生保健、教育技术等9大领域作为优先发展对象;2016年欧盟公布了神经信息平台、大脑模拟平台供AI研究者使用,以促进神经科学、医学和计算机学的合作研究;我国2016年出台《“互联网+”人工智能三年行动实施方案》以打造AI基础资源与创新平台[13]。国外发文量为我国国内的5倍左右,提示世界范围内VR &AI在医学教育领域的应用较之我国国内发展更为迅猛。中国总发文量排名第五,平均被引频次较低,中国机构排名未进入前十,提示研究质量还有较大的提升空间,需要密切跟踪世界范围内的先进研究,提高VR &AI在医学教育领域应用研究的数量和质量,在VR &AI快速发展的阶段,抓住全球快速发展的机遇,争取后来居上。近年来,我国学者也发表了一些高质量论文,如西北工业大学王鹏在Robotics and Computer-Integrated Manufacturing总结了基于增强现实和混合现实的远程协作在医学教育等领域的重要作用[14]。
通过比较国内外文献关键词,表明在国内外研究中VR和AI虽然有融合,但仍是聚类的两大分支,医学教育、人工智能、虚拟现实、增强现实等关注度都很高。国外相关研究更为全面和深入,比如VR在内窥镜领域的应用,包括腹腔镜[15]、关节镜[16]、胃肠镜[17]、内镜[18]、支气管镜[19]等。比如在AI分类下,关于AI的具体组成成分,包括决策[20]、机器学习、深度学习[21-23]、大数据分析[24]等。研究包括:大数据分析和机器学习算法辅助临床决策和预测手术结果[20],机器学习和深度学习用于口腔科诊断和治疗[21],采用深度学习改进诊断成像模式[22],通过预测、分类、回归、诊断、监控等机器学习来完成复杂任务,支持生物医学、神经科学或机器人技术等多个研究领域[23]。总之,国外VR &AI在医学教育中应用的研究相对成熟,细分至医学的亚专科,而我国的研究多为概括的医学教育相关的初步研究,可在已有的AI分支及应用领域的基础上,进行更深入的探究。
综合关键词聚类和直接引文网络研究结果提示,手术教学、解剖学教学、和模拟是VR在医学教育中应用的三大方面。高被引论文中大多是VR相关的,50篇高被引论文中46篇研究VR的应用,仅有4篇文献是AI相关的。其中,被引次数最多的文献2006年发表于New England Journal of Medicine,领域内共被引108次,明确指出VR技术在增强外科技能培训方面的潜力,VR提供了非常详细的反馈机会,可更细致地衡量学员的表现精确度、准确性以及错误率[25]。AI旨在执行传统上需要人工完成的任务,机器学习是应用于AI的计算机算法,能够进行自动学习和数据推断,可以结合不同的学习算法,其中人工神经网络和深度学习最常见,人工神经网络用于分析输入并分配合适的权重来预测结果,深度学习使用多级人工神经网络进行非线性数据处理[26]。AI应用研究中被引次数最多的论文发表于2019年,领域内被引28次,该研究评估本科医学生对放射学和医学领域AI的态度[27]。
本研究存在一些局限性。首先,只搜索WoS核心数据库,而没有搜索Scopus、PubMed等常用数据库,可能遗漏一些相关文献。其次,由于没有考虑论文的质量,结果的质量难以评估。
4 结语
本研究通过文献计量学分析比较国内外VR &AI在医学教育中应用的发展趋势、科学领域及研究热点,结果提示国外VR &AI在医学教育中应用的研究成果涉及更广泛的领域,对我国的研究有较强的借鉴意义。目前VR在医学教育中的应用集中于手术教学、解剖学教学和模拟,可进一步拓展延伸,深入挖掘。AI在医学教育中的应用是近年来最活跃的研究领域,其分支包括决策、大数据、深度学习等,应抓住机遇全力发展。