APP下载

基于Web of Science可视化分析人工智能在乳腺癌领域的研究热点

2021-10-28王嘉良

河南医学研究 2021年29期
关键词:发文乳腺癌癌症

王嘉良

(杭州师范大学附属萧山医院 乳腺外科,浙江 杭州 311200)

人工智能(artificial intelligence,AI)是在计算机科学、神经心理学等多学科基础之上发展起来的一门综合性交叉学科[1];换言之,人工智能也指由人工制造出来的系统所表现出来的智能。2016年3月人工智能系统“AlphaGo”打败职业九段棋手李世石,2017年5月又相继打败世界冠军柯洁,自此,人工智能不仅在AI领域引起轩然大波,更让普通大众意识到人工智能的快速发展。人工智能具有高度技术性和专业性,各分支领域均非常深入且各不相通,因而涉及范围极广[2]。在医学领域,人工智能也发挥了重要作用,癌症是人工智能应用的主要领域之一[3]。乳腺癌是女性最常见的恶性肿瘤,发病率占女性肿瘤的20%[4],严重危害女性健康;若可以利用人工智能技术探索乳腺癌发生和发展,为其早期筛查、临床诊断、精准治疗和生存预测等方面提供快速、有效、准确的方法学手段,则可在某种程度上降低癌症发生率和病死率。为更好地了解国际环境人工智能在乳腺癌研究领域的现状和发展趋势,本文通过检索近10 a人工智能在乳腺癌研究领域的文献,绘制科学知识图谱,剖析人工智能在乳腺癌领域的研究热点和前沿,以期为中国的人工智能在乳腺癌研究中的应用提供参考。

1 资料及方法

1.1 数据来源与检索策略检索Web of Science核心合集数据库2011―2020年人工智能在乳腺癌领域应用的相关研究。检索式为:主题[Artificial Intelligence OR AI OR Intelligence,Artificial OR Computational Intelligence OR Machine Intelligence OR Computer Vision System OR Knowledge Acquisition (Computer) OR Representation,Knowledge (Computer)] AND 主题(Breast Neoplasms OR Neoplasm, Breast OR Breast Tumors OR Breast Cancer OR Breast Malignant Neoplasm OR Cancer of Breast OR Breast Carcinoma OR Carcinomas,Breast OR Breast Malignant Tumor)AND 语种(English),文献类型为article,共检索到1 187条有效记录。

1.2 分析方法将纳入的文献以纯文本格式导出,导出的文献记录包含作者、研究机构、题名、关键词、摘要、发表年份、参考文献等信息。利用VOSviewer文献计量学软件可视化相关研究的发文年份、发文国家、发文作者、发文机构及发文期刊。

2 结果

2.1 年发文量及期刊发文量依据检索结果,2011―2020年共发表相关研究1 187篇,年均发文量为118.7篇。2011―2017年发文量呈波动上升趋势,2017年后逐年递增;相比2011年的70篇发文量,2020年发文量高达256篇。见图1A。571个期刊发表了人工智能与乳腺癌相关研究;发文量大于10的期刊仅有17个,其中发文量排名前3的期刊分别为BreastCancerResearchandTreatment(93篇,7.8%),Breast(42篇,3.5%)和JournalofClinicalOncology(25篇,2.1%),影响因子分别为3.831、3.754及32.956;排名前10位的期刊中,引用次数最多的期刊为JournalofClinicalOncology,引用次数高达2 676次。见图1B。

A为年发文量;B为期刊发文量。

2.2 发文国家分布共75个国家发表了关于人工智能在乳腺癌领域的应用研究,美国发文量高达533篇,位列第一,发文量占文献总数的44.9%,遥遥领先于其他国家;中国继美国之后,发文量为145篇,位列第二;英国位列第三,发文量为124篇。见图2。

图2 人工智能在乳腺癌领域应用研究的发文国家分布

2.3 发文机构分布经分析,共2 297个机构从事人工智能与乳腺癌相关研究,但发文量大于10的机构仅有46个,如图3所示。发文量排名前4的机构分别为美国密歇根大学(Univ Michigan)、美国梅奥医学中心(Mayo Clin)、癌症研究所(Inst Canc Res,国家未知)及英国皇家马斯登癌症中心(Royal Marsden Hosp)。排名前10位的机构中,尚未有中国机构出现。

图3 人工智能在乳腺癌领域应用研究的发文机构分布

2.4 发文作者分布共有7 732位作者从事人工智能与乳腺癌相关研究,但发文量大于10篇的作者仅有14位。发文量前3位的作者为Dowsett Mitch(22篇),Henry N. Lynn(22篇)及Stearns Vered(19篇);排名前10位的作者中,尚未有中国学者出现。见图4。

图4 人工智能在乳腺癌领域应用研究的发文作者分布

2.5 关键词可视化分析关键词共现分析共发现4 932个关键词,其中94个关键词共现次数大于 20次;共现频次排名前20位的关键词见表1。对94个关键词进行聚类共形成4个热点研究领域,每种颜色代表一种聚类类别;其中第1类(红色)包含29个关键词,有人工智能(artificial intelligence)、相关性(association)、乳腺癌(breast cancer)、计算机辅助检测及诊断(computer-aided detection and diagnosis)、模型(model)、钼靶X线(mammography)、风险(risk)及生存(survival)等,主要关注人工智能技术在乳腺癌领域的应用;第2类(绿色)包含28个关键词,主要有化疗(chemotherapy)、雌激素(estrogen)、表达(expression)、生长(growth)、机制(mechanism)、体外(invitro)等,集中于药物治疗的相关机制研究;第3类(蓝色)包含26个关键词,主要有他莫昔芬(tamoxifen)、治疗(therapy)、试验(trial)、预防(prevention)、结局(outcomes)、生活质量(quality of life)及发病率(prevalence)等,主要关注药物的治疗效果;第4类(黄色)包含11个关键词,主要有阿那曲唑(anastrozole)、骨矿物质密度(bone mineral density)、骨质疏松症(osteoporosis)、健康(health)及预防(prevention)等,主要关注治疗后副作用。见图5A。乳腺癌研究热门领域主要有他莫昔芬(tamoxifen)、预防(prevention)、复发(recurrence)、风险(risk)等;人工智能热门领域主要有诊断(diagnosis)、分割(segmentation)及性能(performance)等;人工智能与乳腺癌交叉的热门领域有疾病(disease)、预测(prediction)及模型(model)。仅乳腺癌研究领域侧重治疗及疾病控制研究,人工智能领域侧重该技术的用途及性能,人工智能在乳腺癌领域的研究侧重于构建相关模型预测疾病的发生发展。见图5B。

表1 人工智能与乳腺癌研究领域前20位高频关键词

A为标签视图;B为密度视图。

2.6 共被引文献分析共发现37 219篇文献被引用,其中11篇文献的被引次数超过65次。见图6。高被引论文的主要内容集中于乳腺癌领域化疗药物的应用及治疗效果研究,排名前5位的高被引文献题名及相关信息见表2。

图6 人工智能在乳腺癌领域应用研究的共被引文献分布

表2 排名前5位的高被引论文

3 讨论

自2010年以来,全球围绕人工智能在癌症研究应用领域的文献呈现持续增长的趋势,尤其是2017―2019年文章发表数激增[5]。本研究初步发现,人工智能在乳腺癌领域的应用研究自2017年开始递增。结合本研究分析,可看出2017年后乳腺癌领域人工智能研究激增得益于国际环境下人工智能在癌症领域的广泛应用。该研究还发现,乳腺癌为继“癌症、分类、机器学习”后共现频次排名第4位的高频关键词,且中介中心性位列第一,说明将人工智能技术应用于乳腺癌领域研究的受关注度最大,研究最为广泛,已成为国际热点。相比2017年的94篇发文量,2020年发文量高达256篇,可见近年人工智能技术在乳腺癌领域应用的研究热度一直呈增长趋势。

国家发文量分布显示,美国及中国的发文量排名位于前列。但美国发文的引用次数约为每篇21次,中国发文引用次数为每篇10次;排名前10位的国家中,除印度外,其他国家每篇引用次数均大于10次。从引用频率比较可发现,美国发文的被引频率一直处于世界平均标准以上,而中国文章的被引频率低于平均标准。以上表明,美国目前是研究人工智能应用于乳腺癌研究最活跃的国家,中国在该研究领域也具有突出贡献。但我国人口基数大,人均发文量与美国相距甚远,因此国内研究学者应加大对该领域研究的投入,吸取国外优秀科研经验,加强与国外权威科研机构合作,提高我国的学术生产力,增强我国的学术影响力。此外,排名前10位的机构及作者尚未出现中国机构及学者,说明国内机构及学者应加强国际间合作,输出有较高影响力的成果,从而提高国际影响力。当前,人工智能产业在医学领域的应用正迎来爆发式增长,而中国在人工智能领域仍处于起步阶段,在医学领域的原创性关键技术创新较少。2017年国务院总理李克强在《政府工作报告》中首次提及了“人工智能”,强调要加快中国人工智能技术的研发和转化,可见中国政府对于人工智能的发展高度关注[6]。鉴于中国患者群体庞大,国内人工智能技术和资本应积极投入医学领域,造福更多患者和医生。

对关键词进行聚类分析发现,研究焦点主要集中在人工智能技术在乳腺癌领域的应用、药物机制、治疗效果及治疗后副作用。药物挖掘是人工智能在医学健康领域的主要应用模式之一,将深度学习技术应用于药物临床前研究,快速、准确挖掘和筛选合适化合物,缩短新药研发周期、降低新药研发成本、提高新药研发成功率。此外,通过计算机模拟,人工智能可以对药物活性、安全性和副作用进行预测。此外,人工智能在乳腺癌领域的研究热点主要集中于人工智能的性能、风险识别及建立模型预测疾病等。2012年,韩国学者报道了一种基于SVM的预测模型,用于预测韩国人群乳腺癌患者术后5 a内复发情况[7];2015年,法国学者开发了一种基于模糊逻辑选择的方法,用人工智能筛选乳腺癌的基因特征,成功地将其运用于乳腺癌的病理学分级以判断患者的预后[8]。但如何找到符合医学生物学原理、具有临床实用性的算法,从而提高模型预测的准确性、可重复性和可操作性是关键[9],因此方法学研究的突破可能会为癌症研究开辟新的空间和带来新的机遇。

乳腺癌治疗是人工智能发展的一个领先领域,其应用包括筛查和诊断、风险计算、预测和临床决策支持、管理规划和精准医疗[10]。与以往基于计算机的方法(即计算机辅助检测和诊断)相比,人工智能及其子领域的深度学习提高了诊断准确性[11]。将人工智能技术用于辅助诊疗中,让计算机“学习”专家医生的医疗知识,模拟医生的思维和诊断推理,从而给出可靠的诊断和治疗方案。辅助诊疗场景是医疗领域最重要、最核心的场景。此外,高精准率电子胶片的推广、放射科经验丰富医生的缺乏,使得人工智能技术在医学影像方面透露出巨大的发展空间。目前,越来越多的人工智能增强型钼靶摄影筛查工具进入临床市场[12]。Rodríguez等[13]发现,使用人工智能系统支持后,放射科医生不需要额外的阅读时间,即可在进行钼靶摄影时提升癌症检测效率。

尽管人工智能在医疗领域具有广阔的应用前景,但实现其应用落地仍面临众多问题。如对数据总量和质量的考量;人工智能需在人的监督下完成智能学习,需人工做好标识;但现阶段的数据在总量和标记数量上均远远不足,因此靠人工对数据进行标记,需耗费大量人力。其次,数据监管问题也不容忽视[14];训练人工智能的庞大数据必然来自于医疗机构,涉及患者隐私的高度敏感问题必然是政策高度监管的地带,如何制定和完善法规、合理利用大数据优势又确保患者信息安全[15],是需要解决的矛盾点。再者,人工智能的真正普及更需要跨越观念问题。基于人文伦理的传统观念影响,大众并不认为人工智能可以比人类做得更好,因此,接受人工智能应用于医疗这一过程可能比想象中更艰难。

综上,目前人工智能在乳腺癌领域的研究已成为国际研究热点。国内研究可充分借鉴国外研究的热点与前沿,并结合自身特点发挥中国在癌症防治方面的优势,借助人工智能手段,注重国际合作与国家级机构间合作,加强交叉学科研究,有效促进中国的人工智能技术在癌症研究方面的发展。

猜你喜欢

发文乳腺癌癌症
七部门联合发文 进一步完善和落实积极生育支持措施
绝经了,是否就离乳腺癌越来越远呢?
BCAA代谢异常与癌症的相关性研究进展
中医治疗乳腺癌的研究进展
FBP1在癌症中的研究进展
体检发现的结节,离癌症有多远?
癌症“偏爱”那些人?
别逗了,乳腺癌可不分男女老少!
校园拾趣
爷孙趣事