近6 年代谢组学在疾病诊断中的可视化分析
2024-05-13焦姣隋振宇范金李清毕开顺刘然沈阳药科大学药学院沈阳006国家药品监督管理局高级研修学院北京0007成都中医药大学针灸推拿学院成都60075深圳职业技术大学食品与药品学院广东深圳58055
★ 焦姣 隋振宇 范金 李清 毕开顺 刘然,4(.沈阳药科大学药学院 沈阳 006;.国家药品监督管理局高级研修学院 北京 0007;.成都中医药大学针灸推拿学院 成都 60075;4.深圳职业技术大学食品与药品学院 广东 深圳 58055)
代谢组学作为系统生物学的重要组成部分,是研究生物体受病理生理刺激或遗传修饰引起的内源性代谢物质种类、数量及其变换规律的科学[1-2],其研究的对象为代谢路径中分子量小于1 000 的小分子代谢物质[3]。近年来,代谢组学发展迅速,其在疾病诊断方面也广为应用[4-5]。对于大部分疾病,如若能早期筛查和诊断干预,则患者的生存率可以得到极大提升。对于患病机体,由于其病理变化,使得机体的代谢产物也产生某种相应的改变。代谢组学可以对由疾病引起的关键代谢产物变化进行表征,更好地了解病变过程及机体内物质的代谢途径,以此对疾病进行早期的诊断和治疗,从而降低患者的死亡率[6-7]。
可视化即利用直观的图像信息处理数据,获得研究领域更加清晰详尽的进展和动态[8],因此利用2 种可视化分析软件进行研究。VOSviewer是由荷兰莱顿大学科技研究中心的Van Eck 和Waltman 开发的可绘制关键词等知识图谱的可视化软件,是用于构造与可视化文献计量网络的有力工具。相较于其他的文献计量软件,其在大规模数据的统计以及图谱绘制方面有较大优势[9-12]。COOC 软件作为一款功能强大的数据挖掘与知识发现软件,同样可以用于多样类型矩阵和网络图谱的快速制作[13-14]。
因此,本文借助VOSviewer 和COOC 软件对2015—2020 年的中国知网数据库(CNKI)和Web of Science(WOS)核心合集数据库中代谢组学在疾病诊断中的相关研究进行全面系统的分析,以探讨国内外,有关该领域的现状、趋势和热点。
1 资料和方法
1.1 资料来源
选取CNKI 和WOS 核心合集数据库作为文献检索来源。
1.2 检索策略
中文数据库检索式:(SU=代谢组学 AND SU=诊 断),英 文 检 索 式:(TS=metabolomics OR TS=metabonomics)AND(TS=diagnose OR TS=diagnosis OR TS=diagnostic),检索时间为2015 年1 月1 日—2020 年12 月31 日。
1.3 分析方法
将所得检索文献导出为Refworks 与Text 的格式,导出的文件以 “download_XXX.tet” 格式命名。再将导出的文件分别导入到VOSviewer 和COOC 软件中进行分析。根据发文量、被引高频文献、作者、发文机构、国家以及高频关键词等绘制知识图谱,以探讨国内外代谢组学在疾病诊断中的现状、趋势以及热点。
2 结果
2.1 发文量变化趋势
发文量的变化趋势是衡量该领域研究水平的重要指标[15],根据数据库检索统计,2015—2020年CNKI 数据库属于代谢组学在疾病中诊断中的研究文献有592 篇,WOS 数据库中有3 473 篇,近6 年来国内年均发文量为118 篇,国外年均发文量为695 篇。国内发文量分析可知,在2018 年和2020 年发文量有降低趋势,2019 年发文量为近6 年的最高值,达到131 篇。国外发文量分析可知,2015—2020 年发文量呈稳定增长趋势,在2020 年发文量首次超过600 篇。综合分析CNKI 和WOS 文献总量,虽然国内发文量在部分年份有降低,但总体呈增长趋势。见图1。
图1 2015—2020年间国内外发文量变化趋势图
2.2 文献被引频次分析
将CNKI 数据库中的592 篇与WOS 数据库中的3 473 篇文献按照被引频次由大到小进行排序,不同数据库排名前5 的文献分别见表1、表2。CNKI 数据库中被引频次最高的文献综述了代谢组学研究方法的新进展以及代谢组学在不同疾病诊断、药物研发等领域的应用,排名第2 和第3 的文献都与代谢组学在中医领域不同症候诊断中的应用有关。WOS 数据库中被引频次最高的文献,综述了代谢组学在揭示复杂疾病潜在病因方面的最新研究进展,以及代谢组学在精准医疗中的潜在作用。
表1 CNKI数据库中被引频次排名前5的文献
表2 WOS数据库中被引频次排名前5的文献
2.3 作者分布及其合作关系
2.3.1 CNKI 数据库 对CNKI 数据库中的592 篇文献进行分析,以作者为节点,运行VOSviewer 软件,得到作者合作关系图谱,见图2。1 个节点代表1 位作者,节点的大小反映了作者发文量,节点越大发文量越多,节点的连线代表了作者间的合作关系[26]。发文量排名前3 的作者是张磊(7 篇)、刘树业(6 篇)、汪受传(5 篇)。发文量排名第1 和第2 的作者间存在有较为密切的交流与合作,但是国内各个作者团体间合作并不紧密。
图2 CNKI数据库中作者合作关系图谱
2.3.2 WOS 数据库 对WOS 数据库中的3 473 篇文献进行分析,以作者为节点,运行VOS viewer 软件,得到作者合作关系图谱,见图3。WOS 数据库中共包括15 845 位作者,发文量排名前3 的作者分别是FANOS Vassilios(27 篇)、WISHART David(18 篇)、XU Guowang(18 篇)、LIANG Qun(16 篇)、ZHANG Aihua(16 篇)、JIA Wei(16 篇)、FIEHN Oliver(16 篇)、BARBAS Coral(16 篇)。在发文量排名前3 的作者中有50%的作者为中国学者,表明当前该领域中国研究者占据主导地位。作者合作关系图谱显示,发文量排名靠前的作者间存在有交流与合作。
图3 WOS数据库中作者合作关系图谱
2.4 机构及其合作关系
2.4.1 CNKI 数据库 对CNKI 数据库中的453 家机构进行分析,运行COOC 软件,将CNKI 数据库中发文量排名前10 的机构进行统计,见图4。排名前5 的机构依次是河南中医药大学、山东中医药大学、天津医科大学总医院血液科、天津市第三中心医院检验科、河南中医药大学第一附属医院,代谢组学在疾病诊断中的研究机构多为高校、医院或中医药研究所。
图4 机构发文量排名前十的风向玫瑰图
2.4.2 WOS 数据库 对WOS 数据库中的3 515 家机构进行分析,运行VOSviewer 软件,得到机构合作关系图谱,见图5。排名前3 的机构依次是Chinese Acad Sci(94 篇)、Shanghai Jiao Tong Univ(60 篇)、Univ Alberta(56 篇)。在WOS 数据库中发文量最多的是中国科学院,该机构与复旦大学、浙江大学、重庆医科大学等机构均有较为密切的交流与合作,进一步促进了代谢组学在疾病诊断中的发展。
图5 WOS数据库中机构合作关系图谱
2.5 国家及其合作关系
利用VOSviewer 软件生成国家合作关系图谱,并将数据导入COOC 软件中,生成国家发文量排名前10 的饼形图,见图6、图7。发文量最多的是中国(924 篇),其次是美国(672 篇)、英国(225 篇)、意大利(213 篇)、西班牙(169 篇)、加拿大(168 篇),中国在该领域中占据有一定程度的主导地位。由国家间的合作关系图可知,中国与美国、加拿大、日本之间均有较为密切的合作交流。
图6 国家合作关系图谱
图7 国家发文量排名前10的饼形图
2.6 关键词分析
2.6.1 关键词共现可视化分析
2.6.1.1 CNKI 数据库 关键词是对文献主题和内容的高度概括,运行COOC 软件对CNKI 数据库中的关键词进行分析,生成关键词词云图和关键词共现图谱,见图8、图9。词云图中关键词的字体大小代表关键词频次的高低,关键词字体越大则频次越高,除去与检索策略相关的检索词外,频次前5 的关键词是生物标志物(99 次)、核磁共振(29 次)、蛋白质组学(22 次)、尿液(20 次)、液相色谱质谱联用(18 次)。表明基于代谢组学等研究利用核磁共振、液相色谱质谱联用等技术,寻找不同疾病之间或不同疾病与健康人之间的生物标志物诊断、鉴别诊断疾病为当前国内学者较为关注的研究方向。
图8 CNKI数据库中关键词词云图
图9 CNKI数据库中关键词共现图谱
2.6.1.2 WOS 数据库 运行COOC 软件对WOS 数据库中的关键词进行分析,生成关键词词云图和关键词共现图谱,见图10、图11。除了与检索策略相关的检索词外,频次前5 的关键词是生物标志物685 次、质谱分析204 次、蛋白质组学131 次、核磁共振99 次、尿液94 次,由此表明在该领域国外研究方向与中国所关注的内容一致。
图10 WOS数据库中关键词词云图
图11 WOS数据库中关键词共现图谱
2.6.2 关键词阶段性动态前沿演化分析
2.6.2.1 CNKI 数据库 时区图可以从时间维度上反映该领域的研究热点及前沿,以此对未来的发展方向作出预估,本文利用COOC 软件对CNKI 数据库中的关键词进行累计时区图演进绘制,见图12。发现代谢组学在疾病诊断中的研究大致可分为2 个阶段:第一阶段(2015—2017 年)的研究主要是利用代谢组学分析技术寻找肺癌、口腔癌、前列腺癌、乳腺癌等恶性肿瘤疾病的标志物,并探究其代谢通路和药物起效的作用机制;第二阶段(2018—2020 年)的关注点为同一疾病不同证型诊断的代谢组学研究。
图12 CNKI数据库中关键词累计时区图
2.6.2.2 WOS 数据库 关键词累计时区图是以关键词首次出现的年份为节点所绘制的图谱,横轴代表年份,节点越靠近Y轴,表示出现的时间越早,反之,表示出现的时间越晚。利用COOC 软件对WOS 数据库中的关键词进行累计时区图演进绘制,见图13。发现代谢组学在疾病诊断中的研究大致可分,2 个阶段:第一阶段(2015—2018 年)的关注点是通过联用代谢组学、蛋白质组学、糖组学以及与肠道菌群相结合等技术,对不同疾病进行诊断与鉴别诊断的研究;第二阶段(2019—2020 年)的关注点为网络药理学与代谢组学相结合对疾病进行诊断以及机制探讨的研究。
图13 WOS数据库中关键词累计时区图
3 讨论
近年来,随着代谢组学研究的不断深入,其在疾病诊断中发挥着越来越重要的作用。2002 年,研究者通过对极低密度脂蛋白、低密度脂蛋白、高密度脂蛋白和胆碱浓度进行测定,成功区分了冠心病患者和健康人[27]。2018 年,于莉[28]通过代谢组学发现次黄嘌呤、谷氨酰胺、肉碱、嘌呤和磷脂能够成功区分小细胞肺癌患者与健康人,这为小细胞肺癌患者的早期诊断提供帮助。可见,代谢组学作为一种筛选工具为疾病的诊断做出诸多贡献。
为了更加直观地揭示代谢组学在疾病诊断方面的现状以及国内外有关该领域的趋势和热点,本研究借助VOSviewer 软件和COOC 软件对CNKI 和WOS 两个数据库中近6 年来代谢组学在疾病诊断中的相关研究进行了文献计量及可视化分析,以期为研究该领域的学者提供较为前沿的研究方向和思路。
从发文量来看,近6 年来,虽然在2018 年和2020 年国内该领域发文量相较前1 年有所减少。但整体呈现增长趋势,而国外发文量在2015—2020 年均呈稳定增长趋势。说明该领域仍受到广泛关注,可能是与代谢组学所寻找的标志物对疾病的早期诊断愈加重要,以及与代谢组学分析手段和数据分析方面的不断完善有关[29-30]。
论文被引次数越高,表明其在所属领域科研影响力和科研创新力越大[31]。从被引文献频次来看,质谱分析和核磁共振是研究代谢组学的主要技术手段,而其用于不同疾病诊断并了解疾病发病机制、根据药物作用干预效果识别新的药物靶点,并针对每个病人给予靶向药物治疗和精确适宜的诊断方法是国内外学者较为关注的研究方向[21]。同时,深入研究微生物群落与代谢在人类整个疾病发展过程中的重要作用,以探寻疾病的发病机制及疾病的诊断方法也是较好的研究方向。
从发文作者来看,中国发文量最多的是天津大学化工学院,其主要研究的内容为代谢组学相关技术在冠心病[32]、急性心肌梗死[33]、急性胰腺炎[34]等疾病。国外发文量最高的是意大利卡利亚里大学,其研究方向侧重于代谢组学在结直肠癌中的诊断[35-36]。从发文机构来看,代谢组学在疾病诊断中的研究机构多为高校、医院或中医药研究所,我国发文量最高的机构是河南中医药大学,该机构的主要研究方向为艾滋病肺脾气虚证的血液和尿液代谢组学[37-38]。WOS 数据库中影响力较大的机构为中国科学院,其研究方向多为借助代谢组学相关技术对肝癌[39-40]、结直肠癌[41]、胃癌[42]等恶性肿瘤疾病生物标志物鉴别诊断。目前,代谢组学相关的研究集中于恶性肿瘤方面,由于大多数的恶性肿瘤在患病前期表现并不是很明显,在确诊时大都已接近中晚期,而代谢组学作为一种检测手段,可以在小分子水平寻找疾病的标志物,辅助疾病的早期诊断,提高患者的生存率。因此,代谢组学在帮助诊断恶性肿瘤疾病具有重要研究价值。从发文国家来看,中国为发文量最多的国家,在该领域占有主导地位,并且与美国、加拿大、日本之间均有较为密切的合作交流,而加强作者之间、机构之间、国家之间的相互合作,可进一步提高代谢组学在疾病诊断中的研究水平。
为了更加直观反映代谢组学在疾病诊断中的研究热点以及掌握本领域未来的发展方向,本文对关键词进行了共现及动态前沿演化分析。当前采用多组学整合技术同时利用核磁共振、液相色谱质谱等寻找不同疾病之间或不同疾病与健康人之间的生物标志物,并探寻其代谢通路和药物作用机制帮助诊断、鉴别诊断疾病是国内外学者共同关注的研究方向。同时发现对于代谢组学分析样本来源-尿液,被研究者广泛使用[43]。此外,对于疾病的研究正逐渐从恶性肿瘤疾病转向同一疾病不同证型,这也说明学者对于中医药领域的研究逐渐重视,同时这也是代谢组学在疾病诊断中研究热度较高的方向。目前,由于代表性体液样本如脑脊液、脑组织等难以获取,将代谢组学用于疾病的诊断,尤其是中枢神经系统类疾病的诊断,仍然有很大的局限性。因此,较多脑部疾病的研究仍然停留在动物实验上,缺乏大量临床样本对动物研究所获得的生物标志物进行验证,仍需将代谢组学技术与相关的临床检测手段相结合对疾病进行诊断。
本研究虽然同时利用VOSviewer 软件和COOC软件进行可视化分析,但基于软件限制,只检索了1 个中文数据库和1 个英文数据库,没有同时纳入多个数据库的文献进行分析,因此对此领域的分析还存在一定局限性,仍需进一步探究。