基于聚类分析方法的皮肤病学研究热点分析
2022-01-20祝琳琳崔雷
祝琳琳,崔雷
(1.沈阳市第七人民医院皮肤科,沈阳 110003;2.中国医科大学健康管理学院情报学教研室,沈阳 110122)
皮肤病学作为研究皮肤及其相关疾病的科学,其内容不仅涉及正常皮肤及附属器的结构和功能,还囊括了各种皮肤病及附属器官疾病的病因、发病机制、临床表现、诊断和防治等内容[1]。为了进一步了解此领域当前的研究热点,本研究采用皮肤病研究论文高频主题词进行共词聚类分析的方法,获得当前国际上皮肤病学的研究热点,为广大专业人员提供参考信息。
1 材料与方法
1.1 材料
本研究分析材料来自PubMed数据库(https://www.ncbi.nlm.nih.gov/),该数据库由美国国立医学图书馆的国家生物技术信息中心开发维护。首先通过《期刊引用报告》(Journal Citation Reports,JCR)数据库(http://www.lib.wh.sdu.edu.cn/dn/database490.html)获取皮肤病学相关领域2018年影响因子最高的4种期刊:《JAMA Dermatology》 《Journal of the American Academy of Dermatology》 《The British Journal of Dermatology》 《The Journal of Investigative Dermatology》。在PubMed数据库中检索4种期刊近2年发表的所有文献,检索策略为“JAMA Dermatology”[Journal] OR“Journal of the American Academy of Dermatology”[Journal] OR“The British Journal of Dermatology”[Journal]OR“The Journal of Investigative Dermatology”[Journal]AND“2018/01/01”[PDAT]:“2019/09/30”[PDAT]。并以XML格式下载文献记录。
1.2 方法
对从PubMed获取的相关文献记录,应用书目共现分析系统(bibliographic item co-occurrence matrix builder,BICOMB)2.0进行数据提取与统计,统计字段为主要主题词/副主题词,两两统计它们在同一篇论文中出现的次数,并截取出现频次>15次者为高频词,从而形成主要主题词/副主题词-来源文献矩阵。2个主要主题词/副主题词在众多的文章中同时出现的频率越高,说明它们之间关系越密切。以TXT格式输入至gCLUTO软件中进行系统聚类分析,通过分析不同聚类类别主要主题词/副主题词,以及各个类别相对应的代表性文献,获得目前皮肤病学领域的研究热点。
将主要主题词/副主题词应用BICOMB生成主要主题词/副主题词相关文献词篇矩阵。
2 结果
2.1 皮肤病研究高频主题词
共检索出相关文献5 136篇,截取出现频次>15次的38个主要主题词/副主题词形成高频词表[2-3],见表1。相关文献词篇矩阵每一类中的主题词以及代表性论文见表2。
表1 近2年皮肤病研究论文高频主要主题词/副主题词(频次>15)Tab.1 High frequency major subject headings/sub-heading(frequency > 15)
表2 词篇矩阵Tab.2 Term paper matrix
2.2 高频主题词聚类分析结果
应用gCLUTO软件进行系统聚类分析,得到高频词的聚类结果(图1)、高频词聚类的可视化矩阵(图2)及高频词聚类可视化山丘图(图3)。可视化矩阵(图2)中,纵轴表示高被引论文,横轴表示这些论文之间的距离。图3可视化山丘图中,数据矩阵被聚成4类,可视化山丘将4个类群显示为4个山丘。山丘的高度与类内相似性成正比,体积与类群包含的对象数量成正比。合成的高斯曲线相加在一起形成可视化山丘的地形。山丘的颜色与类内偏差成比例,红色代表变异低,蓝色代表变异度高。
图1 高频词聚类结果Fig.1 Clustering results of high frequency words
图2 高频词聚类的可视化矩阵Fig.2 Visual matrix of high frequency word clustering
3 讨论
通过高频词聚类结果(图1)、高频词聚类的可视化矩阵(图2)以及高频词聚类的可视化山丘图(图3)发现,将所得数据聚成4类后,聚类效果较好,通过阅读各个类别对应的描述度较高的来源文献进一步了解每类的内容,将皮肤病学领域的研究热点主要分为4类。
图3 高频词聚类的可视化山丘图Fig.3 Visual hill map of high frequency word clustering
第一类为皮肤病的药物治疗、疗效评价及安全情况的研究。对Cluster 0中相关代表性文献及类标签文献的分析结果显示,高频主题词主要聚集于皮肤科药物治疗,尤其是特应性皮炎(atopic dermatitis,AD)和慢性银屑病生物制剂治疗的效果、安全性,该类研究[4-7]对指导临床工作有实际意义。AD是一种复杂的慢性炎症性疾病,中重度AD在治疗上存在挑战。Dupilumab治疗中重度AD在疗效及耐受性方面值得被肯定[8]。目前针对AD的其他生物制剂也在临床研发中,如Tralokinumab(白细胞介素-13)及Nemolizumab(白细胞介素-31受体)等[9],这些研究为未来拓宽AD的治疗提供了新的前景。银屑病是一种常见的慢性免疫介导的炎症性疾病,严重影响患者的社会心理和情感健康,重症银屑病的患者通常接受光疗、全身性药物治疗(甲氨蝶呤、环孢菌素b、阿维A等)和生物制剂治疗等。
第二类为黑色素瘤的遗传学、流行病学等方面的研究。对Cluster 1中的相关高被引文献进行分析,4篇代表性文献[10-13]均是基于对黑色素瘤的研究,如突变对黑色素瘤的影响以及使用遗传学方法进行黑色素瘤风险预测。通过全基因组关联研究,已经鉴定出与黑色素瘤相关的单核苷酸多态性(single nucleotide polymorphisms,SNP)。然而,这些SNP对黑色素瘤发展的综合影响仍不清楚。与良性痣相比,黑色素瘤的BRAF突变率较低,这与BRAF突变可能是导致黑色素细胞增殖而不是恶性转化的基因概念是一致的[13]。
第三类为黑色素瘤的危险因素、回归预后、生存率和死亡率等方面的研究。对Cluster 2中相关高被引文献及类标签文献的分析结果显示,黑色素瘤多为黑色素细胞恶变而来的肿瘤,恶性程度高,对黑色素瘤患者的生存预后分析具有十分重要的临床意义[14-17]。经典的因素(厚度、溃疡、年龄)均对预后有影响[14]。皮肤痣数量增多显著增加了黑素瘤死亡的风险。痣的数目在临床实践中可能作为预测黑素瘤死亡风险的独立预后因素。
第四类为人乳头瘤病毒与皮肤肿瘤的关系及皮肤肿瘤的影像学诊断方面的研究。主要包括识别临床和皮肤镜特征,组织病理学诊断皮肤肿瘤,评估恶性肿瘤的风险[18-21]。皮肤镜检查被认为是检测黑色素瘤的重要工具,在临床上发现黑色素瘤之前就可揭示出它的不对称性,帮助临床医生更早地识别黑色素瘤。
综上所述,本研究通过共词聚类分析方法,分析了当前皮肤病学领域的研究热点。目前皮肤病学的研究热点主要集中在以下3个方向:(1)对各种生物制剂治疗皮肤病的效果评价安全情况;(2)对黑色素瘤的遗传学、危险因素、流行病学、生存预后、发病率与死亡率等方面的研究;(3)应用皮肤镜等影像技术诊断皮肤肿瘤,评估恶性皮肤肿瘤的风险。本研究结果为把握皮肤病学的研究现状和发展趋势奠定了基础,为临床工作和未来的研究提供了方向。