基于CiteSpace分析非典型性肺炎研究对传染病诊治防控的启示
2021-10-30隋永博
刘 洁,隋永博
(长春中医药大学 医药信息学院,长春 130117)
随着医学基础研究在各个领域的应用,特别是医学分子学的发展,现代医学对很多疾病的诊断、治疗有了很大的进步,但是未知的突发感染性疾病对现代医学提出了挑战。分析了非典型性肺炎研究文献,通过可视化分析,为可能发生的突发传染性疾病提供有效的防控机制和应对手段。
1 方法
科学知识图谱的概念源于2003年美国国家科学院组织的一次研讨会,随着信息可视化的发展,绘制科学知识图谱的各种工具亦纷至沓来[1-2]。采用可视化应用软件CiteSpace绘制知识图谱是基于共引分析理论和寻径网络算法等,对特定领域的文献(集合)进行计量[3],对文献时间分布和热点关键词的词频和聚类进行可视化,有效呈现学科研究的发展阶段、热点和前沿。CiteSpace融合了合作网络分析、共现分析、共被引分析、文献耦合分析等工具,已成为当前最热门的知识图谱绘制软件之一[4]。
采用CiteSpace可视化软件,对非典型性肺炎研究的关键词网络进行图谱化呈现,基于客观数据,对研究发表文章做特征分析、文献关键词频次分析、聚类分析和突现词分析。
2 分析结果与讨论
2.1 年份发文量分布特征
文献从中国知网(CNKI)平台获取,获取时间是2020年10月11日。检索从2003-2019年发表的文献,检索对象是非典型性肺炎 (SARS) 研究的科技论文。关键词检索:非典、严重急性呼吸综合征、SARS、非典型肺炎、冠状病毒、SARS冠状病毒、SARS-CoV、传染性非典型肺炎、非典型性肺炎。来源类别为核心期刊、CSSCI、CSCD、SCI、EI。共检索3 440篇论文,经过筛选、去重,对3 428篇论文进行分析。从图1可见,将非典研究分为三个阶段:
第一阶段:2003-2006年:对非典型性肺炎研究进入快速发展时期,也是科研人员和科研经费投入最多的时期,年度文献量由峰值急剧下降。
第二阶段:2007-2011年,由最初科研人员和科研究费的大量投入,进入缓慢下降阶段。
第三阶段:2012-2019年,年度文献量不足10篇,进入停滞和缓慢发展时期。
与非典型性肺炎相关文献发文数量从2003年1 732篇下降到2007年76篇。从非典型性肺炎出现时发文量达到峰值,每年逐渐下降,5年后不足100篇,10年以后每年发文不足10篇。通常一个研究领域发文量每年逐渐递增,当研究成熟时,发文量达到峰值,再逐年下降,呈正态分布。非典型性肺炎研究发文量没有经历逐年递增的过程,这是很特殊的一种发文量趋势。当突发性、严重性公共卫生事件发生时,为了尽快了解这一新的感染性疾病,以达到早期控制、治疗的目的,对这一新型疾病的研究就成为热点,之后发文量急剧减少或研究发生变动,分化产生出新的研究方向[5]。
图1 2003-2019年非典研究文献年度分布图Fig.1 Distribution diagram of SARS research literature from 2003 to 2019
2.2 文献关键词频次分析
关键词是从文献提炼出来的核心词汇,频次是关键词在文献中出现的次数。频次分析是在文献中提取能够表达文献核心内容的关键词或主题词频次的高低分布,研究该领域发展动向和研究重点。通过关键词频次统计,可直观展现对非典型性肺炎研究主题或研究重点的演化进程。
表1是2003-2006年频次前15位的关键词列表,频次为前10的关键词有:非典 (SARS) 、SARS 冠状病毒、患者、诊断、疫情、胸部x线及CT、抗体、医护人员、突发公共卫生事件、经济。频次大于100次的关键词有6个,从这6个关键词可以看出,在早期,研究人员关心的是对病毒本身的研究和理解,以解决对患者的诊断和治疗,了解疫情并控制突发公共卫生事件,而它对经济的影响也是需要解决的问题。
表1 2003-2006年共现频次前15的关键词表Tab.1 First 15 co-occurrence keywords from 2003 to 2006
表1中,序号在10以后的是流行病学、传染病、治疗、糖皮质激素、s蛋白,这说明疾病发生发展之后,进一步细致诊断和治疗方法成为研究主题。
表2是2007-2011年频次前5的关键词列表。从表2频次数量上可以看出,2007年以后,对此方面的研究明显下降,这段时间主要是对病毒致病机理进行研究。
表2 2007-2011年频次前5的关键词表Tab.2 First 5 co-occurrence keywords from 2007 to 2011
表3 中药汤剂关键词表Tab.3 Keywords of traditional Chinese medicine decoction
表3截取了4个中药汤剂关键词做了频次统计发现,在2017年,有文章对用中药治疗非典型性肺炎(SARS)进行了研究。
通过麻杏石甘汤、清瘟败毒饮、升降散和三仁汤,对比2020年新冠肺炎治疗方案,发现在公布的《新型冠状病毒肺炎诊疗方案(试行第七版)》中,清肺排毒汤列入中医临床治疗期首选[6]。在新冠肺炎的中医治疗上,因地域不同,南北方法也有差异。如北方的病人,寒湿较多,以伤寒方为代表,清肺排毒汤综合了《伤寒论》中的4个方子——麻杏石甘汤、射干麻黄汤、五苓散、小柴胡汤;而广东病人湿热较多,“肺炎一号方”则选择以达原饮、清瘟败毒饮、补中益气汤等从中化裁[6]。蒋鼎等讨论了麻杏石甘汤、清瘟败毒饮、升降散、三仁汤对非典型性肺炎治疗的作用,在此基础上,针对新型冠状肺炎治疗,快速给出了方案,使用的方剂也是针对南北不同地域,使用不同方法。
2.3 聚类分析
聚类分析是将所有数据按照相似性划分为多个类别,是文献中关键词的聚类分析,每个聚类标签可以用文献标题、关键词和摘要中的主题词来进行标记。
聚类分析得到网络模块性Modularity 的评价指标Q,Q>0.3(经验值)意味着划分出来的社团结构是显著的。平均轮廓值Mean Silhouette,是另一个评价聚类效果的参数,一般当轮廓值为0.7时,聚类是高效率令人信服的,在0.5以上,聚类一般认为是合理的[7]。
通过对研究文献进行聚类分析,得到聚类图谱图2。图2中共有284 个节点,457 条连线,网络模块性Q=0.895 1,平均轮廓值为0.982 8,聚类是令人信服合理的。非典型性肺炎研究领域共有聚类33个,其中前8个聚类规模较大,对诊治防控传染病具有重大意义。
图2 2003-2019年非典型性肺炎研究的关键词聚类图谱Fig.2 Keyword cluster mapping of SARS research from 2003 to 2019
聚类#0冠状病毒,包括以下关键词:SARS冠状病毒、基因组、灭活疫苗、特异性抗体、N蛋白、PCR、血清、DNA疫苗、禽流感、刺突蛋白。可以看出,对病毒本身研究的重要性,对病毒了解越深入,才能更有效进行治疗和预防。
聚类#1非典型肺炎,主要关键词有非典、危机管理、防治工作、社会支持、社会心理。非典型肺炎是冠状病毒引起的主要临床表现,简称为非典。在对非典型肺炎研究中,主要研究社会对非典防治的支持、心理疏导和危机管理。
聚类#2病人,主要关键词有患者、医务人员、防控、口罩、病房、胸片、影像学表现、康复期、护士、病程、病区、标本、隔离病房。病人是防治对象,医治需要依靠医院完整的系统。
聚类#3临床检验,主要关键词有抗体、S蛋白、冠状病毒感染、疑似病例、医院感染、淋巴细胞、白细胞、密切接触者、酶联免疫(Elisa)、单克隆抗体、抗原、抗原表位。临床检验结果为非典型肺炎的诊断提供了重要依据,临床检验的重要性使其在聚类中排在第4。
聚类#4临床诊断和治疗,主要关键词有诊断、治疗、病例、临床表现、预后、发热、病理学、危险因素、感染。有了对冠状病毒及其引起非典型肺炎的认识,就要依据临床检验对病人做出诊断和治疗。
聚类#5骨坏死,主要关键词有放射摄影术、糖皮质激素、中西医结合、骨坏死、恢复期、磁共振成像、中药、T细胞因子。骨坏死是SARS激素治疗后恢复期的一个特殊病症,研究骨坏死包括骨坏死的诊断和治疗。
聚类#6经济,主要关键词有疫情、经济、政府、负面影响、就业、财政管理、投资、旅游业、农民工、公共卫生体系、外贸出口、中央政府、财政金融。突发传染性疾病对经济有严重的影响,关键词清楚展示了非典型性肺炎对经济的影响。
聚类#7冠状病毒传播,主要关键词有疫苗、病毒传播、蝙蝠、特征参数、临床治疗、控制措施、疾病传播、时空特征、抗病毒药物、输入输出流。快速控制传染性疾病的传播是另一个需要及时解决的问题。
以上聚类分析明确显示了与年份发文量分布特征和文献关键词词频分析的一致性,展示了诊断或快速诊断,控制疫情,加强治疗和预防感染相互关系的重要性,进而设立了发热门诊,筛查隐性感染者、密切接触者,从而找疑似病例,进一步做临床诊断。
2.4 非典型性肺炎研究的热点突现词分析
突现词分析的基本原理是根据标题、关键词、摘要等词频增长率,发现研究热点与发展趋势。词频增长率称为突现强度,关键词的突现强度图谱有利于分析研究热点及热点的演变[8]。
通过CiteSpace可视化分析软件,制作了2003-2019年非典型性肺炎研究的热点突现词表4,展示突现强度前8的关键词是:SARS冠状病毒、表达、s蛋白、骨坏死、单克隆抗体、抗体、核衣壳蛋白、突发公共卫生事件。这些突现词最初出现在2004和2005年,进一步显示对病毒本身研究的热点和前沿,对疾病理解、诊断和治疗的重要性。骨坏死一词的出现,表明在一年以后非典后遗症成为研究热点。
表4 2003-2019年非典型性肺炎研究的热点突现词表Fig.4 Hotspot burst words of SARS research from 2003 to 2019
关键词SARS冠状病毒、S蛋白和骨坏死的强度较高。强度最高的突现词为SARS冠状病毒,起始于2005年,结束于2012年。
3 结论
通过对非典型性肺炎研究文献进行知识图谱分析发现,知识图谱能提供对非典型性肺炎研究、治疗和防控过程有价值的认知,当一个未知的传染病出现时,需要组织有效的研究团队,研究病原引发疾病的机制机理。在中医中药治疗中,根据南北不同地域,使用不同中药方剂,同时应快速制定治疗和预防方法和手段,可对今后类似的突发公共卫生事件提供有效的防控机制和应对手段。