APP下载

基于文献计量学对医学领域中体质研究的可视化分析*

2021-11-21李玲孺韩东燃胡聿昕吴胤文许书静史渊源

中医药导报 2021年8期
关键词:图谱体质聚类

贾 鹏,李玲孺,韩东燃,胡聿昕,吴胤文,罗 兰,许书静,史渊源,2

(1.北京中医药大学生命科学学院,北京 102488;2.深圳北京中医药大学研究院,广东 深圳 518118;3.北京中医药大学中医学院,北京 102488;4.北京中医药大学针灸推拿学院,北京 102488)

体质是个体生命过程中,在先天遗传和后天获得的基础上,表现出的形态结构、生理机能及心理状态等方面的特质[1],其包含个体化治疗、体质识别、体质分类和体质调整4个方面,为健康状况评估和个体化治疗提供了方法[2]。体质研究在体质人类学、体育和医学3个学科中不断发展[3],本研究主题为医学领域中的体质研究。该领域历经近60年的研究和发展,学术界涌现出大量的体质学研究文献[4-5],但文献繁多,亟待梳理和分析。由于期刊文献具有良好的时效性,能够较为精准地反映某一研究主题的动态发展状况。因此,本研究采用CiteSpace[6]和VOSviewer[7]数据挖掘可视化软件对中国知网数据库(CNKI)中1962年1月至2020年8月8日发表的与医学领域中体质研究相关的期刊文献进行归纳整理。通过分析所产生的相关数据,呈现出直观化、可视化的知识图谱,并阐述该研究领域的研究现状,分析其研究热点及发展趋势,以期为今后的体质研究提供借鉴。

1 资料与方法

1.1 数据来源及检索策略 本研究的数据来源于中国知网(CNKI)。运用高级检索,选择“期刊”,在文献分类目录栏中勾选“医药卫生科技”,检索条件:主题为“体质”不含“体质指数”,并且主题为“体质”不含“等离子体质谱”。检索结果发现,现有期刊文献中最早提及医学领域中的体质概念的时间为1962年[8]。故检索时间跨度设为1962年1月至2020年8月8日,检索时间为2020年8月8日,共得到16 179篇期刊文献。

1.2 纳入标准(1)关于“体质”的原创文章(论著);(2)“体质”的研究进展类文章。

1.3 排除标准(1)未正式发表的文章;(2)会议摘要和会议记录、勘误文件;(3)重复发表的文献;(4)无关文章(如体质教学、体质指数、体质人类学相关的文章等)。

1.4 数据处理及绘图 为确保数据的完整性和准确性,由两位研究人员根据纳入标准、排除标准各自独立筛选文献,若遇分歧则与第三位研究人员讨论确认是否纳入,最终筛选出6 086篇文献,并将每篇纳入文献的题录信息导出。运用科学计量学工具CiteSpace(v.5.6.R4)和VOSviewer(v.1.6.16)软件绘制本研究领域中的关键词共现、聚类、时间线和突现图谱,以及作者和研究机构合作的网络图谱。Citespace数据参数设置如下:Timespan(1962—2020年;slice length=1),Selection Criteria(Top 50 per slice)。本研究在VOSviwer中设定作者共现频数>8。

2 结 果

2.1 文献发表量变化趋势 本研究将纳入的6 086篇期刊文献的数据绘制出如图1所示的增长分布图。1962—1987年,期刊文献的每年增长量较少(低于10篇),可能是由于医学领域中的体质研究正在处于起步阶段。1988—2001年,国内体质研究的相关文献发表数量缓慢上升,表明体质的研究逐渐受到学术界的关注。2002—2013年,体质研究的相关文献发表数量呈逐年增长趋势,尤其是2010—2013年处于快速增长期。可能与2009年的《中医体质分类与判定》[9]的正式发布有关。2014—2017年,本研究领域发表文章的数量呈现平稳增长的趋势,并于2017年达到峰值(631篇)。2018—2019年,发文量有所下降,但是仍维持在580篇以上,可能是体质领域的研究在快速增长期后,其研究方向及内容趋于稳定。本研究尚未获得2020年全年的数据。总体而言,医学领域中关于体质研究文献的发文量整体呈现增长之势,可见体质研究的热度逐渐上升。

图1 1962-2020年文献增长分布图

2.2 作者分析VOSviewer生成的密度视图(Destiny Visualization)可以直观地辨识出作者间的合作频率与密度,密度的大小取决于作者的发文量。高密度节点(即高产作者)的颜色趋向于暖色调,反之趋向于冷色调[10]。图2是对发文量≥8篇的作者数据所绘制的作者密度视图。在作者密度视图中,合著强度高的作者会互相聚集形成一个合著集群。图2中大约共有8个作者合著集群。该研究领域总计1 091位作者,其中王琦开始研究的时间较早、发文量最多、合著强度最高,王琦提出了中医体质九分法,结合临床对体质类型做了规范化的命名和分类[1],表明其在本研究领域内具有重要影响力。王琦、王济、李玲孺、李英帅形成的作者合作集群,在一定程度上反映了体质研究的继承和发展情况。此外,其他7个作者合著集群为本领域研究中合作强度较高的集群。各个合著集群的作者代表在各自研究机构具有重要地位,为各研究者进行深度合作提供相关信息。根据普赖斯公式(N=0.749×nmax,N代表核心作者发文量,nmax代表最高产作者发文量)对核心作者进行测算[11],通过计算得出本研究领域总发文量≥12篇的作者称为核心作者,因此表1中的作者均为该领域的核心作者。

图2 作者密度视图

表1 8个作者合作集群的相关信息表

2.3 研究机构分析 同一篇文献中的作者分别来自不同的研究机构,说明这些机构之间存在合作关系。通过CiteSpace对筛选出的文献进行机构合作分析,得到如图3所示的国内医学领域中体质研究者所隶属研究机构的合作网络图谱。数据显示:N=772,E=466,Density=0.001 6,即共有研究机构772所,各机构间有466次合作,其网络密度为0.001 6。

研究机构主要集中在中医药院校及其附属医院,且各中医药院校与其附属医院之间存在较为紧密的合作关系,但中医药院校轮廓普遍大于附属医院,这可能与医院侧重临床,而院校侧重于科学研究有关。另外不同地域的研究机构间少有紧密合作。延边大学对应的节点与其他节点不存在连线,可能与其地理位置,以及该机构在体质研究方面主要集中于朝医四象体质相关方面[12-14]等因素有关。

发文总量>100篇且排名位于前7位的研究机构如表2所示。这7所研究机构中包含1家医院和6所高校,表明高校较医院更注重该领域的研究。以上研究机构的中介中心性之间差距较大,大部分研究机构的中介中心性<0.1,结合图3的网络密度(Density=0.001 6),表明该研究领域中研究机构之间合作偏少且分布相对不集中。陈超美提出一个基于中介中心性和突现性的综合指标——Sigma指数(∑),其同时考虑结构和时间,可用于对节点进行综合性评价[15]。根据节点Sigma值(∑)的相对大小可以判断出不同节点之间在综合重要性上的差异。Sigma值(∑)较高的3家机构分别为北京中医药大学(10.79)、南京中医药大学(1.19)、浙江中医药大学(1.26),提示上述3所研究机构在该研究领域有一定的地位及贡献度。

图3 研究机构合作网络图谱

表2 发文量前7位的研究机构相关信息表

2.4 关键词分析

2.4.1 关键词共现分析 通过对研究领域中文献关键词的分析,可以明确该研究领域的研究热点[16]。将CiteSpace软件运行后得到关键词共现图谱,如图4所示。该图的基本图谱特征:N=1 173,E=5 423,Density=0.007 9,表明该图由1 173个关键词节点及5 423条连线所构成,且该研究领域的研究热点相对不集中。而且说明该研究领域所涉及的范围较广,包括体质学(中医体质学、体质辨识、中医体质),中医体质类型(痰湿质、气虚质、阳虚质、阴虚质),研究方法(调查、相关性),人群特征(老年人、儿童),治疗方式(中医药治疗),慢性疾病(糖尿病、高血压),证候类型(中医证候、中医证型)等。

中介中心性是研究节点在网络中重要性的一个指标,在Citespace中运用该指标来发现和衡量文献的重要性。一般认为,中介中心性>0.1的节点在网络中具有重要意义[4,17]。通过对数据的分析和梳理将中介中心性>0.1,且共现频率排名前7位的关键词以表格的形式呈现,如表3所示。研究表明,具有较高中介中心性值的节点更可能识别边界跨越潜力,也许能带来变革性的发现[6]。由于筛选出的文献均与关键词“体质”和“体质学”相关,且两者均为该领域的主题词,故两者的中介中心性较高。通过对共现频数分析发现,关键词“中医体质”的共现频数最高(1 911),表明医学领域中体质研究的热点与中医体质相关。中医体质类型共有9种(一种平和质与8种偏颇质),结合图4和表3,痰湿质的共现频数(402)且其中介中心性(0.11)均处于较高水平,说明痰湿质也是该研究领域的研究热点。可能原因为如今大多数人的饮食生活方式导致痰湿质的人群不断增多[17],也可能是因为代谢性疾病、老年病、慢性病与痰湿质密切相关[4,18-19]。

图4 医学领域中体质研究的关键词共现网络图谱

表3 中介中心性>0.1的关键词统计表

2.4.2 关键词聚类分析 聚类分析是通过一定的算法将多项指标的数据按照其相似程度进行归类[16],可进一步呈现相关研究的关联规律。对本研究领域的关键词节点进行聚类,生成10个核心主题分类的聚类图谱,如图5所示。该图谱显示聚类模块性指数Q值(Modularity Q)为0.415 3>0.3,说明该聚类图谱划分出的色块结构是显著的;聚类轮廓性指数S值(Mean Silhouette)为0.588 8>0.5,表明该聚类图谱是合理的[20]。

图5 医学领域中体质研究关键词的聚类图谱

本研究选用LLR(对数似然率)算法从聚类文献中识别和提取术语作为聚类标签[21],分别以时区和聚类标签为横轴和纵轴,生成时间线图谱,如图6所示。该图谱更为直观地显示了各聚类在时间序列上发展演变的过程。结合图6和表4发现,纵轴上聚类标签的序号与其规模呈反比,即聚类标签的序号越小则规模越广。图6中“体质”节点被紫色圈标注[22],结合表4和图5发现“体质”的规模、S值和突现强度(strength)最大,是因为本研究的核心主题是体质,从侧面反映出本研究所筛选期刊文献的准确度较高。

图6 医学领域中体质研究关键词的时间线图谱

表4及图5表明每个聚类都是由若干个关联密切的关键词节点构成。节点间的关联密切程度由S值(轮廓值)衡量,S值越大,则该聚类集中节点间的一致性越高。聚类#9睡眠质量的S值最大且距今的平均年份最近(2017年),表明最近几年研究者对睡眠质量及其相关因素,以及与体质关系备受关注[23-24]。目前医学领域中体质研究主要以中医体质为主,但也不乏对朝医四象体质的研究,所涉及的研究方向较为广泛,包括体质类型、体质辨识、体病相关、辨体论治、疾病预防、健康指导等方面[14,25]。

表4 关键词聚类详细信息表

CiteSpace中使用探测频率突增算法所实现的突发检测(Burst detection)功能,能检测出在某一时段内词频变化率高的关键词[26]。从图7中可以发现某一个关键词的兴衰情况,而且在一定程度上预示将来的发展趋势。关键词突现时间持续>10年的有体质学、体质、中医辨证,表明以上研究方向长期受到研究者的关注。从开始突现一直持续到现在的关键词有中医体质辨识、湿热质、老年人及慢性病,说明以上关键词是目前该领域的研究热点。(见图6~7)“中医体质”节点较大且轮廓值较高(S=0.755),表明该领域处于相对活跃的状态,有可能是未来研究的发展趋势[27]。

图7 医学领域中体质研究的前15个关键词突现图谱

3 讨 论

体质可以从个体差异、生活习惯、心理状况及对自然环境和社会环境的适应性等方面反映出人类健康现状和预测疾病的发生发展。体质是疾病诊断、预防和治疗的基础,在体质评估、维护健康和预防疾病中发挥重要的作用[25]。因此,本研究运用CiteSpace和VOSviewer对近60年间在医学领域中与体质研究相关的期刊文献进行定性和定量分析,从发表趋势、文献作者、研究机构、关键词共现、关键词聚类、关键词突现等角度进行逐一阐释。

数据显示在体质领域中开展相关研究的国内研究学者总计1 091位,其中密度最高的合作网络是以王琦为代表的合著共同体,该团队不仅研究中医体质,而且还研究少数民族医学的体质。未来该研究团队在很大程度上可能成为该领域的研究力量生成源。其他7个作者合著群为本领域研究中合作强度较高的集群,但是其合著子网络相对局限于较小的范围内。各个合著集群的作者代表在各自研究机构具有重要地位。

在体质领域中开展相关研究的国内研究机构总计733所,通过分析发现该研究领域中的研究机构主要集于中医药院校及其附属医院,且各中医药院校与其附属医院之间存在较为紧密的合作关系,另外不同地域的研究机构间少有紧密合作。Sigma值(∑)较高的3所机构分别为北京中医药大学(10.79)、南京中医药大学(1.46)、浙江中医药大学(1.26),提示上述3所研究机构在该研究领域中处于重要地位且对该研究具有较大的贡献。但是其他研究机构跨地域的合作有待进一步加强。

文献中的关键词是文章的核心观点和主要内容的精炼表达,通过对关键词分析可以探测该研究领域的主题。将图4~7和表3~4整合起来分析,发现关键词“体质”的中介中心性、规模、S值和突现强度均最高,说明体质是本研究的核心主题。本研究发现国内期刊文献对国内外医学体质均涉及,国内医学体质研究主要包括中医体质及各个少数民族医学体质,其包括蒙医体质、藏医体质、维吾尔医学体质、傣医学体质等体质研究,其中中医体质研究占主要地位;国外医学体质研究主要包括朝鲜的四象体质、日本的一贯堂医学体质、印度的阿育吠陀医学中的三大体质,其中朝医的四象体质研究居于主要地位。

高中心性的节点均为共现网络图谱中的重要枢纽性节点,分析表3发现目前医学领域中体质研究的主要研究热点与体质类型和中医体质密切相关。在体质类型方面,不同的学者将体质分为不同的类型。王琦将中医的体质类型分为9种[1],匡调元将体质分为6型[28],田代华将体质分为12型[29]。目前中医体质九分法的应用最为广泛。不同的医学体系中体质类型的划分不同,如:藏医学之三分法[30](朗型、赤巴型、培根型),维医学之四分法[31](干热型、湿热型、湿寒型、干寒型),日本一贯堂医学之三分法[32](解毒证、瘀血证、脏毒证),以及韩国朝医四象医学之四分法[33](太阳人、少阳人、少阴人、太阴人)等。在中医辨证方面,体质辨证是中医辨证体系的重要组成部分,体质辨证与其他辨证方法有机的结合有助于提高临床疗效[34]。在体质类型方面,痰湿质受到较高的关注度,可能是由于痰湿质与糖尿病、冠心病、高血压等高发性疾病的关系较为密切[35-37]。从开始突现一直持续到至今的关键词有中医体质辨识、湿热质、老年人及慢性病,说明以上关键词是目前该领域的研究热点。结合该研究领域的经典文献,发现目前主要的研究话题是中医体质。但是对于少数民族医学体质研究的关注度偏低,亟待进一步对其挖掘,以期又快又好地推动人类健康和医药卫生事业的发展。

本研究存在以下两方面的局限性。一方面是本研究只纳入了国内的文献数据,可能会对结果带来偏差。另一方面是CiteSpace对于CNKI数据库中文献的节点类型进行分析仅局限于Author、Institution和Keyword;VOSviewer仅局限于Keyword和Author。故后续学者应该纳入世界领域内体质研究的相关文献,通过文献的共被引和耦合分析反映其联系程度和结构关系,以期更加全面地分析医学领域中体质的研究现状及未来的发展趋势。

猜你喜欢

图谱体质聚类
中医“体质”问答
中医“体质”问答
中医“体质”回答
绘一张成长图谱
28天吃出易瘦体质
基于DBSACN聚类算法的XML文档聚类
补肾强身片UPLC指纹图谱
基于高斯混合聚类的阵列干涉SAR三维成像
主动对接你思维的知识图谱
一种层次初始的聚类个数自适应的聚类方法研究