APP下载

基于CiteSpace的高血压风险预测模型研究的可视化分析

2024-03-29张亦然王康美朱盛财

全科护理 2024年6期
关键词:共病高血压病聚类

张亦然,朱 璐,王康美,朱盛财,代 炜,黄 沂

高血压是全球性的公共卫生问题。虽然病人数量呈现不断攀升的趋势,但疾病知晓率、治疗率、控制率仍较低。随着健康中国战略的实施,心血管疾病的风险评估与危险因素管理得到广泛重视,早期的评估及预防可以达到疾病防治关口前移的目的[1-2]。同时为减轻全球的疾病负担,高血压病风险的早期评估及预警相关模型也在不断被开发。国内外通过对高血压疾病相关因素进行调查研究及应用各类数学模型,开发与高血压相关的疾病风险预测模型,并实现对疾病及其各类并发症等进行定量预测。为了更加直观地了解与高血压相关预测模型的研究进展与趋势,本研究拟运用CiteSpace软件进行可视化分析,以期为未来展开更全面的高血压疾病相关预测研究、模型的临床转化应用提供思路。

1 资料与方法

1.1 数据来源与检索策略

以中国知网为中文数据来源,以布尔逻辑运算符构建检索式(主题=高血压OR高血压患病OR高血压患者OR高血压并发症)AND(主题=预测模型OR预警模型OR风险预测OR预测因子OR模型构建OR风险评估)进行检索。同时,以Web of Science核心合集为英文数据来源,运用高级检索,构建检索式:[TS=(hypertension OR High Blood Pressures OR essential hypertension)] AND [TS=(prediction model OR prognostic model OR risk prediction model)]。检索时限为2014年1月1日—2023年5月1日,语言仅选择中文及英文。

1.2 文献纳入标准与排除标准

纳入标准:研究主题为与高血压相关预测模型。排除标准:1)会议摘要、评论、信件、新闻报道等非学术类文章;2)动物类研究;3)重复发表的文章。

1.3 文献筛选与提取

文献筛选工作由2名研究者按照检索策略及纳入与排除标准对文献题目及摘要进行阅读筛选,有争议时由第3名研究者裁定,并由第3名研究者将文献导入CiteSpace 6.1.R6软件进行格式转换。

2 结果

2.1 文献检索结果

本研究初步检索得到中文文献989篇、英文文献5 671篇。去除重复文献32篇,按照纳入标准和排除标准阅读题目和摘要后排除6 050篇,最终得到578篇文献(中文文献296篇、英文文献282篇)。

2.2 年发文量分析

国内外高血压疾病相关预测研究在2014—2017年较少,2018年及以后中英文文献发文量均逐年上升。其中,中英文文献在2020—2022年增长速度均明显加快,在2022年发文量最多(中文文献n=96,英文文献n=75),见图1。

图1 2014—2023年高血压风险预测模型研究领域国内外发文量情况

2.3 基于关键词的研究热点分析

2.3.1 高频关键词共现

关键词是能够概括论文主题的词汇,有益于对文献主题进行初步了解。本研究将含义相近的中文关键词“高血压”与“高血压病”“风险评估”与“风险预测”“影响因素”与“危险因素”“风险因素”“预测模型”与“预警模型”合并。频次排名前3位的关键词依次是高血压病、预警模型、风险预测,中心度排名前3位的关键词依次是风险因素、高血压病、预警模型。将含义相近的英文关键词“prediction model”与“prediction”“risk factor”与“risk”“cardiovascular disease”与“cardiovascular risk”合并。频次排名前3位的关键词依次是blood pressure、risk score、association,中心度排名前3位的关键词依次是risk score、disease、cardiovascular disease。见表1。

表1 2014—2023年国内外高血压风险预测模型研究领域高频关键词及中心性

2.3.2 关键词聚类

使用对数似然比(LLR)算法对国内外高血压风险预测模型研究的关键词进行聚类分析。CiteSpace依据网络结构和聚类清晰度,提供了模块值(Q值)和平均轮廓值(S值)2个指标[1]。本研究中中文关键词聚类的模块值Q=0.830 4,平均轮廓值S=0.975 5,说明划分的聚类结构显著,是高效率、可信服的。在可视化图谱中显示,中文文献关键词聚类排名前3位依次是高血压病、风险评估、影响因素,英文文献关键词聚类排名前3位依次是ambulatory、metabolic syndrome、body mass index。见表2。

表2 2014—2023年国内外高血压风险预测模型研究领域关键词聚类列表

2.3.3 突现关键词

突现关键词是某一时期内出现频率较高的文献关键词,可以反映相关研究领域的研究进展及热点。“老年人”“脑出血”“预测价值”是近年来中文高血压预测研究的突现关键词,“guideline”“logistic regression”“machine learning”是近年来英文相关研究的突现关键词。见图2。

图2 2014—2023年国内外高血压风险预测模型研究领域中英文关键词突现图

2.3.4 时间线图

时间线图是从时间维度上来表示研究主题演变的视图。本研究提取中英文聚类高频词进行时间纵向分析,结果见图3、图4。以中文聚类#8机器学习为例,在2017—2022年出现的中文高频词依次是“心血管病”“决策树”“中医证型”“痰湿体质”“网络神经”“社区管理”“脑梗死”。

图3 2014—2023年国内高血压风险预测模型研究领域中文聚类高频词时间线图

图4 2014—2023年国外高血压风险预测模型研究领域英文聚类高频词时间线图

3 讨论

3.1 高血压风险预测模型的研究现状

国内外的高血压疾病相关的预测研究发文量均逐年增长,说明高血压疾病的早期预警越来越受到关注。我国是发文量最多的国家。相关报告中指出,高血压病已成为我国重要的公共卫生问题,高血压管理将直接影响我国心血管疾病如冠心病、脑卒中甚至心血管疾病导致的死亡事件的发生[2-3]。本研究显示,国内外的研究热点均集中在对高血压发病风险及并发症如轻度认知障碍、衰弱等进行预测。且国内外的高血压相关预测研究主要包括对不同特征的人群进行疾病的患病风险、共病及不良结局。然而从关键词来看,国内外相关领域的研究侧重点有所不同。在人口学特征上,国外研究更为关注儿童及孕产妇[2],而国内更关注老年及农村人口[3],并且在预测模型中纳入了中医特色变量[4]。虽然国内外高血压风险预测模型研究已经较为丰富,但原始研究数量较少,缺乏模型之间的联合应用与对比,今后可以进一步完善。

3.2 高血压风险预测模型的研究热点分析

3.2.1 高血压疾病相关预测因素

3.2.1.1 人口学特征

在突现关键词中,“农村人口”“老年人”“children”“women”等是预测因素的研究热点。中国健康与营养调查(China Health and Nutrition Survey,CHNS)发现,农村地区居民的高血压患病率增长速度较城市更快,在2012—2015年的调查中,农村与城市高血压患病率无差别,而2015年时农村高血压患病率已经高于城市[5]。本研究发现,“农村人口”突现时间正值2014—2016年,这可能是由于我国城市化的推进导致人们不良生活方式的发生,以及医疗质量得到改善,疾病知识在农村人口得到了普及等,使得农村高血压患病率逐渐约等于城市高血压患病率。“老年人”是预测研究的高频关键词,这可能与近年来国内老龄化加剧有关。随着老龄化社会的到来,我国高血压防治工作也面临巨大挑战。有研究构建了老年高血压病人并发冠心病的预测模型,预测因子包括年龄、总胆固醇、糖尿病和吸烟等[6]。对于老年高血压病人而言,严重威胁健康的并不是“高血压”这一疾病,而是由高血压带来的各种并发症。由于生理因素导致的认知功能降低、生活质量下降等,也会影响其高血压防治的自我效能。因此,如何高效展开老年高血压病人的健康管理以及提高其依从性、自我效能感是临床上亟待解决的问题。孕产妇及儿童是国外预测研究的重点人群,如研究通过构建模型发现孕期孕产妇高血压疾病、孕产妇教育水平、孕前体质指数(BMI)是儿童高血压发生的预测因子[7]。对子痫的发生及预后进行早期预测,有助于实现母婴健康、优生优育。目前,子痫前期尚无有效的治疗方法,待分娩后症状才可得到缓解[8],因此识别危险因子对于开展预防及明确治疗时机至关重要,研究者未来可进一步探究有效的预防手段或护理措施并验证。

3.2.1.2 共病及并发症

高血压共病及并发症是高血压疾病相关预测研究中的热点话题。其中,高频关键词包括脑卒中、冠心病,关键词聚类中有#4糖尿病、#6 atrial fibrillation。有研究表明,我国老年人慢性病共病的患病率高达65.14%[9]。并且,二元共病组合最常见的依次是高血压+糖尿病、高血压+冠心病、高血压+类风湿性关节炎[10]。因此,在病人具有高血压病、糖尿病等慢性病时,应该警惕与之相关的其他疾病同时发生而形成多元慢性病共病,以此构建预测模型,如国外学者开发的高血压与糖尿病共病人群心房颤动多变量预测模型[11]。对高血压共病的预测,有助于对多元共病病人进行早期筛查及预防,研究者可进一步探究多元慢性病共病管理模式。目前已有研究总结了老年慢性病共病的护理模式,包括出院计划模式、基于互联网的远程随访模式、最小干扰医疗护理模式等[12],但其有效性还有待考究,未来需要进一步实施。而在本研究中发现脑卒中、脑出血、冠心病是高血压并发症预测研究的研究热点,这与李俊等[13]的研究结果一致,脑血管损害、心脏损害、外周血管损害是发生率最高的高血压并发症。目前已有研究对高血压并发脑出血病人的预后及不良结局进行预测模型的构建,能够为临床提供定量的评估方法,对病人进行早期的风险评估,可以进行精确化干预以减少病人不良结局的发生。同时,对于高血压共病或高血压并发其他疾病的病人,由于多种疾病的出现增加了病人身体及心理负担。一项研究表明高血压和糖尿病共病病人存在明显不良情绪,其中预测因子包括年龄、收入水平、疾病种类等[14]。因此,对病人提供心理护理也尤为重要。为高血压并发其他疾病病人进行心理护理,能够减轻病人焦虑、抑郁情绪,并且提高病人的自我管理能力及生活睡眠质量[15]。

3.2.1.3 预测因子

在我国高血压疾病的预测因子中,除不良生活习惯、代谢组学等常见因素外,还包含中医元素特征。本研究中文聚类#0高血压病的时间线图上,发现2017年有中医元素如舌质、舌苔等成为研究热点。此外,中医体质也是热点之一。在吴琼[16]的研究中通过路径分析发现,平和质和气郁质的老年高血压人群心理弹性能够预测其生活质量。此外,痰湿体质、气虚体质、有齿痕、舌下脉络怒张等中医特征也构成了模型的预测因子[12]。动态血压监测是国外研究的热点,Kähönen等[17]监测高血压病人的血流动力学特征,并将全身血管阻力指数纳入至预测模型中以对以往的模型进行改善。在国内外高血压预测模型的相关研究中发现,纳入模型的风险因素呈现出高度一致,说明当前研究已较为广泛及深入,是国内外普遍的高血压病预测因子,但在不同人群中的预测作用有所区别。

3.2.2 模型构建

运用机器学习方法建立预测模型是国内外近年来的研究热点。对于预测模型的选择,主要以Logistic回归、人工神经网络、XGBoost等机器学习方法为主。而对于模型的构建方法,当前最常用回归预测法中的多因素Logistic回归分析和Cox比例风险函数[18]。此外本研究发现列线图在国内疾病预测研究中受到青睐。列线图是复杂统计学可视化的模型,研究将多因素回归分析确定的预测因子建立并绘制根据病人及高血压病特征而评估个体风险的列线图模型[19]。近年来,国内外基于机器学习构建预测模型成为研究热点,其中有回归树及其衍生模型、网络神经等,如在高血压人群特征选择和模型构建时采用了机器学习XGBoost算法,通过生成分类树为每个人提供了最终的预测风险评分[20]。对比传统预测模型而言,机器学习算法构建模型的预测性能会更好,但方法较为复杂,在构建模型时存在一定难度。虽然对于模型构建相关研究已经较为丰富,但还应进一步进行模型的应用转化。目前,只有少数传统模型在开发后被转换为风险评分[21]。通过评分而不是复杂的数学公式来呈现风险预测结果,可能会进一步提高模型的临床应用性。因此,在未来的研究中建议将各类预测模型在实际临床中进行验证及应用。

4 小结

本研究通过CiteSpace软件对国内外高血压预测模型的相关研究热点进行图谱绘制及分析,以关键词为导向对高血压预测模型相关研究的现状进行了解,以期为国内相关领域的预测研究和应用提供参考依据。临床工作中可通过应用预测模型早期识别高血压病的高危人群,如对老年及慢性共病人群进行针对性健康管理,可降低高血压病患病率和延缓、减少并发症的发生,对高血压病的预防和控制具有重要意义。本研究存在检索数据库有限,可能造成文献遗漏,未来将纳入更多文献了解国内外的研究进展。

猜你喜欢

共病高血压病聚类
抑郁状态与慢病共病的老年人健康状态的相关性及干预疗效
基于“脾为生痰之源”探讨高血压病痰瘀互结证
浅谈散偏汤合四逆散治疗偏头痛-抑郁症共病
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
老年人“共病”问题概述
艾司西酞普兰治疗卒中后抑郁焦虑共病的对照研究
高血压病中医规范化管理模式思考
一种层次初始的聚类个数自适应的聚类方法研究
高血压病中医病机探讨