基于多因素的高血压分析机制与智能医患平台
2019-09-10陈炜欣吴怡婷蒋安琪宋之潇
陈炜欣 吴怡婷 蒋安琪 宋之潇
摘 要:本文的目的在于建立多因素影响的血压分析机制,并对现有的线上平台进行创新,创建智能医患平台(小程序)。所使用的方法即在现有研究结果的基础上,收集数据、进行数据分析和参数拟合等。运用微信开发者等工具开发小程序。其结果为结合定量和定性两方面,建立了血压分析机制,在小程序中添加了智能血压分析、医患联系、联系人、生活建议等新功能。
关键词:血压分析机制;智能医患平台;参数拟合
中图分类号:TP391.3 文献标识码:A 文章编号:2096-4706(2019)03-0099-06
Multivariate Hypertension Analysis Mechanism and
Intelligent Doctor-patient Platform
CHEN Weixin1,WU Yiting1,JIANG Anqi1,SONG Zhixiao2
(1.School of Mathematics(Zhuhai),Sun Yat-sen University,Zhuhai 519000,China;
2.Zhongshan School of Medicine,Sun Yat-sen University,Guangzhou 510080,China)
Abstract:The purpose of this paper is to establish a multi-factor blood pressure analysis mechanism,and to innovate the existing online platform to create an intelligent doctor-patient platform (small program).The method used is to collect data,analyze data and fit parameters on the basis of existing research results. Develop small programs with tools such as Wechat Developer. The result is to establish a blood pressure analysis mechanism combining quantitative and qualitative aspects,and add new functions such as intelligent blood pressure analysis,doctor-patient contact,contact person and life suggestion to the program.
Keywords:blood pressure analysis mechanism;intelligent doctor-patient platform;parameter fitting
1 問题背景
高血压是心血管疾病和死亡的重要诱因。[1]2018年8月,欧洲心脏病学会(European Society of Cardiology,ESC)和欧洲高血压学会(European Society of Hypertension,ESH)联合发布了2018年高血压管理指南(下文简称2018指南),强调在全球范围内,超过10亿人患有高血压。高血压是导致心力衰竭、心房颤动、慢性肾病、外周血管疾病和认知功能下降的主要危险因素,同时也是引发缺血性心脏病、卒中等而导致过早死亡的首要因素。[2]在2018指南的主要更新内容中,诊室外血压诊断地位的提高具有极高的参考价值和普适性。
如今,高血压诊断与科技相结合,衍生出一些诊室外血压诊断的APP、小程序。根据我们对应用市场上相关APP及小程序的调研,发现现有的有关医疗方面的APP存在以下缺点:
(1)功能单一。市面上具有医疗功能的APP大多针对某家医院单独设计,仅具有预约挂号、查询医院信息等基本功能,或是仅仅具有针对某一项指标数据进行简单分析的功能,如某“高血压预防APP”仅通过病人输入的舒张压与收缩压来判断病情,其判断结果较为片面,存在较大误差。
(2)数据分析不足,诊断建议准确性较低。病情的自动诊断应该由多次、多项指标的数据统计与分析得出结论,而不能仅仅依靠某一次、某一项指标的变化来判定。
(3)数据缺乏可视化效果。现有的管理高血压APP或小程序大多直接将测量数据显示给患者,不够直观,患者难以理解。
(4)无法与医生取得实际性的联系,给出的建议笼统而空泛。许多健康APP并没有与医生有实际联系,且根据所得结论给出的建议并无大用。人体各项指标的数据变化是复杂的,仅依靠数据分析只能得出问诊人患病的可能性大小,进一步的病情诊断和治疗需要由专业的医生进行,更具针对性的建议也应当由医生给出。
(5)无亲者账号连接等功能,家属不了解患者情况。
此外,现有小程序多数只根据国内对高血压的定义进行诊断,考虑因素不够周全,因此我们希望对此进行创新,建立更完善的血压分析机制,创建面向用户并随时可用的血压分析线上平台。
如表1所示,2018指南中对高血压的定义没有改变,即诊室血压≥140/90mmHg时诊断为高血压,相当于家测血压135/85mmHg及动态血压监测的全天平均血压130/80 mmHg时诊断为高血压;仍然根据诊室血压分级,包括理想、正常、正常高值及1~3级高血压并强调高血压缺乏症状,应加强筛查。其特别强调了诊室外血压如动态血压监测(ambulatory blood pressure monitoring,ABPM)和(或)家庭血压监测(home blood pressure monitoring,HBPM)诊断地位的提高,并且特别推荐ABPM和HBPM用于排除或诊断白大衣性高血压、隐匿性高血压。此外,2018指南还强调对“重视生活方式干预、药物治疗启动时机前移”的观念,其更新内容更为我组微信小程序的成形提供了专业支持,赋予小程序以实际意义。
2 血压分析机制模型
2.1 模型准备
为建立血压分析机制,我们收集了196名患者数据①,其中包含患者年龄、性别、身高、体重、吸烟史、嗜酒史、高血压病史、糖尿病史(含少量血糖数据)、冠心病史、肾病史、心血管疾病家族史、不同时期的血压值。
2.2 模型初步建立及数据检验
高血压的临床研究是一个永恒的问题。我们在前人研究成果(主要是从医专业人士的成果,分析工具有SPSS等)的基础上,借助某些因素与高血压之间的正负相关关系,初步建立血压分析机制的数学模型,并利用此模型从各方面检验所收集数据的可用性。
2.2.1 初步建立模型
定义各因素对高血压的影响度I(influence)。许多文献已研究影响高血压的一些因素[3],在此我们结合所收集数据的特征,考虑下列因素:年龄A(age)、性别G(gender)、体质指数BMI、吸烟S(smoke)[4]、饮酒D(drink)。
(1)年龄A(age)/岁:研究表明,男性、女性高血压发病率高峰都在60岁以上。年龄每增加10岁,高血压发病风险增加16.7%。由此建立年龄对高血压的影响度为。
(2)性别G(gender):总体上男性高血压患病率高于女性,我们定义:G=1表示男性,G=0表示女性。男性高血压发病风险是女性的1.382倍。由此建立性别对高血压的影响度为IG=1.382×G。
(3)体质指数BMI(=体重(kg)/身高(m)2):研究表明,成人肥胖者(BMI≥28)的高血压发病风险增加49%。BMI对高血压的影响度为IBMI=0.49×(BMI-28)。
(4)吸烟S(smoke)、饮酒D(drink):我们定义S/D取值为1表示吸烟/嗜酒严重,S/D取值为0表示轻微吸烟/喝酒、不吸烟/不喝酒、已戒烟/戒酒多年。研究表明,调整高血压患者人口学因素、危险因素及伴发疾病后,在同样心血管危险分层下,吸烟患者发生危险是不吸烟患者的1.40倍。由此建立吸烟对高血压的影响度为IS=1.40×S,同样据前人研究结果,建立饮酒对高血压的影响度为ID=0.50×D。
综合以上各因素对高血压的影响度(合理性有待验证),可得初步的血压分析机制。
2.2.2 数据检验
下面我们不妨将以上各因素对高血压的影响做加和,代入所收集数据进行讨论,既验证初步模型的合理性,又对数据的可用性进行判断。
年龄、性别、体质指数、吸烟、饮酒对高血压的综合影响度为。
对数据进行处理,120例有效(指各因素数据齐全)数据可用于验证I0,数据结果如图1。这120组数据与前人研究成果以及初步模型I0比较吻合,高血压患者I0值普遍较高,可见数据还是比较可靠的。
2.3 模型优化
下面我们运用有效数据对模型进行优化、创新血压分析机制,使其在小程序中发挥更大的作用。
2.3.1 进一步检验初步模型
以上只研究了有无高血压的数据,下面对高血压患者细分高血压等级,数据结果如图2。
各级高血压患者的I0平均值均比未患高血压病人高,这是一种显著性特征。与未患高血压病人相比,各级高血压患者的I0值分布偏高。因此初步模型相对合理,可在此基础上进行创新、完善。
2.3.2 模型创新
(1)考虑遗传因素E(genetics)。人们对于高血压是否会遗传持较大争议。根据以往数据,高血压遗传可能存在(但遗传方式不明确);而实际上,这些数据可能隐含着假象——同样的生活习惯造成家族“遗传”高血压。但是大部分专业人士还是比较认同高血压会遗传。
我们定义遗传E取值为1表示有相关家族史,E取值为0表示无相关家族史。以上所用120组有效数据中,69例患者确诊为高血压,其中有65例患者能够明确是否有相关家族史,家族有高血压/心脑血管疾病史的占14/65。另一方面,我们可以考虑所有数据,101名患者确诊为高血压,其中家族有高血压/心脑血管疾病史的占20/93(除家族史不详的8名患者)。以上两种计算方法的结果相差不大,这在一定程度上验证了遗传因素对高血压的影响。由于前面已验证120组数据,我们选择14/65作为遗传对高血压的影响度,建立遗传对高血压的影响度为。
加入遗传因素后的数据结果如图3,与图2比较,發现各因素对高血压的影响度的总体分布变化不大,主要是Ⅲ级高血压患者的影响度有所升高,高血压级别越高的患者受到遗传影响的可能性更大,即遗传因素对高血压的影响是存在的。而IE的增加不会过度影响年龄、性别、体质指数、吸烟、饮酒对高血压的影响度I0,可见,此模型的改进是合理的。
(2)考虑上、下午血压值差异。一天中不同时间段的血压值会有所差异。由于用户一般无法测得动态血压,但有机会测量上午、下午的血压值,我们引进上、下午血压值对高血压的影响度,提高高血压预诊断的精度。
为减少外界因素干扰,我们不考虑手术后血压值,所收集数据中共有566组符合条件的住院患者的上、下午血压值。首先,我们分析上、下午血压值之间的关系,分别确定其对高血压的影响度。
1)上午收缩压Sa(收缩压SBP;上午AM)、下午收缩压Sp(收缩压SBP;下午PM)。每一组(同一天)的上午收缩压Sa、下午收缩压Sp数据分布如图4,由图可见大部分情况下,患者上午收缩压与下午收缩压差别不大(数据点基本在正比例函数附近),部分Sa偏高的数据点比Sp偏高的数据点较多,符合当今“血压晨峰”[5]的说法。
Sa、Sp的具体统计信息如表2。总体来说,Sa波动比Sp波动大(由标准方差可知),Sa平均值比Sp平均值高3mmHg,不妨以此作为上下午收缩压差别的代表,即设定Sa是Sp的122.9/125.9(≈1.0244)倍,一天的收缩压情况应综合Sa和Sp而得,因此对Sa、Sp分配的权重分别为0.506、0.494,初步建立上午收缩压和下午收缩压对高血压的影响度ISa+ISp=0.506×Sa+0.494×Sp。
2)上午舒张压Da(舒张压DBP;上午AM)、下午舒张压Dp(舒张压DBP;下午PM)。每一组(同一天)的上午舒张压Da、下午舒张压Dp数据分布如图5。
图中可能存在一个废弃数据(右上角Da:153mmHg;Dp:93mmHg),忽略这个数据,大致上患者Da与Dp差别不大(数据点基本在正比例函数附近)。图像上无法观测出Da和Dp的关系,我们考虑其具体统计信息,如表2。总体上Da平均值比Dp平均值高2.57mmHg,同样Da波动比Dp波动大,不妨设定Da是Dp的76.99/74.42(≈1.0345)倍,一天的舒张压水平应综合Da和Dp而得,因此对Da和Dp分配的权重分别为0.509、0.491,即上午收缩压和下午收缩压对高血压的影响度IDa+IDp= 0.509×Da+0.491×Dp。
综合以上所有分析,我们得到进一步的模型,年龄、性别、体质指数、吸烟、饮酒、遗传因素、上下午血压值对高血压的综合影响度为:I=IA+IG+IBMI+IS+ID+IE+ISa+ISp+IDa+IDp。
由于一名患者对应多组上下午血压值,无法仅使用原来的120组数据。现在重新整理原始数据,得到上下午血压值的561组完整数据(包括确切的年龄、性别、体质指数、吸烟、饮酒、家族史等数据)。各因素对高血压的综合影响度的图像结果如图6。
从图中我们可以看出,加入上下午血压值对高血压的影响度之后,数据的分布有几个大变化:Ⅰ级高血压患者的综合影响度均值比未患高血压病人的均值要低;Ⅲ级高血压和未分级高血压患者的综合影响度分布较散。由此可见,模型还需做进一步优化。
2.3.3 参数拟合
由于前面是分别研究各因素对高血压的影响度,忽略了各因素对高血压的总体影响,考虑对每个影响度赋予参数,进行参数拟合,获得更准确的模型。模型的进一步假设如下(其中ki(i=0,1,…,10)为参数)I′=k0+k1IA+k2IG+k3IBMI+ k4IS+k5ID+k6IE+k7ISa+k8ISp+k9IDa+k10IDp。
舍去不齐全数据,得到338组数据,对其进行参数拟合。首先定义各组数据的综合影响度I′的取值,不妨以当今中国对血压水平的定义为标准,取各血压水平的均值收缩压和均值舒张压之和作为代表。我们分别取200(120/80mmHg)、245(150/95mmHg)、275(170/105mmHg)、290(180/110mmHg)作为未患高血压者、Ⅰ级高血压患者、Ⅱ级高血压患者、Ⅲ级高血压患者的综合影响度I′。
参数拟合结果为:
k0=165.8040,k1=23.3534,k2=15.3371,k3=5.9726,k4=-27.1264,k5=113.7696,k6=126.4597,k7=0.6171,k8=0.0844,k9=1.5475,k10=-0.9694。
因此,我们模型改进为(若有多组上下午血压值,取平均值代入):
I′=165.8040+23.3534×IA+15.3371×IG+5.9726×IBMI-27.1264×IS+113.7696×ID+126.4597×IE+0.6171×ISa+0.0844×ISp+1.5475×IDa-0.9694×IDp
其中,IA,IG,IBMI,IS,ID,IE,ISa,ISp,IDa,IDp定义如前。
将这338组数据代回模型,得到分布图如图7。
由于这338组数据中未患高血压的病人占比例较大,我们看到拟合的结果对于未患高血压者来说有所误差,实际上这蕴含着他们可能有高血压的风险或者他们的血压值等数据受到其他病因的影响。我们暂且忽略这点,因为我们面向的对象是普通用户,此模型已基本能预测用户的高血压情况。
最终此模型可以模拟中国对血压水平的定义给出对高血压的预测,如表3。
2.3.4 模型完善
考虑到现有研究成果中提到的另一些影响高血压的因素,如腰围WC、血糖GLU、血脂L(lipid)[6]、睡眠时间ST(sleeping time)[7]、气温T(temperature)、湿度H(humidity)[8]。根据前人的研究数据建立这几个因素对高血压的影响度如下:
IWC=0.22×(WC-90×G+85(G-1)),IGLU= 0.384×GLU×(0.402×G-0.31×(G-1)),IL= 1.92×L,IST=0.22×ST,IT=-0.2375×T,IH=0.2950×T
以上这些影响度可与上述综合影响度I′相结合,形成更加完善的血压分析体制。
对于用户提供的不完整数据,我们可以采用根据用户状态取相应平均值的方法进行计算,确定综合影响度,给予用户的有关高血压的预诊断。
2.3.5 模型补充
虽然我们的重点在于创造血压分析机制在线上预诊断中使用,但是所收集数据给我们另一启发,我们可以加入两种简单的、特殊的预诊断结果。
(1)低血压:近段时间内血压多次低于90/60mmHg,预诊断为(可疑)低血压,建议向医生咨询/医院检查。
(2)白大衣性高血压:偶尔血压高于140/90mmHg且见到医生时情况显著,预诊断为(可疑)白大衣性高血压,建议放松心情重新测量血压。
对于一些影响高血压的定性因素,如A型性格(脾氣较暴躁等),可以在小程序建议模块有所体现。
3 智能医患平台
3.1 项目成效目标
开发一个基于数学模型的管理高血压的医患一体化微信小程序,其主要功能如下:
3.1.1 血压数据分析功能
根据我们通过数学建模创建的血压分析机制,小程序会对与患者病情相关的各种指标进行分析,将血压数据可视化,给予用户切实的血压健康分析。
3.1.2 医患联系功能
在小程序中,用户可以向医生咨询自身的高血压病情,医生会结合该用户数据的历史记录以及用户的身体情况给出建议。一名医生可对应多名患者,为患者提供更加个性化的建议,简化了患者看病方式。同时,小程序会记录患者的评价等,作为线上工作评价的一种参考。
3.1.3 患者联系人联系功能
联系人功能可以让用户的联系人(如:家人)及时地了解到用户的身体状况,并在有异常情况发生时发送消息提示联系人。比如,当患者被诊断为高血压时,系统将会自动为设定联系人发提示信息。这一功能的实现旨在让监护人能够更好地照顾高血压患者或者潜在患者。
3.1.4 生活建议等功能
根据用户的多次血压数据、饮食习惯、既往病史等等,为用户量身推送一些生活建议和一些与高血压相关的知识,如:健康的饮食、生活习惯等。
3.1.5 利用Python语言设计后端,进行大数据处理
用MySQL构建一个关系型数据库,并利用此数据库组织和管理数据;建立医生与患者之间,患者与设定联系人之间数据、消息传输的通道;实现上述前端所涉及的功能。
3.2 项目运行实例
基于上述血压分析机制,我们将开发一个管理高血压的医患一体化微信小程序,如图8、图9。
具体运行如下:
用户输入:年龄、性别、身高、体重、吸烟史、饮酒史、是否有心脑血管疾病家族史、(可能多組)上午和下午的血压值、其他(可选的输入数据:腰围、血糖、血脂、睡眠时间);
输出:高血压预诊断结果。
例子:
输入:70岁,男,170cm,80kg,吸烟,嗜酒,无家族史,上午血压值160/110mmHg,下午血压值156/100mmHg。输出:预诊断为Ⅲ级高血压。(可见,如果仅依据高血压的定义,该用户应为Ⅱ级高血压,但该血压分析机制考虑了年龄、BMI等因素对高血压的影响,因此诊断结果会有所不同,而我们的结果更能引起用户对病情的警惕。)
4 结 语
高血压是心血管疾病和死亡的重要诱因。诊室外血压诊断地位的提高以及现有管理高血压APP和小程序的不足启发我们开发具有智能血压分析、医患联系、联系人、生活建议等新功能的小程序。其中小程序所依据的血压分析机制是结合定量和定性两方面通过数学建模所创立的。然而,血压分析机制的创建是基于前人研究以及所收集的数据,仍有不足之处。一方面,前人研究结果具有地域差异;另一方面,模型创新之处所用数据有限。但是,我们的结果仍有一定的可用性。
参考文献:
[1] NCD Risk Factor Collaboration (NCD-RisC).Worldwide trendsin blood pressure from 1975 to 2015:a pooled analysis of 1479 population-bas based measurement studies with 19.1 million participants. Lancet,2017,389(10064):37-55.
[2] Williams B, Mancia G, Spiering W, et al. 2018 ESC/ESH Guidelines for the management of arterial hypertension:The Task Force for the management of arterial hypertension of the European Society of Cardiology (ESC) and the European Society of Hypertension (ESH).Eur Heart J,2018,39(33):3021-3104.
[3] 孙静,黄玉艳,吴雷,等.糖尿病人群高血压的发病率及影响因素 [J].中华高血压杂志,2013,21(7):654-658.
[4] 贾贡献,余金明,林凡礼,等.高血压患者吸烟状况与心血管危险分层的关系 [J].中华高血压杂志,2013,21(4):340-345.
[5] 刘丹,陈艺莉,黄慧玲.老年高血压患者血压变异性及血压晨峰的相关因素 [J].中华高血压杂志,2013,21(4):335-339.
[6] 陶然,周金意,苏健,等.成人血脂异常与高血压关系 [J].江苏预防医学,2014,25(5):18-21.
[7] 郭潇繁,张晓宇,王军,等.睡眠时间与高血压关系的荟萃分析 [J].中华高血压杂志,2013,21(9):748-754.
[8] 白红革,舒云,艾帅兵.不同天气条件对血压水平的影响研究 [J].中西医结合心血管病电子杂志,2018,6(19):99-100.
作者简介:陈炜欣(1998.10-),女,汉族,广东吴川人,本科,研究方向:信息与计算科学;吴怡婷(1998.12-),女,汉族,广东翁源人,本科,研究方向:数学与应用数学;蒋安琪(1997.04-),女,汉族,广西玉林人,本科,研究方向:信息与计算科学;宋之潇(1998.07-),女,汉族,四川内江人,本科,研究方向:临床医学。