基于数据分析的环境与脑卒中疾病关系研究
2023-12-19王轶中邵勇
王轶中 邵勇
1. 香港城市大学商学院 香港 999077;
2. 西北大学数学学院 陕西 西安 710127
引言
脑卒中(俗称脑中风)是威胁人类生命的严重疾病之一,它发病率高、死亡率高、致残率高。脑卒中的发生是一个漫长的过程,一旦得病很难逆转,积极预防脑卒中的发生,对提高人们的生活质量、减轻家庭和社会的负担有着非常重要的现实意义。
预防脑卒中,找出诱发这种疾病的诱因是关键。脑卒中的诱发与多种因素有关,包括年龄、性别、职业、环境、气候等。本文主要探究环境与脑卒中发病的关系,同时,通过数据模型的建立,为掌握疾病发病率规律提供理论依据。研究结果对有效预防脑卒中和卫生行政部门、医疗机构合理调配医疗资源等具有实际的指导意义。
1 理论分析
1.1 总体思路
本文将大量数据进行分析和可视化处理,利用回归分析法,用理论依据支撑脑卒中各诱因之间的关系。通过分析中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息,依据病人的性别、年龄、职业得出高危的发病人群并且进行相关数据统计,分析此3项因素与发病率的关系[1]。此外,鉴于气候因素的变化是脑卒中发生或病变的一个重要因子,利用回归分析法研究脑卒中的发病率与气温、气压、相对湿度之间的关系。在研究的基础上得到高危人群的特征和关键指标,进而给出脑卒中的预防建议方案。
1.2 基本信息统计分析
原始数据为2007-2010年间的数万份脑卒中患者数据,以及2010年各个月份气温、气压、湿度的最大、最小和平均值[2]。对这些数据进行可视化,分别从性别、职业、年龄和气温、气压、湿度的不同角度整合数据并分析,得出脑卒中与其的大致关系。
1.3 回归分析
建立多元线性回归方程,在发病人数与月平均气压、月平均气温、月平均相对湿度三者间建立相关性关系,得到矩阵。利用最小二乘法估计回归方程中的参数,最终得到多元线性回归方程(精度为小数点后四位)。
2 脑卒中患者基本信息统计研究
为了验证脑卒中与不同职业、年龄段、性别等的影响,首先对原始数据进行可视化处理,得到相关因素对脑卒中的影响程度。
2.1 性别影响
如图1,对数据进行可视化处理后得到脑卒中患者男女比例的饼图,其中女性占比约为46.2%,男性占比约为53.8%。
图1 性别统计饼图
由此可判断,性别对脑卒中的发病有一定的影响,这可能与性激素有关,经查阅资料,血液中雌激素水平对脑卒中的发生起着重要作用。雌性激素可提高高密度脂蛋白,降低血液中低密度脂蛋白,从而延缓动脉粥样硬化病变的发生和发展速度。此外,男性的平均吸烟率和饮酒率高于女性,男性所承受的家庭和社会压力也较高。
2.2 职业影响
如图2,得到六万多名脑卒中患者的八种职业与未知职业的百分比分布。患者中,占比最高的是农民47.99%,其次是退休人员10.73%和工人7.83%,占比均不到0.5%的是教师、渔民、医生以及占比不到3%的渔民和离退人员。农民主要以户外重体力劳动为主,经济收入较低,发病率较高。而教师、医务人员、职工这类人群主要以轻体力为主,经济收入较稳定,生活压力较小,发病率较低。由此可分析出,脑卒中发病的概率与从事的职业有着密切的关联,多发作于高龄人士,且与工作环境及经济实力有一定的关系,工作环境差、经济实力不足的人群脑卒中发病率较高。
图2 职业统计饼图
2.3 年龄影响
如图3和4,可直观地看出患者集中在50-90岁之间,51-60岁占约14%,61-70岁占约24%,71-80岁占约35%,81-90岁占约18%,40岁以下患病的概率非常小。对比图2退休人员的高患病率,71岁以上的超过一半的患病占比也相符合。可以明显看出,随着年龄的增加,脑卒中发病的概率也会随之升高。主要原因一方面随着人们年龄的增长运动量会减少,另一方面物质生活的提高,容易导致中老年人普遍患有高血压、高血脂、糖尿病等疾病,而三高疾病正是引发中老年脑卒中的一个重要因素。
图3 年龄分布柱状图
图4 年龄分布饼图
3 脑卒中发病率与气温、气压、相对湿度间的关系研究
3.1 基本关系
3.1.1 脑卒中与气温的关系。图5是六万多名患者的月发病人数与月平均气温的折线图。分析脑卒中发病人数随日期的变化,发现1月发病率最高,此时也是全年最为寒冷的时期,可以推断隆冬时节对脑卒中的发病有较大的影响[3]。在经过了1月的高峰期后,2至6月的发病人数呈现稳定且缓慢上升后下降的趋势,此时正值春季,气温较为平和。经过6月的人数最低点后,发病人数随着夏季的到来又开始逐渐上升,并且没有下降的趋势,可见夏季为脑卒中发病的次高峰期。中国大部分地区的秋季时间较短且没有明显的特征,主要为夏冬的换季状态,而数据展现出的9、10月左右没有出现与春季类似的发病人数稳定或下降的情况也与这一情况相符合[4]。自6月开始发病人数逐月递增,一直到12月达到又一新高,再次证实寒冷天气对脑卒中患者的不利。
图5 脑卒中发病率与气温的关系
3.1.2 脑卒中与气压的关系。图6是六万多名患者的月发病人数与月平均气压的折线图。可看出全年的平均气压呈现出夏季低冬季高的趋势,虽然发病患者的数量在全年没有明显的波动,但隐约呈现出夏季少于冬季的现象,由此可大致判断脑卒中的发病概率与气压及变压呈正相关。
图6 脑卒中发病率与气压的关系
3.1.3 脑卒中与湿度的关系。图7是六万多名患者的月发病人数与月平均湿度百分比的折线图。可看出全年的平均湿度百分比呈现出与发病人数类似的变化形态,全年没有过于明显的变动,但与发病人数呈反方向变动[5]。由此可以大致判断脑卒中发病概率与平均湿度百分比呈负相关,但1月的湿度百分比高于12月,同时1月的发病人数也高于12月,因此不能直接说明二者有绝对的线性关系。平均湿度百分比的高点为6月,低点为1月和12月,这是发病人数开始反弹上升的时间点以及人数较多的时间点,由此可以判断相对湿度过高或过低均对脑卒中疾病有一定的影响。
图7 脑卒中发病率与湿度的关系
3.2 脑卒中发病率与气温、气压、相对湿度间的精确关系
3.2.1 建立关系。利用回归分析法研究脑卒中发病率与气温、气压、相对湿度间的关系。根据已经统计得出的每月发病人数与气温、气压、相对湿度的数据,利用发病人数与气温、气压、相对湿度间三者间的相关性建立关系,得到:
记:
由此得到 的无偏估计:
3.2.3 回归方程。回归系数为:
因此,有回归方程:
4 结论
4.1 脑卒中患者主要特征[6]
①脑卒中患者中男性多于女性。原因是男女在社会的整体分工不同,男性抽烟喝酒多于女性,男女的生理构造不同。②脑卒中患者主要为高工作强度、工作环境恶劣、低收入的人群。低收入人群也难以保证足够的经济支撑预防和治疗脑卒中。③脑卒中患者主要为50岁以上的人群,尤其是70岁以上人群患病概率大大增加。随着年龄的增加,人体的机能不断退化,70岁以上的高龄人群普遍患有高血压、高血脂、糖尿病等疾病,患脑卒中的概率更是大大增加。
4.2 脑卒中发病与气压、气温和相对湿度的关系
气压、气温和相对湿度都是脑卒中疾病的重要影响因素,三者的高低与患病概率整体均呈反比关系。
回归方程如下:
依据回归方程,可得到结论:气温对脑卒中发病率的影响最大,其次是气压,相对湿度对发病率影响最小[7]。冬季气温低、湿度低、气压高,脑卒中的发病较高;夏季气温高、湿度高、气压低,脑卒中也易发病;春秋季温差过大时也应注意防范。
5 预防脑卒中的建议方案
基于脑卒中患者男女比例的研究,男性需比女性更加关注脑卒中疾病,应控制吸烟和饮酒量,且年龄越大越应注意。
基于脑卒中患者职业分布比例的研究,低收入以及高劳动强度人群更应积极预防脑卒中疾病,尽量减少长时间高强度工作可有效预防。
基于脑卒中患者年龄分布比例的研究,50岁以上人群应注意脑卒中疾病,尤其是70岁以上的高龄人群。中年人平日应注意休息,控制工作强度,高龄人群可进行适度锻炼,中高龄人群每年应例行体检,同时保持饮食健康和情绪稳定。
基于脑卒中发病率与气温、气压、相对湿度间关系的研究,天气因素人为难以控制,但可以根据不同的气候选择不同的应对方案。
①对个人而言,做好预防。夏季,注意防暑降温,适当使用空调,尽量避免长时间连续工作,将工作划分为小部分,使身体有较高频率的休息。冬季,天气寒冷注意保暖,多食用暖胃的食物,尽量减少长时间的外出。②对医疗机构而言,做好应对。在发病率较高的冬季和夏季,保证充足的医疗资源,为及时救助脑卒中患者做好充分的准备。
6 结束语
随着高科技的不断发展,现代的医学数据分析正由定性分析向定量分析转变,这需要有效探索医学科学领域中各种相关量与量关系的规律。数学方法的运用可将医学从依赖经验的束缚中解放出来,使医学分析不断向着定量、精确、可预测、可防控等方向发展。本研究所运用的数据可视化、线性回归分析等数学方法,正是通过医学定量分析解决疾病规律并为其提供建议方案的有力工具。希望能更多地运用数学方法来为医学分析提供有效的理论支撑,使医学分析更为精准科学,为现代医学的发展提供更为广泛的帮助。