基于临床大数据分析探讨成人社区获得性肺炎与气象因素的相关性
2018-07-25黄晶一颜仕星
黄晶一,朱 威,颜仕星,周 红
(1. 广州中医药大学第二临床医学院,广州 510405; 2. 同济大学电子与信息工程学院,上海 200092)
社区获得性肺炎(community-acquired pneu-monia CAP)是指过去14 d内未曾入院或未在长期护理机构居住的患者在社区环境中感染微生物而发生的肺炎。临床表现为发热、咳嗽、咳痰以及胸片检查中肺部有新的渗出。在美国和英国,每年成人社区获得性肺炎患病率估计为5‰~11‰[1],2012年我国肺炎病死率高达17.46/10万[2]。肺炎患者中有1.1‰~4‰需住院治疗,其中10%~15%的病人需ICU监护治疗,造成医疗资源极大的消耗。在中医学理论中,整体观念及运气学说阐述了疾病与四时气候相适应的变化规律。但整体观念和运气学说的实际应用价值及现代科学阐述尚不明确,气象因素与疾病的关系很可能是整体观念和运气学说的表现形式之一[3]。因此,通过数据挖掘建模的方式科学阐明社区获得性肺炎中医证型与气象因素的关系,从而科学地证明整体观念及运气学说的价值,并为疾病预测提供另一种方法。
1 资料与方法
1.1 病例数据来源
选取2009年1月至2013年12月广东省中医院就诊并符合社区获得性肺炎诊断的门诊和住院病人病历,病历内容包括主诉、现病史、既往史、实验室及影像学检查、中医诊断、西医诊断、处方,检索广东省中医院电子病历系统数据库。气象数据来源2009年1月至2013年12月中国地面国际交换站(广州)气候资料日值数据集,气象数据包括20~20时降水量、大型蒸发量、极大风速、极大风速的风向、平均本站气压、平均风速、平均气温、平均水汽压、平均相对湿度、日照时数、日最低本站气压、日最低气温、日最高本站气压、日最高气温、小型蒸发量、最大风速、最大风速的风向和最小相对湿度。
1.2 数据处理
1.2.1 纳入标准 根据美国感染病学会/胸科学会2007年成人社区获得性肺炎指南[4]:发热、咳嗽、咯痰、胸片显示斑片状渗出或间质性改变;根据中医药学名词审定委员会2010版《中医药学名词规范》[5]:风热犯肺证以主要症状伴微恶风寒,或身痛、咽痛、气喘、烦渴、胸痛、舌尖红、苔薄黄、脉浮数;痰热壅肺证以主要症状伴烦渴、气喘、吐痰黄稠、胸闷、胸痛,或痰黄带血、舌红、苔黄腻、脉滑数。
1.2.2 排除标准 医院获得性肺炎、呼吸机相关性肺炎、卫生保健相关性肺炎;年龄<18周岁。
1.2.3 发病率计算 采用构成比近似计算=(某中医证型病例人数/全院同期总就诊数)×(1∶100000)。
1.2.4 气象数据处理 通过气候资料日值数据集按月份累计,得出月平均相对湿度(monthly mean relative humidity,MinRH)、月平均气温(monthly mean temperature,MT)、月平均降水量(monthly mean precipitation,MP)、月平均风速(monthly mean wind velocity,MWV)、月平均日照时数(monthly mean sunshine duration,MSD)。
1.2.5 统计学方法 采用LASSO算法构造一个惩罚函数获得一个精炼的模型,在回归系数的绝对值之和小于一个常数的约束条件下,使残差平方和最小化,从而产生某些严格等于0的回归系数,得到一个解释力较强的模型。采用均方误差(mean squared error, MSE)作为评价标准,它是衡量“平均误差”的一种较方便的方法,MSE可以评价数据的变化程度,MSE的值越小说明预测模型描述实验数据具有更好的精确度。
2 结果
2.1 广东省中医院成人社区获得性肺炎中医证型病例统计
表1显示,风热犯肺证的发病例数逐年升高,痰热壅肺证发病例数呈波动状。
表1 广东省中医院成人社区获得性肺炎中医证型病例统计
2.2 广东省中医院成人社区获得性肺炎平均每月中医证型构成比
表2显示,风热犯肺证的发生主要集中在3~6月,痰热壅肺证的发生每个月相对平均。
表2 广东省中医院成人社区获得性肺炎平均每月中医证型构成比(1∶100000)
2.3 风热犯肺证与痰热壅肺证均方误差值
表3显示,采用前8个月全部气象数据进行筛选,2个证型的MSE值均最小。
2.4 提出前8个月全部气象数据进行LASSO选择
前8个月(8—month):风热犯肺:日照时数2。痰热壅肺:日照时数2、日照时数3、日照时数5、日照时数8、平均风速3、平均气温7、平均相对湿度7、降水量8。
注:上述所列气象因素后面的数字代表的是第几个月之间的气象因素,如“日照时数2”表示上个月的日照时数,“日照时数3”表示的是上上个月的日照时数。
表3 风热犯肺证与痰热壅肺证均方误差值比较
2.5 风热犯肺证LASSO模型回归预测图
图1显示,对于风热犯肺组计算机采用前8个月的全部气象数据进行筛选得到的MSE值最小,而在前8个月的气象数据中,进一步筛选出的相关气象因素为前2个月平均日照时数(MSD2)。根据以上相关气象因素建立风热犯肺证发病构成比预测模型。
图1 风热犯肺证LASSO模型回归预测图
2.6 痰热壅肺证LASSO模型回归预测图
图2显示,对于痰热壅肺组计算机采用前8个月的全部气象数据进行筛选得到的MSE值最小,而在前8个月的气象数据中,进一步筛选出的相关气象因素有前2、3、5、8个月平均日照时数(MSD2、MSD3、MSD5、MSD8)、前3个月平均风速(MWV3)、前7个月平均气温(MT7)、前7个月平均相对湿度(MinRH7)、前8个月平均降水量(AP8)。根据以上相关气象因素建立痰热壅肺证发病的预测模型。
图2 痰热壅肺证LASSO模型回归预测图注:图1和图2中横坐标代表时间(月),纵坐标代表每月平均构成比,深色曲线均表示的是通过LASSO模型预测的预测值,而红色曲线均表示的是真实值
3 讨论
五运六气是古人对天地、时空自然运动变化规律的理解,是古人社会实践活动和领会世界的基本依据,是古代天文和历法的理论基础。同样在中医学中,运气学说是中医学基本理论的基础和渊源[6],是中医学探讨天象气候规律及其人体生理、病变、防治规律的理论,是中华民族科学智慧的体现[7],是现代中医理论缺失的一块重要版图。因此,运用五运六气才能从中医学理论的角度阐明疾病发生发展的规律。五运六气蕴涵了丰富的周期思想,是由五运的5年、10年,六气的1年、6年、12年,五运六气相合的30年以及60年大周期组成[8],因此,周期的选择包含了5年、6年、30年、60年。本文基于现有条件采用5年周期,选择了广东省中医院5年社区获得性肺炎病例,参考2009年至2013年运气发现,2009年(己丑年)太阴湿土司天,太阳寒水在泉,主气厥阴风木,客气少阳相火,阳热气甚,气候反常温暖易发生温病。2010年(庚寅年)少阳相火司天,厥阴风木在泉,主气厥阴风木,客气少阴君火,同样气候反常温暖易发生温病。2011年(辛卯年)阳明燥金司天,少阴君火在泉,主气少阴君火,客气少阳相火,阳热更甚,更易发生热病。2012年(壬辰年)太阳寒水司天,太阴湿土在泉,主气厥阴风木,客气少阳相火,少阳相火与2011年(辛卯年)的少阴君火迁移与相交,气候反常温暖易发生温病。2013年(癸巳年)厥阴风木司天,少阳相火在泉,主气太阳寒水,客气少阳相火,气候同样反常温暖易发生温病。对于风热犯肺证,2009年至2013年疾病的发生集中在3月份至6月份,春季反常的温暖造成风热犯肺证的增加。从气象数据看,过度的日照可能导致火气过剩,过剩之气过度制约肺脏。同样过度日照使燥邪化生,两者共同导致患者出现微恶风寒,或身痛、咽痛、气喘、烦渴、胸痛、舌尖红、苔薄黄、脉浮数等风热犯肺证表现,这就是“淫气病肺”。对于痰热壅肺证,2009年至2013年疾病的发生每月均较为平均。中医认为风为百病之始属阳,其性动,无孔不入,风邪为患,不单单侵入人体,其他邪气侵入人体也往往借助风邪。其余邪气也有相兼的但种类很少,只有风气、六气可以相兼相杂,因此对于痰热壅肺证出现诸多相关气象因素也就不足为奇了。首先,风速的异常变化令人腠理疏松,卫气受伤,不能正常司开阖,发挥温煦作用,为其余淫邪的兼杂打下基础。日照与气温的升高使人腠理更加开张,容易出汗,加之湿度的变化使湿邪易生,遂风邪而入,郁结在内,阻遏了气机,使得气血不能正常运行化而生痰、郁热,使人出现烦渴、气喘、吐痰黄稠、胸闷胸痛,或痰黄带血、舌红、苔黄腻、脉滑数等痰热壅肺证的表现。
从现代医学气象看,当气温出现很长一段时间的偏高或剧烈变化时,不但使细菌、病毒微生物的繁殖增加,同样也降低人体免疫力,包括对微生物的抵抗力,甚至导致环境如空气和水的污染,这些因素都会影响疾病在人群中的分布。环境湿度过高易造成
吸入空气湿度增大,造成细菌微生物滋生;人体免疫力的下降使病原微生物容易侵入机体,使人出现感染特别是对于呼吸系统的影响。此外,月平均风速越小相对湿度越大,肺炎发生率越高[9]等均有相关文献报道。本研究中笔者认为,对于风热犯肺证日照可以影响温度的变化,温度的短时间剧烈变化使人体免疫系统功能下降,导致疾病发生风险增加。对于痰热壅肺证,从模型筛选结果看是多气象因素综合的结果,从微生物的生长繁殖角度看,微生物的代谢和物质交换必须在水的参与下发生,如果没有适当的湿度环境下微生物几乎很难繁殖,更遑论感染人体。适当的湿度条件是滋生和传播病原生物的一个必要条件。频繁的降雨和低风速导致相对湿度增高,在这种潮湿的环境微生物可以大量繁殖和传播。笔者在使用lasso算法选择相关的气候因素时还发现,8个月前的气象因素也是成人社区获得性肺炎风热犯肺证与痰热壅肺证发病增多的重要因素,这意味着多个月前的气象变化可能是一个预测社区获得性肺炎风热犯肺证和痰热壅肺证发生的条件。原因可能与人体体质的改变时间及细菌微生物的繁殖和生长周期有关,但目前论证相关结论的文献仍然较少,有待进一步的研究。
自然界有生长化收藏的规律,天气当中有寒暑燥湿风的正常变化,春温夏热、秋凉冬寒,之所以有这样正常地运转,就是因为六气中有相互制约、避免过亢、避免“未至而至”“至而未至”,万事万物才能生生不息并在历史的长河中生生化化。从《黄帝内经》的“三部之气”,到张仲景的“千般疢难,不越三条”,再到陈言的“内因、外因、不内外因”,对气候、外因的研究始终是中医病因学的重要一环,而这些时刻体现出中医学整体观念的思想特点。