青海田鼠鼠疫流行情况分析与预测
2017-01-17王芳谭颖
王芳+谭颖
利用青海田鼠体蚤检测数据和青海田鼠鼠巢监测数据,对鼠害的影响因子进行因子分析化为较少因子后,利用因子得分作为自变量,分别以细菌性检验阳性率、牧犬血清阳性率为因变量建立鼠巢监测数据逐步回归模型。以细菌性检验阳性率、田鼠血清阳性率为因变量建立田鼠体蚤检测数据多元回归模型。
鼠疫流行因子分析逐步回归模型多元回归模型
青海田鼠疫源地是四川省1997年由原四川省卫生防疫站在石渠县首先发现的,2000年后被纳入国家级鼠疫监测点,2001年青海省称多县证实为青海田鼠鼠疫自然疫源地。了解和评估石渠县的鼠疫流行状况,对影响鼠疫流行的因素进行科学地评估以及对预测未来鼠疫的变化态势,对于四川省未来的鼠疫防治工作具有重要的意义。为此,根据实际需要,对石渠县2001-2013年鼠疫数据进行分析,建立数学模型。
1材料与方法
1.1材料
1.1.1数据来源
四川省石渠县青海田鼠鼠疫自然疫源地鼠疫监测数据。
1.2方法
1.2.1影响鼠疫流行因素筛选方法
利用因子分析法对青海田鼠鼠巢监测数据指标进行筛选。
1.2.1数学建模方法
采用青海田鼠鼠巢检测数据筛选出影响鼠疫流行的因子,进行因子分析后将影响化为少量的因子后,用银子得分代替影响因子作为自变量,分别用牧犬血清阳性率、细菌性检测阳性率作为因变量建立逐步回归方程;采用青海田鼠体蚤检测数据筛选出影响鼠疫流行的因子,进行因子分析后将影响化为少量的因子后,用因子得分代替影响因子作为自变量,分别用细菌性检测阳性率、田鼠血清检验阳性率作为因变量建立多元回归方程。
2模型的建立
2.1鼠巢监测数据分析
2.1.1数据标准化和指标筛选
通过查阅相关文献,结合实际应用,选取巢数、蚤指数、细钩盖蚤数、直缘双蚤指明亚种数、五侧纤蚤邻近亚种数作为影响因子。作Z标准化后进行因子分析,提取3个因子,其特征根分别为:2.231、1.487和1.139,均大于1,且这3个因子的累积方差贡献率为97.144%。因此选择这3个因子。第一个因子中系数绝对值大的主要有直缘双蚤指明亚种数、五侧纤蚤邻近亚种数,这两个指标主要反映鼠疫主要的传播媒介;第二个因子中系数绝对值大的有:细钩盖蚤数,这个指标是最重要的鼠疫传播媒介;第三个因子中系数绝对大的主要有取巢数、蚤指数,这两个指标反映的是鼠巢监测的总体信息。旋转后的3个因子之间的相关系数为0,可以明显的看出各因子之间互不相关,说明提取的四个因子是合理的、科学的。
因子分析结束后,可以将原始观测量转换成这些因子的的得分,用这些因子得分代替原来的观测量进行进行下一步的统计分析。
2.1.2牧犬血清阳性率逐步回归模型
用因子分析筛选出来的3个因子作为自变量,牧犬血清检测阳性率作为因变量,数据集中观测值在这3个因子上的得分作为数据输入,并采用F检验,以确保每次引入新的变量之前回归方程中只包含显著的变量,建立逐步回归分析模型。其R为0.702,R方为0.492,调整R方为0.446。模型的F值为10.668,P值为0.008。模型变量系数分别为:方程的常量为0.069,第一个因子的系数为0.045,常量的t值为5.161,第一个因子的t值为3.266.
逐步回归分析法排除了第二个因子和第三个因子,说明牧犬血清阳性率与第一个因子有关。根据上文中对因子分析结果的解释,第一个因子与直缘双蚤指明亚种数、五侧纤蚤邻近亚种数这两个指标有关。因此,牧犬血清阳性率主要与直缘双蚤指明亚种数、五侧纤蚤邻近亚种数这两个指标相关。
2.1.3细菌性检测阳性率逐步回归模型
用因子分析筛选出来的3个因子作为自变量,青海田鼠细菌性检测阳性率作为因变量,建立逐步回归分析模型。其R为0.616,R方为0.380,调整R方为0.324。模型的F值为6.739,P值为0.025。模型变量系数分别为:方程的常量为0.007,第一个因子的系数为0.003,常量的t值为6.069,第一个因子的t值为2.596。
逐步回归分析法排除了第二个因子和第三个因子,说明牧犬血清阳性率与第一个因子有关。根据上文中对因子分析结果的解释,第一个因子与直缘双蚤指明亚种数、五侧纤蚤邻近亚种数这两个指标有关。因此,青海田鼠细菌检验阳性率主要与直缘双蚤指明亚种数、五侧纤蚤邻近亚种数这两个指标相关。
2.2青海田鼠体蚤数据分析
2.2.1数据指标筛选
通过查阅相关文献可知,影响鼠害流行的主要因素有:主要宿主和主要传播媒介。青海田鼠鼠疫自然疫源地鼠疫的主要宿主为青海田鼠,主要传播蚤类为细钩盖蚤和直缘双蚤指明亚种。因此选取捕鼠数、鼠密度、染蚤率、蚤指数、直缘双蚤指明亚种数、细钩盖蚤数为影响因子。作Z标准化后进行因子分析,得到2个因子,其特征根分别为:2.741和2.594,均大于1,且这3个因子的累积方差贡献率为88.92%。因此选择这2个因子。
查看各成份在2个因子载荷矩阵可知:第一个因子中系数绝对值大的主要有鼠密度、染蚤率、蚤指数,第二个因子中系数绝对值大的有:捕鼠数、直缘双蚤指明亚种数、细钩盖蚤数。旋转后的2个因子之间的相关系数为0,可以明显的看出各因子之间互不相关,说明提取的四个因子是合理的、科学的。
2.2.2青海田鼠体蚤染蚤率和蚤指数相关性分析
青海田鼠体蚤染蚤率和蚤指数变化情况如图1所示:
图1青海田鼠体蚤染蚤率和蚤指数变化图
用典型相关分析法分析这两个变量的相关性,变量染蚤率和蚤指数的相关系数为0.799,说明两个变量显著相关。
2.2.3细菌性检验阳性率多元回归模型
用因子分析筛选出来的2个因子作为自变量,细菌性检验阳性率作为因变量,细菌学检验阳性率作为因变量,青海田鼠体蚤观测值作为数据输入,并采用F检验,建立多元回归分析模型。其R为0.588,R方为0.345,调整R方为0.214。模型的F值为2.638,P值为0.120 .模型变量系数分别为:方程的常量为5.632,第一个因子的系数为-0.387,t值为-1.514,第二个因子的系数为-0.442,t值为-1.728.
2.2.4血清学检验阳性率多元回归模型
用因子分析筛选出来的2个因子作为自变量,血清学检验阳性率作为因变量,细菌学检验阳性率作为因变量,青海田鼠体蚤观测值作为数据输入,并采用F检验,建立多元回归分析模型。其R为0.748,R方为0.560,调整R方为0.472.模型的F值为6.359,P值为0.017。模型变量系数分别为:方程的常量为4.565,第一个因子的系数为-0.238,t值为-1.136,第二个因子的系数为0.709,t值为0.007。
3总结
本文分别对青海田鼠体蚤监测数据和青海田鼠鼠巢检测数据进行多元统计分析,并得出相应的回归模型,对青海田鼠鼠疫疫情的监测和预测有重要的知道作用。参考文献:
[1]黄建忠,邓祖军.2000-2003年四川省石渠县鼠疫自然疫源地初探[J].预防医学情报杂志,2015,31(1):26-32.
[2]汪立茂,宋晓玉,李光清等.2000-2004四川省青海田鼠鼠疫流行特点分析[J].预防医学情报杂志,2006,22(2):146-149.
[3]刘振才,周晓磊,张博宇等.动物鼠疫预测模型及预警指标的建立[J].中国地方病防治杂志,2015,30(1):1-3.
[4]刘振才,海荣,李富忠等.青藏高原青海田鼠鼠疫自然疫源地的发现与研究[J].中国地方病防治杂志,2001,16(1):321-327.
[5]祁腾,杨孔,汪立茂等.石渠县2001-2013年鼠疫疫源地流行病学分析[J].中国人兽共患病学报,2015,31(5):485-488.
[6]张立军,任英华.多元统计分析实验[M].北京:中国统计出版社,2009.122-141.
[7]何晓群,刘文卿.应用回归分析[M].北京:中国人民大学出版社,2011.56-77.
[8]汪立茂,李光清,许光荣.青海田鼠鼠疫流行特点分析[J].中国地方病防治杂志,2004,19(3):178-181.
[9]杨俊平.沙鼠鼠疫预测的数学模型[J].内蒙古科技与经济,2001(1):68.
[10]李仲来,周方孝等.达乌尔黄鼠鼠疫预测预报的数学模型(Ⅶ)[J].中国地方病防治杂志,200217(3): 129-131.
基金项目:中央高校基本科研业务费专项资金项目,优秀学生培养工程项目,项目编号:2016ZYXS16。