我国戊型肝炎发病例数的时间序列分析*
2012-12-04复旦大学公共卫生学院教育部公共卫生安全重点实验室200032
复旦大学公共卫生学院 教育部公共卫生安全重点实验室(200032)
魏 珊 陆一涵 高眉扬 卫国荣 姜庆五 赵耐青△ 郑英杰△
戊型肝炎(戊肝)病毒是近年发现的新型病毒,目前在全球各地广泛传播,尤其是在发展中国家〔1〕。据卫生部全国法定传染病疫情报告,戊肝作为我国乙类法定报告传染病,近年来其发病率在我国逐年上升。戊肝发病的时间分布是戊肝流行病学特征中重要的一个方面,如能较好地分析戊肝发病与时间的关系,可加深对戊肝的病原学和生态学认识,为研究其传播机制和危险因素提供线索,完善预警机制,进而提高预防、控制效果。目前有关戊肝的时间分布的研究很少,并且为数不多的研究存在结论不一致的情况,例如在关于戊肝的发病季节性的研究中,不同研究得出的有无季节性的结论不同;即使在发现有季节性的研究中,发病高峰期的结论也不完全相同,春夏秋冬四个季节均有涉及〔2-6〕。为了更好的了解戊肝的时间分布特征,为戊肝的防治工作提供参考依据,本文选取2005~2010年全国戊肝发病数据,综合借鉴时间序列分解法和圆形分布法对戊肝的发病趋势和季节性特征进行了研究分析。结果报告如下:
资料与方法
1.资料来源
本文选取全国传染病网络直报系统报告的2005~2010年全国戊肝发病数据,具体数据资料来源于国家卫生部网站 http://www.moh.gov.cn 2005 年1 月至2010年12月每月报告的全国戊型肝炎病例数。
2.方法
(1)数据准备:
时间变量ti(i=1,2,…,72)以月份为单位,依次为2005年1月至2010年12月的72个月份。按时间变量ti依次统计全国戊肝每月原始病例数Ni。
为去除由于各月份天数不同以及人口自然增长可能引起的偏倚,本文在分析前根据各月份天数和人口月自然增长率对原始数据进行校正。我国2000~2010年期间年平均人口自然增长率为0.57%〔7〕,求得月平均人口自然增长率P=0.46%。校正公式为:Xi。其中,Xi为校正后月观察病例数,Ni为原始月观察病例数,di为第ti月天数。
时间序列一般包括长期趋势因素(T)、季节性变动因素(S)、循环性变动因素(C)和随机性变动因素(R)四部分,首先采用时间序列分解乘法模型,将本研究中的数据资料进行分解〔8〕。
① 对校正后的病例数(Xi)做散点图(图1),观察其变化情况,以N=12(月)为一个周期。
②计算12个月的移动平均数(MAi)。
通过计算移动平均数,随机性变动因素和季节性变动因素的正负波动在一定程度上相互抵消,所以MAi只包括长期趋势因素和循环性变动因素两部分(T×C)。
③ 计算 SRi。
SRi=Xi/MAi=(T×S×C×R)/(T×C)=S×R,因此SRi只包括季节性变动因素和随机性变动因素两部分(S×R)。
④计算季节性变动因素S。
控制变量:由于上市公司资产规模、利润率等不同,其税负和盈利能力会有所不同,为了避免上市公司个体异质性给“营改增”对企业影响的评估造成干扰,引入包括营业毛利润率、资产负债率、企业规模三个控制变量。
计算各年同一月份的SRi的平均值S,去除随机性变动因素的影响,得到的平均数只包括季节性变动因素。
⑤计算长期趋势因素T,拟合趋势方程。
对MAi曲线进行拟合,选择最佳拟合曲线类型,用最小二乘法求得最佳拟合参数,拟合到的曲线方程即为长期趋势因素T。
⑥计算模拟发病数,与实际观察值进行比较,并计算相对误差;绘制模拟发病曲线,与实际观察曲线进行比较。
随机性一般无法直接进行估计,循环性变动因素比较复杂且变动周期较长,在短期估计中也可以忽略不计。因此模拟发病数由长期趋势因素和季节性变动因素共同决定,即 ^Xi=T×S,与校正后的月观察病例数Xi进行比较;考虑人口自然增长率,对模拟值进行调整(乘以(1+0.46%)ti)后与原始月观察病例数Ni进行比较。如模拟效果良好,可进行下一步的分析。
采用圆形分布法的原理,对分解出来的季节性变动因素S进行分析:
①1年以365天计算,相当于圆周360°,则一天为0.9863°。由于在分析开始前对原始病例数进行了校正,每月换算为365/12天,以元旦零时为0,则一月的月中位数为15.2083,转化为月中位角α为0.9863°×15.2083=15.0°,余类推。
②根据圆形分布公式计算平均角α及角标准差s。计算公式如下:
其中,S为各月份季节性变动因素,n为各月份季节性变动因素之和,r为集中趋势,s为角标准差。r的检验采用均匀性检验,以P<0.05为统计学显著。
结果分析
本研究共纳入原始病例119158例,根据各月份天数和人口自然增长率校正后为100414.7例。
图1中右图“校正模拟值”为长期趋势因素T和季节性变动因素S共同模拟的月发病情况,与“校正后月观察病例数Xi”进行比较;左图“原始模拟值”为根据月平均人口自然增长率对“校正模拟值”进行调整后的数值,与“原始月观察病例数Ni”进行比较。由图1可知,模拟值与观察值拟合程度良好,平均相对误差为。说明此分解法科学可行,较符合真实情况。
由图1(a,b)两图对比发现,在去除人口自然增长率带来的影响后,原始观察值的上升趋势变的不明显。曲线“移动平均数MAi”(图2)拟最佳模型为 Tt=0.012t3-1.386t2+46.82t+969.0(R2=0.884),此即全国戊肝发病的长期趋势T。2005到2010年期间,全国戊肝病例数呈缓慢上升后下降再上升的趋势,六年间月病例数大约上升T72-T1=625例。
图1 2005~2010年全国戊肝观察值与模拟值比较
图2 2005~2010年全国戊肝季节性变动因素、移动平均数及其趋势拟合
由图2中“季节变动因素S”曲线观察到戊肝发病在一个周期内(N=12月)呈单峰型,3月份到达高峰,10月份到达低谷。对“季节性变动因素S”采用圆形分布法进行分析的中间结果见表1。经计算,X=-0.0072,Y= -0.1846,r=0.1847。对 r值进行均匀性检验,查圆形分布界值表〔9〕,P <0.01,具有统计学意义,说明戊肝发病具有季节性集中趋势,进而推算其发病的高峰时点和高峰期,结果见表2。
表1 2005~2010年全国戊肝季节性变动因素S的圆形分布分析过程
表2 2005~2010年全国戊肝季节性变动因素S的圆形分布分析结果
讨 论
本研究发现,2005~2010年期间全国戊肝发病数据经人口自然增长率调整后发现上升趋势不太明显,呈缓慢上升后略下降再上升的趋势。由于对戊肝病毒缺乏特异性消杀措施,对戊肝感染者缺少有效治疗药物,对易感者缺少有效疫苗预防等,所以这一趋势比较客观的反映了戊肝在我国的自然传播情况,根据长期趋势拟合曲线也可以推测戊肝病例数在短期内会继续缓慢上升。
近些年来,由于甲肝、乙肝等计划免疫工作的有效开展,我国甲乙肝发病率呈下降趋势,这使得戊肝逐渐成为病毒性肝炎中对人群危害较大的病种,对戊肝的流行病学、病原学等特征的认识亟待加深,其时间分布特征可以为戊肝的防治工作提供重要参考依据。然而如前所述,目前对于戊肝时间特征分布的研究比较少且结论不一致,例如,姜梅等认为戊肝发病具有季节性并且在冬春季高发〔2〕,Saeedi MI认为戊肝在夏末冬初高发〔3〕,Shrestha SM 等发现戊肝发病高发期在8月份的雨季〔4〕,Zhuang H 则认为戊肝在秋季高发〔5〕,同时也有些研究未发现戊肝的季节性〔6〕。
而在本研究中,我们发现在2005~2010年期间我国戊肝发病具有季节性,以一年为一个周期,每个周期内发病呈单峰分布,在冬春季高发,尤其是3、4月份,其他季节散发,这与上述姜梅等人的研究结论是相同的,与其他人的结论不同。之所以得出不同结论的原因可能包括:研究数据来自不同地区,影响戊肝发病的因素可能有所差异;可以感染人的戊肝基因型有4种,不同基因型的主要传播途径不同,各项研究中戊肝的基因型可能不同;收集、处理数据的准确性不同;研究方法不同等。
为了保证数据收集、处理的准确性和可靠性,本文采取了以下措施:首先数据全部来自2004年开始运行的全国传染病网络直报系统,数据能较全面完整的反映全国戊肝发病情况。同时为防止直报试运行第一年的数据存在不完善之处,本文自2005年开始选取数据;其次,为去除由于各月份天数不同以及人口自然增长可能引起的偏倚,本文在分析前根据各月份天数和月平均人口自然增长率对各月份病例数进行了调整,由结果中图1左右两图的比较可知,如果不根据人口自然增长率进行调整会带来较大偏倚。而在其他相似的研究中,鲜有对数据进行调整者;最后,对时间序列进行分解后,利用季节性变动因素和长期趋势因素模拟发病情况,与真实发病情况进行比较,如发现模拟良好,则说明此分解法较科学的反映了真实情况。
同时,在研究方法上,本文分别借鉴时间序列分解法和圆形分布法的原理并将两者进行综合,对戊肝的季节性分布进行了分析。时间序列分解法一般被用来进行时间序列的描述性研究、回归分析和预测分析〔9-10〕,从一个时间序列里可以分解出季节性变动因素,可以描述疾病的季节性,但是缺少证明其具有显著性意义的统计指标;圆形分布法是通过观察原始病例数的圆形分布情况来分析原始病例数的集中趋势、发病高峰和高峰期,并且可以通过对集中趋势r进行均匀性检验来判断集中趋势是否具有统计学意义〔11〕,但是原始病例数不仅包括了季节性变动因素,还包括了长期趋势、循环性、随机性等非季节性变动因素,如果不加剔除地直接使用原始病例数会导致误差。因此,本文综合了两种方法的优点对戊肝的季节性进行探讨:首先将季节性变动因素S从时间序列中分解出来(S即相当于传统圆形分布法中的病例数),排除其他非季节性因素的干扰,去除季节指数的趋势性变动,再运用圆形分布法分析S的集中趋势、发病高峰时点及高峰期,并且应用明确的指标来判断集中趋势是否有统计学意义,增加结果的准确性。
本文认为我国戊肝于春季高发的可能原因有如下几点:(1)春节期间人们聚餐、在外就餐增多,易感人群接触被污染食物中戊肝病毒的机会增加。(2)春暖花开之时人们交往活动增加、人员交流频繁,有利于戊肝病毒在传染源与易感人群之间的传播。(3)春季气温回暖,该阶段气温可能利于传染源内戊肝病毒的激活、繁殖、生存和传播。但是由于戊肝的传染源广泛存在〔12〕,所以对于影响其发病的因素尚需进一步的研究。
综上,根据戊肝的发病趋势和发病季节性,结合戊肝的潜伏期2~9周,提醒应于冬季12月份开始开展戊肝的防治工作,采取针对性的预防、监测措施,以降低戊肝的发病率。
1.Kuniholm MH,Purcell RH,McQuillan GM,et al.Epidemiology of hepatitis E virus in the United States:results from the Third National Health and Nutrition Examination Survey,1988-1994.J Infect Dis,2009,200(1):48-56.
2.姜梅,崔伟红,李波,等.烟台市戊型肝炎流行特征及危险因素分析.中华流行病学杂志,2010,31(12):1417-1420.
3.Saeedi MI,Mahmood K,Amanullah,et al.Frequency and clinical course of hepatitis E in tertiary care hospitals.J Coll Physicians Surg Pak,2004,14(9):527-529.
4.Shrestha SM,Shrestha S,Tsuda F,et al.Molecular investigation of hepatitis E virus infection in patients with acute hepatitis in Kathmandu,Nepal.J Med Virol,2003,69(2):207-214.
5.Zhuang H,Cao XY,Liu CB,et al.Epidemiology of hepatitis E in China.Gastroenterol Jpn,1991,26(3):135-138.
6.Mansuy JM,Abravanel F,Miedouge M,et al.Acute hepatitis E in south-west France over a 5-year period.J Clin Virol,2009,44(1):74-77.
7.Peng X.China's demographic history and future challenges.Science,2011,333(6042):581-587.
8.Vose D.Risk analysis:a quantitative guide.America:John Wiley and Sons,2008:325-327.
9.崔树峰,马建新,李书明.时间序列分解法在北京市朝阳区细菌性痢疾周报告发病率预测中的应用.中国卫生统计,2009,26(6):583-585,591.
10.Zeger SL,Irizarry R,Peng RD.On time series analysis of public health and biomedical data.Annu Rev Public Health,2006,27:57-79.
11.李艳琳,周雨.应用圆形分布分析我区近年甲型肝炎患者发病的季节性趋势.中国卫生统计,2010,27(3):303-304.
12.Mushahwar IK.Hepatitis E virus:Molecular virology,clinical features,diagnosis,transmission,epidemiology,and prevention.Journal of Medical Virology,2008,80(4):646-658.