肥城市农村居民肺癌发病趋势分析及预测*
2018-04-27张楠李琰琰顾建华孙雅文崔永春卢培培赵德利王家林
张楠 李琰琰 顾建华 孙雅文 崔永春 卢培培 赵德利 王家林
国际癌症研究机构(IARC)的数据[1]显示,2012年全球约新增1 410万例癌症患者,约820万例因癌症死亡。其中,新增肺癌患者180万例,占总发病例数的12.76%,因肺癌死亡160万例,占因癌症死亡总例数的19.51%,肺癌新发病例和死亡率高居恶性肿瘤之首。在中国,肺癌同样为发病率和死亡率最高的恶性肿瘤[2],已被列为重点防治的癌种之一[3]。本研究采用Joinpoint回归模型和差分自回归移动平均模型(autoregressive integrated moving veage model,ARIMA)相结合的方法分析肥城市2000年1月1日至2012年12月31日农村居民肺癌发病率的变化情况,对2013年至2018年发病率进行预测,可以反映其发展趋势和防治重点,为制定肺癌防治策略提供参考。
1 材料与方法
1.1 病例资料
肥城市于1997年建立了覆盖全市农村地区的肿瘤登记报告系统,2000年被纳入世界卫生组织(WHO)肿瘤发病和死亡登记报告点,并使用WHO提供的登记报告系统和规范收集肿瘤发病资料[4]。登记资料完整、可靠。登记病例由两部分组成:1)肥城市具有肿瘤诊断水平的二级甲等医院报告;2)肥城市肿瘤登记处收集的各乡镇和村恶性肿瘤发病资料。肥城市肿瘤登记处专职人员按照《中国恶性肿瘤登记工作指导手册》[5]进行质量控制,对所有病例进行审核后,按照国际疾病分类编码ICD-10(肿瘤病理组织学类型编码采用ICD-O-3)录入登记报告系统。2000年1月1日至2012年12月31日肥城市农村居民恶性肿瘤发病登记数据的病理诊断比例为64.83%,仅有死亡证明书(death certificate only,DCO)比例为2.43%,死亡发病比(mortality incidence,M/I)为0.80,除病理诊断比例略低于要求的66%[5]外,其余指标均符合要求。本研究选取肥城市2000年1月1日至2012年12月31日期间登记的所有肺癌病例(ICD-10编码C33、C34)进行分析。人口资料由肥城市公安机关提供,农村居民指户籍为农村者。
1.2 发病率的标化
分别采用2000年中国标准人口构成(ASRC)、Segi's世界标准人口构成(ASRW)计算中国人口标化发病率(中标率)和世界人口标化发病率(世标率)。
1.3 统计学分析
1.3.1 肺癌发病趋势分析 应用Joinpoint regression program 4.5.0.1软件分析肺癌发病的时间、年龄趋势,用对数线性模型对发病率进行拟合,计算年度变化百分比(annual percent change,APC)并进行统计学检验(检验水准α=0.05),APC为正则表示发病率随时间推移呈上升趋势,为负则表示下降趋势[6-7]。Joinpoint回归模型是将一个长期趋势线分成若干段,每段采用连续性的线性进行描述,可对数据进行分段线性回归来分析趋势变化[6-7]。
1.3.2 发病趋势预测 采用SPSS 19.0软件建立ARIMA模型,对肥城市农村居民肺癌发病率进行拟合,并对2013年至2018年的发病趋势进行预测。ARIMA(p,d,q)模型中的AR为自回归,p为自回归项数;MA为移动平均,q为移动平均项数,d为转换为平稳序列时所做的差分次数[8-10]。ARIMA模型用公式表示为[11]Wt=μ+θ(B)/φ(B)×at。其中,t为时间变量,Wt为肺癌发病率或其差分,Wt=(1-B)dYt,B为后移算子,BYt=Yt-1,θ(B)为自回归算子,θ(B)=1-θ1B-θ2B2-K-θqBq,φ(B)为移动平均算子,φ(B)=1-φ1B-φ2B2-K-φpBp,at为随机误差项。本研究将肺癌发病率预测对象随时间推移而变化的数据序列视为一个随机数列,以时间t综合代替各种影响因素,建立时序模型,从而达到预测未来值的目的。
建模的基本步骤为根据序列图对数据平稳化进行识别和处理、模型识别和定阶、模型参数检验、诊断残差数列是否为白噪声序列、利用合适的模型进行预测分析[12-14]。
2 结果
2.1 肺癌发病率及变化趋势
2000年1月1日至2012年12月31日,肥城市农村居民肺癌新发肺癌病例3 908例,平均发病率为40.77/10万(中标率为32.95/10万,世标率为32.97/10万),男性发病率是女性的2.14倍(χ2=525.34,P<0.001)。发病率和标化率均呈上升趋势(P<0.001),总人群发病率从25.13/10万上升至64.92/10万,APC值为9.74%,男性发病率由34.68/10万上升至91.30/10万,APC值为9.78%,女性发病率则由15.60/10万上升至40.19/10万,APC值为9.60%。男、女性及总人群的中标率和世标率均明显升高,APC值在8.81%~13.20%之间,总人群标化发病率的APC值高于粗发病率(表1,图1)。
2.2 性别、年龄别发病率情况
肥城市农村居民40岁之前肺癌发病率较低,40岁以后开始迅速升高;男性和总人群75~79岁年龄组发病率最高,分别为369.38/10万、279.27/10万,女性80~84年龄段最高,为206.89/10万。结合Joinpoint回归分析结果,男、女性肺癌发病的年龄别变化趋势可分为3段:0~59岁、60~79岁和80岁及以上。男、女性人群的肺癌发病率在0~59岁年龄段呈快速上升趋势,APC值分别为122.31%、94.52%,(P<0.05);60~79岁段增幅趋缓,APC值分别为15.95%、30.20%,(P<0.05);80岁之后开始缓慢下降,APC值分别为-27.44%、-10.17%,(P>0.05)。女性各年龄段上升和下降幅度均低于男性(表2,图2)。
表1 2000年1月1日至2012年12月31日肥城市农村居民肺癌发病率及标化率(1/10万)
图1 2000年1月1日至2012年12月31日肥城市农村居民肺癌发病率、标化发病率变化趋势
2.3 发病率的预测
肥城市农村居民肺癌发病率呈明显上升趋势,可初步判断其为非平稳的时间序列。对原始数据进行一阶差分处理后,数据序列趋于平稳化,一阶差分后的自相关函数(auto correlation function,ACF)和偏自相关函数(partial auto correlation function,PACF)均呈拖尾性(图3),故可选取ARIMA(p,d,q)模型进行拟合[12]。根据ACF和PACF图与BIC准则相结合的方法对模型进行定阶[11],最终建立ARIMA(0,1,1)模型(R2=0.834,正态化BIC=4.207)。残差序列的ACF和PACF(图4),滞后11阶残差的自相关和偏自相关系数值均在正负2倍标准之间,残差自相关性不显著,为白噪声序列。采用ARIMA(0,1,1)模型对肥城市肺癌发病率进行拟合和预测,拟合值与实际值之间的平均相对误差为0.141,符合中长期预测(5~10年)的相关要求[13]。模型ARIMA(0,1,1)可以较好地拟合肺癌发病率的时间序列,可用于外推预测。2013年至2018年肥城市农村居民肺癌发病率逐年升高,2018年将达到87.92/10万,年均增长率为4.92%(表3,4)。
表2 2000年1月1日至2012年12月31日肥城市农村居民肺癌性别、年龄别发病率年度变化百分比
表3 ARlMA(0,1,1)模型参数
图2 2000年1月1日至2012年12月31日肥城市农村居民性别、年龄别发病率变化趋势
图3 一阶差分后的自相关图(A)和偏自相关图(B)
图4 残差序列的自相关(A)和偏自相关图(B)
表4 2013年至2018年肥城市农村居民肺癌发病率预测值及年增长率
3 讨论
肺癌是发病率和死亡率增长速度最快的恶性肿瘤,对人类健康和经济社会发展造成了沉重的负担。借助统计学分析方法对肺癌发病资料进行分析,了解其发展变化的规律性,旨在为肺癌致病因素探讨和防治措施的制定等提供科学依据。Joinpoint回归通过模型拟合把变化趋势分成若干具有统计学意义的区段,比人为分段更加科学合理[14],本研究利用Joinpoint回归拟合出的最优模型无转折点,肥城市农村居民肺癌发病率呈逐年上升趋势,APC均在9%以上,标化发病率亦呈逐年升高的特点。农村居民40岁以后肺癌发病率迅速上升,60岁之后增长幅度减小,80岁之后则开始缓慢下降,女性发病高峰晚于男性。常见的疾病发病率、死亡率预测方法有年龄-时期-队列模型、灰色预测模型和时间序列分析等,各方法均有其优、缺点和适用范围。其中,时间序列分析是一种历史悠久而又富有生命力的预测方法,特别是在预测变量的主要影响因素不明确或主要影响因素的相关数据无法获得时,其优势更为显著[10-11]。恶性肿瘤病因复杂,可能与遗传、不良生活习惯、空气污染等有关,但主要影响因素不明确[15-18],ARIMA模型可克服此困难,将多种因素的综合效应统一蕴含于时间变量中进行分析,可以克服这一问题,确保预测的准确性。本研究采用ARIMA(0,1,1)模型的预测结果显示,2013年至2018年肥城市农村居民肺癌发病率仍呈上升趋势,年均增长率为4.92%。有研究发现,肥城市农村居民恶性肿瘤发病率呈快速上升趋势,世界人口标化发病率的APC值约为4.5%,且肺癌的APC值高于全部恶性肿瘤的平均APC[4]。陈永胜等[18]研究发现,男女性肺癌发病性别比为2.62:1,75~79岁年龄组达到发病高峰。王庆生等[19]的研究中,肺癌的年龄别发病率变化区段有4个,即出生时处于极低水平,42岁时开始较快升高,62~72岁期间持续快速升高,其后平稳下降,均与本研究结果一致。其他肺癌发病趋势及预测相关研究,也得出了肺癌发病率较高且将会进一步升高的结论[2,11,20-23]。
男性肺癌发病率显著高于女性,可能与男性具有较多的不良生活习惯相关,如吸烟、饮酒和职业暴露机会较多等[14,20]。有研究证实,吸烟是肺癌最主要的危险因素,吸烟和被动吸烟者罹患肺癌的危险性显著增加[24]。2010年全球成人烟草调查[25]显示,中国女性吸烟率未明显改变,维持在较低水平。本研究中发现,中国农村女性肺癌发病率逐年升高,标化率的增幅甚至超过男性,这可能与女性雌性激素的影响、环境烟草暴露、对烟草中致癌物更加敏感和室内油烟暴露等因素相关[26],但相关结论仍需更深入的病因学研究证实。另一方面,人口老龄化是肺癌发病率升高的重要因素,随着年龄的增长,暴露于危险因素的时间和基因损伤概率增加,肺癌的发生概率就越大[24]。据国务院《国家人口发展规划(2016~2030年)》数据,2020年后中国老龄人口增长速度将明显加快。因此,肺癌的发病率将进一步升高。
综上所述,肺癌发病率逐年升高和负担不断加重的问题不容忽视。肺癌的防治需结合其发病特点,制定针对性的策略,如继续开展肺癌病因学研究,明确肺癌的危险因素及其致病机制;大力开展以控制烟草使用、减少环境烟草暴露和防治大气污染等为主的肺癌一级预防工作;针对40岁以上的高危人群,尤其是男性吸烟者,探索开展适宜有效的肺癌评估和筛查方法,实现早发现、早治疗,充分发挥癌症一级预防和二级预防的联合作用[27-28],逐步降低肺癌的发病率和死亡率。
[1] Torre LA,Bray F,Siegel RL,et al.Global cancer statistics,2012[J].CA Cancer J Clin,2015,65(2):87-108.
[2] Chen WQ,Zheng RS,Peter D.Baade,et al.Cancer statistics in China,2015[J].CA Cancer J Clin,2016,66(2):115-132.
[3] 董志伟,乔有林,李连弟,等.中国癌症控制策略研究报告[J].中国肿瘤,2002,11(5):250-260.
[4] 伊丽,马恒敏,李琰琰,等.2000-2012年肥城市农村居民恶性肿瘤发病趋势分析[J].中国肿瘤防治杂志,2015,22(24):1861-1864.
[5] 全国肿瘤防治研究办公室,卫生部卫生统计信息中心,全国肿瘤登记中心.中国肿瘤登记工作指导手册[M].北京:中国协和医科大学出版社,2004:48-50.
[6] Kim HJ,Fay MP,Feuer EJ,et al.Permutation tests for joinpoint regression with application to cancer rates[J].Stat Med,2000,19(3):335-351.
[7] 张亮,林庆山,白玉琢,等.铁岭市2007-2015年城市居民食管癌死亡变化情况Joinpoint分析及灰色预测模型预测[J].中华肿瘤防治杂志,2016,23(23):1531-1534.
[8] Velicer WF.Time series models of individual substance abusers[J].NIDA res Monogr,1994,(142):264-301.
[9] Craigmile PF,Kim N,Fernandez SA,et al.Modeling and detection of respiratory-related outbreak signatures[J].BMC Med Inform Decis Mak,2007,7(5):28.
[10]朱慈华,丁彦培,叶波,等.运用ARIMA模型预测江岸区恶性肿瘤死亡率的变化趋势[J].中华临床医师杂志(电子版),2016,10(7):41-42.
[11]陈勇,陈建国,朱健,等.1972~2001年启东市肺癌发病趋势的时间序列分析及预测模型探讨[J].南京医科大学学报(自然科学版),2005,25(7):514-519.
[12]宋宇辰,张志启.基于ARIMA模型对我国"十二五"能源需求的预测[J].煤炭工程,2012,(1):76-79
[13]和融.基于Joinpoint回归模型的住院量实证分析[J].中国卫生统计,2016,33(3):471-473.
[14]屈若祎,周宝森.2004-2010年中国肺癌死亡分布及趋势分析[J].中国卫生统计,2014,31(6):932-935.
[15]陈万青,郑荣寿,曾红梅,等.中国恶性肿瘤发病趋势分析和预测[J].中华预防医学杂志,2012,46(7):581-586.
[16]朱陈,李辉章,王悠清,等.2010年至2014年浙江省肿瘤登记地区癌症死亡情况分析[J].中国肿瘤临床,2017,44(11):552-557.
[17]宫舒萍,林少倩,阮师漫,等.2012年山东省济南市居民恶性肿瘤死亡分析[J].疾病监测,2014,29(7):564-566.
[18]陈永胜,陈建国,朱健,等.启东市1972-2011年肺癌发病趋势分析[J].中国肿瘤,2014,23(8):629-635.
[19]王庆生,陈万青,郑荣寿,等.癌症年龄别发病率的Joinpoint线性回归分析及其在癌症防控中的意义[J].中国肿瘤,2013,22(3):180-185.
[20]陈万青,张思维,邹小农.中国肺癌发病死亡的估计和流行趋势研究[J].中国肺癌杂志,2010,13(5):488-493.
[21]陈万青,郑荣寿,张思维,等.2012年中国恶性肿瘤发病和死亡分析[J].中国肿瘤,2016,25(1):1-8.
[22]温登瑰,张楠,冯诚,等.石家庄市区户籍人口2012年恶性肿瘤发病分析[J].中国肿瘤临床,2015,42(3):141-146.
[23]杨玲,李连弟,陈育德,等.中国肺癌死亡趋势分析及发病、死亡的估计与预测[J].中国肺癌杂志,2005,8(4):274-278.
[24]马臣,姜永晓,刘曙正,等.河南省居民2010年至2019年肺癌死亡率预测[J].郑州大学学报,2013,48(2):220-225.
[25]杨功焕.2010全球成人烟草调查中国报告[M].北京:中国三峡出版社,2011:8-13.
[26]韩仁强,郑荣寿,张思维,等.1989年-2008年中国肺癌发病性别、城乡差异及平均年龄趋势分析[J].中国肺癌杂志,2013,16(9):445-451.
[27]张春芳,曾强,王维民,等.体检人群肺癌筛查低剂量螺旋CT检出率与成本分析[J].中华肿瘤防治杂志,2015,22(4):247-251.
[28]左婷婷,郑荣寿,曾红梅,等.中国胃癌流行病学现状[J].中国肿瘤临床,2017,44(1):52-58.