我国云南曲靖肺癌高发区环境流行病学调查研究
2012-09-10张霖琳李继华汪亚杰吴国平魏复盛
张霖琳 李继华 汪亚杰 吴国平 魏复盛
我国云南省东北部的曲靖是全世界肺癌高发地区之一,当地居民以烟煤为燃料,用不通风的炉灶做饭、取暖,烟气无法直排到室外,造成室内空气的严重污染[1]。研究[2]表明长期暴露在燃煤烟气中是导致两地居民肺癌持续高发的主要原因,但是近年来随着改炉改灶的进行和社会主义新农村建设,当地环境污染有了明显的改善,但是肺癌发病率和死亡率仍然居高不下[3]。2007年在云南省卫生厅的组织下,曲靖地区开展了5万人的大规模肺癌流行病学调查。本研究仅对此次调查过程中环境状况与肺癌发病的部分内容展开讨论,旨在为当地肺癌高发的病因学研究提供科学依据和数据支持。
1 材料与方法
1.1 调查对象和内容 通过收集历史资料,了解云南曲靖市宣威、富源等地的环境背景情况,包括大气、土壤、水等。采用流行病学问卷调查的方式,掌握当地自然村使用燃料的种类、附近有无炼焦厂、铁锌厂、化工厂等情况,自然村环境污染状况的调查问卷设计见附表。
1.2 抽样方法 样本量估算:由于肿瘤发生属于低概率事件,肿瘤的分布呈Poisson分布,样本量估计依据Poisson分布期望值可信限表[4]和滇东(产)燃煤区肺癌发病率的估计值(50/10万)推算,总样本量约50,000人。
乡级样本:根据肺癌历史发病、死亡情况把曲靖市辖区内产(燃)煤乡镇分为肺癌高发区、次高发区、中发区和低发区。发病率或死亡率≥80/10万为高发区,次高发区50/1万-79/10万,中发区20/10万-49/10万,低发区<20/10万。无发病率或死亡率资料的乡镇以2003年-2006年当地县、市级主要医院新诊断的肺癌病例数为依据划分:高发区≥90例、次高发区60例-89例、中等发病区30例-59例和低发区<30例。按比例(2:1)通过电脑软件随机抽取18个乡级样本。村级样本:从每个乡级样本随机1个-2个行政村,共抽取28个行政村。调查点:每个村级样本随机抽取居住人口比较集中的6个-8个自然村作为整群抽样调查点,以满足2,500人-3,000人的乡级样本量要求,共计280个调查点。
1.3 数据分析 用Access建立数据库,将问卷中的信息录入到编好的程序中,把所有汇总后的数据导入到SPSS 18.0软件中进行统计分析,利用Logistic回归方法分析变量之间的关系并进行预测。
1.4 质量保证和质量控制 本次流行病学调查规模较大,采用了系统、严格的质量控制和保证措施来确保数据的准确性和可靠性,具体做法如下:①组织保障:成立市级流调领导小组、领导小组办公室、技术指导组(省、市级)、现场流调督导组、临床督导组,各县成立相应的协调小组;②业务培训:由技术指导组制定实施计划以及详细的实施细则,对参加调查的流调人员和临床诊断人员进行技术培训;③现场调查:流调表由市疾病预防控制中心统一印制,市、县督导组于流调开展初期和进展中进行定期、不定期现场督导,及时更正发现的错误。流调现场发现问题及时上报市流调技术指导小组。调查表完成后,由各组审核员完成当天调查表的审核,发现问题或缺项的,及时纠正或补充。审核完成后,审核人员签名确认。经过流调技术指导小组检查验收合格后,采用双录入法进行录入,确保数据录入的准确性。
2 结果
2.1 区域划分和调查对象 根据肺癌筛查的阳性率将宣威和富源分为A、B、C、D四个地区,调整分层区域的结果见表1。A为高发区,包括宣威市来宾和西宁;B为次高发区,包括富源县后所、大河、墨红以及麒麟区东山;C为中发区,包括宣威市倘塘、龙潭、格宜、龙场、羊场、田坝以及富源县中安、竹园、营上;D为低发区、麒麟区茨营、罗平县阿岗、师宗县雄壁。
2.2 调查问卷统计结果 2007年调查曲靖市宣威、富源产煤市、县、区,调查点分布与曲靖市煤炭资源地理分布一致,行政村样本地理分布无明显偏倚,共走访19个乡镇28个行政村280个自然村,每个自然村填写一份环境状况调查表,总计收集到280份调查问卷,根据低发区主要产无烟煤或者不产煤,燃料使用无烟煤或者木柴,而其它地区均产烟煤,使用烟煤或者焦煤,因此分成高、低两组,其中高发区、次高发区和中发区共计228份,低发区52份,问卷内容统计的详细结果见表2。
根据表2中汇总的数据统计得出,高发区78.1%的自然村使用烟煤和焦煤,43.4%自然村附近有焦化厂,31.1%附近有铁锌厂,11.8%附近有化工厂;低发区78.8%的自然村使用无烟煤和不产煤,26.9%自然村附近有焦化厂,23.1%附近有铁锌厂,5.8%附近有化工厂。炼焦厂和铁锌厂的使用年限和产量在高、低发区差异不大,但高发区附近的化工厂较为集中,比低发区的使用年限长且产量较高。高发区的工厂在上风向的较多,对自然村的污染较工厂在下风向的严重。
2.3 调查问卷二项Logistic回归 由于本表设计被解释变量为二值变量即高发区或低发区,因此建立二项Logistic回归模型探讨各个解释变量如燃煤种类和各种工厂的兴建对不同区域的影响。采用极大似然估计法对回归方程进行检验。调查问卷中的各个哑变量的确定及其赋值情况详见表3,燃料类型以木柴为参照类,附近无工厂作为另三项的参照类,其它定距变量均用原始调查表中该项数值直接代入方程。
表1 调整分层区域肺癌筛查阳性率(1/10万)Tab 1 Positive rate of lung cancer screening in adjusted investigating area (per 100,000)
使用统计软件对表中数据进行分析时,采用向前逐步筛选策略,表3中的变量如炼焦、金属冶炼和化工厂均没有进入方程,只有燃料类型进入到最终的筛选结果中(表4)。以使用木柴为参照,烟煤和焦煤的回归系数β值为正值,提示烟煤和焦煤的使用与肺癌高发具有正关联作用,Exp(β)>1,且Wald观测值所对应的概率P均<0.05,说明烟煤和焦煤较不产煤对于Logit P平均增长2.162和1.855个单位,结合Exp(β)值可知使用烟煤和焦煤在高发区的发生比是木柴的8.689倍和6.389倍。无烟煤的回归系数β值为-1.952,提示木柴、无烟煤与肺癌高发具有负关联作用,Wald观测值所对应的概率P<0.05,且Exp(β)<1,说明无烟煤在高发区的发生可能性与烟煤和焦煤相反。二项Logistic回归分析的结果表明,当地居民使用燃料类型是影响肺癌高发的重要因素,其中烟煤和焦煤对当地肺癌高发的有促进作用,而无烟煤或者木柴作用不大或有抑制作用。
3 讨论
本次流行病调查调查抽样框架合理,调查点严格按设计要求抽取,调查点分布基本与曲靖地区煤炭资源分布一致,调查区域体现了肺癌高、低发区的特点,保证了设计、抽样的科学性和样本的代表性。在流行病学调查的全过程,均采取严格的质量保证和质量控制措施来确保数据的准确性和可靠性。自然村环境污染状况的调查问卷的统计分析结果表明,使用的燃料类型是当地肺癌高、低发区形成的关键因素,其中烟煤和焦煤对当地成为肺癌高发区的影响较大,而无烟煤的作用则与之相反。金属冶炼、化工生产、大规模炼焦等企业在高发区要高于低发区,虽然对环境有一定影响,但大多数生产时间较短,且就目前情况来说对当地肺癌的影响尚不明显。
附表见http://www.lungca.org/files/survey0308.pdf
表2 自然村环境状况调查统计结果Tab 2 Statistics of environmental survey of sampling villages
表3 编码类目型变量表Tab 3 Variable table of coding method
表4 环境状况调查问卷的二项Logistic回归分析(逐步筛选策略)Tab 4 Binary logistic regression analysis of environmental survey by means of stepwise strategy