APP下载

试分析流行病生态学研究的统计分析方法

2018-09-30翁雪

商情 2018年41期
关键词:生态学流行病学研究

翁雪

[摘要]流行病生态学研究是生态学与流行病学的有效融合,旨在从环境变化与生态变化的层面探索疾病的发生在地域、时间与人群上的分布规律,从而通过生态学指标参数尽早预测相关疾病发生的可能性,以更加科学的依据积极主动地预防疾病的流行。本文对流行病生态学研究的统计分析方法进行阐述并分析,以供参考。

[关键词]流行病学;生态学;研究;统计分析方法

数千年来,人类一直面临着疾病为何出现和如何防治等重大问题。在缺乏生物学实验技术的年代,上述问题的解答仅能通过基于多个对象的观察所获得的经验性结论。此为流行病学研究方法的雏形,此种方法下,生物现象的或然性问题不能得到有效的解决,两个事物之间的复杂因果关联与伴随现象即很难辨别,因而很容易出现错误的判断。在流行病生态学研究的发展过程中,广义因果律(概率论下的因果观)的出现、逻辑学理论的完善、数理统计学的发展以及辩证唯物主义科学技术方法论的形成,为流行病生态学研究方法的形成提供了广泛的理论基础。在此背景下,一套探讨疾病发生的因果关系、了解疾病的分布规律的研究方法逐渐出现,使得以人群为基础的流行病生态学研究结果更具科学性与说服力。以下笔者就流行病生态学的概念与流行病生态学研究的统计分析方法进行探讨。

一、流行病生态学概述

流行病生态学研究是一种描述性的研究,以群体为观察、分析的基本单位,进而在群体水平上研究与疾病发生有关的因素,以及该因素与疾病之间的关系。一般而言,暴露因素与疾病之间的关系能够通过描述不同人群该因素的暴露情况与疾病情况进行分析。在流行病生态学研究过程中,结合常规资料与数据库等信息,可以在较短的时间内获得分析结果,进而节省人力、物力与时间。20世纪中期,为了适应多病因论的需求,流行病研究方法有了突飞猛进的发展。如今,流行病学的群体研究方法在医学的各个领域得到了较为广泛的应用,并成为医学相关学科不可或缺的研究方法。

在流行病生态学研究中,生态学研究能够为病因未明的疾病提供重要的病因线索,进而对该疾病进行深入的研究,此为生态学研究的显著优点。针对待研究暴露因素在某一人群中变异程度较小的情况,疾病与待研究暴露因素之间的关系的测量存在较大的难度,此时采用多個人群比较的生态学研究方式则能够取得较为有效的研究结果。因此,在疾病监测工作中,借助生态学研究方法,能够较好的评估疾病的发展趋势,从而为预防、控制策略的制定提供重要的依据。但流行病生态学研究也存在一定的缺陷,即生态学谬误。生态学谬误是因研究群体由各个情况不同的个体集合而成,加之其中存在的混杂因素,而导致的研究结果与真实情况之间的差异。

二、流行病生态学研究的发展

在当代流行病生态学研究中,自然环境与人类社会之间的关系被纳入研究的范畴,以社会一经济一自然的复合生态系统观点研究流行病学面临的问题。因此,生态学研究越加注重个体与群体的结合,以及社会发展与生活实际需求的结合。在生态学研究中,以群体为研究与观察的单位,对两个变量进行相关性分析或回归分析,其疾病测量的准确性或暴露水平相对较低,且其间的时序关系很难确定,因而研究的结果并不能直接作为因果关系的有力证据。

就流行病生态学研究手段与研究设施来看,除了一些可准确获取信息的手段与技术在流行病生态研究中得到有效应用外,部分数学模型与模拟方法也在大尺度、多因素的研究中得到了重视。基于信息技术与网络技术的应用,流行病生态学的研究对象与研究任务也发生了一些变化。在传统的生态学研究中,多是在一个相对孤立的局部地区的研究的基础之上逐步扩大,而继SARS之后,我国的疾病控制信息系统已在全国范围内建立,这对流行病生态学研究具有实质性意义。

三、流行病生态学研究的统计分析方法

在流行病生态学研究中,为保证研究结果的准确性,一般数据总量是巨大的,与之对应的数据分析处理方法也相对较多。就统计分析方法的分类来看,大致可分为传统统计方法与空间统计分析方法。以下分别进行探讨。

(一)传统统计分析方法

传统分析方法建立在大样本容量与样本独立两项基本假设之上,根据待分析危险因素的数量可细分为单因素分析与多因素分析两类。生态学研究的观察与分析单位是由不同情况的个体组成的群体,如县区等。在群体层面监测或者收集与流行疾病发病、危险因素、伤残、死亡等信息,常见的危险因素如气象指标、空气污染指标、群体经济水平、其他基础疾病等,在此基础上构建危险因素与疾病发病之间的关联。

在单因素分析中,常见的统计分析方法有相关分析、t检验、F检验与Mann-Whitney检验等。相关分析是对总体中确定存在联系的标志进行分析的过程,以描述客观事物之间的关系,同时选用适当的统计指标进行展示。在统计分析过程中,为了明确两个变量之间的关系,需要收集成对的数据,而后通过散点图等方式进行呈现,以便分析二者之间的关系。在流行病生态学研究中,相关分析旨在分析单个危险因素与疾病发生之间的关系,即独立危险因素。t检验又称studentt检验,主要用于小样本、总体标准差盯未知的正太分布分析,借助t分布理论推导差异发生的概率,从而比较两个平均数之间是否具有显著性差异。t检验是流行病生态学研究中较为常用的一种统计分析方法,能够有效构建疾病发生与危险因素之间的关系。F检验又称方差比率检验、联合假设检验、方差齐性检验,是一种基于零假设之下统计值服从F-分布的检验方法。F检验对数据的正态性具有较高的敏感性,常用于分析模型中部分参数或全体是否适合母体的估计,也可用于三组或者多组数据之间的均值比较,但当显著性水平较低时,数据的稳健性将出现大幅降低。Mann-Whitney检验又称曼-惠特尼u检验,旨在检验两个总体的均值之间是否存在显著性差异。此种检验方法基于两个样本分别来自除了总体均值以外完全相同的两个总体这一假设,明确地考虑了每一个样本中各测定值所排的秩,所使用的信息相对较多。

在多因素分析中,常见的统计分析方法有对应分析、回歸分析、主成分分析、聚类分析等。对应分析主要用于分析二维数据矩阵中行、列因素之间的关系,又称相应分析,其基本原理为通过二维数据矩阵的对应变换,分析矩阵的行因素与列因素之间的关系。对应分析是近年发展起来的一种新的多元相依变量统计分析方法,基于定性变量构成的交互汇总表,揭示变量之间的联系。在流行病生态学研究中,采用对应分析,可借由视觉化的表示方式,将多组看不出任何联系的暴露因素进行展现。回归分析旨在处理与分析多个变量之间的线性依存关系,在流行病生态学研究中,多为多重线性回归模型,即多个自变量对1个因变量的变化关系的研究。聚类分析又称点群分析,是一种多元统计分析方法。在聚类分析中,通过相应的类别划分方法(性质相近的归为一类)进行“聚类”,并对各类事物进行直接比较。聚类分析的原则为不同类中的个体差异相对较大,借助相应的聚类方法(模糊聚类、系统聚类、最优分割法、动态聚类),实现待研究变量之间的相异性研究。主成分分析是借助多变量之间的线性变换选出其中的重要变量,以实现变量压缩的一种统计分析方法。在流行病生态学研究中,为了满足全面分析相关危险因素与疾病发生之间的关系的要求,常常需要提出较多的危险因素。但就实际的研究过程来看,过多的变量将会急剧增加问题分析的难度与复杂度。此外,两个变量在解释同一问题时可能存在重叠部分,提示变量存在压缩的可能性。基于此,主成分分析的统计分析方法得到重视并逐渐用于流行病生态学分析。

(二)空间统计分析方法

针对空间数据,多数空间数据样本并不独立,使得传统的统计分析方法的两项基本假设难以满足。针对流行病生态学研究,各种空间统计分析方法的应用,为流行病影响因素的探索、空间聚集性的分析以及防治控制策略的制定提供了重要工具。

空间统计分析又称地理统计分析,以区域化变量理论为基础,研究分布于空间中呈现出一定的随机性、结构性的自然现象。常见的空间统计分析方法包括空间自相关分析、空间分类分析、多变量统计分析、空间模拟等。空间自相关分析建立在现象或食物具有对空间位置的依赖关系的理论之上,其计算方法可细分为全局性与局部性。全局空间自相关分析常用于整个研究区域下空间对象某一属性取值的空间分布状态的描述,从而判断其在空间上的聚集性。全局性计算方法忽略了空间异质性,以此为基础,局部空间自相关分析方法出现。空间插值分析是通过一组分区数据或离散数据推求未知区域的数据的分析过程,主要包括变换函数插值、边界内插值、样条函数插值、距离倒数插值等方法。流行病学标点地图法是一种较为常用的流行病生态学研究方法,可细分为以密度为基础、以距离为基础与以疾病分布热点为基础的流行病学标点地图的空间推断方法。

四、结语

在流行病学研究中,传统统计分析方法的应用较为成熟,空间统计分析方法仍存在较大的进步空间。因此,在实践应用中,应当加强空间统计分析方法的应用分析,从而为流行病学的理论研究提供重要的支持。

猜你喜欢

生态学流行病学研究
小儿手足口病的流行病学特征及预防分析
斯诺医生——流行病学调查基本方法创立者
健康体检常见慢性病及指标异常流行病学分析
细菌性食物中毒的流行病学调查分析
谁说小孩不能做研究?
Applications of Deep Mixing to Earthquake Disaster Mitigation
A Thought:What have We Learned from Natural Disasters? Five Years after the Great East Japan Earthquake
对周期函数最小正周期判定法的研究与应用
生态学视野下的幼儿园环境创设探析