潜在类别分析在识别MSM人群HIV高感染风险的亚组人群中的应用*
2021-10-09天津医科大学公共卫生学院流行病与卫生统计学系300700张甜甜宋德胜姚婷婷于泽洋黄慧杰张洪璐李长平刘媛媛
天津医科大学公共卫生学院流行病与卫生统计学系(300700)张甜甜 崔 壮 宋德胜 姚婷婷 陈 阳 于泽洋 黄慧杰 张洪璐 李长平 刘媛媛
【提 要】 目的 探讨潜在类别分析在男男同性恋(men who have sex with men,MSM)人群分类中的应用,识别HIV感染风险高的MSM人群潜在类别,为采取有针对性的干预措施提供科学依据。方法 将文化程度、户籍所在地、天津本地居住时间、最近一次安全套使用情况、安全套使用频率、最近6个月内的异性性行为作为显变量进行潜在类别分析,对MSM人群进行分类。对不同潜在类别的MSM进行人口学和危险性行为的差异性分析;将是否感染HIV作因变量,潜在类别作自变量进行logistic回归,分析不同潜在类别MSM的HIV感染风险;进一步将年龄、商业性行为等作为协变量纳入潜在类别分析。结果 根据潜在类别模型拟合结果得到3个潜在类别的模型为最佳模型,MSM人群的三个潜在类别分别为:“外地危险行为组”811(15.7%)人,“外地安全行为组”2291(44.33%)人,“本地相对安全行为组”2066(39.98%)人,其中以外地危险行为组MSM感染HIV风险最高。该类人群的多人性行为比例显著高于其他两类人群,且卫生服务接受情况及HIV检测显著低于其他两类人群。结论 潜在类别分析可以用于MSM人群的分型研究,探索不同潜在类别人群的HIV感染情况及人口学、行为学特点,为合理分配卫生资源,有针对性地提供干预措施提供科学依据。
UNAIDS最新数据表明,截至到2018年,全球共有3790万艾滋病患者,并且HIV感染者数量仍呈持续上升趋势[1]。如何有效地控制HIV传播,降低HIV感染者人数是国内外亟待解决的问题。
男男同性恋者(MSM)因多性伴、无保护性肛交(UAI)、低安全套使用率、缺乏定期检测等高危行为[2-4],其HIV感染风险远高于一般人群[5-6],是普通成年男性的23倍[1]。据中国疾病预防控制中心(CDC)数据显示,在2018年新增的149 000 HIV感染者中,23.3%的感染者其感染途径为男性性传播[7]。正因如此,在HIV防控工作进展的同时,我们应该着重控制MSM人群HIV的传播。
2013年我国卫生部在61个城市开展的艾滋病综合防治试点调查发现,浴池型MSM的HIV感染率、梅毒患病率和UAI的比例明显高于一般MSM[8]。因此,2011年11月,中国CDC、天津市CDC与美国CDC合作,以天津市MSM浴池作为中国的第一个试点,开展浴池MSM的HIV防控干预项目。因此,了解浴池MSM群体人口学以及危险性行为特征,找到高感染风险的MSM亚群,可为实行有针对性的精准干预提供科学依据。
在既往的MSM人群的调查研究中,人口学特征、行为因素与HIV感染的关联性分析多采用回归模型,评价危险因素的平均效应以及因素间的一级交互效应,却很难解释多个因素的交互作用[9-10]。潜在类别分析( latent class analysis,LCA )是基于现有的数据结构分析目标人群潜在类别的一种统计分析方法。通过将特征相似的个体分为一组,达到同时评价多个危险因素的交互效应的目的。
为探究MSM人群的人口学和危险性行为在HIV感染风险中的多维度特性,我们采用LCA方法,分析天津浴池的MSM人群的人口学以及危险性行为特征,得到浴池MSM的潜在类别。通过比较不同潜在类别的MSM的人口学及危险性行为差异,以及不同潜在类别的MSM的HIV感染风险,揭示MSM人群HIV高感染风险的亚组人群,有助于我们识别HIV感染风险高的MSM,为实行有针对性的防控工作提供科学依据。
资料与方法
1.研究对象
本研究是从2011年3月31日开始实行,截至到2018年10月1日,共纳入5168名MSM,其中HIV感染者564人,HIV阴性者4604人。本研究的纳入标准为自报是男男同性恋者,且在过去12个月内与男性有过性行为。
2.抽样方法
由于MSM是特殊群体,因此本研究采用雪球抽样。在天津浴池,自愿咨询治疗服务站(VCT)的工作人员均是男男同性恋者,同时他们也是天津深蓝工作组的工作人员。前来检测和咨询的MSM需签署知情同意书,且在咨检前需在艾滋病预防管理系统中录入指纹,并生成唯一的指纹识别号,用以记录和追踪MSM的问卷和检测信息。为保证研究的客观性和及时性,该系统无管理员许可不能进行篡改。VCT工作人员采用圈内话术与咨检的MSM进行交流,并且在整个交流过程中填写调查问卷。完成调查问卷之后,对MSM进行HIV快速检测,检测结果将在20分钟之后递交受检人员。在等待检测结果的这段时间,工作人员会根据该受检者的问卷调查情况对其进行风险评估,并对他们进行有针对性地安全性教育。出现快速检测为阳性的受检者将会提供阳性咨询,并接受WB(western plot)检测以确证HIV感染状况。对于HIV确诊检测为阳性者,将提供标准化HIV治疗服务。对于所有的受检MSM,工作人员会发放免费的安全套和润滑油,并且鼓励他们带性伴或朋友进行检测。除此之外,为保护受检者隐私,HIV的检测和咨询均是在私密的房间内进行。除负责检测的工作人员外,只有受检者本人知道自己的感染状况。
3.研究设计
本研究针对目标人群设计“浴池健康服务”问卷,问卷内容包括:人口学信息(年龄、户籍所在地等),行为学信息(最近一次肛交安全套使用情况、安全套使用频率、最近6个月商业性行为、最近6个月异性性行为等),HIV知识,药物使用,其他性传播疾病的感染状况以及HIV意识和卫生服务使用情况在内的42道问题。除此之外,问卷还包括是否是MSM浴池的男男性工作者,HIV检测及复检结果在内的5道问题,将由天津浴池的工作人员填写。
4.潜在类别模型(latent class model,LCM)基本原理
潜在类别模型基于描述多个潜变量关联的结构方程模型和寻找多变量模型中潜在公因子的因子分析的理念加以发展,完善既往模型对类别潜变量处理的不足,提升分类变量的利用度。当目标群体内存在多个分布不同的亚组,且各亚组所占比例未知时,利用潜在类别分析构建潜变量解释群体内存在的异质性[11],从而将目标人群分类。该模型基于两个基本假设:(1)所有样本能且仅能分入一个潜在类别中,各类别相互独立且不相交;(2)局部独立性假设,即在特定的潜在类别下,显变量相互独立。其分析过程包括模型参数化、参数估计、模型识别、拟合优度评价、潜在分类与结果解释等[12]。
(1)概率参数化(probabilistic parameterization):概率参数化包括两种类型的分类变量:显变量(manifest variable)和潜变量(latent variable);两种类型的参数:潜在类别概率(latent class probabilities)和条件概率(conditional probabilities)。LCM假定任意两个观测变量之间的关系可以由潜变量解释。现假定A、B、C、D为四个显变量,潜在类别模型可以表达为:
(1)
(2)模型估计与模型拟合:模型估计包括EM(expectation-maximization)算法和NR(newton-Raphson)算法。比较模型适配度的指标有log likelihood检验,Akaike information criterion(AIC),Bayesian information criterion(BIC)和样本校正的BIC(aBIC)。其中,AIC准则和BIC准则在LCA方法中应用最为广泛[13],两者的数值越小表明模型适配度越好。当样本量大于1000时,BIC指标较AIC可靠。当样本量小于1000时,AIC指标优于BIC[14]。Entropy指数用来评估分类的精确程度,取值范围在0~1之间。当Entropy=0.6时,表明约有20%个体存在分类错误,Entropy在0.8左右时,表明分类的准确度超过90%[15]。
(3)潜在分类:经过以上模型假定、估计、评价等确定模型后,接下来是将各组观察值分类到适当的潜在类别中,来说明观察值的后验类别属性(posterior membership)。
5.数据分析
本研究的所有的数据分析使用SAS 9.4进行。潜在类别分析使用SAS中的PROC LCA 来执行[16]。P<0.05表明有统计学意义。本研究共纳入6个显变量,包括文化程度、户籍所在地、天津本地居住时间、最近一次安全套使用情况、安全套使用频率、最近6个月内的异性性行为。我们通过6个显变量采用LCA方法将该人群划分为不同的潜在类别,采用卡方检验进一步分析不同潜在类别的MSM人口学和行为学差异,通过logistic回归分析研究不同的潜在类别人群HIV感染风险,为干预措施的实施以及卫生资源的分配提供科学依据。我们进一步分析带有协变量的LCA,将年龄、最近6个月商业性行为、最近6个月多人性行为、1年内安全套宣传和发放情况、1年内艾滋病检测、MSW作为协变量纳入LCA,提高模型的参数估计值的准确性,从而降低分类误差。
结 果
1.模型拟合和选择
本研究共纳入5168名MSM,对这5168名MSM进行潜在类别分析。将潜在类别数分别设置在3、4、5,LCA拟合统计结果见表1。由于AIC与BIC最小为模型最优的衡量标准,且在样本量大于1000时,BIC为主要衡量指标,因此我们考虑将类型设置为三分类。在三分类时,模型的BIC最低且Entropy为0.78,表示该模型的准确度较高,具有合理性。我们根据MSM后验概率值最大对其进行分类,可将该人群分为三个潜在类别,即Class1 :户籍为外地,安全套使用频率低且(或)最近一次肛交未使用安全套,命名为“外地危险行为组”;Class 2:户籍为外地,最近6个月安全套使用频率高且最近一次肛交使用安全套,命名为“外地安全行为组”;Class 3:户籍为本地,最近6个月安全套使用频率相对较高且(或)最近一次肛交使用安全套,命名为“本地相对安全行为组”,见图1。
表1 潜在类别模型拟合结果
图1 三类MSM人群各变量的响应概率
2.三类潜在类别人群的差异性分析
三类人群在HIV患病率、年龄、文化程度、6个月多人性行为、6个月内商业性行为、6个月内异性性行为、1年内安全套的宣传和发放、1年内艾滋病检测、是否是同志浴池MSW、与异性的婚姻状况方面均有统计学差异。其中,外地危险行为组的HIV感染率(15.54%)最高,其次是外地安全行为组(12.05%),以本地相对安全行为组的HIV感染率(7.84%)最低。在人口学方面,外地MSM的年龄低于本地MSM的年龄,其中以外地安全行为组的年龄最低,且外地MSM的单身、离异、丧偶的比例高于本地MSM。除此之外,外地危险行为组的文化程度为三类人群最低,其次是外地安全行为组。在危险性行为方面,外地危险行为组的MSM最近6个月多人性行为的比例最高,其次是本地相对安全行为组。外地MSM商业性行为的比例以及男性性工作者(MSW)的比例均高于本地MSM。除此之外,外地危险行为组的MSM一年内接受安全套宣传和发放以及HIV检测的比例为三类人群最低(表2)。
表2 三类人群差异性分析
3.三类潜在类别人群的logistic回归分析
与本地相对安全行为组相比,外地危险行为组HIV感染风险的OR值为2.16(95%CI:1.69~2.77,P<0.0001);外地安全行为组HIV感染风险的OR值为1.61(95%CI:1.31~1.97,P<0.0001)。在调整年龄、婚姻状况、文化程度、最近6个月是否有多人性行为、商业性行为、异性性行为、最近一年HIV检测以及卫生服务接受情况、是否是MSW之后,与本地相对安全行为组相比,外地危险行为组HIV感染风险的调整OR值为2.27(95%CI:1.74~2.96,P<0.0001);外地安全行为组HIV感染风险的调整OR值为1.52(95%CI:1.22~1.89,P=0.0002)。
表3 三类潜在类别人群HIV感染状况分析
讨 论
本研究采用LCA将MSM人群分为三个亚组,分别是外地危险行为组、外地安全行为组和本地相对安全行为组。我们发现,外地(不论是否进行危险行为)MSM,其HIV感染风险均高于本地MSM,且该人群更低龄,文化水平偏低,未婚离异丧偶的比例更高。外地危险行为组是三类MSM中HIV感染风险最高的人群,更倾向于进行多人性行为,且MSW比例较高。该类人群在一年内接受卫生服务以及HIV检测在三类人群中的比例最低。除此之外,本地相对组的MSM商业性行为,MSW、未婚离异丧偶比例为三类人群最低且卫生服务接受情况为三类人群最高。这提示有关卫生部门,除了针对外地MSM进行规律性的卫生服务以及定期的HIV检测外,还应对其进行安全教育,以提高该类人群安全性行为。通过本项研究,为MSM人群有针对的实施干预措施,合理分配卫生资源提供科学依据。
本研究存在一定的局限性:(1)本研究纳入LCA中的变量较少,虽能在一定程度反应MSM人群的行为和人口学信息。(2)本研究的MSM人群采用雪球抽样获得。该抽样方法虽具有一定的偏性,但是本研究是基于天津浴池开展,天津浴池聚集了全国各地的MSM,可在一定程度上降低抽样方法带来的偏性。