大规模人群中疾病筛查混采检测效率评估
2023-10-10曾四清
曾四清
1. 广东省疾病预防控制中心(广州 511430)
2. 广东省公共卫生研究院(广州 511430)
混合检验的主要目的是提高检测能力和效率,降低检测成本。混合检验的方法主要包括单采混检、混采检测和混采混检三种[1-4]。2020—2022 年间,我国新冠肺炎疫情防控大规模人群新冠病毒核酸筛查工作中,采用了5 至10份单采标本稀释混样检测,5 合1、10 合1 和20合1 等多种混采检验技术[5-8]。有的地区还尝试采用混采混检技术,以进一步提高检验工作效率、降低成本[2]。目前,对于混合检验的效率研究主要集中于单采混检,而对混采检测和混采混检的研究则较少[1-4,9-14]。不同于单采混检,混采检测涉及二次采样检测问题。研究表明,采用最适宜的样本混合数是实现混合检测工作效率最大化的关键[12-13,15-16]。Agarwal 等[17]认为有必要通过数学模型评估混采检测的适宜采样混合数。因此,本研究采用二项分布和群检验技术原理,探讨了混采检测的工作效率和最适宜采样混合数[18]。
1 资料与方法
1.1 采样混合数、感染率、人口规模及采样与检验单位工作量权重假设
目前,我国发布的多项混采检测技术规范中,提出的采样混合数有 5 合1、10 合1 和20 合1。据此,本研究通过预分析,缩小采样混合数至2合1,扩大采样混合数至120 合1;假定人群中的感染率为1%~9%、1‰~9‰和1/万~9/万三个等级区间水平;假定采样区域的总人口规模为N,每个人感染的概率均等且在采样检测期间保持不变。
假设采样与检验单位工作量的权重分别为SW 和DW,SW ∶ DW=1 ∶ K,K 为二者权重比值,则SW=1/(1+K), DW=K/(1+K)。假设K 值依次为1/4、1/3、1/2、1、2、3 和4。
1.2 混采检测方式
本研究所指的混采检测(n-in-1 test)技术指将采集自n 人的n 支拭子集合于1 个采集管中进行核酸检测的方法,n 即为采样混合数。混采检测结果为阳性、灰区或单个靶标阳性,则对该混采管的n 个受试者分别重新采集单管拭子进行复核,按照复核单管核酸检测结果报告[7-8]。本研究假定检测的灵敏度和特异度均为100%。
1.3 分析方法
通过两轮采样检测发现全部阳性感染者所需的人均采样次数、人均检测管数及其加权综合工作量等指标的变化规律来评价混采检测的工作效率。
研究主要采用二项分布和群检验技术理论进行分析[13,18]。二项分布是指在只会产生两种可能结果如“阴性”或“阳性”之一的n 次独立重复试验中,当每次试验的“阳性”概率π 保持不变时,出现“阳性”次数X=0,1,2,…,n 的一种概率分布。其概率可由下面的公式求出(式1)[18]:
X=0,1,2,…n。
对于抽样调查,若从阳性率为π 的总体N 中,有放回随机抽取个体数为n 的样本,则出现阳性数为X 的概率分布即呈二项分布。若是无放回随机抽样,当抽取的个体数n 远小于总体数N(如n<N/10)时,也可近似当作二项分布处理。群检验技术是二项分布的主要应用之一,主要用于估计总体感染率,也可用于混合样品分析[18]。
本研究假设大规模人群N 中的感染率为π,混合采样采用n 人一组(管)。n 人中只要有1人阳性,该组(管)检验结果即呈“阳性”,然后该组n 人即分别再次进行单独采样检测。根据二项分布原理,n 人一组(管)混合采样检测结果呈“阴性”的概率为n 人中“阳性”人数X=0的概率,表示为P(0)(式2);n 人一组(管)混合采样检测结果呈“阳性”的概率为n 人中“阳性”人数X=1,2,…,n 的概率合计,表示为P(1 ≤X ≤n)(式3)。
据此,计算混合采样检测结果呈阳性的管数(number of positive tubes, NPT)(式4)、需再次单独采样的人数(number of resamplers, NRS) (式5),以及再次单管检测管数(number of retest,NRT) (式6)。最后计算人均采样次数(number of samples per capita, NSPC)(式7)和人均检测管数(number of tubes per capita, NTPC)(式8)。如果采用单采单检,人均采样次数和人均检测管数则均为1。因此,本研究采用混采检测的采样工作量增长率(sampling workload growth rate,SWGR)(式9)和检测工作量增长率(detection workload growth rate, DWGR)(式10)反应采样工作效率和检测工作效率变化。同时,计算权重比值为K 时的采样与检测加权综合工作量增长率(weighted comprehensive workload growth rate,WCWGR)(式11或式12),反应综合工作效率变化。SWGR=((NSPC-1)/1)×100%
可见,如果不考虑单检与混检之间检测灵敏度与特异度的差异,式9 和式10 两指标均只取决于两个参数π 和n 的大小,与N 无关;式11和式12 除与π 和n 的大小有关,还与权重比值K 有关,与N 无关。因此,本研究主要分析在较大规模人群中,不同感染率下,采用不同采样混合数n 时的采样工作效率和检测工作效率,绘制不同感染率、不同采样混合数情况下的SWGR 变化曲线图和DWGR 变化曲线图。同时,分别从不同感染率π 值、不同权重比值K 情况下,筛选出加权综合工作量增长率最小值(minimum weighted comprehensive workload growth rate, MWCWGR)及其采样混合数(m),即为混采检测加权综合工作效率最适宜的采样混合数m 值,并制成图表。
绘制SWGR 和DWGR 曲线时选用2 ≤n≤50示意;计算最小值和绘制MWCWGR 与m 曲线时选用2 ≤n≤120,以展现最佳工作效率和最适宜采样混合数变化规律。
根据本研究结果,对采样混合数为5 合1、10 合1 和20 合1 的最适宜人群感染率及混采检测效率进行评估。
1.4 分析工具
本研究采用Python 语言numpy、pandas、matplotlib.pyplot 和scipy.stats 等编程工具包进行数据整理分析和可视化[19-20]。
2 结果
2.1 不同感染率人群中混采检验采样与检验工作量增长率
按照人群感染率π 在1%~9%、1‰~9‰和1/万~9/万三个区间取值并进行分析,绘制采样混 合数n 为2 合1 至50 合1 的SWGR 和DWGR变化曲线图,分别见图1、图2 和图3。结果显示,SWGR 随着采样混合数的增加而增加,感染率越高,增加幅度越大,但不超过100%;DWGR 随着采样混合数的增加呈现先下降后回升的变化趋势,存在最低值,感染率越高,下降幅度越小,但不超过0%。
图1 感染率为1%~9%的人群混采检测的SWGR和DWGR变化曲线图Figure 1. Curves of SWGR and DWGR for swab pooling detection in a population with an infection rate from 1% to 9%
图2 感染率为1‰~9‰的人群混采检测的SWGR和DWGR变化曲线图Figure 2. Curves of SWGR and DWGR for swab pooling detection in a population with an infection rate from 1‰ to 9‰
图3 感染率为1/万~9/万的人群混采检测的SWGR和DWGR变化曲线图Figure 3. Curves of SWGR and DWGR for swab pooling detection in a population with an infection rate from 1/10 000 to 9/10 000
2.2 不同感染率人群中混采检验加权综合工作量增长率最小值及其采样混合数
根据感染率π、采样混合数n 和权重比K,计算WCWGR,筛选出MWCWGR 及其采样混合数(m),结果见表1 和图4。结果显示,感染率越高,最适宜采样混合数越小,MWCWGR越大(负数的绝对值越小),即混采检测效率提高越少;K 值越大,最适宜采样混合数越大,MWCWGR越小(负数的绝对值越大),即混采检测效率提高越多。然而,当感染率超过6%以上,且K 值小于1/2 时,MWCWGR 即为正数,表明混采检测反而增加工作量,降低工作效率。此时,就不宜采用该方法。
表1 不同感染率人群中混采检测加权综合工作量增长率最小值(%)及其采样混合数Table 1. Swab pooling sizes at the MWCWGRs (%) for swab pooling detection in people with different infection rates
2.3 采样混合数为 5合1、10合1和20合1混采检测技术应用的最适宜感染率及工作效率评估
表1 和图4 显示,当K 值依次为1/4、1/3、1/2、1、2、3 和4 时,5 合1 分别最适用于在感染率为7‰~1%、9‰~1%、1%~2%、2%、3%、3%~4%和4%的人群中进行混采检测,相应的MWCWGR 分别为-12.55%~-11.10%、-15.58%~-15.10%、-21.93%~-17.24%、-30.39%、-39.21%、-45.87%~-41.54%和-45.54%;10合1 分别最适用于在感染率为2‰、2‰~3‰、3‰~4‰、5‰、7‰、8‰~9‰和8‰~9‰的人群中进行混采检测,相应的MWCWGR 分别为-16.02%、-20.55%~-19.55%、-27.05%~-26.09%、-40.11%、-53.22%、-59.78%~-58.86% 和-64.28%~-63.36%;2 0 合1 分 别 最适用于在感染率为5/万、6/万~7/万、8/万~9/万、1‰~2‰、1‰~2‰、2‰和2‰的人群中进行混采检测,相应的MWCWGR 分别为-18%、-22.56%~-22.36%、-30.08%~-29.88%、-45.55%~-43.72%、-61.53%~-59.43%、-67.33%和-72.08%。可见,随着K 值增大,采样混合数5 合1、10 合1 和20 合1 混采检测技术应用的最适宜感染率分别逐步提高,加权综合工作量减少的幅度分别逐步增大。
3 讨论
本研究主要基于二项分布和群检验技术原理,推导出混采检测的采样工作效率和检测工作效率计算公式,并据此分析了人群感染率在百分率、千分率和万分率三个取值区间场景下,不同采样混合数的采样和检测工作量增长率,得到了其变化趋势图。同时,按照采样与检测单位工作量七级权重比值,分别计算了各个水平感染率情况下的MWCWGR,筛选出其中的最小值及其采样混合数。据此,对5 合1、10 合1 和20 合1 混采检测的最适宜感染率及工作效率进行了评估。
本研究主要有以下发现:第一,混采检测综合工作效率的决定性因素(参数)是感染率、采样混合数,以及采样与检验的单位工作量权重,而与人口规模没有直接联系。第二,无论感染率高低和采样混合数多少,混采检测均会增加采样工作量人次数,超过单采人次数,且随着采样混合数的增加,采样人次数增加;感染率越高,增加的幅度越大,速度越快。第三,无论感染率高低和采样混合数多少,混采检测均会减少检测工作量,且随着采样混合数的增加,检测工作量呈现先减少后回升的变化趋势,但总不会超过单采单检的检测工作量。因此,存在检验工作量减少幅度最大的最佳采样混合数。感染率越低,检测工作量减少幅度越大,减少的速度越快。第四,加权综合工作量增长率分析显示,在不同感染率的人群中进行混采检测,可以得到相应的混采检测加权工作效率最高的采样混合数。感染率越高,最适宜采样混合数越小,其提高的工作效率值越低;感染率越低,最适宜采样混合数越大,甚至可以达到90 合1 及以上,其提高的加权工作效率值越高,可以达到75%以上。第五,当人群感染率超过6%,且K 值小于1/2 时,MWCWGR 即为正数,此时混采检测会增加工作量降低工作效率,不宜采用。第六,不同的采样与检验单位工作量权重下,5 合1、10 合1 和20 合1 混采检测技术分别有各自最适用的人群感染率水平。然而,近两年发布的多个混采检测技术规范,均未指明其适用范围,各地在实际工作中无法科学选择使用[6-8]。对此,很有必要修订完善,确保使用混采检测技术时,能根据人群感染率高低和采样与检验的单位工作量权重,正确选用最适宜采样混合数,以最大限度地提高工作效率。
本研究主要采用的是数理分析方法,其中检测效率部分的研究方法和主要研究结果与Robert D[21]对混合血清检测梅毒抗原的研究,Abdalhamid等[9]和Brynildsrud[16]对SARS-CoV-2/COVID-19 混样检测效果研究及陈颖丹等[13]对混合血清检测寄生虫病的效果研究具有一致性,表明该数理分析研究方法用于实践是可行的。然而,上述研究采用实验室检测效率对比分析方法,主要针对的是实验室混样检测工作效率。本研究则是针对混采检测,不仅针对实验室检测工作效率,同时还包括现场采样工作效率。因此,本研究结果有助于制定最佳混采检测策略,提高综合工作效率。
本研究的结果分析及其应用需注意以下几点:首先,从分析原理及计算模型直观看,混采检测的工作效率不受人口规模的影响,但为了满足二项分布的应用条件,需假设人群中个人的感染概率保持均等且恒定,所应用场景的人口规模应足够大。其次,由于传染病具有一定的传染性和聚集性,通常人群中的感染率分布并不均匀,应用时须考虑到这一点,可将人群根据感染率水平细分为亚群进行分析应用。再次,本研究主要以采样和检测工作量(人力成本)变化为指标,评估混采检测的工作效率,并未考虑经济成本和流行病学调查等其他成本权重。采样工作与检测工作的单位工作量成本与单位经济成本存在一定差异,单位检测经济成本权重高于单位采样经济成本权重;如果采样混合数过大,对混采检测阳性管全体人员进行再次单独采样和流行病学调查时,会增加人力成本[22]。因此,对全要素成本—效益综合评估有待进一步研究。最后,本研究假设混采检测与单采单检的检测方法的灵敏度与特异度保持一致,实际上二者可能存在差异,样本混合数过多会增加假阴性的风险,对检测效果会产生一定影响[3,23]。
综上,混采检测能提高采样检测综合工作效率,针对不同感染率的人群,存在提升加权综合工作效率最大化的最适宜采样混合数。本研究为分析评估混采检测工作效率提供了技术方案,为疾病筛查检测工作中针对不同的感染率水平确定能最大化提升综合采样检测工作效率的适宜采样混合数提供了参考。同时,也为开展混采检测综合成本—效益分析提供了研究方法基础。通过研究混采检测综合工作效率最大化和成本投入最小化,可以实现最优的综合成本—效益,从而为进一步优化完善疾病筛查混采检测技术规范提供科学依据。