基于新型冠状疫情病毒核酸混合检测的数学模型及其意义

2021-03-08陈本晶陈敏娜

新一代信息技术 2021年23期

陈本晶，陈敏娜

(广东环境保护工程职业学院基础部，广东佛山 528216)

0 引言

自2019年12月以来，由新型冠状病毒感染引起的肺炎疫情，已蔓延至全球212个国家和地区。截至2021年7月12日15时07分，数据来自WHO和霍普金斯大学网站[1]，全球新冠肺炎累计确诊187 443 664例，现有确诊27 769 106例，累计死亡4 039 389例，累计治愈155 635 169例。中国大陆自2020年3月21日之后本土确诊较少（http://www.nhc.gov.cn），数据来自国家及各地卫健委每日信息发布，主要为境外输入。2020年在北京，东北，河北，云南局部区域也出现过几十例、几百例确诊的影响公共安全的突发事件，这些地区的中高风险地区，多次实行全员核酸检测，自从2019年末武汉疫情发生以来，“核酸检测”这一医学名词频频出现在普通市民的日常生活里。核酸检测的结果成为判断确诊病例，疑似病例的标准。由于待检人数数量庞大，第三方检测机构采用混合检测模式。混合检测指将多人的样本混合入同一检测管开展检测，降低检测时间和成本，增加核酸检测便利性等。北京市疾病预防控制中心发布《北京市新型冠状病毒核酸混合检测采样、样本处理及结果判定技术指南》（第一版），对之前热议已久的“混样检测”进行了规范[2]。

1 国内外混合检验情况介绍

2020年5月14日开始[3]，19天的时间，武汉累计共有1 090.9万人完成核酸检测，基本做到武汉常驻居民和暂住居民全覆盖，其中有 1/4的采样样本采取了混合检验法。2020年6月11日[4]，北京市报告1例新冠肺炎确诊病例，打破了56天无新增本地确诊病例的状态。6月11日～23日，北京累计报告确诊病例256例。疫情发生后北京市立即对重点人群、重点行业和重点区域实施“应检尽检”，对广大市民实行“愿检尽检”，几天之内完成超过1 100万人次的检测量[4]。从武汉全员核酸检测到北京大规模核酸检测，短短一个月时间，检测效率大幅提高。2020年7月15日[3]，乌鲁木齐发现新冠肺炎确诊病例1例，截至2020年7月24日，乌鲁木齐累计采样230万份，2020年7月22日，大连发现新冠肺炎确诊病例3例，截至7月28日，大连累计采样352.6万份。2020年10月11日，青岛发现新冠肺炎确诊病例3例，截至10月16日，青岛累计采样1 090万份，平均一天200多万份采样。2021年1月30日，针对春节期间大量返乡人员核酸检测的需求[5]，按照卫生健康部门技术条件和标准，受检人员可以自愿选择混合检测，5人混合检测，每人每次30-40元不等；10人混合检测每人每次在15-30元不等。相对于单人单管检测每人次60-150元不等，混合检测既减轻了受检人员的经济负担，也提高了检测机构的效率。2021年5月21日，广州发现新冠肺炎确诊病例1例。2021年6月4日以来[6]，广州陆续启动11个区的全市全员核酸检测，并在6月4日-6日3天时间内累计核酸采样1 869.67万人次。在广州新闻办6月13日召开的广州市疫情防控新闻发布会上，记者获悉，5月21日至6月12日21时，全市累计核酸检测3602.3万例，发现阳性感染者43例，集中在重点区域、重点人群。随着全员检测的落实，病毒的传播途径和规律，感染者的范围正愈加清晰起来。及时隔离，控制传染源，切断传播途径，我们见证了三天检测一个中国一线城市的“广州速度”[7]。此次广州疫情全员核酸检测新冠病毒全部采用混合检测，开始是采用5人样本混合检测，后面数次都是10人样本混合检测，混合检测对于广州进行大规模人群多次快速筛查的重要意义除了提高效率和降低检测成本外，还可以最快速锁定感染者的范围，及时隔离，减少病毒传播途径。

混合检测法最早是在 1943年第二次世界大战期间R.Dorfman为美国公共健康服务和筛选服务系统设计的方法[3]，在二战期间，美国政府在征兵过程中，需要对报名参军的年轻人体检验血，筛查携带淋病病毒的年轻人。什么情况下混合检测法可以减少检测的次数呢？1960年P.Ungar假设所需检测的N个样本有pN个是阳性的，其中0≤p<1，每组可以包含任意多的样本（不再限于5个或者10个），而且每一个样本可以重复使用，在这些假设下，他证明了当少于 38.2%的样本是阳性的时候，混合检测法平均需要的检测次数比逐一检测法需要的检测次数少。1981年黄光明与合作者证明[3][8]：当时，若已知有2/5以上的样本是坏的，则逐一检测法就是最好的。1982年黄光明与堵丁柱证明：当时，若已知有8/21以上的样本是坏的，则逐一检测法就是最好的。1998年底他们证明：若已知有1/2.70951129以上的样本是坏的，则逐一检测法就是最好的。广州的常住人口是 1 800万，而疫情的确诊人数是几十例，密接者和次密接者，高风险区域、中风险区域和涉疫的低风险区域占广州的总人口数量比例较低，非常适合用混合检测。

2 模型假设与建立

模型假设[9]：（1）被检测为阳性的概率p在较短时间内假设为常数，不是变量。（2）检测的样本混合后不会产生化学反应，即性质不发生改变。（3）混合样本检查法的灵敏度较高，如果混合样本中有一份样本是阳性，则混合样本必须是阳性。如果混合样本结果是阴性，则混合样本中每个样本都是阴性。（4）若有N个人的检测样本分别化验，要化验N次。若把N个人检测样本分成若干组，每组K个人的检验样本混在一起。对混合样本进行检测，若是阴性的样本，说明每个人都健康。如果结果为阳性，则需要进行逐个化验，亦即对这K个人共进行K+1次化检，再筛查出患病的和不患病的。那么已知有N个人的样本要化验，K取多少时效率最高？就要建立数学期望模型。

若用随机变量X表示每组中每个人需要的检测次数，则X是离散型随机变量[10-11]，假设每个样本可能被检测为阳性的概率为p，检测为阴性的概率是q=1–p。

易得X的分布律为：

X 1 k 1 1 k+P k k q 1 k q-

这样，随机变量X的数学期望E(X)表示每组中每个人的平均检测次数，且

为了有效降低检测工作量，对给定的q，只要选取每组人数k，使得

即可，而且E(X)的取值越小越好。

同时，对不同的p值，用软件计算得最优k值及对应的数学期望值，见表1。

表1 不同p值对应的最优k值Tab.1 the optimal k values corresponding to different p values

从表1的结果可以看出，若p较大，每组的样本数k应选小。若p较小，每组的样本数k应选大。如p=0.3，每组样本数应为k=3，此时每个人需要的平均检测次数为 0.99，非常接近于 1。这说明混合样本检测与独立检测的效率，成本相当，即便进行混合样本检测也不会减少检测工作量，节省成本。如p=0.01，每组样本数k=11，此时每个人需要的平均检测次数为 0.196。也就是说：如果每组11人（左右），大约可减少80%的检测工作量，这时混合样本检测可以大大减少检测工作量，这就是混合检测的巨大优势。如p=0.001，每组样本数k=32，此时每个人需要的平均检测次数为0.0628，大约可减少94%的检测工作量。中国新冠疫情确诊人数远远低于0.001，密接者和次密接者，高风险区域、中风险区域和涉疫的低风险区域占全国的总人口数量比例较低，我国采用较多的是混合检测每组10人，准确性有保证，效率大幅提高，混合检测意义非凡。对于疫情常态化下防控工作，核酸混合检测对于降低检测成本也具有重要意义。

混合检测模型理论和实践分析表明，当大量的待检测样本中含阳性样本较少时，如果混合检测在敏感性方面与独立检测相当，特异性不受影响[12]，混合检测法比逐一检测法的检测效率要高很多，如高考考生体检验血、新兵入伍复查体检验血等，尤其适用于群体阳性率低且检测样本量大的疾病。混合检测法还可以做基因序列的检测。混合检测模型除了本文介绍的概率模型，组合模型外，还有序贯模型，竞争模型，容错模型等[3]。数学在生活中无处不在，人工智能，大数据时代，数学知识，数学模型，数学算法起重要决定作用。

3 结论

中国将混合检测方法发扬光大，疫情之下，每一次“清零”背后都离不开党中央的高度重视，各级政府部门的有序组织和广大医务工作者们的辛勤付出。下一步防控工作除了继续保持高度的防护意识，还离不开疫苗接种，截至2021年7月12日，全球累计接种34.2亿剂，全球每百人接种43.83剂。中国累计接种 13.8亿剂，中国每百人接种96.05剂[1]。全球疫情仍在蔓延，国内新冠肺炎疫情防控形势依然严峻，境外输入压力依然巨大，巩固来之不易的防控成果，希望早日迎来这场战“疫”的最终胜利。