两种类型的最优查血方案问题及其研究
2022-05-28甘志国
【摘 要】 通过查血来查出给定的n个人中感染了某种病毒的所有人.为了提高检测效率,可采用“k合1检测法”,进而产生两类最优查血方案问题:(1)感染病毒人数已知的最优查血方案问题;(2)感染病毒概率已知的最优查血方案问题.文章提出这两类问题并做细致研究,得到了一些有益的结论.
【关键词】 最优查血方案问题;数学期望;正整数的分拆;最佳咽拭子核酸检测
通过查血来查出给定的n个人中感染了某种病毒的所有人.为了提高检测效率,可采用“k合1检测法”,进而产生两类最优查血方案问题:(1)感染病毒人数已知的最优查血方案问题;(2)感染病毒概率已知的最优查血方案问题.本文详述这两类问题并做细致研究,得到了一些有益的结论.
约定本文中的某人是否感染病毒可通过查血来检测:(1)若查血的结果呈阳性则感染了该病毒,若查血的结果呈阴性则未感染该病毒;(2)把一些人的血液混在一起化验:若结果呈阴性则说明这些人均未感染该病毒,若结果呈阳性则说明这些人中有人感染了该病毒.
定义1 (1)[1](已知正整数的分拆)把n=n1+n2+…+nt(t,n1,n2,…,nt∈N*)叫做已知正整数n的一种分拆(记作τ),其中的n1,n2,…,nt都叫做τ的元素(当有元素相同时也可用乘法记,比如分拆7=1+2+2+2也可记作7=1+2·3,但这里的“2·3”不能改写成“3·2”).本文研究的分拆与元素的顺序无关;
(2)(已知正整数的均分拆)当n1=n2=…=nt时,(1)中的分拆τ(记作分拆τ*)叫做已知正整数n的一种均分拆τ*.定义2 (把血液先分成两份的查血方案)现有k(k∈N*)个人,其中有若干个人感染了某种病毒.为了检测出所有感染了该病毒的人,可这样通过查血来检验:
当k=1时,对这个人查血1次即可.
当k≥2时,先把每个人的血液分成两份,再把这一组所有人的血液各一份混在一起化验.若结果呈阴性,则说明这k个人均未感染该病毒,不需再做检测;若结果呈阳性,则说明这k个人中有人感染了该病毒,再对这k个人的另一份血样逐一化验.
从而可检测出这k个人中所有感染了该病毒的人.本文把这种查血方案叫做“把血液先分成两份的查血方案”.
1 感染病毒人数已知的最优查血方案问题及其研究
定义3 现有n个人,其中恰有λ(λ∈N,n∈N*,λ≤n)个人感染了某种病毒.为了通过查血检测出这n个人中感染了该病毒的λ个人,先把这n个人分成t组,各组人数分别是n1,n2,…,nt(t,n1,n2,…,nt∈N*)(即n=n1+n2+…+nt是n的一种分拆τ),对各组的人分别按照定义2查血,记总查血次数是ξτ(一般来说,λ个感染了某种病毒的人在各组的人中是随机出现的,因而ξτ是随机变量),再记ξτ的数学期望是En-λ(ξτ).对于n的所有分拆τ,当En-λ(ξτ)最小时,τ叫做n关于λ的最优分拆,记作τn-λ.
问题1 (感染病毒人数已知的最优查血方案问题)在定义3中,对于已知的n与λ,求τn-λ.
彻底解决问题1难度较大,下面的定理1与定理2是其部分答案.囿于篇幅,本文只证明了2,4,6.
定理1 τn-0=n,τn-n=1·n.
定理2 τ4-1=1+1+2;τ6-2=1·6.
证明 下面只证τ6-2=1·6.6的分拆共有10种情形,分别论述如下:
(1)τ1:6=1·6.可得总检测次数ξτ1=6,因而数学期望E6-2(ξτ1)=6.
(2)τ2:6=1·4+2.若2名感染病毒者在一組(即在“2”的一组),可得总检测次数ξτ2=5+2=7,且P(ξτ2=7)=2·16·5=115(理由:把并排的6个位置从左到右依次编号为1;2;3;4;5,6(并分成这5组).把两名感染病毒者放在6个位置中的两个位置上有6·5种放法.两名感染病毒者满足题设的放法是2·1种);若2名感染病毒者不在一组:若在“1,1”的两组,可得ξτ2=5,且P(ξτ2=5)=4·36·5=25;若在“1,2”的两组,可得ξτ2=5+2=7,且P(ξτ2=7)=4·2+2·46·5=815.所以E(ξτ2)=115+815·7+25·5=615.
(3)τ3:6=1·3+3.可求得E(ξτ3)=15+35·7+15·4=625.
(4)τ4:6=1+1+4.可求得E(ξτ4)=25+815·7+115·3=61115.
(5)τ5:6=1+1+2+2.可求得E(ξτ5)=215+815·6+115·4+415·8=625.
(6)τ6:6=1+5.若2名感染病毒者在一组或不在一组,均可得总检测次数ξτ6=2+5=7,所以E(ξτ6)=7.
(7)τ7:6=1+2+3.可求得E(ξτ7)=115+215·5+15+15·6+25·8=635.
(8)τ8:6=2·3.由后文的定理8(1)可得E(ξτ8)=635.
(9)τ9:6=2+4.可求得E(ξτ9)=115·4+25·6+815·8=61415.
(10)τ10:6=3+3.由后文的定理8(1)可得E(ξτ10)=645.
综上所述,可得欲证结论成立.
题1 (2021年高考数学北京卷第18题)为提高新冠肺炎病毒检测的效率,某检测机构采取“k合1检测法”,即将k个人的拭子样本合并检测,若结果为阴性,则可以确定所有样本都是阴性的,若结果为阳性,则还需要对本组的每个人再做检测.现有100人,已知其中2人感染了新冠肺炎病毒.
(1)①若采用“10合1检测法”,且已知两名患者在同一组,求总检测次数;
②已知每10人分成一组,共分成10组,两名感染患者在同一组的概率为111,定义随机变量X为总检测次数,求X的分布列和数学期望E(X);
(2)若采用“5合1检测法”,总检测次数Y的期望为E(Y),试比较第②小问中的E(X)与E(Y)的大小(直接写出结果).
笔者由这道高考题提出了下面的问题2.
定义4 现有n个人,其中恰有λ(λ∈N,n∈N*,λ≤n)个人感染了某种病毒.为了通过查血检测出这n个人中感染了该病毒的λ个人,先把这n个人均分成nk(k是n的正约数)组,各组人数均是k(即n=k·nk是n的一种均分拆τ*),对各组的人分别按照定义2查血,记总查血次数是随机变量Xk,再记Xk的数学期望是En-λ(Xk).对于n的所有均分拆τ*,当En-λ(Xk)最小时,τ*叫做n关于λ的最优分拆,此时记k=Gλ(n).
问题2 (感染了某种病毒人数已知的“k合1检测法”最优查血方案问题)在定义4中,对于已知的n与λ,求En-λ(Xk)及Gλ(n).
彻底解决问题2难度也不小,下面的定理3-9及推论1-5是其部分答案.
定理3 (1)若n是质数且λ∈N*,则En-λ(Xk)=n,k=1,n+1,k=n,Gλ(n)=1;
(2)En-0(Xk)=Xk=nk,G0(n)=n;
(3)En-n(Xk)=n,k=1,k+1kn,k是n的非1正约数,Gn(n)=1.
定理4 (1)(ⅰ)当n=1时,En-1(Xk)=E1-1(X1)=X1=1;
(ⅱ)當n≥2时,En-1(Xk)=Xk=n,k=1,k+nk,k是n的非1正约数;
(2)(ⅰ)当n=1,2,3时,G1(n)=1;当n=4时,G1(n)=1,2;
(ⅱ)当n≥5时,若n是n的正约数(即n是完全平方数),则G1(n)=n;若n不是n的正约数,则G1(n)是n的小于n的最大正约数l或n的大于n的最小正约数m(可得En-1(Xk)min=min{En-1(Xl),En-1(Xm)}.当En-1(Xl)<En-1(Xm)时,G1(n)=l;当En-1(Xl)>En-1(Xm)时,G1(n)=m;当En-1(Xl)=En-1(Xm)时,G1(n)=l,m).
证明 只证(2)(ⅱ):由f(x)=x+nx(2≤x≤n)在[2,n],[n,n]上分别是减函数、增函数及n>f(2),可得欲证结论成立.
定理5 (1)当n=1时,En-(n-1)(Xk)=E1-0(X1)=1;当n≥2时,En-(n-1)(Xk)=Xk=n,k=1,n+nk,k是n的非1正约数;
(2)Gn-1(n)=1.
定理6 (1)当n=2时,En-(n-2)(Xk)=E2-0(Xk)=Xk=2k(k=1,2),Gn-2(n)=G0(2)=2;
(2)当n是奇数且n≥3时,En-(n-2)(Xk)=Xk=n,k=1,n+nk,k是n的非1正约数;
(3)当n是偶数且n≥4时,En-(n-2)(Xk)=n,k=1,3n2-3n-42(n-1),k=2,k+1kn,k是n的正约数且k≠1,2;
(4)当n=3时,Gn-2(n)=G1(3)=1;当n≥4时,Gn-2(n)=1.
证明 下面只证(3)中k≠1的情形.
(ⅰ)当k=2时(由n≥4,可得组数n2≥2):若两名感染病毒者在同一组,可得Xk=n2+(n-2)=32n-2,且PXk=32n-2=n·1n(n-1)=1n-1(理由:把并排的n个位置从左到右依次编号为1,2,3,…,n,其中1,2号组成第1组,3,4号组成第2组,…,第n-1,n号组成第n2组.把两名感染病毒者放在n个位置中的两个位置上有n(n-1)种放法.两名感染病毒者满足题设的放法是:第一名感染病毒者可放在以上n个位置中的任一个位置,第二名感染病毒者与第一名感染病毒者在同一组,只有1种放法,所以共有n·1种放法);若两名感染病毒者不在同一组,可得Xk=n2+n=32n,且PXk=32n=n(n-2)n(n-1)=n-2n-1.所以
En-(n-2)(Xk)=En-(n-2)(X2)=1n-1·32n-2+n-2n-1·32n=3n2-3n-42(n-1).
(ⅱ)当3≤k<n时(可得nk>1即组数nk≥2),当两名感染病毒者在同一组或不在同一组时,均可得Xk=nk+n=k+1kn.
(ⅲ)当k=n时,可得En-(n-2)(Xk)=En-(n-2)(Xn)=n+1=k+1kn.
进而可得欲证结论成立.
定理7 (1)当n=3时,En-(n-3)(Xk)=E3-0(Xk)=Xk=3k(k=1,3),Gn-3(n)=G0(3)=3;
(2)当n是奇数且不是3的倍数且n≥5时,En-(n-3)(Xk)=n,k=1,k+1kn,k是n的非1正约数;
(3)当n是偶数且不是3的倍数且n≥4时,En-(n-3)(Xk)=n,k=1,3n2-3n-122(n-1),k=2,k+1kn,k是n的正约数且k≠1,2;
(4)当n是奇数且是3的倍数且n≥9时,En-(n-3)(Xk)=n,k=1,4n3-12n2+8n-183(n-1)(n-2),k=3,k+1kn,k是n的正约数且k≠1,3;
(5)当n是6的倍数时,En-(n-3)(Xk)=n,k=1,3n2-3n-122(n-1),k=2,4n3-12n2+8n-183(n-1)(n-2),k=3,k+1kn,k是n的正约数且k≠1,2,3;
(6)当n=4时,G1(4)=1,2;当n≥5时,Gn-3(n)=1.
定理8 (1)En-2(Xk)=n,k=1,1n-1n(n-1)k+(2n-1)k-k2,k是n的非1正约数;
(2)(ⅰ)当n=2,3,4,5,6,7时,G2(n)=1;
(ⅱ)当n≥8时(可证得函数g(x)=2x3-(2n-1)x2+n(n-1)(2<x<n)有唯一零点,设为x0),若x0是n的正约数,则G2(n)=x0;若x0不是n的正约数,则G2(n)是n的小于x0的最大正约数l或n的大于x0的最小正约数m(可得En-2(Xk)min=min{En-2(Xl),En-2(Xm)}.当En-2(Xl)<En-2(Xm)时,G2(n)=l;当En-2(Xl)>En-2(Xm)时,G2(n)=m;当En-2(Xl)=En-2(Xm)时,G2(n)=l,m).
推论1 当n=22时,G2(n)=1;当n=pα(α∈N*,p是质数)且n≠22时,G2(n)=pα2(其中[x]表示不超过实数x的最大整数,下同).推论2 (1)当n=pq(pq>6,p<q,p,q均是质数)时,G2(n)=p;
(2)当n=pq2(p<q,p,q均是质数)时,G2(n)=q;
(3)当n=p2q(p<q,p,q均是质数)时,G2(n)=min{p2,q};
(4)当n=p2q2(p<q,p,q均是质数)时,G2(n)=p2,q(2p3q+1)>p(pq3+pq+p2+1),pq,q(2p3q+1)<p(pq3+pq+p2+1)(由質数p<q,可得q(2p3q+1)≠p(pq3+pq+p2+1)).特别地,当q>2p时,G2(n)=pq.注 在推论2(4)中,还可证得En-2(Xp2)<En-2(Xp),En-2(Xp2)<En-2(Xq2).
定理9 (1)En-3(Xk)=n,k=1,1(n-1)(n-2)[k3+(3-3n)k2+(3n2-6n+2)k+n3-3n2+2nk],k是n的非1正约数;
(2)(ⅰ)当n=3,4,5,6,7,8,9,10时,G2(n)=1;
(ⅱ)当n≥11时(可证得函数g(x)=3x4+(6-6n)x3+(3n2-6n+2)x2-n3+3n2-2n(2<x<n)有唯一零点,设为x0),若x0是n的正约数,则G3(n)=x0;若x0不是n的正约数,则G3(n)是n的小于x0的最大正约数l或n的大于x0的最小正约数m(可得En-3(Xk)min=min{En-3(Xl),En-3(Xm)}.当En-3(Xl)<En-3(Xm)时,G3(n)=l;当En-3(Xl)>En-3(Xm)时,G3(n)=m;当En-3(Xl)=En-3(Xm)时,G3(n)=l,m).
下面的推论3(用定理9可证)给出了关于G3(pα)(α∈N*,p是质数)的完整结论.
推论3 (1)当n=4,8,9时,G3(n)=1;
(2)当n=2α(α-3∈N*)时,G3(n)=2α-12;
(3)当n=pα(α∈N*,p≥3,p是质数)且n≠32时,G3(n)=pα2.
推论4 当n=pq(pq≥14,p<q,p,q均是质数)时,G3(n)=p.
推论5 G0(100)=100,Gi(100)=10(i=1,2),G3(100)=5,Gj(100)=1(j=97,98,99,100).
2 感染病毒概率已知的最优查血方案问题及其研究
定义5 现有n(n∈N*)个人,其中每个人感染某种病毒的概率均是1-p(0<p<1).为了通过查血检测出这n个人中所有感染该病毒的人,先把这n个人分成t组,各组人数分别是n1,n2,…,nt(t,n1,n2,…,nt∈N*)(即n=n1+n2+…+nt是n的一种分拆τ),对各组人分别按照定义2查血,记总查血次数是随机变量ητ,再记ητ的数学期望是En,p(ητ).对于n的所有分拆τ,当En,p(ητ)最小时,τ叫做n关于p的最优分拆,记作τn,p.
问题3 (感染病毒概率已知的最优查血方案问题)在定义5中,对于已知的n与p,求τn,p.彻底解决问题3难度也较大,下面的定理12是其部分答案.
定理10[1] 现有k(k∈N*)个人,其中每个人感染了某种病毒的概率均是1-p(0<p<1).若按照定义2查血,则每个人的平均查血次数是
Pp(k)=1,k=1,1-pk+1k,k∈N且k≥2.①
由定理10,可得问题3等价于[1]下面的问题3′:
问题3′ 在定义5中,对于已知的n与p,设n=n1+n2+…+nt(t,n1,n2,…,nt∈N*)是n的一种分拆τ),可得相应的总查血次数的数学期望是En,p(ητ)=n1Pp(n1)+n2Pp(n2)+…+ntPp(nt).对于n的所有分拆τ,当En,p(ητ)最小时,求出相应的分拆τ(记作τn,p).
定理11[1] (最优分拆的性质)若n=n1+n2+…+nt(t,n1,n2,…,nt∈N*)是n关于p的一种最优分拆,则在n1,n2,…,nt中随意取出若干个元素ni1,ni2,…,nij(设其和为m),则m=ni1+ni2+…+nij是m关于p的一种最优分拆.
定理12 (即文[1]定理1)正整数n关于0.1的最优分拆分别是(其中m∈N*):1=1,2=2,3=3;4m=4·m;4m+1=4·(m-1)+5;4m+2=4·(m-1)+3·2;4m+3=4·m+3.
定义6 现有n(n∈N*)个人,其中每个人感染了某种病毒的概率均是1-p(0<p<1).为了通过查血检测出这n个人中所有感染了该病毒的人,先把这n个人均分成nk(k是n的正约数)组,各组人数均是k(即n=k·nk是n的一种均分拆τ*),对各组的人分别按照定义2查血,记总查血次数是随机变量ητ*,再记ητ*的数学期望是En,p(ητ*).对于n的所有均分拆τ*,当En,p(ητ*)最小时,τ*叫做n关于p的最优均分拆,此时记k=gp(n).
问题4 (感染病毒概率已知的“k合1检测法”最优查血方案问题)在定义6中,对于已知的n与p,求gp(n).
由定理10,可得
定理13 在定义6中,对于已知的n与p,问题4的答案gp(n)即函数
Pp(k)=1,k=1,1-pk+1k,k是n的非1正约数.②
取到最小值时k的值.
定理14 (即文[2]的推论)对于函数①,有
(1)当0<p≤e-4e2=0.5819…时,当且仅当k=1时函数Pp(k)取到最小值,且最小值是Pp(1)=1(当k∈N且k≥2时Pp(k)的值随k的增加而减少);
(2)当0.5819…=e-4e2<p<1时(可证得方程x2pxlnp+1=0在区间2,-2lnp,-2lnp,+∞上均有唯一实根,分别记为x1(p),x2(p)),Pp(2)>Pp(3)>…>Pp([x1(p)]),Pp([x1(p)]+1)<Pp([x1(p)]+2)<…<Pp([x2(p)]),
Pp([x2(p)]+1)>Pp([x2(p)]+2)>Pp([x2(p)]+3)>…>1=Pp(1)(所以由已知的p可得函数Pp(k)的最小值存在,且最小值只可能在k=1或[x1(p)]或[x1(p)]+1时取到,最小值是min{1,Pp([x1(p)]),Pp([x1(p)]+1)}).
推论6 对于函数②,有
(1)当0<p≤e-4e2=0.5819…时,当且仅当k=1时函数Pp(k)取到最小值,且最小值是Pp(1)=1(当k是n的非1正约数时Pp(k)的值随k的增加而减少);
(2)当0.5819…=e-4e2<p<1时(可证得关于x的方程x2pxlnp+1=02<x<-2lnp有唯一实根,记为x1(p)),若x1(p)是n的正约数,则由已知的n,p可得函数Pp(k)的最小值存在,且最小值只可能在k=1或x1(p)时取到,最小值是min{1,Pp(x1(p))
};若x1(p)不是n的正约数,则由已知的n,p可得函数Pp(k)的最小值存在,且最小值只可能在k=1、或n的小于x1(p)的最大正约数l、或n的大于x1(p)的最小正约数m时取到,最小值是min{1,Pp(l),Pp(m)}.
注 定理13与推论6给出了问题4的答案.当n很大时,考虑题设“k是n的正约数”意义不大,因此定理14也给出了问题4的答案.
题2 (1)(ⅰ)(文[2]的例1)求函數P0.9(k)的最小值;(ⅱ)求g0.9(90);
(2)(ⅰ)(文[2]的例2)求函数P0.6(k)的最小值;(ⅱ)求g0.6(100);
(3)(ⅰ)(文[2]的例3)求函数P0.9999(k)的最小值;(ⅱ)求g0.9999(150).
解 (1)(ⅰ)由定理14(2)可求得方程0.9xx2ln0.9+1=02<x<-2ln0.9有唯一解x1(0.9),且3<x1(0.9)<4.
进而可得当且仅当k=4时P0.9(k)取到最小值,且最小值是P0.9(4)=0.5939.
(ⅱ)由推论6(2),可求得g0.9(90)=3.
(2)(ⅰ)由定理14(2)可求得方程0.6xx2ln0.6+1=02<x<-2ln0.6有唯一解x1(0.6),且3<x1(0.6)<4.
进而可得当且仅当k=1时P0.6(k)取到最小值,且最小值是P0.6(1)=1.
(ⅱ)由推论6(2),可求得g0.6(100)=1.
(3)(ⅰ)由定理14(2)可求得方程0.9999xx2ln0.9999+1=02<x<-2ln0.9999有唯一解x1(0.9999),且100<x1(0.9999)<101.
进而可得当且仅当k=100时P0.9999(k)取到最小值,且最小值是P0.9999(100)=1.01-0.9999100=0.019950661…
(ⅱ)由推论6(2),可求得g0.9999(150)=75.3 两个广义最优查血方案问题
问题5 (广义感染病毒人数已知的最优查血方案问题)现有n个人,其中恰有λ(λ∈N,n∈N*;λ≤n)个人感染了某种病毒.为了通过查血检测出这n个人中感染了该病毒的λ个人,先把这n个人分成若干组(每组至少1人),再查出每组中所有感染了该病毒的人,这种查法是:先把每个人的血液分成足够的份数,再把这一组所有人(设人数是k)的血样各一份混在一起进行检测,若结果呈阴性,则说明这k个人均未感染该病毒,不需再做检测;若结果呈阳性,则说明这k个人中有人感染了该病毒,对这k个人的血样还需再进行检测:又可把这一组k个人的血样分成若干个小组(每个小组至少1人),……请设计一种查血方案,使总查血次数最少.问题6 (广义感染病毒概率已知的最优查血方案问题)现有n(n∈N*)个人,其中每个人感染了某种病毒的概率均是1-p(0<p<1).为了通过查血检测出这n个人中所有感染了该病毒的人,先把这n个人分成若干组(每组至少1人),再查出每组中所有感染了该病毒的人,这种查法是:先把每个人的血液分成足够的份数,再把这一组所有人(设人数是k)的血样各一份混在一起进行检测,若结果呈阴性,则说明这k个人均未感染该病毒,不需再做检测;若结果呈阳性,则说明这k个人中有人感染了该病毒,对这k个人的血样还需再进行检测:又可把这一组k个人的血样分成若干个小组(每个小组至少1人),……请设计一种查血方案,使总查血次数最少.
参考文献
[1] 甘志国.最佳查血方案问题[J].数学通讯,2005(05):29-31.
[2] 甘志国.全区居民作咽拭子核酸检测时几人一组合适[J].中学数学杂志,2021(03):32-34.
作者简介 甘志国(1971— ),男,笔名甘喆;1988年参加教育工作,钻研教法与学法,提倡并关注学生运算能力的培养.总结提出并践行“懂、会、熟、巧、通”五步解题学习法,“思、探、练、变、提”五步解题教学法,“知、懂、熟、用、赏”五种解题境界及高中数学教学的四个关键词“夯实基础、激发兴趣、着眼高考、适当提高”,倡导教师要做明师;出版著作多部;发表文章多篇.