“信息熵”课程思政教学设计和实践
2024-10-31杨录峰张光晨
摘要:信息熵是信息论中的最重要的概念,各类教材都给出了详细的定义和数学推导,但是由于概念较为抽象,致使许多学生都无法准确理解和应用该部分的教学内容。以“核酸混合检测”从消除新冠病毒携带者的不确定性出发,贯穿课程理论知识的疫情防控案例和典型例题的构建,引导学生利用信息熵的理论知识,指导探究解决问题的方法与技术。理论知识与生活实践的结合,既让学生充分理解信息熵的概念,又可以体会信息论对实践的指导意义。
关键词:信息熵;核酸混合检测;信息论;课程思政
中图分类号:TB文献标识码:Adoi:10.19311/j.cnki.16723198.2024.20.090
0引言
习近平总书记指出:要用好课堂教学这个主渠道,思想政治理论课要坚持在改进中加强,提升思想政治教育亲和力和针对性,满足学生成长发展需求和期待,其他各门课程都要守好一段渠、种好责任田,使各类课程与思想政治理论课同向同行,形成协同效应。2020年5月,教育部印发《高等学校课程思政建设纲要》指出,全面推进高校课程思政建设,发挥好每门课程的育人作用。
信息论与编码是以概率论和随机过程等数学方法研究信息在通信系统中的存储、传输、处理和控制的学科,是信息与计算科学专业的专业核心课程,是数学理论在信息科学中的典型应用,结合信息论与编码的课程内容,以讲好中国故事为主线,将科学探索精神、严于律己精神、爱国精神、科技报国的家国情怀与担当等如盐化水般融入课堂教学,使学生获得专业知识的同时,不断提高思想道德素养,提高服务国家服务人民的社会责任感。最大限度地激发学生自主学习的内在动力。“信息熵”是信息度量的重要概念,是后续内容学习的基础。
从“核酸混合检测”要消除新冠病毒携带者的不确定性,需要获取的信息量出发,设立问题,引出本节内容——信息熵,在解决问题的过程中学习知识,提高学生的参与度和兴趣,培养学生独立思考的能力。利用理论工具指导编码实践。既让学生深刻理解信息的本质,又让学生体会到信息论的使用价值。在教学过程中适当嵌入课程思政要素,在信息论基础专业课程中潜移默化地影响和教育学生。
1课程设计
围绕“疫情防控”这一社会热点,构造案例和典型例题,贯穿本节课程的理论教学。通过回答核酸混合检测的数学原理,展开信息熵的讲解,在理论指导下引导学生探索具体实现方法。既让学生深刻理解信息的本质,又能让学生体会到信息论的使用价值。在专业课程的教学过程中潜移默化地影响和教育学生。
1.1问题提出
根据统计资料,我国的阳性人群的感染率低于01%,通常采用10合1的混合检测技术。
问题1:10合1的核酸检测技术的原理?为什么美国不能使用这种混合检测技术?
问题2:在阳性人群的概率是01%的地区,检测出1名病毒携带者,该事件携带信息量?
问题3:设A地,阳性人群的概率是50%;B地阳性人群的概率是1%。何地的核酸检测(单检)提供的信息量更大?
问题1设立问题,引发学生思考,提示学生可以利用本节学习的知识,得到核酸混检技术的原理,并能够计算出最少的检测次数;问题2,3用于回顾前面的内容-自信息量;并可以得到
pA(阳)=pA(阴)=1bit,pB(阳)=-log001=664bit,pB(阴)=-log099=001bit.
有
pB(阳)>pA(阳),pB(阴)<pA(阴)
可以看出平均一IIjpt8uILSg0V8Yd4vgi6Myk+icm7zUVDoghdx9i0q0=次核酸检测结果能够提供的信息量无法用自信息量刻画,引出本节的内容——信息熵.
1.2熵的定义
定义1:信源空间X为
XP(X)=x1,x2,…,xi,…,xnp(x1),p(x2),…,p(xi),…p(xn)
各离散消息自信息量的数学期望定义为平均自信息量(信息熵)
H(X)=E[I(xi)]=-∑ni=1p(xi)logp(xi)(2.1)
其物理意义为:信息熵H(X)表示信源发出符号之前,确定信源X中每个符号平均需要的信息量;信息熵H(X)表示信源发出符号之后,平均每个符号所携带的信息量;
定义2.信源符号集X和信宿符号集Y中,每对元素xiyj联合自信息量的数学期望定义为联合熵H(XY)
H(XY)=EX,Y[I(xiyj)]=∑ni=1∑mj=1p(xiyj)I(xiyj)=-∑ni=1∑mj=1p(xiyj)logp(xiyj)(2.2)
定义3.信源符号集X,和信宿符号集Y中,条件自信息量I(yj|xi)的数学期望定义为条件熵H(Y|X)
H(Y|X)=EX,Y[I(yj|xi)]=∑ni=1∑mj=1p(xiyj)I(yj|xi)=-∑ni=1∑mj=1p(xiyj)logp(yj|xi)(2.3)
类似地有X相对Y的条件熵H(X|Y)定义为
H(X|Y)=-∑ni=1∑mj=1p(xiyj)logp(xi|yj)
1.3核酸混合检测的原理
为了加强学生对信息熵概念的理解和应用信息熵理论分析解决实际问题,结合核酸检测问题,详细讲解例题。
例1.某地感染阳性的概率0.1%,即1000人中有且只有1人为病毒携带者,假设感染病毒是等概率的,求需要多少支试剂能锁定病毒携带者?
问题分析:设等概率分布的1000人建立信源空间X
XP(X)=x1x2…x10001100011000…11000
利用试剂检测1次,检测结果为阴性或阳性也是等概率的,建立核酸检测结果的信源空间Y
YP(Y)=y0(阳)y1(阴)1212
因此要锁定病毒携带者,需要利用核酸检测获取的信息量要大于等于信源空间X的不确定性即可。
解答:信源X的不确定性
H(X)=-∑ni=1p(xi)logp(xi)=-11000log11000×1000=9.97bit
1支试剂完成检测能够获得的信息量为
H(Y)=-∑1i=0p(yi)logp(yi)=-12log12+12log12=1bit
假设需要k只试剂确定病毒携带者,
k·H(Y)H(X)=9.97
因此至少需要做10支试剂才能够确定病毒携带者,任何想低于这个检测次数的努力都是徒劳的。
问题扩展:利用信息论知识确定了核酸检测次数,如何检测?
方法一:分半混合检测
第一步:每组500人混合,检测其中1组,利用1份试剂可以排除1半阴性人员;
第二步:将阳性组的液体再对半分成两组,利用第2支试剂检测1组,又可以排除1半阴性人员,
反复进行下去,只需要10步,即需要10支试剂。可以解决问题。但是这种检测方法共需要10轮检测,每轮都需要数小时,时间耗费过长。
思考2.1:有没有更好的方法利用10支试剂,1轮即可得到检测结果?
第一步:二进制编码,对待检测人员按0~999进行编号,将数字转化为二进制序列。如表1。
第二步:检测,根据二进制编码的数字进行检测,编码的第几位是数字“1”,就用第几号试剂进行检测,第一号试剂只检测第一位是1的人员。例如第153号检测人员,二进制编码为0001011001,体液分别放入第4,6,7,10号试剂进行检测。
第三步:确认,最后根据试剂的值,锁定阳性人员,例如:试剂显示0010110110(0代表阴性,1代表阳性),则该二进制对应的第182号为病毒携带者。
该方法是最节省试剂,检测最快的方法,但是由于人员组织过于繁琐,通常没有在实际中采用,实际生活中通常采用易于操作的10混1的混合检测方法,只需要110支试剂,即可锁定病毒携带者。
思考2.2:当感染阳性的概率p取什么值时,不能使用10混1的检测方法?
答案为p=0.206可以作为课后思考题,让同学们思考推导。这说明,感染率高的西方国家不能采用这样的混合检测技术。
例3.将A地的核酸检测结果通过有干扰的信道传送到B地,“0”表示阴性,“1”表示阳性,已知A地的检测结果p(0)=14,已知p(0|0)=34,p(0|1)=14,
(1)求由B地阳性结果获得A地阳性结果的信息量?
(2)求A、B两地检测结果不确定性?
(3)根据B地收到的检测结果,求A地检测结果仍然剩余的不确定性?
问题分析:
a)首先让学生分析待求解问题的数学描述,分别计算的是
I(x1;y1),H(XY),H(X|Y)
b)这是典型的信息传输问题,信道输入为A地值,输出为B地收到的结果,如图1所示。
解:经过分析,已知A地的先验概率p(0)=14,p(1)=34,计算条件熵与联合熵,需要先确定联合概率和后验概率。已知的条件概率矩阵
PY|X=p(yj|xi)2×2=3/41/41/43/4
由p(xy)=p(x)p(y|x),可以得到联合概率矩阵
PXY=p(xiyj)2×2=34×1414×1414×3434×34=316116316916
后验概率矩阵
PX|Y=p(xiyj)p(yj)2×2=1211012910
(1)计算的是由Y=y1获得关于X=x1的互信息量,即
I(x1;y1)=logp(x1|y1)p(x1)=log9/103/4=0.263bit
(2)计算XY的联合熵为
H(XY)=-∑ni=1∑mj=1p(xiyj)logp(xiyj)=-316log316×2+116log116+916log916=1.6626bit
(3)计算Y已知时,X的条件熵
H(X|Y)=-∑ni=1∑mj=1p(xiyj)logp(xi|yj)=-316log12×2+116log110+916log910=0.6681bit
或者先计算H(Y),然后利用熵的性质,计算条件熵
H(Y)=-∑1j=0p(yj)logp(yj)=
-38log38+58log58=0.9544bit
H(X|Y)=H(XY)-H(Y)=1.6626-0.9544=0.6681bit
1.4课程思政的设计
在信息熵的理论教学过程中,利用信息熵给出了核酸混合检测技术的理论基础,并且给出了最少检测次数的理论极限值,利用二进制编码(信源编码)方法给出了具体实现的途径,从该案例可以看出,信息论知识对生活实践中的实际问题的解决具有非常重要的指导意义,进而激发学生对信息论强烈的学习兴趣。
传输核酸检测结果的典型例题可以作为一个简单的含干扰的通信系统,准确说明了各种熵的计算依赖于信息传输过程中概率的分布。传输错误的后果(隔离、封城),使学生更好地体会通信系统的本质,信源编码能够提高系统传输的效率,仅仅提高系统的效率,并不能提高通信的效率。还需要利用信道编码能提升通信系统的可靠性,降低信息传输的错误率。培养学生的系统思维和“大局意识”。
2结论
贯穿课程理论知识的疫情防控案例和典型例题的构建,从“核酸混合检测”,要消除新冠病毒携带者的不确定性(即确定病毒携带者),需要获取的信息量出发,引出主要理论内的讲授。
(a)有机融合疫情防控课程思政点的理论教学,将抽象的理论问题学习具象化、生动化,将脱离实际的熵的计算,融入国情、民情,使学生由单纯的知识学习变为问题的解决者,将跟随式学习变为主动式学习,降低了理论学习的枯燥性,提升了学习专业的兴趣。
(b)案例及例题的设计,充分体现了理论对实践的指导意义;树立认真学习的信心。
参考文献
[1]高德毅,宗爱东.从思政课程到课程思政:从战略高度构建高校思想政治教育课程体系[J].中国高等教育,2017,(1):4346.
[2]周荫清.信息论基础(第5版)[M].北京航空航天大学出版社,2020.
[3]朱春华.信息论编码技术(MATLAB实现),清华大学出版社,2020.
[4]董宏杰,张俊梅等.新型冠状病毒混合样品监测研究[J].山东大学学报(医学版),2021,59(4):15.
[5]孙兵,李建楠等.平均互信息量的案例是教学方法研究[J].电气电子教学学报,2022,44(4):7881.
[6]新冠病毒核酸10合1混采检测技术规范[J].中国病毒病杂志,2020,10(5):330332.