APP下载

概率论与数理统计教学案例研究

2022-05-07臧鸿雁张志刚

大学数学 2022年2期
关键词:数理统计概率论加密算法

臧鸿雁, 刘 林, 张志刚

(北京科技大学 数理学院,北京100083)

1 引 言

随着大数据时代的来临,统计学的思想方法越来越多地渗透到自然科学和社会科学的各个领域,成为这些领域解决实际问题的强有力的工具.概率论与数理统计课程中涉及到的概念、理论和方法是统计学的基础.提升概率论与数理统计课程的教学质量,对提升高校人才培养质量有着十分重要的作用.各高等院校的数学工作者积极探索概率论与数理统计课程的教学改革方法[1-3].

概率论与数理统计课程是一门实用性很强的课程,其应用领域十分广泛,将概率论与数理统计的知识点与实际问题相结合做成的教学案例,对激发学生学习兴趣,更好掌握本课程教学知识点,培养学生用概率统计知识解决实际问题的思维方式都起到了十分重要的作用.关于概率论与数理统计教学案例的研究已经引起数学教育工作者的广泛关注[4-6].

概率论与数理统计教学案例从内容方面看,可以分成通用型案例和专业型案例两种.其中通用型案例是所有专业的学生都可以使用的,比如抽奖问题,彩票问题,扑克牌中的概率问题,赌金分配,三门问题,成绩评定,风险分析,保险问题等.而专业型案例通常是与学生专业相关性较强的案例,比如通信相关专业的译码规则的选取,信息安全专业关于加密方案的安全性分析指标;管理等专业的决策问题,经济学等专业的投资组合问题等.

文章针对新冠筛查问题和图像加密中安全性指标问题,给出了一个通用型教学案例和一个专业型教学案例.关于新冠筛查问题,文献[7]以武汉市全民新冠肺炎核酸检测方法为例,阐述了数学期望在新冠筛查中的应用.文章针对这一问题进行了进一步的分析和数值模拟,通过问题描述、问题分析、建模求解、问题引申、数值模拟等步骤将新冠筛查问题做成适合各专业使用的通用型教学案例.

2 通用型案例举例——概率分布及数学期望在新冠筛查中的应用

2.1 问题描述

在新冠的排查中需要进行某种检验,比如咽拭子的检验,来排查每个人是否被感染,假设现有N个人参加检验,针对如下两种检验方案:

(i)每个人逐一检验.这种方案对应的检验次数自然是N次;

(ii)分组检验.将k个人的采样混合一起检验,如果检验结果为阴性,则只需要检验1次.如果检验结果为阳性,则再对k个人的采样重新逐个检验,此时需要的检验次数为为k+1.

问题是上述两种方案哪一种方案更优?

2.2 解决问题的思路及方法

思路将方案(ii)的平均检测次数与方案(i)的平均检测次数N作比较.

假设条件每个人呈阳性的概率为p;每个人的检验结果是相互独立的.

方法不妨设N是k的倍数,共分成N/k组,设第i组需要的检验次数为随机变量Xi,则Xi的取值有两个,1或者k+1,进一步容易得到Xi的分布律如下:

Xi1k+1pk(1-p)k1-(1-p)k

则Xi的数学期望为

E(Xi)=(1-p)k+(k+1)(1-(1-p)k)=(k+1)-k(1-p)k.

2.3 问题引申

(a)p=0.1 (b)p=0.2

进一步研究,固定检测人数N,比如N= 150,可以画出平均检测次数E(Z)与分组人数k和人群中的阳性率p之间关系的曲面图,如图2(a)所示.若确定p= 0.15,用p= 0.15截曲面得到的截线为图2(b).从图2(b)可以看出,当N= 150,p= 0.15时,最佳的分组人数为3人.类似可以研究,针对不同的N和p,计算出相应的最佳分组人数.这为分组检测问题提供一定的理论依据.

(a)曲面图 (b)p = 0.15时的截线图

3 专业型案例举例——相关系数和信息熵在信息安全领域的应用研究

3.1 问题描述

该案例适用于信息安全专业.在信息安全领域,信息加密是很重要的研究领域.而在信息加密中,图像加密是其中重要的研究方向.对于图像来讲,其显著的特征是相邻像素之间的相关性较强,如果加密后的密文相邻像素之间相关性仍然较强,这将会被攻击方利用,从而达到破解的目的.在度量一个加密算法安全性的时候,我们希望密文相邻像素的相关性近可能地小.另外,香农对加密算法提出了“混淆”和“扩散”的基本原则,从信息论的角度来讲,密文的熵越大,其像素分布越均匀,不确定性越强,其破解的难度也越大.那么就产生如下两个问题:

(i)如何度量明文图像和密文图像相邻像素的相关性?

(ii)如何度量密文的不确定性的程度呢?

这两个问题的答案,将为我们对加密算法的安全性度量提供一定的标准.

3.2 加密算法及加密试验

文章采用文献[8]中的加密算法,在加密试验中,选取明文为256×256的LENA图像,如图3(a)所示,加密图像和解密图像分别见图3(b)和图3(c).

(a)原图像 (b)密文图像 (c)解密图像

由图3直观地看,原明文图像相邻像素相关性很强,而加密后的密文图像相邻像素相关性明显变弱了,那如何严格度量这个量呢?可以由相关系数严格描述.

3.3 图像相邻像素相关性

可以用概率论与数理统计中相关系数的概念定量刻画图像相邻像素点的相关性.而相邻像素考虑水平、垂直、对角三种方向.以下对Lena图像加密前后的三种方向上的相邻像素点的相关性进行分析.从图像中随机选2000个像素点,用下列公式计算相邻像素之间的相关系数.

一般来说图像相邻两个像素点之间像素值呈现高度相关的特点,图4(a),4(b),4(c)显示相邻的两个元素之间呈现出很强的线性相关性;而加密图像的相关程度越低表示加密效果越好,由图4(d),4(e),4(f)可以得出,相邻元素之间的相关性很弱,计算得到的相关系数几乎接近0.

图4

3.4 统计直方图和密文熵分析

图5(a)、图5(b)分别给出了Lena原图像和加密后密文图像的像素值统计直方图,由图5(a)可知,原图像的像素分布明显不均匀;而图5(b)显示,加密后密文图像的像素值的分布比较均匀.

(a)原图像统计直方图 (b)密文图像统计直方图

统计直方图的描述比较直观和定性,那如何定量地度量图像的像素值分布的均匀程度呢?Shannon以概率统计为基础提出了信息熵的概念[9],可以用来度量一个信源均匀分布程度,如果一个离散型随机变量X,其分布律为p(X=xi)=p(xi)i=1,2,…n,X的信息熵定义为

对于一个图像来讲,p(xi)表示图像像素中的各像素值的频率.

可以用密文的信息熵来度量密文像素值分布的均匀程度.若像素值为等概率分布时,信息熵取得最大值为8 bit.该加密算法得到的密文熵值为7.9969,具有较好的均匀性.密文的熵值越大,说明加密后图像灰度分布越均匀,加密算法能抵抗统计攻击的能力越强,信息熵能够成为度量加密算法安全性的一个重要指标.

4 学生反馈

关于以上两个案例的内容学生是否能够理解,教学案例对理解概念和概念的应用场景是否有帮助这样两个问题,对北京科技大学2019级车辆专业和物流专业的同学做了如下调查问卷,回收答卷62份,结果见图6.

(a)案例1内容是否能理解 (b)案例1对理解数学期望概念及应用场景是否有帮助

这两个教学案例上课并没有讲解,只是以拓展阅读的方式让同学们了解.由图6可见,对于案例1,有32.26%的同学理解程度一般,并未达到基本理解的程度,但在案例1对理解数学期望概念及应用场景是否有帮助的选项上,仍有95.16%的同学选择很有帮助或者较有帮助,也就是说很多同学并没与完全理解案例内容,但仍然很认可案例教学给自己带来的帮助.可见,学生对知识拓展有比较强烈的需求.

5 结 论

文章给出了概率论与数理统计的两个教学案例.两个案例用到的概率论与数理统计知识点包括离散型随机变量的分布律,数学期望,两个随机变量的相关系数,统计直方图,均匀分布,基于概率论与数理统计基本知识引申到信息熵的概念,以及用信息熵度量均匀分布的程度.这两个案例通俗易懂,实用性强,案例一是适用于所有专业的通用型案例,案例二是适用于信息安全专业的专业型案例.在实际教学中,可以课堂上作为知识点的引申讲解,也可以将问题作为开放性作业留给学生完成,或者作为拓展阅读,增加知识的高阶性和挑战度.

致谢作者非常感谢相关文献对本文的启发以及审稿专家提出的宝贵意见.

猜你喜欢

数理统计概率论加密算法
线上线下混合教学模式在概率论与数理统计课程中的应用
基于DES加密算法的改进研究
数学实验在概率论与数理统计中的教学应用
DES加密算法的实现
基于整数矩阵乘法的图像加密算法
基于数理统计方法的发动机关键零部件加工误差统计分析系统
概率论方法在高等数学解题中的应用
基于小波变换和混沌映射的图像加密算法
论《概率论与数理统计》教学改革与学生应用能力的培养