概率计算中数据思维的应用
2024-02-28陈寿文
陈寿文
概率计算中数据思维的应用
陈寿文
(滁州学院 数学与金融学院,安徽 滁州 239000)
概率计算是概率统计理论的重要组成部分.针对传统概率统计教学重知识传授轻数据思维引导现象,阐述了古典模型、全概率、独立和事件、小概率事件、条件概率和几何模型等概率计算中如何应用数据思维进行分析.教学实践表明,运用数据思维的整体性、量化性、互联性、价值性、动态性和图像化等特征来计算概率,可以降低概率计算的复杂度,有利于理解随机试验过程和发现概率潜藏价值,还能够促进学生数据思维意识形成和数据分析技能提升.
概率计算;数据思维;课程教学
概率统计是推动数据科学与大数据技术发展的主干学科.概率计算是概率统计理论的重要组成部分.数据驱动价值和数据思维成为大数据时代人们思考问题、解决问题的重要手段[1].传统的概率统计教学过程往往只关注理论传授和学生逻辑思维能力的培养,而忽视了内容的实际应用以及学生数据思维的训练,致使学生尽管掌握大量的定义、定理和公式,在问题分析求解中却不会运用[2],理论与实践脱节,影响了实际教学效果和人才培养质量.本文运用数据思维对古典模型、全概率、独立和事件、小概率事件、条件概率和几何模型等概率计算进行教学探讨,以期培育学生数据思维意识和数据分析技能.
1 概率计算方法与数据思维
概率计算需要不断探索和实践,理解事件的概率模型有助于求解概率问题.概率计算主要包括古典模型、几何模型、全概率和条件概率的相关计算.古典模型的概率(古典概率)计算可分三步:确定所研究的对象为古典模型、计算样本点数以及利用公式计算概率[3];几何模型的概率(几何概率)是一种“无限等可能”的概率模型,可借助几何图形(线段长度等)的测度计算概率[4];利用全概率公式可求得复杂事件的概率,关键在于找到适当的完备事件组对样本空间进行分割[5];条件概率利用在已知信息限定的条件下研究事件发生的可能性,由它可推出全概率公式和贝叶斯公式.
数据思维是一种基于多源异构和跨域关联的海量数据分析产生的数据价值挖掘思维,是收集、生产、处理数据,发现数据价值,并用数据来观察世界、思考问题、分析问题、解决问题的一种量化思维模式,呈现出整体性、量化性、互联性、价值性、动态性和图像化等特征.一方面,运用数据思维特征计算概率,利于降低概率计算的复杂度;另一方面,计算概率过程中有意识地培养数据敏感度,发现数据的隐藏信息,利于促进数据思维的形成.
2 概率计算中数据思维的应用
为了引导学生用数据思维解决概率计算问题,提升其专业素养和数据分析能力,列举以下计算情形.
2.1 古典概率计算中利用数据思维的整体性特征
数据思维主要特征为整体性.穷举古典模型随机试验所有结果,将其作为整体,统计所关注试验结果中包含的样本个数,利用公式即可计算概率.
例1 彩票36选6+1方案:不考虑号码顺序,从号码1~36中选出6个基本号,再从剩下的30个号码中选出1个特别号,各个奖项的号码分布及其奖金见表1.计算中奖概率并判断购买彩票的收益情况.
表1 彩票36选6+1方案的奖项及其概率分布
2.2 全概率计算中利用数据思维的量化性特征
数据思维表现出量化性特征.量化是具体或明确目标的一种表达,是解释客观世界的一种有效方式.其中,概率树图[6]是一种描述随机试验过程的工具.
例2 有两只碗,碗1中装有5粒绿豆和3粒红豆,碗2中绿豆和红豆数量分别为1粒和4粒.试验中,先从两碗中随机抽取一只,接着在该碗中任意抽取一粒豆,试求取得绿豆和红豆的概率.
图1 概率树
从数据可视化角度来看,利用概率树图展示随机试验的数据特征,增强了试验过程的可理解性,数形合一,较传统的计算概率方法,降低了计算难度.
2.3 独立和事件概率计算中利用数据思维的互联性特征
数据思维的互联性源于事物泛在的相关关系.运用互联思维可以发现不同事物之间的关联,同样在概率计算中,也可以运用互联思维来挖掘概率潜藏规则.
例3 “三个臭皮匠,赛过诸葛亮”的数量化解释.
表2 五种情形下的数量化解释
2.4 小概率事件概率计算中体会数据驱动决策的价值性
数据思维具有价值化特征,发掘数据潜藏价值是数据思维的本质,体现着大数据发展的直接目的.运用数据思维,能够高效地处理数据分析任务,并对事件做出概率性的分析结果和预测.通过计算概率,基于“小概率事件在一次试验中一般是不可能发生的”小概率事件原理来做推断,启发了人们的数据思维及思考模式.在对数据进行收集、整理和分析后,从中获得洞察力,基于数据驱动决策,以支持决策具有更高的准确性,这体现着数据思维的价值性特点.
例4 大学英语四级考试包括听力、语法结构、阅读理解、综合填空、写作等,其中85分为单项选择题,写作15分.少数学生认为碰运气有可能猜对选择题.试从概率角度考察靠运气能否通过英语四级考试.
分析 小概率事件原理是概率论中利用概率进行统计推断的理论基石.单选题作答时从四个选项中随机挑选一项,通过计算答题结果中不同答对数量发生的可能性大小,结合小概率事件原理来做推断.
function t = tongguolv()
t=0;
for k=51:85
t = t + nchoosek(85,k)*0.25^k*0.75^(85-k);
end
sprintf('t=%f ',t);
end
2.5 条件概率计算中运用动态思维发现数据价值
数据思维摆脱了静态思维的束缚,从动态视角来认识数据的价值.结合历史数据记录,运用朴素贝叶斯分类方法[7],依据最大后验概率准则,可对动态数据记录实施分类.
例5 商店购物数据库中顾客表的部分记录见表3,利用朴素贝叶斯分类方法分析零售数据.
表3 是否购买儿童早教机的顾客样本
注: 该表在数据库中被命名为“ZDJ”; 数据预处理(如年龄分段:18~44周岁为青年等)后,表中顾客编号为整数类型,其他字段均为字符串.
分析 朴素贝叶斯分类方法能够基于客户数据,识别出潜在顾客,这利于实现精准营销,降低商业成本并增加企业利润.
select (select count(*)from ZDJ where 类别 = '是' )/(select count(*)from ZDJ)
2.6 几何概率计算中运用图像展现数据的思维
在数据思维的应用中,通过数据的图像化展现,可以使数据处理的目的和数据分析结论更易于被理解.
分析 几何概率[9]计算需要确定样本点和样本空间所在的区域,从等可能参数值的含义入手,先找出相应的区域并确定它们的测度,再代入几何概率公式来求解.
图2 图解随机事件
3 结语
大数据时代,以数据的深度挖掘和融合应用为主要特征的智能化进程不断被推演,培养本科生数据思维的重要性日益凸显,专业学习应与数字化转型、工业数字化战略、人工智能发展规划相结合,概率计算中尚需采用更多新措施去培养大学生的数据分析思维.
[1] 胡广伟.数据思维[M].北京:清华大学出版社,2020:24-44.
[2] 石凯,刘洪江.地方高等院校概率统计课程教学改革模式探析[J].大学教育,2022(10):127-130.
[3] 曾宏伟.古典概型的概率计算方法与应用[J].信阳农业高等专科学校学报,2005,15(4):91-93.
[4] 段克峰.几何概率的计算技巧与应用[J].甘肃联合大学学报(自然科学版),2010,24(6):32-35.
[5] 李佳炎,张玉婷.全概率公式在复杂事件概率计算中的应用[J].中学数学研究,2023(1):35-38.
[6] 王荣.用概率树图法求解事件发生的概率[J].天津成人高等学校联合学报,2004,6(5):18-20.
[7] 张步良.基于分类概率加权的朴素贝叶斯分类方法[J].重庆理工大学学报(自然科学版),2012,26(7):81-83.
[8] 韩兵,王照清,廖联军.基于MySQL多表分页查询优化技术[J].计算机系统应用,2016,25(8):171-175.
[9] 刘崇林.几何概率计算中参数及测度的选取[J].中学数学杂志,2010(5):28-30.
[10] 王静.量子蒙特卡洛方法的发展与应用[D].上海:华东师范大学,2022.
Application of data thinking in probability calculation
CHEN Shouwen
(School of Mathematics and Finance,Chuzhou University,Chuzhou 239000,China)
Probability calculation is an important component of probability statistics theory.In view of the phenomenon that traditional probability and statistics teaching pays more attention to knowledge teaching than data thinking guidance,it is explored that how to apply data thinking in probability calculations such as classical models,total probability,independent sum events,small probability events,conditional probability and geometric models.Teaching practice has shown that,using the holistic,quantitative,interconnected,valuable,dynamic,and visual characteristics of data thinking to calculate probability,the complexity of probability calculation can be reduced,the process of random experiments is beneficial to being understanded,and the hidden value of probability is conducive to being discovered and it can also promote the formation of students′ data thinking awareness and the improvement of data analysis skills.
probability calculation;data thinking;course teaching
O211∶G642.0
A
10.3969/j.issn.1007-9831.2024.02.016
2023-08-01
安徽省高校质量工程项目(2020jyxm1353,2021kcszsfkc292);滁州学院质量工程项目(2019jyz011,2020kcsz022)
陈寿文(1979-),男,安徽怀宁人,副教授,博士,从事统计学研究.E-mail: cshouwen@163.com