贝叶斯定理的应用与展望
2019-03-18孙焱
孙焱
【摘要】本文简述了贝叶斯公式的内容,并讨论了贝叶斯公式及其思想在实际中的强大作用与广泛的运用空间。
【关键词】概率论 贝叶斯定理
随着科学技术的发展,为数众多的科技成果与科技产品正在影响并逐渐融入我们的生活。而这些科技成果与科技产品的诞生都是离不开人类数学水平的发展的,尤其在信息化愈发全面,并且人工智能与机器学习越来越成为时代焦点的今天,概率论及其背后的广博的数学思想,在源源不断地滋养着人类科技的进步。本文将从贝叶斯定理的基础理论出发,简述其在日常生活中的强大之处。
一、贝叶斯定理
贝叶斯定理由英国数学家贝叶斯(Thomas Bayes 1702-1761)提出并发展,用来描述两个条件概率之间的关系,可用数学语言描述如下:
其中,对(Bj)P(A|Bj)使用全概率公式,知其等于P(A),分子由条件概率的定义知其等于P(A|Bi)。将其代入条件概率的定义即知贝叶斯定理正确性。另外,再引入几个概念:
条件概率(又称后验概率):就是事件A 在另外一个事件B已经发生条件下的发生概率,这里指在事件A发生后,对事件Bi的发生概率进行重新评估,称为A的后验概率,这里记作P(Bi|A);
联合概率:表示两个事件共同发生的概率。A与B的联合概率表示P(AB);
边缘概率(又称先验概率):边缘概率是某个事件发生的概率,在这里指事件A发生之前,我们对事件Bi的发生与否有一个基本的概率判断,称为Bi的先验概率,记作P(Bi)。
贝叶斯公式中,若称P(Bi)为Bi的先验概率,称P(Bi|A)为Bi的后验概率,则贝叶斯公式是专门用于计算后验概率的。
二、贝叶斯定理在实际问题中的应用
贝叶斯公式在数学问题中的用途十分广泛,其通常用于在新的事件发生后对于原有事件发生概率的更新。比如,人的信用问题,若一个人在多次撒谎的情况下,其信用度会大幅下降,这一点常被用于银行贷款。如果一个人的信用记录有污点,其向商业银行申请贷款时将会遇到更多的麻烦,甚至被直接拒绝。下面通过简单计算说明:
设事件A表示此人不遵守承诺(事实上的行为),事件B表示此人可信(他人或机构对其信用评定),再设
P(B)=0.8, P(B)=0.2, P(A|B)=0.1, P(A|B)=0.7
另外,贝叶斯公式还可以用于疾病筛查中。如果对于疾病筛查仅仅初筛,很容易出现“假阳性”现象,而对于初筛的阳性再进行一次复查,“假阳性”出现的概率将大幅下降,结果将会非常准确。
另外,在法庭庭审中的辩护与审判,也可以用贝叶斯公式解释。律师要尽力降低当事人是罪犯(事件B)的先验概率P(B),并且要举出对当事人有利的证据(事件A),使得当事人是罪犯的情况下做出如此事件的概率P(A|B)尽可能小。最后法官也会综合证据,得出P(B|A),做出尽可能公正的判决。
三、贝叶斯定理在人工智能中的应用
(一)贝叶斯定理在汉字识别后处理中的应用
每一种语言都是一种基于上下文的信息表达和传递的方式,而让计算机处理自然语言,一个基本的问题就是基于这种上下文相关的特性建立数学模型。这样的模型中,一个很重要的思想便是贝叶斯定理。
我们在在这里以汉字的手写识别转换为文字为例子:设当前识别的结果是A为事件A,计算机接收到的信号为S为事件S,则我们需要找到使得P(A|S)最大的A。使用贝叶斯公式得
其中P(S|A)为信息A经传输后变为信号S的概率,在实际处理中,我们可以将其处理为识别信度,更简单地,甚至可以将其作为常数,而P(S)表示接收到信號为S的概率,也是常数,故问题可以简化为求P(A)的最大值。而在汉字到句子的例子中,我们可以认为
可以更进一步简化问题假设,每一个字只与其前一个字有关,这种假设被称为马尔科夫假设,问题退化为马尔科夫过程。至此,问题简化为求的最大值。
(二)朴素贝叶斯算法
目前,随着基于网络的服务的发展,网络中存在的机密与隐私信息数量的大幅度增长,网络安全技术的重要性日益显得重要。如何有效地去检测并且有效地防范网络入侵来起到保障网络数据的安全性的作用也开始受到社会各界的关注和重视。朴素贝叶斯算法因其坚实的贝叶斯理论基础,被广泛地应用于文本分类领域。我们在这里讨论一种基于朴素贝叶斯算法的文本分类系统。我们设文章的输入为n维向量X(其每个分量可以为文章中提取出的特征词,如中国,恒大,美元等等),文章类型为ck(如政治,体育,经济等等),则有
另外,记为文章库中该类文章的频率,是常数,这样求出概率最大的值,即可以将文章分类。
朴素贝叶斯算法有很多改进的方法,比如平滑,或者引入其他概率分布模型,都可以提高算法的鲁棒性和准确性。