APP下载

基于贝叶斯方法的不确定性信息处理研究进展综述

2018-12-13胥新政傅华栋

机电产品开发与创新 2018年6期
关键词:后验先验贝叶斯

胥新政,强 毅,傅华栋

(1.机械科学研究总院集团有限公司,北京 100044;2.中国合格评定国家认可中心,北京 100062)

0 引言

大数据时代,如何有效处理庞杂的不确定性信息从而获得规律性认知是人们所面临的一大难题。“不确定性”是指我们对事物“不能完全确信”的状态,一般包括固有不确定性和认知不确定性。前者源于事物固有的随机性,后者源于人们所掌握知识和信息的局限性[1]。其中,认知不确定性作为一种特定的不确定性,在各个学科领域已引起足够重视。因此,需要采用新方法新思路来定性、定量地分析各个环境系统的不确定性。

贝叶斯(Bayes)方法是以概率论为基础的一种统计学方法,与传统统计学理论的最大不同在于贝叶斯理论将所有参数作为随机变量,并根据专家经验赋予其先验分布,以使参数估计更可靠[2]。近年来,该方法已被成功地引用到各个学科领域处理不确定性信息。鉴于此,本文系统地阐述了贝叶斯方法的基本思想、应用和展望。

1 贝叶斯方法的基本思想与发展

贝叶斯方法是联系先验知识和后验知识的桥梁。它以贝叶斯公式、贝叶斯统计推断及贝叶斯网络为基础,使用先验概率和样本信息得出后验概率,主要用于处理不确定性信息中的随机信息。

1.1 贝叶斯公式及其统计推断

贝叶斯定理描述了条件概率及其逆概率的关系,公式如下:

其中,P(A)为事件 A 的先验概率,P(A|B)为在事件 B条件下事件A的后验概率,P(A|B)/P(B)为事件A发生对事件B的支持程度,即似然函数。

贝叶斯统计推断的基本过程如图1所示[3]:首先通过实验获得样本信息 X1、X2、X3……Xn,估计先验分布 π(θ)反映先验信息,同时构建似然函数 L(θ|X1、X2…、Xn)反映样本信息;再结合贝叶斯定理得到待估计量的后验概率分布 h(θ|X1、X2…、Xn);最后利用后验分布得到预报概率分布。公式如下:

图1 贝叶斯统计推断的基本过程Fig.1 The primary process of the bayesian method for statistical inference

1.2 贝叶斯网络

(1)贝叶斯网络概念与组成。贝叶斯网络是贝叶斯方法的扩展,又称贝叶斯信度网络(BBN),是以图形化的方式表达不确定性信息的概率模型,能直观地表达系统内各元素之间的相互影响关系[4]。贝叶斯网络的组成:一是有向无环图(DAG),由代表变量节点及连接这些节点有向边构成;二是变量之间因果影响强度的条件概率表(CPT)。其中,节点代表随机变量,节点间的有向边代表节点间的互相关系(由父节点指向其子节点);条件概率表达关系强度,没有父节点的用先验概率表达。

(2)贝叶斯网络的构建。首先,确定目标领域的变量集,即贝叶斯网络的节点集。目标问题应被变量集中所有的特征变量完全描述,并确定每个变量的状态和取值范围;其次,根据变量之间的概率依赖关系或先验依赖关系确定网络结构。对具备大量专家知识的问题领域,根据专家对变量之间存在因果依赖关系的认知,连接自变量与因变量。最后,估计参数,计算每个节点的概率分布。概率分布包括根节点的先验概率分布和中间节点的条件概率分布。

(3)基于贝叶斯网络的推理。贝叶斯网络的推理是指在给定一组证据变量概率值的条件下,计算一组查询变量的概率分布,包括精确推理和近似推理。即对原始数据进行数据挖掘,找出符合原始数据的定性网络图关系,然后根据各节点之间的因果关系,利用Bayes公式中条件概率的计算方法,计算出所感兴趣的查询节点(query node)发生概率。

(4)基于贝叶斯网络的学习。贝叶斯网络学习是指利用样本数据更新网络原有参数或结构的先验分布,即寻找一种最能真实反映数据集中各变量间的依赖关系,并能按某种测度较好地与给定实例数据集拟合。给定离散变量集{X1、X2、X3……Xn}上的数据样本 D,学习的目的是找到与D匹配程度最高的贝叶斯网络。

可见,贝叶斯网络既能将先验知识和后验数据有机结合,也能客观的表达与处理目标问题,以从不完全、不精确或不确定的知识或信息中做出推理,被认为是表达不确定性问题最有效的模型之一。

2 贝叶斯方法处理不确定性信息的具体应用

贝叶斯方法结合先验信息和观测数据下的似然信息得到参数的后验概率分布。近年来,采用贝叶斯方法耦合输入不确定性、结构不确定性以及数据不确定性,在评价、模拟及预报的不确定性分析方面取得了系列成果,使得不确定性信息处理理论日臻完善,并在诸多领域广泛应用。现就其在医疗卫生、气候地理、信息技术和经济管理等领域的应用阐述如下:

2.1 医疗卫生领域的应用

贝叶斯方法在医疗卫生领域的应用主要表现在贝叶斯网络的应用。它通过对疾病案例建立贝叶斯网络,编码各种症状与疾病之间的因果关系,计算病人患有某种疾病的概率。国外,如TakeHeart II系统是基于贝叶斯网络的心血管疾病诊断临床支持决策系统 (Clinical Decision Support System,CDSS),具有良好的人机接口,能够实时提供决策并做出风险评估[5]。国内,南开大学徐曼等人在不确定性与非平衡性条件下,通过构建考虑稳态与随机态关联性的贝叶斯网络学习模型,研究了基于规则/案例(CBR/RBR)融合推理模式在医疗决策方面的应用。

2.2 气候地理领域的应用

2.2.1 空间地理知识表达和推理

在定性地理空间知识表达和推理中,存在各种不确定性问题,如位置表达的不精确性、地物的模糊性、空间关系的模糊性及空间陈述的不确定性等。目前,贝叶斯方法越来越广泛的应用于地理空间数据不确定性的处理。国外,如Aspinall[6]在GlS系统中用贝叶斯方法结合大量的数据集,预测苏格兰北部格兰扁地区红鹿的分布情况;国内,北京大学邬伦等人利用贝叶斯定理,建立了根据地理位置描述确定地物分布的概率方法,并研究了定性地理空间知识不确定性表达和推理及其在地理信息检索中的应用。

2.2.2 气候预测

环境生态系统模拟和预估的不确定性研究是气候预测的研究重点。气候变化模拟的不确定性是影响环境生态系统模拟不确定性的一个重要的因素。中国科学院地理科学与资源研究所何洪林等人结合现有的观测数据和研究基础,构建了贝叶斯神经网络,模拟了站点尺度净CO2交换量(NEE)的时间动态及环境变量对NEE的影响,并量化了NEE的不确定性。

2.3 信息技术领域的应用

2.3.1 数据挖掘

随着数据库技术的迅速发展和广泛应用,数据挖掘已经成为数据库知识发现的重要途径。由于贝叶斯网络的预测能力,并且其能够显示变量间最直接的关联关系,贝叶斯网络已成为大规模数据库中数据挖掘的重要手段。国外,Sebastian等人用贝叶斯网为慈善机关的客户建模,较好地预测了捐赠人的特征和希望得到的礼物,帮助慈善机构获得了最大的效率[7]。国内,慕春棣等人对贝叶斯网学习方法的数学推导进行了分析总结,并介绍了贝叶斯网络在数据挖掘中的应用[8]。

2.3.2 故障诊断与决策

在故障诊断技术中,所获得的观测信息或样本具有一定的有限性和不确定性。贝叶斯网络是一种有效的诊断决策模型,具有不确定性问题的表达能力。国外,Nicholson AE等人[9]将动态贝叶斯网络作为传感器故障诊断模型,研究了传感器故障预测和诊断的方法。国内,西北工业大学的傅军等在柴油机动力装置的故障诊断中,采用贝叶斯网络故障诊断模型,提高了故障诊断的精度和速度[10]。

综上所述,通过建立系统模型,达到辅助决策、特征融合及数据分析等目的是贝叶斯方法的基本应用过程,并以其独特的综合先验知识的增量学习特性和卓越的推理性能被广泛应用到不同领域中,并取得令人瞩目的效果,成为国内外研究的热点。其中,贝叶斯网络作为一种基于概率的不确定性推理工具,在医疗诊断、统计决策、专家系统、学习预测等方面得以成功应用,已成为处理不确定性信息的最重要途径。

3 展望

人工智能的目的是建立最接近人类认知水平的智能模型,随着相关理论和技术的日益成熟,其应用领域也不断扩大,具有广阔的发展空间。不确定性知识的推理和决策,是人工智能技术中的关键环节。贝叶斯方法因具备在不确定环境下知识表示与推理的优势,已成为人工智能重要的研究热点之一。目前,基于人工智能的计算机视觉、自然语言处理等技术发展日新月异;未来,贝叶斯方法在人工智能技术中仍具有广阔的发展空间。但是,贝叶斯方法在机器深度学习及数据挖掘技术方面的研究成果较少,建议加强该方面的应用与研究。

猜你喜欢

后验先验贝叶斯
基于贝叶斯解释回应被告人讲述的故事
基于无噪图像块先验的MRI低秩分解去噪算法研究
基于贝叶斯理论的云模型参数估计研究
基于自适应块组割先验的噪声图像超分辨率重建
一种基于最大后验框架的聚类分析多基线干涉SAR高度重建算法
基于贝叶斯估计的轨道占用识别方法
康德审美判断的先验演绎与跨文化交流
基于互信息的贝叶斯网络结构学习
基于平滑先验法的被动声信号趋势项消除
基于后验预测分布的贝叶斯模型评价及其在霍乱传染数据中的应用