基于贝叶斯网络的概率图模型变分近似推理研究
2019-02-22何林海
何林海
(湘潭医卫职业技术学院 湖南 湘潭 411102)
1.概率图模型介绍
概率图模型是综合运用概率论和图论的结合,描述统计关系的应用模型。在实践操作中概率图模型能够将集合点表示为变量,通过空间标记明确连续的离散特征。其离散状态的空间概率模型标识研究其取值范畴,或者近似值的推理模式。较为常见的概率图模型主要为贝叶斯网络可以将贝叶斯网络理解为一种概率网络的图型结构,叶斯网络也是最为常见的概率推理图形化网络模式。贝叶斯公式便是在概率网络的基础之上进行构建的解析过程。其数学模型描述了概率推理的变量关系,以及概率信息的来源和获取路径。而基于概率推理而设计的贝叶斯网络也是为了进一步解决推理过程中的不完整性或不定性。虽然其解决路径相对复杂,但是仍然可以描述其中的不确定因素,或者关联性较强的故障类型,因此在诸多实践操作中应用叶斯网络进行概率推导的优势仍然存在,也是众多领域应用其网络结构的主要因素。利用变量关系表述其概率函数的模型,可以利用叶斯网络的联合概率分布作为函数表达模型,其表达式为在此公式中,xs 代表父代结点的集合,其局部函数乘积可以描述关联干了的表达式从理论上任何有向图模型都能够转化为无向图模型,等价转化的方式可以保持联合概率之间的变量和分布规律不变,进而在独立条件下支持概率推理的进一步优化,直至无限接近于近似目标的取值范畴。
2.概率推理的主要问题
应用贝叶斯公式构建概率图模型,实质上是为了解决概率推理中极为重要的三项问题,分别为:结构学习、参数学习、概率推导。首先,结构学习的问题主要集中于在已知的参数样本信息中,预测或估计尽量符合依赖关系的数据类型。其次,参数学习是在已知的概率图模型中,借助样本数据预测多各个参考变量之间依存关系。诸如,条件概率的分布趋势等。最后,概率推理是最终求取所有变量或者部分变量的边缘概率问题,也可以界定为最大概率状态下的推理路径。概率推理问题可以借助概率图模型深入分析和探讨,在应用过程中逐步解析概率近似值。由于概率图模型能够最终求得推理结果,而概率推理的关联问题也可以得到解析。因此,贝叶斯网络的推理流程可以借助概率图模型推导,并求得近似推理结果。此外,在诸多结构学习或者参数学习的基础算法中,可以利用概率推理算法的中间步骤,明确概率推理问题所包涵的边缘概率范畴,从而在求解最大概率状态时逐步优化解析路径,并在边缘化概率的统筹范围内明确计算部分的变量关系。例如MAP 最大概率的运算模型为:X*=arg max p(x)。其计算边缘化的求解问题为在类似问题描述中,计算最大概率的过程中相当于不完全问题类型,计算步骤趋向于边缘概率的解析内容。由于多数情况下求解问题的精确度并不能充分保障,需要借助近似值取值范畴来描述类似情况。因此,从变分角度考量边缘概率的解析路径,也是尽量简化运算流程的方式,能够在很大程度上优化最大概率的解析流程。
3.概率图模型变分近似推理发展历程
3.1 信度传播
信度传播算法是概率图模型变分近似推理的早期发展阶段,上世纪九十年代由Pearl 等提出树状贝叶斯网的运算结构。而该模型也可以应用于非树结构的概率图模型中,因此其近似推理结果适用范围更广。在此阶段近似推理方法更加倾向于精确推理的方向,其本质思想是利用部分变量的独立性,设定已知参考变量,并结合精确推理流程得到不同假设状态下的近似值。其中应用较为广泛的近似推理模型包括:定界条件法、剪枝算法等。但是由于精确推理方法并无法解决计算复杂度过高的指数级运算内容,因此其应用范畴仍然具有一定的局限性。而且类似方法含有启发式成分,所得近似值并无法确保其真实性。
3.2 自由能优化
自由能优化的近似值推理方法最早由Yedidia 等在本世纪初期提出,该方法是通过变分法角度诠释信度传播算法的运算模式,能够在很大程度上证明树状图模型或环图模型所涵盖的信度传播具有最小化自由能。在此之后诸多学术研究依据自由能优化的原理构建了多种形式的信度传播算法。在求解近似值的概率推导中优化了运算步骤和流程,也相对增强了所得结果的理论参考价值。
3.3 对偶分解
对偶优化是概率图模型变分近似推理发展的第三阶段,其基本理念是将复杂问题设定为一个包含了诸多简单问题的集合,并针对子集问题进行逐步求解。最后将子集问题汇总并得到近似解的过程。Wainwright 等提出了重参数化和基于树分解推理方法,此后该方法被Kolmogorov 等运用和推广形成了对偶分解的近似值概率推理框架。
4.基于贝叶斯网络的概率图模型变分近似推理算法
基于贝叶斯网络的概率图模型变分近似推理算法,是针对边缘概率问题求解过程中引用的近似值求解思路。在不同参量的条件限制下,其变分近似推理算法更加契合运算条件的基本规律,从边缘概率问题中提取其近似算法的优先考量范畴之后,也可以在最大限度上优化解决方案。
由于不同参考变量α 和P 在优化问题中可以得到差异化的推理路径。从α 趋向于0 的解集中能够发现α 本身也具备了离散特征。而利用自由能算法进行解析能够得到Dα→0(P||q)=KL(P||q)的解集方案。而在α→0 的情况下,P 相对固定,可以利用拉格朗日乘子算法求解类似问题。并得到信度传播算法。边缘管理的迭代信息也可以借助该算法进行描述,从而得到近似值的参考范畴。而其中利用朴素平均场算法时,能够分析联合概率的近似值,从而得到PST=0 或者PST=1 的结论。其更加接近于迭代原理的算法机制,有助于针对树状平均场的近似值进行约束。也是利用修正方法得到线性规律的普遍模式,能够从平均场的基础上得到信度传播算法的精准近似取值范畴。因此在利用了信度传播算法之后,自由能分解所得到的近似值P(x)满足了权树分解的函数解析条件。对于分数信度的传播机制加以描述,能够明确线性响应理论的可行性。进而在优化了PST取值范围后,进一步凸显近似值的内在联系,为后续选择参量提供基础条件,支持信度传播算法的收敛性。
在 α→1 的情况下,α 离散度为 KL(P||q),此时∑xP(x)log q(x)作为自由能的实质参量,能够在期望值的界定中明确近似推理方法的可行性。在α→0 的情况下,α 的离散度可以被定义为对数形式,从而依据相对简化的表述形式支持运算流程的便捷性。在α 的取值范畴内定义简化条件,能够借助α 的繁琐性解决取值过程中的边缘概率形式,因此其近似方法也得到了有效性的验证。变分近似推理算法所得近似值,与自由能所提供的收敛性和凸性产生了密切的关联度,相关研究构造凸的自由能函数也是为了进一步优化近似效果的诉求。Heskes等提出了针对线性约束条件的自由能解析框架,而Pakzad 等提出了等价转化的运算条件,Meshi 等提出了自由能解析模式在利用参数变量之后,能够优化该参数距离最小自由能取值空间,进而优化了求解步骤和问题解析路径。变分近似推理算法所具备的收敛性,是优化迭代算法的重要条件。在迭代算法中所具备的收敛性也将进一步优化解题条件。在Tatikonda 等提出了计算树采样算法中所具备的收敛性之后,LBP 算法的收敛性也被进一步证明,能够依据LBP 所具备的收敛特征补充算法条件,进而为优化信度传播算法,并降低运算误差率提供基础条件和优化方向。多种算法在求解近似值的过程中,均采用了概率图模型,并结合了参数关系的运算原则,对于优化自由能的参考价值,依据突出收敛性均起到了重要作用,是求解近似推理概率结论的主要发展趋势。
5.结语
综上所述,概率推理中涵盖了边缘概率、最大概率等近似值的运算问题。利用概率图模型进行解析,可以借助贝叶斯网络的诸多特征加以描述,在求解近似推理方法的过程中运用信度传播、自由能优化、对偶分解等多种运算模式,能够优化解决路径,并在最终的求解思路明确后得到近似值,是综合运用贝叶斯网络求解概率图模型变分近似推理的主要发展方向。