APP下载

基于马尔可夫链的历史和现状的研究

2017-03-20李自玲

商业经济 2017年3期
关键词:稳定性

李自玲

[摘 要] 马尔可夫链是人类历史上第一个从理论上被提出并加以研究的随机过程模型。自1906年由马尔科夫提出这一概念,多位学者将其与其他理论结合不断发展。现代随机过程大致分为马尔可夫过程、平稳过程、布朗运动、离散鞅、无穷粒子马尔可夫过程和超过程。上世纪50年代前,学者们主要运用微分方程半群理论研究马尔科夫链,目前鞅论方法与随机微分方程相结合成为处理多维扩散过程的重要工具。中国学者许宝騄、王梓坤、严士健、陈木法、张绍义等人也在这一领域取得累累硕果。马尔科夫链的研究深入到经济、生物、物理、化学等众多领域,其理论发展方兴未艾。

[关键词] 马尔可夫链;随机过程模型;稳定性;收敛速度

[中图分类号] O211.62 [文献标识码] B

[文章编号] 1009-6043(2017)03-0132-02

一、马尔可夫链的创立

在当代科学与社会领域,有一种数学模型叫随机过程,从银河系的亮度起伏到星系空间物质的分布、从小分子的布朗运动到原子的蜕变过程,从化学反应的动力学原理到电话通讯理论,从谣言的传播过程到传染病在人群中的扩散、从预测市场到破译密码,基于随机过程方面的理論和应用随处可见。

在人类发展的历史上,马尔可夫链是第一个从理论上被提出并加以研究的随机过程模型。为了扩大概率论极限定理的应用范围,1906年,马尔可夫在论文《大数定律关于相依变量的扩展》中第一次提到这种如同锁链般环环相扣的随机变量序列,其特点是:当一些随机变量依次被观测时,随机变量的分布仅仅依赖于前一个被观测的随机变量,而不依赖于更前面的随机变量,这就是被后人称作马尔可夫链的著名概率模型。齐次马尔可夫链的渐进正态性、非齐次马尔可夫链的中心极限定理和模型的各态历经性都被马尔可夫证明了。他还给出了统计物理中遍历理论的第一个严格证明结果。马尔可夫链的研究一方面是对荷兰数学家克里斯蒂安·惠更斯提出的无后效原理的概率推广,另一方面也是对法国数学家拉普拉斯机械决定论的否定。

二、马尔可夫链的发展

马尔可夫链概念后来被扩充到连续时间和任意相位时间,按照辛钦的建议称之为马尔可夫过程。柯尔莫戈洛夫把傅里叶的传热理论、爱因斯坦与斯莫洛霍夫斯基的布朗运动理论、马尔可夫等关于随机徘徊的描述与首次构造随机过程例子、巴夏里埃与维纳的思想结合在一起,抽象出马尔可夫过程的一般模型。他和辛钦发展了马尔可夫过程和平稳过程理论。莱维自1938年开始就研究轨道性质的概率论方法。1948年他出版了《随机过程和布朗运动》一书,在书中他提出了独立增量过程的一般理论,这极大推进了布朗运动的研究。伊藤清于1944年引进了随机积分与随机微分方法。1951年,他在莱维和伯恩斯坦的研究基础上建立了布朗运动的随机微分方程方面的理论,为马尔可夫链的研究开辟了新的道路。1975年他推出伊藤清积分和Stratonovich积分之间的关系,以及无穷维随机变元情形的推广。美国概率论学派的代表人物杜布于1950年开始研究鞅,使它衍生为一门独立的概率论分支。1953年,他出版的《随机过程论》一书,系统又全面地叙述了随机过程的基本理论。1954年,费勒将泛函分析中的半群方法运用到马尔可夫链的研究中,登金、麦基恩和伊藤清等人赋予它概率意义(如特征算子等)。上世纪50年代初,角谷静夫和杜布发现了偏微分方程中狄利克雷问题与布朗运动的关系,后来亨特又研究了位势与一般马尔可夫过程(亨特过程)的关系。上世纪60年代,法国布尔巴基学派发展了随机过程的一般理论。现代随机过程大致可分为马尔可夫过程、平稳过程、布朗运动、离散鞅、无穷粒子马尔可夫过程和超过程。

三、马尔可夫链的研究工具

1936年左右学者们开始探讨马尔可夫过程的轨道性质,直到将轨道性质的概率方法与微分方程及半群理论的分析方法结合起来应用,才使他们的研究工作进一步深化,形成了对轨道分析的强马尔可夫性概念。伊藤清于1942年创立的随机分析理论用于研究一类特殊的马尔可夫过程——扩散过程,他开辟了研究马尔可夫链的新路径。在上世纪50年代之前,学者们研究马尔可夫链主要是运用微分方程和半群理论。近年来,学者们将鞅论方法运用到了马尔可夫链的研究当中。目前,鞅论方法与随机微分方程相结合已成为处理多维扩散过程的重要工具。另外,分析学中的位势理论和马尔可夫链有着紧密联系。学者们对马尔可夫链的研究,促进了位势理论的发展,它为偏微分方程的研究提供了概率论方法。在国外Richard Tweedie, Sean P. Meyn, E. Numnelin等人主要用Lyapunor drift条件和分裂技术研究马尔可夫过程的稳定性和收敛速度。在国内陈木法、王凤雨、张绍义等用耦合方法研究马尔可夫过程的稳定性。

四、中国当代学者的研究动态

许宝騄是中国最早从事概率论与数理统计研究并达到世界先进水平的优秀数学家。他加强了强大数定理,研究了中心极限定理中误差大小的精确性,发展了矩阵变换技巧,得到了高斯-马尔可夫模型中方差的最优估计。

中国著名数学家、中国科学院院士、中国概率论研究的先驱和主要领导者之一——王梓坤对马尔可夫过程的理论研究和应用都作出了很大贡献:将差分方法和递推公式应用于生灭过程的泛函和首达时分布的研究,得到一系列深刻结果,并将此理论应用于排队论、传染病学等研究领域;在中国他最早着手研究随机泛函分析,导出了广义函数空间中随机元的极限定理;他研究了位势理论与布朗运动之间的关系,得出了高维布朗运动和对称稳定过程未离球面的时间分布、位置分布及极大游程分布;推导了马尔可夫链的零一律和常返性成立的条件;他在国际上最先引进多参数有限维恩斯坦-乌伦贝克过程的严格数学定义,并取得对三点转移、预测问题、多参数与单参数关系等系列研究成果;创造了多种统计预报方法及供导航的数学方法。20世纪90年代至今,王梓坤所领导的研究集体致力于对测度值马尔可夫过程(超过程)的研究,其研究成果已达到国际先进水平。

北京师范大学教授严士健及中国科学院院士陈木法领导的无穷粒子系统研究集体,将算子谱和泛函不等式半群性质作为研究对象,综合应用微分几何、泛函分析及概率论等知识,取得了很多研究成果。上世纪60年代,嚴士健、王隽骧及刘秀芳在平稳过程研究方面取得了一些成果。上世纪70年代末期,严士健与陈木法在国际上首次引入了非平衡粒子系统的典型模型——反应扩散过程,且创立了相关理论体系。从1988年开始,陈木法选定“马尔可夫过程的遍历速度与谱理论”为研究方向,他和王凤雨合作在国际上首创运用概率方法估计第一特征值。他最早研究马尔可夫耦合,更新了耦合理论;完善了一般或可逆跳过程的唯一性准则,且推导出了唯一性的充分条件;彻底攻破了“转移概率函数的可微性”等难题,还创立了跳过程的系统理论。湖北大学张绍义教授的两项重要工作:最优马氏耦合存在定理和跳过程ρ最优保序耦合算子的存在定理受到陈木法院士的高度肯定。陈木法在他的两本英文专著From Markov Chains to Non-EquilIbrium Particle System和Ergodic Convergence Rates of Markov Processes-eigenvalues, Inequalities and Ergodic Theory中给出了这些工作的详细介绍,并称之为张定理。

中国科学院院士严加安在鞅论、随机分析和白噪声分析等方面取得了显著成果:他证明的局部鞅分解引理被外国专家称为“严引理”;他创立的半鞅随机积分“初等”定义为学者研究随机积分的性质提供了捷径;他对无穷维分析中很有名的Gross定理及Minlos定理作了推广;他还与法国通讯院士Meyer合作提出了白噪声分析数学框架,其被称作“Meyer-Yan空间”,被国际《数学百科全书》引述。

中国科学院院士马志明研究狄氏型与马尔可夫链的对应关系取得了重要成果,创建了右连续马尔可夫过程与拟正则狄氏型一一对应的新框架。在Malliavin算法研究上,他与合作者证实了维纳空间的容度与选取的可测范数无关。在无穷维分析方面,他与合作者推导出了紧Riemann流形的环空间上带位势项的对数索伯列夫不等式,这是当前国际上该研究领域的最佳成果。

1974年,中南大学侯振廷教授在《中国科学》第二期发表论文“Q过程唯一性准则”,成功地解决了Q过程的唯一性问题。这项成果被概率学界称为“侯氏定理”。近年来,他又研究了马尔可夫决策过程,推导出了马尔可夫骨架过程新理论,并将这一理论运用到排队论的研究中,成功地解决了GI/G/N排队系统和排队网络的队长瞬时分布等问题。

五、马尔可夫链的应用

随着马尔可夫链的逐步深入研究,它在经济学、生物学、物理学、化学、军事学、天文学等领域都引起了连锁反应,衍生出一系列新课题、新理论和新学科。马尔可夫链具有丰富的数学理论,与其他数学学科相互渗透;而它又与自然科学、技术科学、管理科学、经济科学以至人文科学有广泛的交叉应用。很多问题都可建立马尔可夫过程概率模型,运用概率论及随机过程的理论及方法进行研究,而它们又不断地衍生出新的研究课题。这种交互作用促进了当代概率论的飞速发展。而当前马尔可夫链的理论研究,正方兴未艾。

六、马尔可夫链的研究方向

目前,马尔可夫过程、马尔可夫随机场、无穷粒子马尔可夫过程、测度值分支过程(超过程)、流形上的马尔可夫过程等都是正在深入研究或有待研究的领域。

[参 考 文 献]

[1]DA Levin,Y Peres,EL Wilmer.Markov chains and mixing times[M].New York:American Mathematical Society,2009

[2]Ren Zihui,Wang Jian,Gao Yuelin.The global convergence analysis of particle swarm optimization algorithm based on Markov chain[J].控制理论与应用,2011, 28(4):462-466

[3]XS Yang,S Deb,Cuckoo.Search:recent advances and applications[J].Neural Computing and Applications, 2014, 24(1):169-174

[4]MF Chen.Eigenvalues,Inequalities and Ergodic Theory[M].Beijing:Science Bulletin,2000(9)

[5]龚光鲁,钱敏平.应用随机过程教程及在算法和智能计算中的随机模型[M].北京:清华大学出版社,2004(3)

[6]徐传胜.从博弈问题到方法论学科:概率论发展史研究[M].北京:科学出版社,2010(7)

[7]徐传胜.彼得堡数学学派的概率思想研究[D].西安:西北大学博士论文,2007

[责任编辑:史朴]

猜你喜欢

稳定性
一类具有扩散项的消费者资源模型的稳定性分析
一类考虑疫苗接种的新型冠状病毒流行模型的稳定性分析(英文)
独柱墩桥梁上部结构抗倾覆稳定性分析
某道路边坡稳定性分析及支护措施研究
基于自适应神经网络的电网稳定性预测
不确定时滞系统的整体控制稳定性分析
不确定时滞系统的整体控制稳定性分析
纳米级稳定性三型复合肥
非线性多率离散时间系统零动态的稳定性
任意切换下的连续非线性切换系统的输入—状态稳定性分析