因素表示的信息空间与广义概率逻辑
2019-11-09汪培庄周红军何华灿钟义信
汪培庄,周红军,何华灿,钟义信
(1. 辽宁工程技术大学 智能工程与数学研究院,辽宁 阜新 123000; 2. 陕西师范大学 数学学院,陕西 西安710062; 3. 西北工业大学 计算机学院,陕西 西安 710072; 4. 北京邮电大学 智能科学技术中心,北京 100876)
机制主义的人工智能理论抓住并提升了目前三大流派的共性,为人工智能理论的发展构建了一个统一的平台[1]。泛逻辑理论要在不确定性演化环境下对各种非经典逻辑进行统一的柔性归纳[2]。Lukasiewiez[3]提出的多值逻辑和Zadeh[4]提出的模糊逻辑先后突破了布尔的二值逻辑,所引起反响至今还是方兴未艾。特别是,王国俊[5]提出的计量逻辑、Schweizer等[6]提出的概率逻辑、周红军[7]提升出的概率计量逻辑以及王国俊学派[8-11]和徐扬[12]在格值逻辑方面的工作。这些工作和何华灿的泛逻辑都与概率论有密切的联系,不妨统称为广义概率逻辑。概率论的出现改变了数学,广义概率逻辑的出现对逻辑发展有重要意义。
信息不同于物质,它在物理空间中不占位置,不具有不可入性。但是,“有这样一种学说:在物质世界与信息世界的对立统一中,物质在物理空间中具有不可入性和惯性,信息在可能性空间中也具有不可入性和惯性。这应当成为柔性逻辑的公理”[2]。这里提出了一个非常重要的概念“可能性空间”,究竟什么是可能性空间,它与概率论和模糊数学所提的可能性空间有什么联系与区别?什么是广义概率逻辑?广义概率逻辑的发展将面临什么问题?这些问题的深入探讨,将会对人工智能的发展带来重大的影响。本文就是要用因素空间的数学理论来把这些问题说清楚。
1 可能性空间
在前面曾提到,就像物质在物理空间中具有不可入性和惯性一样,信息在可能性空间中也具有不可入性和惯性。这两句话意义重大。信息是要占“地方”的,需要有空间,这个空间不在物质世界里,在认识主体的处理架构之中。
可能性空间在概率论和模糊数学中分别出现过两次。第一次,Kolmogorov 在1936年用公理化定义把概率定义成为像面积、体积和重量一样的测度,可加性测度是不可入性的产物,测度测量“占有”这位数学家第一次把信息概念与物质概念等同起来,在可能性空间中为事件争夺地盘。三十多年以后,模糊集的创始人 Zadeh[13]也要把模糊概念放到可能性空间中来争夺地盘。
Kolmogorov的可能性空间就是他所定义的基本空间。这个空间对现代概率论来说具有特殊的重要性。Kolmogorov把随机变量定义成为一个从到实直线的可测映射,它把中的概率传递到直线上形成各种类型的概率分布列、分布密度和分布函数,使古典概率突变成为现代概率论。问题是,随机变量所描述的是像降雨量和命中率这样一些不确定的现象,而映射却是一个非常严格的数学概念,对于中的每一个点,必须有唯一确定的实数值与之对应,怎样才能把随机的现象和严格的映射连在一起呢?关键就在基本空间的建立。Kolmogorov的基本空间就是作者所提出的一个因素空间[14],把所有对结果有影响的因素全部考虑进来,所考虑的因素越多,结果就越确定,作为一种数学抽象随机变量在中最终会变成一个必然的映射。我们姑且不在哲学上对此进行评价,数学家就需要有这种魄力和手段。汪培庄[15]明确地把基本空间当作因素空间来研究,提出了因素概率论的思想。天下事物说来说去,就是因果二字,因果出理性,因果生逻辑。若则,就是因,就是果,逻辑就是因果。概率就是广义的因果律。概率都是相对于一定条件而言的。条件概率就是推理句“若则”的真值:。
用因素空间描述概率论叫做因素概率论。每个可描述的发生因素都规定了一个相域。例如,投掷一枚骰子,因素是出现的点数,它的相域是。由于骰子具有6面对称性,我们把这样的发生因素叫做对称性因素。包含6个相,6称为可能结果数。古典概率中有这样一条公理,即对称性公理。
对称性公理具有可能结果数为的对称性因素,在它与其他发生因素独立的情况下,种结果的发生都具有等可能性。若,则。
现代概率论的发展要归功于中心极限定理和各种概率分布的推导,但其根源是来自古典概率和样本平权公理:
样本平权公理设是关于随机变量的一组独立观察的样本点,如无特殊声明,则每个样本点都是平权的,亦即1/m;每个样本各自平权地把的概率搬到因素空间中去争夺地盘,就形成了各种各样的概率分布。根据这一公理,被视为一组相互独立的与同分布的随机变量。
模糊数学也强调可能性空间,这种可能性空间与概率论不同,所有主观性测度都是非可加的。如果把不可入性狭义地理解为测度的可加性,那么非可加的测度是可入的。但是,非可加的测度照样是要占“地方”的,汪培庄把模糊集定义所在的论域当作可能性空间,研究了模糊性与随机性的区别和联系,发现论域上的模糊性可以转化为幂上的随机性,提出了模糊落影理论[15]。证明了主观性测度与概率测度之间的同构对应定理,说明模糊信息在因素空间中也具有不可入性。
总之,概率论与模糊数学都特别强调可能性空间。在英文中概率与可能性是一个字probability,为了与概率相区别,Zadeh把模糊分布的可能性改称为possibility[13],不幸的是,这个词的中文翻译也是可能性。西方人对probability和possibility的理解是有分别的,probability是预测中某种结果出现的可能性,而possibility是识别中某种类别出现的可能性。随机性出现在预测过程中,当事件还没有发生的时候,大家要猜测将会是什么结果,这时就要用到概率,事情一旦发生,所占的位置马上腾空,可能性空间马上关闭而转换成另一个可能性空间。面对一个已经发生的事情,要去判断这是什么的时候,如果说不清楚,这就出现了模糊性,有多种possibility等我们去选择,这些possibility也要在这个新的可能性空间中来争夺地盘。为了避免文字上的混淆,我们最好把可能性空间改称为信息空间。概率论的可能性空间是以发生因素所组成的信息空间,模糊数学的可能性空间是由识别因素所组成的信息空间。在信息科学领域里,因素的相域就是信息域,因素空间也就是信息空间。
概率论的产生是数学上的重大事件,相应的广义概率逻辑的发展将是逻辑学中的一个重大事件。为了促进这一发展,我们需要在广义概率逻辑中引用因素表现论域。
2 简化的Stone表示定理与因素表现论域
在这一章里,我们需要对经典逻辑作一点反思,弄清Stone拓扑表示定理的思想实质,强调谓词变元的因素特质,用因素空间的思想对数理逻辑开拓一种新的思路。
2.1 命题演算的局限性
这个系统对经典逻辑来说是自给自足的了。但是,命题演算在语言上存在着一个大问题:语言学上的每一句话都有主语和谓语,一个判断句的谓语是“be”, 宾语是be所连接的一个名词、代名词或形容词,它表示一个概念。要问主语是否符合这个概念,便形成一个判断。有人主张把be+概念合称为一个谓词,我们赞同并采用此说法。概念是命题的核心,主语是命题的立足点。主语不同,无法进行推理,我是中国人推不出安倍晋三是亚洲人。绕了一个大圈子,人们发现,如果把主语事先规定死了的话,则命题演算就是概念演算。在进行推理的时候,如无特别声明,参加演算的命题必须是同一个对象,不能有变!命题演算的局限性是很大的。
谓词演算的朴素思想本来是很简单的(绝不像一阶谓词逻辑定义得那么烦琐):将命题改写成,是”,它是可以判断真伪的一句话,叫做一个谓词。叫做概念,叫做对象,或叫变元。就像代数是带变元的算术一样,谓词是带变元的命题。这是布尔逻辑的一大进步。
2.2 Stone拓扑表示定理
谓词演算带给逻辑学的一项最重要的启迪就是:逻辑蕴涵的本质就是集合的被包含,三段论法就是包含关系的传递。逻辑从数学中找到了坚固的理论基础。
道理非常简单,概念的内涵与外延是逆向对合的:概念甲的内涵蕴涵乙的内涵,当且仅当概念乙的外延包含概念甲的外延。但是,直到Stone拓扑表示定理的出现,这条简单的道理才从数学上得到严格的证明。
Stone拓扑表示定理告诉我们,任何一个布尔代数都同构于由其全体极大滤子所形成的紧零维Hausdorff空间的开闭集代数[16]。简单地说,就是布尔逻辑与集合论是同构的。但要问怎样同构法,就复杂化了。为了简单,我们不妨提出一个Stone简化定理。需要介绍滤子的2种不同的定义,我们把一般格论中定义的滤子叫做强滤子。权威的格论著作[17]给出:在一个尔代数B = (B,中,按常规定义了偏序:
定义1在布尔代数中,叫做一个强滤子,如果满足:1)满性,即(且);2)尾敛性,即对任意,都有。是一个平凡的强滤子。非平凡的强滤子叫做真强滤子。一个强滤子叫做极大强滤子,如果它不被不同于它的强滤子所包含的话。
在某些格论的文献中所定义的滤子只满足第一个条件。于是,滤子与强滤子是两个不同的概念,按强滤子叙述更好。称只含有限个原子命题集的布尔代数为有限布尔代数或元布尔代数,元指的是原始公式的个数。
命题1在元布尔代数中,每个强滤子必有一个最小元,使对任意,都有。
定义2强滤子的最小元叫做它的滤尾。
命题2元布尔代数中真强滤子是极大的充分必要条件是:它的滤尾是中的次小元。
证明下面将提到的与分别是真滤子和的滤尾。显然与都不是最小元0。
定义3记为元布尔代数中次小元的集合,叫做布尔代数的表现论域。
表现论域是按照强滤子来定义的。强滤子所具有的尾敛性是拓扑学中邻域系的典型特征。在有限情形下,它保证了滤尾的存在,在无限情形下保证了强滤子向一点的收缩。它始终保证强滤子像一颗炮弹,在有限情形下有弹尖(滤尾),在无限情形下有尖口(极限点)。非强滤子由于没有尾敛性,它就不是一个弹头而是多弹头的并。不难证明,中全体滤子所成的集合乃是强滤子所成集合的幂:。
证明命题2说明与是一一对应的。所以,根据Stone表示定理,与、、之间也都是一一对应的。中公式的析取、合取、否定运算显然与中集合的并、交、余运算同态。证毕。
证明给定, 若有公式则必有比小的公式,使有。
从二值逻辑到多值逻辑,所有新的理论都要推广Stone拓扑表现定理,这是考验新逻辑理论的一块试金石。我们需要做什么工作呢?首先,要去掉有限布尔代数的限制,使Stone简化定理的面扩大,然后,要证明一个普适性的广义Stone简化定理。若有一个能够一劳永逸地解决Stone简化定理推广的理论,就可以加速新理论的发展。比如,抓住,当时Stone简化定理成立,要证对任意(三值、多值、连续值)Stone简化定理都成立。对于模态逻辑,量词逻辑类似。
2.3 谓词演算中的变元争议与因素逻辑
在命题演算中我们曾经强调过,由我是中国人推不出安倍是亚洲人。推理句中的前后两个命题必须是同一个对象。在谓词逻辑中也应该坚持同对象推理的原则,毫无联系的两个对象之间是不能推理的。
常会遇见下面的推理句:若气温高则降雨量大
我们希望搞辩证逻辑,辩证法的核心是要具体问题具体分析,什么是具体分析呢?就是要对问题的内在和外在的因素进行分析。在谓词逻辑中把变元进一步写成因素是逻辑发展的新机。
逻辑是对事物的性质进行是非判断的科学,它要离开具体事物的性质而抽象出是非判断的一般规律,但抽象离不开现实,要想使逻辑更加有效地解决实际问题,需要开辟逻辑返回世界的接口。表现论域就是这个接口, 它是变元活动的空间。若把变元看作因素,就是因素空间,以因素空间做表现论域的逻辑就是因素逻辑。
定义4在上的二值因素逻辑系统是这样来规定的:
4) 真值集是二值布尔代数W2:
为什么会有虚的信息组态呢?因为因素之间存在着相互联系与制约。譬如,气温与降雨量这两个因素在平面的联合分布就形成一个背景集,显示一种正变关系,极低气温不可能接受高降雨量。所以,(极低温,高降雨量)就是虚搭配,就不能容许虚搭配在其中出现,它只能包含像(低温,低降雨量)、(中温,中降雨量)、(高温,高降雨量)等这样一类信息组态。此时,的几何形状就被想象为一个泡胀了的上升曲线,反映气温与降雨量之间呈一种正变的关系。
图1 因素推理的直观模型Fig. 1 Illustration of factorial reasoning
3 结构-功能分析与语法-语用对接
布尔逻辑可以用电路来表现,每个字代表一个电器开关。每一个元公式都代表一个开关的电路。等效的电路与布尔代数之间形成一种同构对应。这种对应叫作结构-功能对应。结构指的是开关的线路结构,功能指的是逻辑的判别功能。等效的公式有很多,等效的线路也有很多,经典的逻辑理论要研究最小化问题,就是根据一张赋值表,从中找出一个公式使所对应的线路最简单。
定义5若则称是的蕴涵式。若是的蕴涵式且在中不存在的任何其他蕴涵式,则称是的素蕴涵式。
命题4公式的最小化是与它等效的一个析取范式,式中的每一项都是它的素蕴涵式。
最小化理论将语法的结构和逻辑的语义功能有效地联系起来,意义重大。但是这种联系有一个前提,表现逻辑的电路开关必须相互独立。如果开关之间存在着关联,或者,由于系统受到侵蚀,两个开关在开时连通,在变元非独立的情况下,逻辑的结构功能关系应当如何进行呢?例如,给出下面一张三变元公式的赋值表(见表1)。
表1 公式 在 上的赋值表Table 1 The assignment table of formula p on
表1 公式 在 上的赋值表Table 1 The assignment table of formula p on
images/BZ_11_302_862_336_891.pngimages/BZ_11_302_936_336_966.png0 0 0 0 1 1 1 1images/BZ_11_302_1011_336_1040.png0 0 1 1 0 0 1 1images/BZ_11_306_1084_331_1113.png0 1 0 1 0 1 0 1 0 0 0 1 1 1 1 1
3个开关,每个开关有2种状态,搭配出8种组态,形成表现论域,由于这3个开关都是独立的。中8种搭配都用上了。现在,设想这3个开关不是独立的,譬如:和是等效的:。在这种限制下,第二、三、六、七列的组态是不可能出现的,背景只包含4种组态:
注意,为了简单,我们在符号上有下列等价的表示方法:
命题5若字组蕴涵字组,则的字长必大于的字长。
证明若字组蕴涵字组,则存在字组使, 且不包含中的字。于是的字长是与的字长之和。证毕。
命题6若字组是蕴含的最短字组。若它不在蕴含的任何字组中出现,则是的素蕴涵式。
证明若字组不在蕴含的任何字组中出现, 则的有效真集必在的真集之内,从而有,故是的蕴涵式。若有蕴含,由于是蕴含的最短字组,故不可能蕴涵,故是的素蕴涵式。证毕。
极小化方法(新):
命题7用极小化方法所得到的是的一个极小析取范式。
证明首先要证明算法一定有停止的时候,亦即,正字类一定会被删尽。设是的一点。它一定不属于。以它为真集的公式就是字组。 假设这一点没有在以前的比对中被删除,那么就对此字进行检查,因为它不会在负类字组中出现,所以这个字组一定在正类的某个字组中出现,因而它就是的一个蕴涵式,从而这个点就可被删除。这说明,任何正字都可在算法执行的过程中被删除。
表2 表1在R上的子表Table 2 The sub-table of table 1 on R
这个例子引自文献[18], 该文最早把因素逻辑的思想应用于故障检测,说明在变化的环境中布尔逻辑是如何被辩证化地发挥其推理功能的。
机制主义人工智能强调语法、语用和语义的全信息。全信息的核心是语义,而语义是语法和语用的结合体。所以,逻辑的结构-功能分析不仅是电路实现的实践问题,更是人工智能理论的一个关键点。语法-语用的结合都是在场景多变的非独立信息系统中来实现的。没有因素逻辑的思想和框架,是很难面对这种挑战的[19]。
4 逻辑的目标驱动与逆向推理
机制主义人工智能突出目标驱动,为智能服务的逻辑也应该是目标驱动的。逻辑以推理的后件为目标。我们希望生活快乐,怎样才能得到快乐呢?我们要寻找一个事态p使成立。在理论上,这是逆向推理的核心,在实践上这是神经网络的本事。因素空间可以在这里做出贡献。
定义6如果,则称在背景下包含,记作。
在图2 中,那个带阴影的月亮是我们的关注点。它是所有满足前件而不满足目标的点所成之集。换句话说,所有推翻推理句的点全在其中,所以这个月亮叫做推理的雷区。只要背景关系不与雷区相交,则推理就恒真了。
图2 在背景 下包含 :Fig. 2 B containing A under background R:
5 泛逻辑前三连续算子对的数学证明
泛逻辑把模糊数学出现以来所出现的多种连续并、交算子对的定义用带参数的方式统一归纳成为一套单一的运算。归纳的根基是4种极端的连续算子对, 其中前3对算子为:
1) Zadeh算子:
2) 概率算子:
3) 有界和积算子:
这3种算子在什么情形下适用,泛逻辑都有明文规定。这3套算子的选择,是需要数学来证明的。
所谓模糊性,就是概念外延的不确定性,以年轻这一概念为例,不同人或同一人在不同场景下所报的年轻区间是不一样的。设有份调查问卷,每份问卷上都答有一个区间。根据因素空间的理论,论域上的模糊性可以转化为幂上的随机性,因而这些区间可被视为一个随机集的样本。如图3所示,这组样本像是天上的云,云左端的竖线段就是基本空间,其中的每一个点对应一个问卷,个点均匀地分布在中。在不改变均匀分布的情况下,调换的位置,再做点拆拼,让随机云从天上落下来变成年轻的隶属函数曲线:(是覆盖年龄的区间数目)。这就是模糊落影理论,它把隶属度定义为随机集的覆盖率。这样,我们就可把图3的下半部看成是随机落影的简单模型。
图3 模糊集是随机云的落影Fig. 3 A fuzzy set is the falling shadow of a random cloud
模糊集A和B分别是截集At和Bs的落影,其中(t,s)是上的 2 维随机变量,具有均匀的边缘分布。图4左下方是,其对角线还是,表示年龄域。对于中的任意一点,向右交的隶属曲线于其高度,向上交的隶属曲线于其高度 t ,这样在方块中就确定了一点。由这一点作十字架将U分成四块,左下方的矩形叫做交区,挖掉右上方的矩形后剩下的三块矩形之并叫做并区。假设读者已经知道如何把因素空间背景集的概念随机化为背景分布,为节省篇幅,不在此赘述。
图4 模糊集的并、交运算Fig. 4 Union and intersection of fuzzy sets
证明是随机集对的覆盖概率,它等于矩形所占有的概率。是随机集对的覆盖概率,等于矩形所占有的概率。应当等于两矩形并区中的联合背景概率。证毕。
定理1的直观意思见图4。
定理2 当两个概念的表现因素是完全正相关时,它们之间的并、交运算必须取最大、最小概率:
当两个概念的表现因素相互独立时,它们之间的并、交运算必须取概率和与概率积:
当两个概念的表现因素是完全负相关时,它们之间的并、交运算必须取有界和与有界积:
定理2是因素空间对泛逻辑前3个连续逻辑算子对的证明,所叙述的条件完全符合泛逻辑的要求。定理2的证明见文献[20],这一结果曾在1991横滨国际模糊系统协会议上宣读。定理2的证明是最早也是最严格的数学证明。定理1也给出了在一般情况下隶属度的计算方法。其运算可由因素背景分布唯一确定。明确指明了解决隶属度运算的选择性困难的关键在于模糊概念背后的因素背景分布。
6 结束语
因素空间是泛逻辑表现的空间和舞台,因素空间为泛逻辑连续算子对的选择提供数学依据。泛逻辑是因素空间表现的内核与指引。泛逻辑与因素空间是逻辑与数学之间互相依靠的伙伴。
机制主义人工智能-泛逻辑-因素空间三者的结合,可以为人工智能的统一机制从逻辑与数学方面提供比较全面的研究。本文着重阐述了泛逻辑与因素空间之间存在着天然的联系,这样就保证了三结合理论的内在和谐与统一。