APP下载

基于区间集上的云模型研究

2014-02-24史运美蒋梦雪袁艺林王超亚秦瑜华

科技视界 2014年9期
关键词:云滴集上定性

史运美 蒋梦雪 袁艺林 王超亚 秦瑜华

(河南师范大学,河南 新乡 453002)

0 概述

在日常生活中,一些模糊概念经常会出现在我们的自然语言中,如果想用定量的数据来表示,却发现很困难。而云模型[1]恰能实现从定性概念到定量数据间的转化,它通过期望Ex、熵En、超熵He 三个数值来完成这些模糊概念到具体数据之间的转换,并以云图表现出来,与传统的处理模糊概念的方法相比,更加直观、具体;云模型对于日常生活中的不确定性概念有很好的表达能力。目前,传统的模糊数学在很多领域已经不能够满足模糊研究的需要,而云模型凭借其处理模糊度和随机性的优势越来越频繁的应用到各个领域。为了完善模糊研究中的存在的不足,本文对云模型的理论和应用的发展进行了探讨和总结。

与此同时许多不确定性或信息不安全的问题也体现在生活各处,仅用点值描述很难表达其准确的含义,而如果用区间集[2]来描述却可以有效的表达语义。将信息合理有效地区间分段,可以减少局部区间的波动,保证了结果的科学性和合理性,降低了结果分析的失误率,因此,区间集被广泛的应用于人工智能的控制、神经网络等领域中。区间集不仅能够反映逻辑推理的模糊性,而且符合人类推理模糊信息的习惯。故此,区间集本文研究的对象,并在区间集的基础上引出高斯云模型。

在国内外不乏单一的对云模型及区间集进行深入研究的学者,但将两者结合却寥寥无几,本文即是将两者结合的研究,即基于区间集的云模型研究。

本文首先在区间集上对2013 年统计得到的中国科学院院士的年龄分布情况进行统计分析,可以发现在40-60、60-100 岁上各年龄段的人数在总体呈正态趋势,同时在各年龄阶段范围内呈现局部正态函数的趋势。然后运用高斯函数对所有年龄段总体分析和计算,继而拟合出高斯云的回归方程。

1 基于区间集的云模型研究

1.1 区间集上的实例分析

科学家年龄及其结构是科学社会学研究中一个不可忽略的问题。但是,在研究的过程中,以什么方式研究对结果的产生在一定的程度上会有影响。本文通过采集2013 年中国科学院全部院士的年龄数据,基于区间集对其整体结构进行分析。

表1 院士年龄统计

从表1[3]数据可以得出在40-60 岁、60-100 岁的不同年龄区间局部年龄趋势呈正态分布,而且以上两个大年龄段的区间集上离散点的总体趋势也几近于正态分布,故可在此区间集上运用云模型加以研究。

从图1 可以看出院士年龄整体偏高,偏高的院士当选年龄和偏高的院士平均年龄不利于国家的科技创新与科技进步。要综合运用科学哲学、科学社会学等多种理论和知识,准确把握科学家群体的特殊属性及要求,完善院士选拔制度、调整院士的年龄结构,使大多数当选院士处在科学创造力和生产力的最佳年龄段。

图1 不同年龄的分布

1.2 区间集上的高斯云模型

由图1 发现年龄所构成的图形与高斯云分布[4]的图形在一定的程度上是相似的。因此,借助高斯函数对采集的数据进行拟合,以此引申为对科学家年龄的研究分析。

运用高斯云的数字特征[5]对表1 中60-100 年龄区间上的数据进行分析计算,得到不同区间集上利用高斯云的数字特征拟合后的数据。高斯云的数字特征如下:

1)高斯云分布的期望E{}X =Ex。

1.3 云的数值特征

一个云滴[6]是定性概念,在数量上一次实现,大量云滴组成云。尽管在不同的时刻产生的云滴不同,但是云的数字特征决定的云的整体形态基本不变。云的数字特征由期望Ex,熵En,超熵He 三个数值来表示,他们反映了定性概念上的定量特征。

期望Ex:是在数值域空间中最能体现定性概念的点值,是将定性概念数值化的最佳样本点。在云图中体现为云的峰值所处的位置,反应了这个概念的云滴群的云重心。

熵En:用来综合度量定性概念的模糊度和概率,即被定性概念接受的取值范围大小,反应了定性概念的不确定性。在云图中体现为云的宽度,熵值越大,概念越宏观,其模糊度和随机性也就越大。

超熵He:熵的不确定性的度量,反应云滴的离散程度,代表云滴出现的随机性,揭示了模糊性和随机性的关联。超熵越大,云滴离散程度越大,云图中的云厚度也就越大。

1.4 实例验证

根据回归曲线的定义,高斯云的回归曲线形成过程为:对于给定的 xi,对应确定度μi的期望值为 Eμi,不同的 xi对应的 Eμi拟合形成回归曲线。高斯云的回归曲线为

其解析形式难以求出,但可通过线性逼近的方法近似求得。

与回归曲线不同,高斯云曲线[7]的每一点是投影到该点的所有点的期望值。云主曲线的解析形式也难以给出,但同样可以通过线性逼近的方法近似求得。

先绘制中国科学院全体院士的年龄分布折线图,如下从图2 中可以看出,已分段后的年龄在局部范围内在不同程度的达到了峰值,因此,截取60 岁之后的数据,共579 个,以年龄段分组,作为研究之用。

利用MATLAB,直接对所采集的数据进行拟合。经过拟合之后,发现只有当套用高斯公式时,图形的贴近率最高。可得拟合之后的公式和图形分别为:

图3

2 结论

在基于区间集的云模型研究中,利用区间集的不确定概念不但可以得到语义解释,更能考虑到其计算性,一举两得。云模型利用期望、熵和超熵这三个数字特征来定量描述一个不确定性概念,通过正向云发生器[8]实现从概念的内涵向其外延进行转化,通过逆向云发生器实现从概念的内涵向其内延进行转化,较好地刻画了概念内涵与外延之间的双向认知变换过程,同时也解释了客观对象具有的模糊性和随机性。这种研究使云模型在更广泛的领域上得以应用。

[1]李德毅,刘常昱.论正态云模型的普适性[J].中国工程科学,2004,6(8):28-34.

[2]李德毅,杜.不确定性人工智能[M].北京:国防工业出版社,2005.

[3]刘禹,李德毅,张光卫,等.云模型雾化特性及在进化算法中的应用[J].电子学报,2009,37(8):1651-1658.

[4]刘玉超,李德毅.基于云模型的粒计算[J].

[5]苗夺谦,李德毅,姚一豫,等.不确定性与粒计算[M].北京:科学出版社,2011:1-23.

[6]刘禹,李德毅.正态云模型雾化性质统计分析[M].北京:航空航天大学学报,2010,36(11):1320-1324.

[7]邱东.模糊分析中的若干问题及与粗糙集理论的结合研究[D].电子科技大学,2009.

[8]张虹.模糊关系下的粗糙近似算子及相关属性的约简理论[D].昆明理工大学.2005.

猜你喜欢

云滴集上定性
分裂平衡问题的Levitin-Polyak适定性
福建九仙山一次佛光的云滴粒子尺度分析*
Cookie-Cutter集上的Gibbs测度
链完备偏序集上广义向量均衡问题解映射的保序性
当归和欧当归的定性与定量鉴别
复扇形指标集上的分布混沌
云微物理特性及云滴有效半径参数化:一次降水层状云的飞机观测资料结果
云滴谱离散度对气溶胶间接效应影响的研究进展