基于投影寻踪算法对体型转变的可能性评价研究
2018-05-23黎长春
王 涵,黎长春,张 雷
(重庆交通大学,重庆 400074)
《富态:腰围改变中国》作者认为,“肥胖问题是中国未来经济发展和公共卫生系统的一枚定时炸弹。”不要让肥胖大肆地祸害少年儿童。然而,青少年肥胖问题不仅是在中国呈严峻趋势,更是在其他多个国家肆掠,俨然成为全球性的问题。通过比较各个国家中青少年肥胖转变的可能性,得到普遍的规律以便国家间进行互相学习。
1 问题分析
为了对该群体的转变可能性进行科学评价,首先需要对影响其转变可能性的因子进行判定,筛选出最合适且影响度较大的因子,以形成一套完整的可能性指标体系。得到评级体系后,基于投影寻踪算法建立肥胖转变可能性评估模型得到5个国家的评价分值。就实际情况将由肥胖转变为正常体型可能性划分为5个等级,进而可将5个国家的转变可能性分等定级。
2 投影寻踪算法
由美国科学家Kruskal提出的投影寻踪聚类方法普遍应用于处理和分析高维数据。该方法既可进行不确定分析,也可进行确定性分析,经常用于各种方案的选择、生态安全中的评价分析、建设条件下的等级评价、可能性的评价以及项目决策分析与评价。因此,本文基于投影寻踪算法,对肥胖青少年由肥胖向正常体型转变的可能性进行评价。
3 模型的建立
3.1 指标体系的建立
由肥转向正常体型的转变可能性取决于外界因子、人体承受能力和应对能力3个方面。由于在外界因子的干扰下,再加上人体的应对能力的脆弱容易使转变为正常体型的可能性降低,如果人体在外界因子的干扰下而不采取措施,则会引起肥胖。本文通过查询相关文献资料,总结出在青少年肥胖背景下的外界因子、人体承受能力和应对能力3个一级指标,其下包括相对应的8个二级指标,以此建立肥胖转变为正常体型的可能性指标体系,如图1所示。
图1 指标体系
3.2 肥胖转变可能性评估模型的建立
由于该可能性评估的复杂性与多变性,单一函数不可能准确描述出肥胖转变为正常体型的可能性与三者之间的关系,因此,本文采用投影寻踪聚类方法对肥胖转变为正常体型的可能性进行评价。
3.3 评价指标归一化处理
假设由肥胖转为正常体型的可行性指标的样本集为{x*(i,j),i=1,2,…,n,j=1,2,…,p},其中,x*(i,j)为第i个样本的第j个指标值,n和p分别为待评国家数和可能性指标的数目,由于各指标值存在量纲差异,并需要统一其变化范围。
可采用下式处理越大越优的指标:
可采用下式处理越小越优的指标:
式(1)(2)中:xmax(j)、xmin(j)分别为第 i个指标值的最大值和最小值,x(i,j)为指标特征值归一化的序列。
3.4 线性投影
线性投影的原理即从不同角度对数据进行分析从而得到数据特征的最优投影方向。因此,本文采用线性投影,将多项影响指标值投影到一维空间上,进而得到反映该国家的特征数值,其被认为是能够反映该国家的肥胖转变可能性等级的量化值。将p维数据{x(i,j)│j=1,2,…,p}综合成以a={a(1),a(2),…,a(p)}为投影方向的一位投影值 z(j),即:
3.5 投影指标函数Q(a)的构建
投影指标散步特征被要求具有局部密集性,而在整体投影点团具有分散性。因此,投影指标函数为:
式(4)中:SZ为投影值z(i)的标准差;DZ为投影值的局部密度。
此外,且:
式(5)(6)中:E(z)为序列{z(i)│i=1,2,…,n}的均值;R为局部密度的窗口半径,通常取值为0.1SZ;r(i,k)=│z(i)-z(k)│,k=1,2,…,n,为样本之间的距离;u[R-r(i,k)]为以单位阶跃函数,当R-r(i,k)≥0时,值为1,当R-r(i,k)<0时,值为0.综上所述,目标函数与不同类的样本离散度(或同类样本的聚集度)成正比。
3.6 优化投影指标函数
已知最佳投影方向是Q(a)取得最大值时所对应的投影方向,其可表示为这是一个以{a(j)│j=1,2,…,p}为优化变量的复杂非线性优化问题,常用加速遗传算法(RACA)来处理,本文基于其求解代码,通过MATLAB实现了该运算。
3.7 评价等级及意义
投影特征值z(i)总体上反映了肥胖转变可能性的情况,参考相关文献中的等级划分原则,本文将其可能性等级分为五个等级(高、较高、中等、较低和低),肥胖转变可能性等级划分如表1所示。
表1 肥胖转变可能性的等级划分
3.8 综合评价分析
依据最佳投影方向,可计算待评样本的投影值z(i)。将计算结果与表1中所列的投影特征值区间进行对照,即可确定肥胖转变可能性的等级。
4 模型的求解
根据肥胖转变为正常体型的可能性评价指标体系以及收集到的数据资料,对各个国家的同一影响因素进行排名,根据排名打分,最高为5分,最低为1分。分值越高,其转变可能性越低;反之越高。
各国家肥胖转变可能性的评价可根据其分值进行投影寻踪聚类分析,由于指标分值越高,转变可能性越低,因此,将以上数据归一化处理可计算出结果。得到含有未知向量的投影值 z1=0.75a(1)+0.75a(2)+0.75a(3)+0.75a(4)+0a(5)+0.5a(6)+1a(7)+0.75a(8),同理代入第二、三、四组数据可得z2,z3,z4,z5的表达式,将各个表达式代入投影指标函数Q(a)。通过对目标函数及约束函数的编写,可利用MATLAB中的遗传算法工具箱进行求解。设置群体大小为100;终止进化代数取200;交叉概率取0.99;变异概率取0.1,可得到最佳投影方向向量a=(0.301 7,0.194 8,0.079 5,0.421 5,0.272 3,0.392 7,0.447 1,0.4805)。将最佳投影方向向量a代入公式得到各个国家的投影特征值z(i)和可能性等级如表2所示。
表2 各国家投影特征值和肥胖转变可能性等级
5 结果与分析
在基于投影寻踪聚类的肥胖体型转变(由肥胖转变为正常)的可能性评价模型中,最佳投影方向向量中各分量的大小实质上反映的是各指标对肥胖转变可能性的影响程度。因此,其值越大,对其可能性的影响程度就越大。
评价结果显示,中国和南非肥胖转变为正常体型的可能性较高,新西兰肥胖转变为正常体型的可能性中等,美国和西班牙肥胖转变为正常体型的可能性较低。本文对5个国家肥胖转变为正常体型的可能性评价结果同实际情况的符合度较高,即可验证该模型的可行性与可靠性。
6 模型的评价与推广
采用投影寻踪模型进行可能性评价,即需要将评价指标视为多投影参数的投影方向,从最佳投影值计算出每个国家的肥胖转变概率,有效地避免了人工赋值权重的干扰。如果加入更多的因素来评价该转变的可能性,同时,考虑主客观相结合的方法对评价指标赋值权重,模型将更切合实际。
利用该模型,可对某一地区的肥胖程度进行评估。通过分析肥胖的影响因素,可以根据实际问题控制或降低肥胖的比例,投影寻踪聚类模型也可有效用于水质安全评价。
参考文献:
[1]舒畅,姚安林,韩昌柴,等.基于投影寻踪聚类的油气管道失效可能性评价[J].中国安全生产科学技术,2016,12(12):99-104.
[2]刘海娟.遗传投影寻踪模型在生态评价中的应用[D].兰州:兰州大学,2013.
[3]黄显峰,贾永乐,方国华.基于投影寻踪法的城市水生态文明建设评价[J].水资源保护,2016,32(06):117-122.