多属性皮肤指标的中医体质模糊优化分类模型*
2016-10-12张慧妍王小艺董银卯
李 爽,张慧妍,+,王 立,,王小艺,,董银卯,孟 宏
1.北京工商大学 计算机与信息工程学院,北京 100048 2.北京工商大学 中国化妆品研究中心,北京 100048
多属性皮肤指标的中医体质模糊优化分类模型*
李爽1,张慧妍1,2+,王立1,2,王小艺1,2,董银卯2,孟宏2
1.北京工商大学 计算机与信息工程学院,北京 100048 2.北京工商大学 中国化妆品研究中心,北京 100048
LI Shuang,ZHANG Huiyan,WANG Li,et al.Fuzzy optimization classification model in Chinese medicine constitution of multi-attribute skin indexes.Journal of Frontiers of Computer Science and Technology,2016, 10(7):995-1002.
探索面部皮肤指标与人体内在的中医体质类型间的隐形关联关系并确定体质类型,可为皮肤养护与诊疗提供新途径。选取中国化妆品研究中心实测的具有多属性特性的皮肤本底样本值及由中医体质问卷确定的体质分类结果作为建模匹配数据对,依据Spearman相关性进行主成分分析,实现了皮肤指标降维,而后依据模糊统计方法得到皮肤指标对体质的模糊隶属度,实现了非标准化数据的智能化划分。在此基础上,提出了一种融合主客观信息的模糊优化组合赋权法,用以降低分类误差,建立多属性皮肤指标的中医体质模糊优化分类模型。针对新样本的测试结果表明,模型分类正确率达到80%,从而证明了模糊分类模型具有较好的实用性及有效性,并可为其他非标准化与个性化数据的模糊多属性分类与评价问题的深入研究提供新思路。
模糊分类;组合赋权;统计分析;中医体质
1 引言
依据中医理论,体质是人体生命过程中,在先天禀赋和后天生活习惯基础上所形成的形态结构、生理功能和心理状态方面综合的、相对稳定的固有特质[1]。体质作为皮肤表征的重要物质基础,对皮肤的颜色、光泽、质地、水分、弹性、平滑度等众多属性具有影响[2]。目前研究将人体划分为平和质、气虚质、阳虚质、阴虚质、痰湿质、湿热质、血瘀质、气郁质、特禀质九大体质,其中平和质的人群肤色润泽,唇色红润,精力充沛,属于健康人群,而其他8种则归类为偏颇体质,其对应的皮肤或多或少存在一些问题。研究皮肤与体质的潜在联系,对于皮肤保养及人体健康诊疗具有重要意义。
黄冲等人[3]采用朴素贝叶斯分类和最小距离分类两种分类方法,从数理统计角度对王琦教授《中医体质分类与判定》标准问卷中的答案进行判别研究,建立了中医体质分类模型;战文翔等人[4]通过统计学方法对36 486例调查对象的问卷答案进行分类,结果显示中老年人偏颇体质占多数,达到98.45%,平和体质仅占1.55%;马建伟等人[5]通过问卷调查获取了200名中国飞行员的体质类型后,采用多元Logistic回归分析确定了体质与生活习惯、周围环境等因素的相互关系,为后续提高飞行员的健康水平提供了理论指导。李建民等人[6]对中医体质与皮肤水分和酸碱度的关系进行了研究,结果表明相较于平和体质,其他体质的水分含量和PH值都相对较高;王雪等人[7]研究了黑龙江地区女性皮肤黑色素、血红素与中医体质的关系,发现与平和质相比,其他各类体质的黑色素、血色素值均较小;曲建宁等人[8]在对测试者皮肤状态打分的基础上,根据其体质类型统计数据,指出平和体质人群各项皮肤指标得分均最高,偏颇体质会影响皮肤指标得分,其中对指标影响最大的是阳虚质和气郁质。
本文基于反映专家诊疗经验的调查问卷及实测数据挖掘外在皮肤品质特征与内在人体中医体质的信息关联,建立判定个体属于平和体质及偏颇体质的二分类模型,为后续进行皮肤状态改善和人体健康诊疗提供理论支撑与决策依据,为信息技术处理模糊多属性数据以更好地服务民生拓展了新的思路。
2人体面部皮肤指标体系的建立及数据预处理
2.1人体面部皮肤指标体系建立
目前,常用的人体面部皮肤指标包括水分含量、水分散失、油脂、黑红色素等。本文根据皮肤领域背景知识和中医理论,从水润度、白皙度、平滑度、紧实度等角度确定能够充分全面衡量人体面部皮肤状态的指标体系如图1所示。
Fig.1 Index system of human facial skin图1 人体面部皮肤指标体系
2.2基于Spearman相关性的主成分分析
皮肤指标体系中的指标维数较多,为了避免分类、评价研究中皮肤指标存在冗余,在处理指标数据前先通过主成分分析法对指标降维。
由于人体面部皮肤指标数据具有离散型、非标准化与个性化的特点,样本间差异较大,在小样本条件下无法满足正态分布,故选择对分析变量不需要正态性假设的Spearman秩相关系数来度量指标间的相关性[9],一般认为 ρs大于0.4的指标间相关性较强。参照文献[10]所述的方法,依次计算20个指标两两之间的Spearman秩相关系数,筛选出相关系数大于0.4的指标,采用主成分分析法对其进行降维[11]。具体计算步骤如下:
(1)标准化各指标数据;
(2)求解标准化后指标数据的相关系数矩阵;
(3)求解相关系数矩阵的特征根;
(4)求解特征根对应的特征向量,其中最大特征根的特征向量对应第一主成分的系数向量,以此类推;
(5)计算各主成分的贡献率,取累计贡献率大于70%的主成分作为综合后的新指标,并结合实际给对应指标赋予新的含义。
2.3模糊统计确定指标对体质的隶属度
皮肤指标数据受内外影响存在一定的波动性,区间边界附近的指标值在重复测试中可能被划分到不同区间,这从根本上制约了标准化分类与评价研究工作的开展。因此,本文提出采用模糊统计方法确定皮肤指标对中医体质的隶属度,实现数据的规范化。
以水分散失指标为例,考察n个人的水分散失数据,其中通过调查问卷确定p个人属于平和体质,f个人属于偏颇体质,则根据水分散失数据确定对平和体质的隶属度计算步骤如下:
(1)将p个平和体质人群的水分散失值按照从小到大的顺序进行排序,然后分成合适的正整数h组,分别对应h次的模糊统计实验。其中第1组由个值组成,第2组增加了个值,以此类推,h组即包含了所有p个样本值。
(3)将p个人的水分散失值依次带入式(1)中,计算出每个人在水分散失指标下对平和体质的模糊隶属度矩阵l(p)1。
(4)依次将余下h-1组数据带入步骤(2)、(3),计算出h-1个模糊隶属度矩阵。
(5)将h次模糊统计实验计算出的模糊隶属度矩阵取平均,得到水分散失对平和体质的平均相对隶属度矩阵为:
3基于皮肤指标的中医体质模糊优化分类
从中医角度对人体面部皮肤状态进行直观评判目前主要依据水润、白皙、紧实及平滑这4个维度进行,其指标权重的确定对分类的准确性具有重要影响。若能结合实测数据对指标权重进行调整,则有利于体质与皮肤之间客观规律的提取。因此本文提出一种融合主客观信息的模糊优化分类算法对指标进行赋权,以提高分类准确率。
3.1层次分析法与熵值法组合赋权
熵值法是一种客观赋权方法,它通过计算信息熵求解出各指标的差异系数,进而根据指标的差异系数对整体的影响来决定指标的权重。其中,信息熵的计算步骤如下。
(1)计算第j项指标下,第i个测试对象的特征比重:
(2)计算第j项指标的熵值:
层次分析法是易于吸取领域专家经验,对定性问题进行定量分析的一种简便、灵活而又实用的多准则决策方法[12]。熵值法可以充分挖掘指标数据所蕴含的信息,结果相对客观,层次分析法则集成了专家的经验和知识,主观随意性相对较大[13-14]。因此,本文采用将二者结合的组合赋权法确定各指标权重,设二者的比例系数分别为a和b,则组合赋权法计算步骤如图2所示。
Fig.2 Flowchart of determining index weight图2 指标权重确定流程图
其中,a和b的计算原理如下:
设sj、cj分别为熵值法和层次分析法计算出的某指标xj的权重系数,则称
是具有同时体现主客观信息集成特征的权重系数。
依据上述测试样本的模糊隶属度计算易知,平和质受测对象pi的第j个指标对属于平和体质与偏颇体质的隶属度之差为l(p-f)ij,则偏颇体质受测对象fi的第j个指标对偏颇体质与平和体质的隶属度之差为l(f-p)ij,则构成的lij矩阵如式(6)所示,反应第i个受测对象的第j个指标对两类体质的隶属程度之差:
显然有lij>0,对各指标加权后可得:
为提高分类模型准确率,本文提出比例系数a和b,优化的目标函数为:
可见,目标函数取值越大表明用于体质分类的参数取值越适当。此外,参数a、b满足的约束条件为:
应用Lagrange条件极值原理,即可求得a、b的最优解。
3.2体质分类
在通过组合赋权法确定皮肤指标的权重后,进行中医体质的二分类研究则仅需计算出样本的多属性指标综合后对两类体质的隶属度之差lw,进而判定对应的分类结果。lw定义为:
若加权综合后的lw>0,则这个人属于平和体质,否则属于非平和体质。
4 实例
4.1样本来源
选取北京工商大学化妆品研究中心于2014年11月测试获得的175组皮肤本底样本数值,测试对象为京津冀地区年龄在18~35岁之间的女性,体质分类结果根据中医体质问卷调查确定。实验采用德国CK公司专业的皮肤测试仪器对受测者的水分含量、水分散失、油脂、黑色素MI、光泽度、弹性、粗糙度等20项指标进行测试,其中每个指标又分别测试额头、左眼角、左脸颊和下巴4个部位。测试过程中保证了受测者皮肤清洁,环境恒温等测试条件。
随机挑选155组样本数据为建模的训练样本,余下20组为测试样本。其中,训练样本包含平和体质51组,偏颇体质104组;测试样本包含平和体质6组,偏颇体质14组。
4.2体质分类模型的建立
在建模过程中为充分利用全部的面部皮肤信息,将每位受测者的4个部位指标值进行加权,依据专家意见对其权重分别设定为额头0.1、左眼角0.2、左脸颊0.5、下巴0.2,加权后每个指标得到一个综合值。
计算155组训练样本中20个皮肤指标两两之间的Spearman秩相关系数,筛选出相关系数大于0.4的指标。分析计算结果可得,{MI、EI、L、A、B、IAT}、 {R2、R5、R7}、{LR、Ra、Rz、Rt}、{PO2、PCO2}间具有较强相关性。对上述4组指标分别采用主成分分析法进行降维,得到的第一主成分贡献率均大于70%,故将4组指标分别综合为第一主成分所对应的新指标,分别命名为色度、弹性、粗糙度和气血。最后获得的人体面部皮肤指标体系包括水分含量、水分散失、油脂、色度、光泽度、弹性、PH值、粗糙度和气血9个指标。
首先,依次对155位受测者的上述9个皮肤指标进行模糊统计,将51位平和体质受测者的各项指标值分成5组,104位非平和体质受测者的各项指标值分成8组,每组等分为5个区间。参照2.3节所述的实验步骤,计算各指标对两类体质的平均相对模糊隶属度。以水分散失对偏颇体质的模糊隶属度为例展示模糊统计结果如图3所示。可以看出,随着实验次数的增多,模糊隶属度趋于稳定。
然后,构建融合主客观信息的人体面部皮肤状态层次结构模型如图4所示。本次参加测试的皆为年轻人,其皮肤大多较光滑,紧实度高,因此领域专家给出的准则层皮肤状态考量4个维度的权重排序依次为:水润度>白皙度>平滑度>紧实度。
这样,依据专家意见构造判断矩阵,经过一致性检验,表明具有较好的一致性。同时,按照图2所示的计算步骤,基于实测数据采用熵值法进行指标权重计算。
为优化确定组合权重系数,需要将上述获得的各指标权重值和其对两类体质的模糊隶属度带入式(4)~(7),这样便可计算出归一化后的比例系数a、b,求得a=0.51,b=0.49。具体皮肤指标权重结果详见表1。依据式(8),即可确定每位受测者的体质类型。对20组测试样本,分别将3类赋权方法的结果带入已经建好的分类模型中,分类输出与问卷调查结果相对比,可发现组合赋权法分类准确率最高,达到80%,层次分析法和熵值法均有所下降,只达到75%。分类模型的详细分类情况见表2。分析实验结果可知,采用本文提出的基于组合赋权的模糊优化体质分类模型与基于专家诊疗经验的体质问卷分类结果吻合度较高。
Fig.3 Average relative membership degree of water loss to non-gentle constitution图3 水分散失-非平和体质平均相对隶属度
Fig.4 Hierarchical structure model of skin图4 皮肤状态层次结构模型
Table 1 Results of analytic hierarchy process&entropy method combination weighting表1 层次分析法-熵值法组合赋权结果
Table 2 Output of classification model表2 分类模型输出
5 结束语
本文依据中医理论——“有诸内,必形于外”,探索人体面部皮肤状态多属性指标与体质之间的隐性关联关系。由于人体面部皮肤指标与性别、地域、季节、年龄,甚至测试前的睡眠状况等都关联密切,本次测试仅针对京、津、冀地区,年龄在18~35岁之间的女性集合进行。考虑影响因素的复杂性与随机干扰,采用模糊优化方法融合调查问卷获取专家关于体质分类的经验及皮肤指标实测数据,对多属性皮肤指标进行中医体质分类研究。首先对常规的皮肤指标体系采用基于Spearman相关性的主成分分析法进行降维,然后通过模糊统计获得各指标对中医体质的模糊隶属度,最后提出采用分类偏差最小化原则优化确定组合权重,以建立分类精度较高的中医体质分类模型。该模型的分类结果与体质问卷调查结果具有良好的一致性,能够比较客观地描述皮肤状态和体质间的潜在联系,具有较好的实际应用与理论参考价值,分类模型简洁、高效,易于推广。后续,考察其他地域、年龄人群的皮肤指标与中医体质关联关系时,可借鉴本文方法并结合特定人群皮肤测试数据集进行深入研究。
[1]Wang Ji,Zhang Huimin,Li Lingru,et al.Theory of skin relating to constitution put forward by professor WANG Qi and its application in dermatology[J].Journal of Beijing University of Traditional Chinese Medicine,2013,36(7): 476-477.
[2]Zhang Haidi,Dong Yinmao,Meng Hong.TCM constitution and skin health[J].Beijing Daily Chemical,2011(3):14-19.
[3]Huang Chong,Liu Zhuojun.Astudy about constitution catagories in traditional Chinese medicine based on statistic analysis[J].Chinese Journal of Management Science,2012,20 (S1):120-125.
[4]Zhan Wenxiang,Shen Fangfang,Shen Wei,et al.A study of TCM constitution classification in 36486 cases of wrinkly[J]. Chinese Journal of Clinical Research,2014,27(9):1150-1152.
[5]Ma Jianwei,Dong Jing,Xu Limei,et al.Study on the characteristics of TCM constitution classification of pilots[J]. Beijing Journal of Traditional Chinese Medicine,2011,30 (5):337-339.
[6]Li Jianmin,Wang Xue,Qi Yonghua,et al.Study on the relationship between traditional Chinese medicine constitution and skin’s water,pH value[J].Acta Chinese Medicine and Pharmacology,2012,40(4):81-82.
[7]Wang Xue,Xu Yanming,Zhang Ning,et al.Study on the relationship between traditional Chinese medicine constitution and skinƳs melanin,protoheme[J].Chinese Journal of Aesthetic Medicine,2012,21(5):764-766.
[8]Qu Jianning,Wang Ji,Zhao Ya,et al.A relevant research on facial skin conditions of Chinese urban females and TCM constitutional types[J].Chinese Journal of Information on TCM,2014,21(10):22-23.
[9]Bickel D R.Robust cluster analysis of microarray gene expression data with the number of clusters determined biologically[J].Bioinformatics,2003,19(7):818-824.
[10]Liu Di,Cho S Y,Sun Dongmei,et al.A Spearman correlation coefficient ranking for matching-score fusion on speaker recognition[C]//TENCON 2010-IEEE Region 10 Conference,Fukuoka,Japan,Nov 21-24,2010.Piscataway,USA: IEEE,2010:736-741.
[11]Costa J F P D,Alonso H,Roque L.A weighted principal component analysis and its application to gene expression data[J].IEEE/ACM Transactions on Computational Biology &Bioinformatics,2011,8(1):246-252.
[12]Du Changxiao,Li Xiaohong,Shi Hong,et al.Security evaluation method for the architecture of J2EE applications[J]. Journal of Frontiers of Computer Science and Technology, 2014,8(5):572-581.
[13]Ma Xiyuan,Sun Yuanzhang,Fang Hualiang,et al.Scenariobased multi-objective decision-making of optimal access point for wind power transmission corridor in the load centers[J]. IEEE Transactions on Sustainable Energy,2013,4(1):229-239.
[14]Gu Zhenli.Research on an evaluation model of the MCAI software based on the improved entropy method[J].Computer Engineering&Science,2010,32(7):134-136.
附中文参考文献:
[1]王济,张惠敏,李玲孺,等.王琦教授“肤-体相关论”的提出及其在皮肤病诊疗中的应用[J].北京中医药大学学报,2013,36(7):476-477.
[2]张海娣,董银卯,孟宏.中医体质学与皮肤养生[J].北京日化,2011(3):14-19.
[3]黄冲,刘卓军.基于统计分析的中医体质分类研究[J].中国管理科学,2012,20(S1):120-125.
[4]战文翔,申芳芳,沈伟,等.36486例中老年人中医体质分类研究[J].中国临床研究,2014,27(9):1150-1152.
[5]马建伟,董静,徐丽梅,等.飞行员中医体质分类特征的研究[J].北京中医药,2011,30(5):337-339.
[6]李建民,王雪,祁永华,等.中医体质与皮肤水分及pH值的关系研究[J].中医药学报,2012,40(4):81-82.
[7]王雪,徐艳明,张宁,等.中医体质与皮肤黑色素和血红素的关系研究[J].中国美容医学,2012,21(5):764-766.
[8]曲建宁,王济,赵亚,等.中国城市女性面部皮肤状态与中医体质类型相关性研究[J].中国中医药信息杂志,2014, 21(10):22-23.
[12]杜长霄,李晓红,石红,等.J2EE应用软件的架构安全评估方法[J].计算机科学与探索,2014,8(5):572-581.
[14]谷震离.基于改进熵值法的MCAI软件评价模型研究[J].计算机工程与科学,2010,32(7):134-136.
LI Shuang was born in 1992.She is an M.S.candidate at Beijing Technology and Business University.Her research interest is data analysis and modeling.
李爽(1992—),女,北京人,北京工商大学硕士研究生,主要研究领域为数据分析与建模。
ZHANG Huiyan was born in 1973.She is an associate professor at Beijing Technology and Business University. Her research interest is data modeling,classification and evaluation.
张慧妍(1973—),女,黑龙江齐齐哈尔人,博士,北京工商大学副教授,主要研究领域为数据建模、分类与评价。
WANG Li was born in 1983.She is an associate professor at Beijing Technology and Business University.Her research interest is statistical analysis and forecast.
王立(1983—),女,北京人,博士,现为北京工商大学副教授,主要研究领域为统计分析与预测。
WANG Xiaoyi was born in 1975.He is a professor at Beijing Technology and Business University.His research interest is modeling and forecasting based on data.
王小艺(1975—),男,山西新绛人,博士,北京工商大学教授,主要研究领域为基于数据的建模与预测研究。
DONG Yinmao was born in 1963.He is a professor at Beijing Technology and Business University.His research interess include Chinese medicine constitution and skin health cosmetics.
董银卯(1963—),男,河北辛集人,博士,北京工商大学教授,主要研究领域为中医体质,皮肤养生化妆品。
MENG Hong was born in 1969.She is a professor at Beijing Technology and Business University.Her research interest is skin medical health technology(traditional Chinese medical science).
孟宏(1969—),女,山东菏泽人,博士,北京工商大学教授,主要研究领域为皮肤医学养生技术(中医)。
Fuzzy Optimization Classification Model in Chinese Medicine Constitution of Multi-Attribute Skin Indexes*
LI Shuang1,ZHANG Huiyan1,2+,WANG Li1,2,WANG Xiaoyi1,2,DONG Yinmao2,MENG Hong2
1.School of Computer and Information Engineering,Beijing Technology and Business University,Beijing 100048,China 2.China Cosmetic Research Center,Beijing Technology and Business University,Beijing 100048,China +Corresponding author:E-mail:zhanghuiyan369@126.com
This paper explores the invisible incidence relation between facial skin indexes and traditional Chinese medicine(TCM)constitution to determine constitution types,which can provide new ways for skin diagnosis and treatment.Multi-attribute skin background sample values tested by China Cosmetics Research Center and the constitution classification results determined through constitution questionnaire are selected as model matching data.Firstly,principal component analysis based on Spearman correlation is adopted to reduce the dimension of indexes.Then,fuzzy membership degrees of indexes to constitution are gotten by statistical experiment to realize intelligent classification of non-standardized data.On this basis,this paper proposes a fuzzy optimization combination weighting method fused by subjective and objective information to reduce classification error,and establishes TCM constitution fuzzyoptimization classification model of multi-attribute skin indexes.Testing results of new samples show that classification accuracy of model reaches 80%.Thus the fuzzy classification model in this paper has good practicality and validity,which can provide new ideas for further research on fuzzy multi-attribute classification and evaluation of other non-standardized and personalized data.
fuzzy classification;combination weighting;statistical analysis;Chinese medicine constitution
2015-10,Accepted 2016-01.
10.3778/j.issn.1673-9418.1510035
A
TP182
*The Key Project of Science and Technology Development Plan of Beijing Municipal Education Commission under Grant No. KZ201510011011(北京市教委科技计划重点项目);the Comprehensive Reform Project of Personnel Training of Beijing Technology and Business University-Research Center of Chinese Cosmetic Collaborative Innovation under Grant No.19008001060(北京工商大学促进人才培养综合改革项目-中国化妆品协同创新研究中心).
CNKI网络优先出版:2016-01-27,http://www.cnki.net/kcms/detail/11.5602.TP.20160127.1635.002.html