APP下载

可用性观点下的烟叶质量粗糙集评价方法

2015-07-07毛太田

运筹与管理 2015年3期
关键词:决策表粗糙集可用性

谭 旭, 毛太田, 邹 凯

(1.深圳信息职业技术学院 软件学院,广东 深圳 518172; 2.湘潭大学 公共管理学院,湖南 湘潭 411005)



可用性观点下的烟叶质量粗糙集评价方法

谭 旭1,2, 毛太田2, 邹 凯2

(1.深圳信息职业技术学院 软件学院,广东 深圳 518172; 2.湘潭大学 公共管理学院,湖南 湘潭 411005)

通过对现代卷烟产业中烟叶质量新需求的理解和归纳,构建了可用性观点下的烟叶质量综合评价新指标体系。考虑到实际烟叶质量评价中的数据的复杂性和问题求解的特殊性,将基于等价关系的Pawlak粗糙集模型扩展为基于上、下近似相似关系的扩展粗糙集模型,并设计了相应的可用性观点下烟叶质量粗糙集智能评价模型,在实现了不依赖主观先验信息求取各指标客观权重的同时,进一步引入了专家的主观权重信息,以达到对烟叶“可用性”需求的动态调整。文章首次尝试了基于定量化解决途径来应用和阐释烟叶的“可用性”概念,文末的实证分析验证了本文方法的可行性和一定程度的优越性。

烟叶质量;粗糙集理论;相似关系;可用性;综合评价

0 引言

烟叶质量是一个复杂而综合的概念,如何正确地理解和评价烟叶质量,有利于促进烟草资源的合理利用、保持卷烟产品品牌的一致性、维护烟农的合理收益,实现烟草行业的良性发展。目前国内外对烟叶质量的研究主要集中于基于烟叶的化学成分探索烟叶的外观质量和感官评吸质量[1]取得了丰富的研究成果。随着烟叶质量评价要求的提高,并缓解人工评测的压力和对人工经验要求的依赖度,国内外相关研究学者纷纷探索借助计算机技术进行烟叶质量的评测。如Sun利用主成分分析法基于中性挥发性化合物的分析区分研究了不同部位的烟叶质量[2],文[3]综合主成分分析和逐步回归分析从烟叶的评吸指标和外观指标上研究了烟叶质量,Zhang借助图像处理技术和模糊综合评价法进行了烟叶外观质量的评价分析[4],中国海洋大学的研究团队长期探索了在神经网络法、支持向量机、模糊聚类法等智能化分析方法下基于烟叶理化指标对烟叶外观质量和感官评吸质量的评价预测分析[5],殷勇教授尝试了利用粗糙集方法基于烟叶的6种化学成分数据研究了烟叶质量评价问题[6]。

随着“低害吸烟”的呼声日趋高涨和现代卷烟产业精细化生产要求的提升,单纯地依靠烟叶理化指标、外观特征或感官评吸质量来确定烟叶的总体质量将越来越显露出其局限性。而当评价指标呈现出纷繁复杂的多样性,评价数据也将体现出较大的复杂性和不规则性,为了提升烟叶质量评价结论的可信度并降低对人工经验的依赖度,如何选择和构建合理的智能化评价模型将显得尤为重要。粗糙集方法是不需要借助任何先验信息的一种有效数据分析工具[7],目前该方法在医疗诊断、社会计算、机器学习、管理决策分析等各领域有了成功的应用[8]。由于Pawlak经典粗糙集是基于上、下近似等价划分的简单数据处理模式,难以应对较为复杂的数据信息,所得的分析结果通常不具有较好的容错性和解释性[9]。由此,本文将首先基于文献综述理解,构建符合现代卷烟产业需求的“可用性”观点下的烟叶质量综合评价指标体系,而后考虑评价指标体系中数据的复杂性和求解问题的不确定性,将经典粗糙集进行扩展分析[10][11],并设计相应的扩展粗糙集烟叶质量综合评价模型,以较好地实现烟叶质量定量化评价的合理化和自动化。

1 可用性观点下的烟叶质量综合评价指标体系

关于烟叶质量,不同的学者基于不同的思考角度有着不同的结论看法。《烤烟》国标从最直观的烟叶外观表征出发将烟叶质量进行42等级的划分;而烟草专家认为应内在地捕捉烟叶燃烧后的烟气感官评吸数据来评定烟叶质量[12];相关研究学者则认为烟叶质量是“适合卷烟需要的物理性质和化学性质”和烟叶经济价格的综合;目前较普遍接受的观点认为,烟叶质量应包含烟叶的外观和内在品质以及烟叶的物理性状和化学成分[13]。近年来,自卫生界提出吸烟与肺癌的关系后,“低害吸烟”的呼声越来越大,世界卷烟业也因此受到了日趋严峻的吸烟影响健康的舆论压力,提高吸烟的安全性逐渐成为烟草行业能否继续生存与发展的共同目标。2000 年5 月,朱尊权院士在“中菲合作开发优质烟叶项目鉴定会”上提出了烟叶“可用性”评价的概念[14],该概念集成了当前烟叶质量评价的诸多观点,指出了烟叶质量评价的一条新思路。朱院士认为,“可用性”包括了烟叶本身主观的特征和客观的要求,是可变的,是随购买者的要求而变的,它是对烟叶本身概念更进一步的全面评价。

“可用性”的提出彻底修正了以前以烟叶部位和颜色为主导的烟叶品质划分以及单一的烟叶质量评价知识结构。不再信守“宁青勿糠”的信条,不盲目追求中部上等烟叶,充分考虑卷烟产品的综合质量和安全性,使得各部位的烟叶在“可用性”导向下得以充分利用。据此,烟叶质量我们可以理解为烟叶本身的外观特征和内在特点的优劣以及烟叶在工业上的可用性以及客观需求的统一体,也可以认为是卷烟消费者的合意性和制造卷烟时的烟叶可用性的利益攸关方之间的平衡。从另一方面理解,烟叶质量涵盖了叶片和烟气上的质量。叶片质量主要是指可以触及的外观质量和物理特性以及不可触及的含于叶片内部的化学成分,烟气质量主要是通过感官评吸的内在质量以及烟气成分对吸食者的安全性评价。故,烟叶质量的综合评价大体上可以囊括为烟叶的外在质量、烟叶的内在质量以及烟叶使用的安全性三个方面。图1为“可用性”观点理解下构建的烟叶质量综合评价指标体系。

以上所构建的三层评价指标体系,考虑了叶片本身的质量,叶片燃烧后评吸的质量,叶片燃烧时的安全性以及所有这些质量的化学成分基础,实现对烟叶进行全方位的合理理解。那么,如何将“可用性”因素体现于综合评价结果中?“可用性”是一个瞬息万变的概念,具有时间性、对应性和区域性,即不同的用户在不同的时间内面对不同的生产要求对烟叶的可用性均有不同的定义。有些时候在特定配方中只需强调某几个评价指标而其它的评价指标可以淡化处理,同样在购买烟叶时也不需要苛求全部的评价指标,他们甚至愿意用某几个指标来换取其它更重要指标的满足。在综合评价中,评价指标的确定无疑是非常关键的,但决定最终评价结果还需要通过设立指标权重值以及综合评价指标函数来实现。那么“可用性”这个变化因素可以考虑通过对评价中各指标权重值的调整以及指标函数的变化来达到其影响力。

图1 “可用性”观点下的烟叶质量综合评价指标体系

2 烟叶质量综合评价扩展粗糙集模型

“可用性”观点构建下的烟叶质量评价指标体系可望对烟叶质量予以全面的理解,但如何基于该评价指标体系对“可用性”因素予以定量化的应用分析,并智能化地获取烟叶质量的定量评价结论,本文将细致考虑求解问题的特殊性和数据的特殊性,尝试构建相应的扩展粗糙集模型予以解决。

经典Pawlak粗糙集模型的出发点是考察对象间基于条件属性集C的等价关系IND(C)。然而在烟叶质量综合评价中,依据图1指标层的指标所构建的决策表含有较多条件属性,且条件属性取值较为复杂,决策表呈现出一定程度的非协调性[15],经典粗糙集模型中的完全等价关系将过于严苛,难以获取具有容错性和完备性的分析结论。由此,本文基于数据的复杂性和非协调性考量,将等价关系延伸至相似关系[16],并构建相应的扩展粗糙集分析模型。

定义3和定义4将经典粗糙集模型中的等价关系泛化为相似关系,并更为细腻从上、下近似相似的两个维度刻画了这种相似关系。为了更加深入地依据决策表中的数据进行问题背景的决策分析,下面基于矩阵的方式考察决策表中数据对象集在条件属性集下的相似划分相对于决策属性等价划分的情况[17]。记U/IND(D)={[oi]D|oi∈U}={Y1,Y2,…,Yq},给出如定义5的分布矩阵刻画。

算法1 条件属性权重值粗糙集方法计算

输出:条件属性集C的权重向量值W(C)

算法1考虑了实际烟叶质量评价中获取评测数据的复杂情况,为了求取更为客观精确的评价指标(条件属性)权重值,我们尝试从ε-上、下近似相似划分的角度合理地扩展了粗糙集模型,并借助分布矩阵的刻画方式,以全面客观地获取藏匿于历史评测数据信息中的评价指标(条件属性)权重值。然而,在实际烟叶质量综合评价中,烟叶的可用性需求是动态变化的,相关专家的即时经验信息依然举足轻重(尤其是烟叶的感官数据和评吸数据信息),所以在“依据数据说话”客观求取各个评测指标权重值的同时,需要一定程度地参考相关专家的主观经验信息(本质上体现于各评测指标的主观权重值)来响应实时的烟叶可用需求情况。在三个不同准则层下,基于烟叶质量评价历史数据集所求取的指标客观权重以及专家经验给定的指标主观权重,借鉴文献[18]中的非线性规划组合赋权计算方法,获得不同准则层下各个指标更为合理的权重值。

图2 “可用性”观点下的烟叶质量粗糙集评价算法流程

算法2 可用性观点下的烟叶质量粗糙集综合评价计算

输入:烟叶外在质量历史数据决策表T1,烟叶内在质量历史数据决策表T2,烟叶安全性历史数据决策表T3,待评价烟叶数据信息表I

输出:可用性观点下待评价烟叶的综合质量评价值CEi

Step 1 依据算法1,分别基于决策表T1求取外在质量下的7个指标客观权重向量W(C1),基于决策表T2求取内在质量下的7个指标客观权重向量W(C2),基于决策表T3求取安全性下的5个指标客观权重向量W(C3);

Step 2 基于专家经验给定的特定烟叶可用性需求下外在质量各指标主观权重向量W′(C1)、内在质量各指标主观权重向量W′(C2)、安全性各指标主观权重向量W′(C3),分别与W(C1)、W(C2)和W(C3)进行组合赋权求解,获得最终的外在质量各指标权重向量W*(C1)、外内在质量各指标权重向量W*(C2)、安全性各指标权重向量W*(C3);

3 实例分析

为了求取在三个不同准则(C1,C2,C3)下各个指标的客观权重值,我们随机选取了275份同样产地为云南玉溪的样本烟叶作为评测分析历史数据集,且样本烟叶均匀采集于上、中、下等不同的分组部位。历史数据集中的275份烟叶样本均测定如表1所示的19个指标数据,并分别将归属于三个不同准则的指标集作为不同的条件属性集,决策属性则统一为区分烟叶分组的部位,由此获得烟叶外在质量历史数据决策表T1,烟叶内在质量历史数据决策表T2和烟叶安全性历史数据决策表T3。

表1 待评价候选烟叶指标数据集

进一步根据所挑选主料烟叶的“可用性”要求“所选烟叶应有较浓郁的香气,合适的劲头,余味干净,不允许较大的杂气,且焦油含量不可超标,而对于烟叶的填充性,伤残度,烟支重量无太大要求”,假设经提取相关权威专家的经验信息,获取三个评价准则下的各指标主观权重值为:

W′(C1)=(0.30,0.20,0.10,0.10,0.15,0.10,0.05)
W′(C2)=(0.25,0.20,0.15,0.08,0.15,0.15,0.02)
W′(C3)=(0.10,0.15,0.20,0.35,0.20)

借鉴文献[18]提出的组合赋权计算模型,分别将三个评价准则下各指标的客观权重值与主观权重值进行组合赋权最优化求解,可以求得最终的三个评价准则下的指标向量权重值:

W*(C1)= (0.168,0.265,0.227,0.084,0.158,0.050,0.048)
W*(C2)=(0.126,0.097,0.118,0.050,0.257,0.151,0.201)
W*(C3)= (0.099,0.075,0.342,0.233,0.261)

将表1中的部分指标数据基于文献[19]进行量化处理,并进一步将数值数据进行0-1形式的无纲量化处理。依据算法2中的步骤3,将求取的“可用性”观点下而分属不同评价准则的三个最终指标向量权重值与每份候选烟叶在各评价指标上的取值数据进行加权求和计算,容易得到这8份候选烟叶在三个不同“可用性”准则下的综合评价值,数据如表2所示。

表2 候选烟叶在各评价准则下的综合评价结果

CE1=0.3479,CE2=0.4134,CE3=0.2957,CE4=0.3384
CE5=0.3722,CE6=0.4635,CE7=0.3633,CE8=0.3187

依据分析结论并对比候选烟叶的指标数据,可以看到在本例中,“可用性”好的烟叶不再追求传统理念上的“叶片身份适中、伤残度小”等概念,也不盲目追求“劲头、燃烧性、烟支重量”等指标,而是根据烟叶使用的即时需求(本例更多地关注于外在质量的叶片成熟度,内在评吸质量上的香气、余味、杂气含量以及烟叶吸食安全性中的焦油含量、烟气烟碱含量)来判定,使得各部位、各类型的烟叶均具有相应的使用价值,这与现代卷烟消费和卷烟生产的理念是相契合的。

进一步,为了验证本文方法的正确性和一定程度的优越性,我们将实验结果与文献[20]中所采用的基于组合赋权的TOPSIS方法进行对比分析。首先,基于本文求取的指标层所有19个指标的组合赋权最终权重值与表2中无纲量归一化处理后的数据进行加权求解,进一步求得8份候选烟叶与正理想解和负理想解的欧氏距离分别为:

S+=[0.1598,0.1150,0.1868,0.1689,0.1452,0.1071,0.1391,0.2157]
S-=[0.1145,0.1493,0.1059,0.1177,0.1510,0.1822,0.1435,0.0382]

本文以烟叶“可用性”为基本指导,不仅合理求取了各评价指标的组合权重,更进一步定量化计算了各准则的权重值,使得针对各待评价烟叶的评价结论更加精细化且具有较好的区分度。为了验证本文方法的优越性,并考虑消除在不同评价方法下评价结果的不可公度性,定义方案评价结果的区分度为:

由此,求得本文方法的方案间评价结果的区分度为0.8436,而基于文献[20]的方法得到的区分度为0.8142。显然说明了由于本文针对权重的精细化求取,不仅保持了较好的评价结论一致性,更在一定程度体现了基于方案间区分度的优越性。

4 结语

烟叶“可用性”的提出深刻影响了现代卷烟产业,使得人们对烟叶质量的理解有了全新的认识。本文借鉴多方学者的相关研究成果并基于对朱尊权院士所提出的烟叶“可用性”评价概念的理解,尝试构建了 “可用性”观点下的三层架构烟叶质量综合评价指标体系,并考虑通过对各指标权重的计算调整来达到对特定需求环境下烟叶“可用性”的动态合理理解与把握。然而,目前针对烟叶“可用性”的实施应用很大程度上依然停留在定性化分析。对此,我们创新性地基于粗糙集智能方法从定量化的角度对本文所提出的烟叶“可用性”观点进行了扩展建模实现,将经典粗糙集模型中的等价划分关系扩展到ε-上、下近似相似划分关系,较好解决了具有较大复杂性和不确定性的烟叶质量综合评价定量化分析,且其中指标层的各指标客观权重求取实现了不依赖主观先验信息而纯粹依靠指标数据计算的方式来获取,达到了合理的评价分析自动化。

[1] Daniel Layten Davis, Mark Nielsen T. Tobacco-production, chemistry and technology[M]. Oxford: Blackwell Science, 1999.

[2] Sun Weifeng, Zhou Zhilei, Li Yue. Differentiation of flue-cured tobacco leaves in different positions based on neutral volatiles with principal component analysis(PCA)[J] .European Food Research and Technology, 2012, 235(4): 745-752.

[3] 张延军,李旭华,林锐锋.主成分回归分析法在永州烟叶评吸质量与外观质量的关系模型构建中的应用[J].中国农学通报,2012,28(18):260-265.

[4] Zhang Fan, Zhang Xinhong. Classification and quality evaluation of tobacco leaves based on image processing and fuzzy comprehensive evaluation[J]. Sensors, 2011, 11(3): 2369-2384.

[5] 冯天瑾,丁香乾.计算智能与科学配方[M].北京:科学出版社,2008.

[6] 殷勇.烟草成分对其品质影响程度的粗糙集判别方法[J].农业机械学报,2004,35(4):124-127.

[7] Zdzislaw Pawlak. Rough set theory and its applications to data analysis[J]. Cybernetics & Systems, 1998, 29(7): 661- 688.

[8] 李华雄,周献中,李天瑞.决策粗糙集理论及其研究进展[M].北京:科学出版社,2011.

[9] Yao Yiyu, Yao Bingxue. Covering based rough set approximations[J]. Information Sciences, 2012, 200: 91-107.

[10] Zbigniew Bonikowski, Edward Bryniarski, Urszula Wybraniec-Skardowska. Extensions and intentions in the rough set theory[J]. Information Sciences, 1998, 107(1- 4): 149-167.

[11] Wojciech Ziarko. Variable precision rough set model[J]. Journal of Computer and System Sciences, 1993, 46(1): 39-59.

[12] 张双红,潘中兴.论卷烟产品内在风格[J].烟草科技,1996,(2):7- 8.

[13] 沈光林.烟草内在质量评价体系的系统研究[D].广州:华南理工大学,2001.

[14] 朱尊权.烟叶的可用性与卷烟的安全性[J].烟草科技,2000,(8):3- 6.

[15] Krzysztof Dembczyńskia, Salvatore Greco, Roman Slowiński. Rough set approach to multiple criteria classification with imprecise evaluations and assignments[J]. European Journal of Operational Research, 2009, 198(2): 626- 636.

[16] Wei Wei, Liang Jiye, Qian Yuhua. A comparative study of rough sets for hybrid data[J]. Information Sciences, 2012, 190(1): 1-16.

[17] Xu Weihua, Li Yuan, Liao Xiuwu. Approaches to attribute reductions based on rough set and matrix computation in inconsistent ordered information systems[J]. Knowledge-Based Systems, 2012, 27: 78-91.

[18] 谭旭,高妍方,陈英武.区间型多属性决策求解新方法[J].系统工程与电子技术,2007,29(7):1082-1085.

[19] 吴殿信,袁志永,闫克玉,等.烤烟各等级烟叶质量指数的确定[J].烟草科技,2001,(12):9-15.

[20] 舒欢,刘文娜.基于组合赋权—TOPSIS 模型的水利工程建设方案优选决策方法[J].工程管理学报,2013,27(4):83- 86.

Quality Evaluation on Tobacco Leaf Based on Rough Set Theory:A View of Usability

TAN Xu1,2, MAO Tai-tian2, ZOU Kai2

(1.School of Software Engineering, Shenzhen Inst. of Info. Technol., Shenzhen 518172, China; 2.School of Public Management, Xiangtan Univ., Xiangtan 411005, China)

By digesting new requirements and influencing factors of tobacco leaf quality in modern cigarette industry, a novel comprehensive evaluation index system of tobacco leaf quality under the view of usability is built up. Regarding the complexity and diversity of index data and the particularity of problem through the assessment, we try to extend Pawlak rough set model to a new kind of rough set model based on upper-lower similarity relation, and construct an intelligent rough set model for tobacco leaf quality evaluation under the view of usability in further. In this way, objective index weights calculated by historical data without prior knowledge and subjective index weights based on expert experiences, are put forward to reach the dynamic understanding of tobacco leaf usability. So, it’s the first time we’ve tried to apply and express the concept of usability in a quantitative way. At the end of this paper, a flavorful tobacco leaf selection example is given to prove the feasibility and superiority.

tobacco leaf quality; rough set theory; similarity relation; usability; comprehensive evaluation

2013-10- 09

国家自然科学基金资助项目(71101096);广东省自然科学基金资助项目(S2012010008540);深圳市科技研发资金基础研究计划项目(JC201105190819A)

谭旭(1981-),男,湖南株洲人,博士,副教授,硕士生导师,主要从事粒计算和多属性评价决策分析的研究。

N94;TS4

A

1007-3221(2015)03- 0219- 08

猜你喜欢

决策表粗糙集可用性
粗糙集与包络分析下舰船运行数据聚类算法
基于决策表相容度和属性重要度的连续属性离散化算法*
基于辐射传输模型的GOCI晨昏时段数据的可用性分析
基于Pawlak粗糙集模型的集合运算关系
带权决策表的变精度约简算法
医疗器械的可用性工程浅析
基于决策等价性的决策表属性集分解研究*
一种基于粗糙集理论的社交网络潜在路径研究
基于决策技术和粗糙集理论的诊断知识库构建研究
黔西南州烤烟化学成分可用性评价