应用信息熵理论综合评价甘蔗新品系
2014-12-24安汝东周清明经艳芬朱建荣孙友芳桃联安董立华杨李和
安汝东 ,周清明 ,经艳芬 ,朱建荣 ,孙友芳 ,桃联安 ,董立华 ,杨李和
(1.云南省农业科学院甘蔗研究所瑞丽育种站,瑞丽 678600;2.云南省甘蔗遗传改良重点实验室,开远 661699)
甘蔗是我国重要的糖料作物,甘蔗品种是蔗糖生产最为关键的基础。根据生产蔗区的不同生态环境条件和生产管理水平,选育适宜的品种来提高蔗糖生产水平,是蔗糖产业持续健康发展的重要保障。甘蔗品种选育主要是依据育种目标选配相应的亲本进行杂交产生杂种优势,在杂交后代中选择优异单株进行无性繁殖并将杂种优势固定,在后续观察与繁殖并行的选育阶段对目标性状进行调查、鉴定,按照“选优去劣”的原则进行评价、选择,进而育成新品种。甘蔗品种具有较多的经济性状,农艺方面主要包含出苗率、分蘖率、宿根萌苗率、茎径、有效茎数、甘蔗产量等性状,工艺方面主要包含早熟性、甘蔗糖分、还原糖分、重力纯度、纤维分、蔗糖产量等,因此对甘蔗品种进行评价涉及的指标也较多,要对甘蔗品种的优劣作出科学、客观的评价,就必须综合考察多个性状的表现,才能成功育成对生产具有利用价值的品种。
熵(Entropy)的概念来源于物理学,用于描述热力学意义上系统的混乱程度。1948年由信息论的创始人美国数学家Claude E.Shannon引入信息论之中,称为信息熵(Information Entropy),用于对一个随机变量的不确定性或信息量的度量,认为在一个系统中有序程度越高,其信息熵越小;反之,系统越混乱,其信息熵就越大,这一概念解决了对信息的量化度量问题[1]。信息熵能够反映出系统内部某种分布的差异,能够描述对系统进行评价时其相关指标的数据被利用的程度,即可以用来量化评价指标的重要程度[2]。在一个多指标的综合评价系统中,如果某一评价指标的信息熵越小,就表明其指标值的变异程度越大,提供的信息量就越多,其权重就应该越大;反之,评价指标的信息熵越大,其指标值的变异程度就越小,提供的信息量就越少,其权重就应该越小[3]。近年来基于信息熵的理论被多个领域应用,万星火[4]、周薇[5]等提出利用熵权进行综合评价的方法,曾蓉等[6]应用熵权法对高速公路洪灾风险进行评价,严宝文等[7]应用信息熵理论对农业环境地质系统状态进行评价,刘丙军等[8]利用信息熵原理对作物的需水空间相似性进行研究,陈敬武等[9]应用熵权法评价上市公司投资的价值,许学娜等[10]应用熵权法对企业的经营业绩和管理水平进行综合评价;应用信息熵理论在农作物综合评价方面的研究也较多,曹雯梅等[3]应用熵权法对棉花区试品种进行综合评价,李卫华等[11]结合DTOPSIS法对烟草区试品种试验进行综合评价,陈贤等[12]应用熵权法对番茄果实商品性状进行综合评价,张勇刚等[13]利用熵权法对烤烟感官质量进行综合评价。以上研究涉及的学科非常广泛,而且都获得了较好的结果,但是目前还未见信息熵理论在甘蔗方面的应用。近十年来,甘蔗品种的综合评价大多采用模糊综合评判法[14-18]、近似理想最优排序(DTOPSIS法)[19-24]等方法,这些方法的共同特点是需要人为的确定评价指标的权重,因此容易被主观因素影响评价结果。为此本研究基于信息熵理论来对甘蔗品种进行综合评价,以期克服传统评价方法中评价指标权重因人为赋值引起的局限性,从而实现对品种更为客观、可靠的综合评判。
1 材料与方法
1.1 试验材料
供试材料为本单位07系列甘蔗新品系:云瑞07-569、云瑞07-752、云瑞07-801、云瑞07-808、云瑞07-816、云瑞 07-928、云瑞 07-1226、云瑞 07-1433、云瑞 07-1610、云瑞 07-1914、云瑞 07-2446,全国统一对照品种 ROC22(CK1)和当地蔗区的主推品种粤糖 93-159(CK2),共计 13个。
1.2 试验方法
试验地设在云南省农科院甘蔗研究所瑞丽育种站的试验基地。于2010年初布置新植圃、2011年初将上年的新植蔗按宿根要求砍收布置成为宿根圃,并再重新布置一次新植圃,2年新植1年宿根共3次的品比试验。试验按随机区组设计,5行区,行长7m,行距1.1m,小区面积35.8m2,四周设保护行,两年期间的田间管理与大田生产相同。
1.3 调查测定项目与数据收集
农艺性状调查:下种后分别于4月初和月末调查出苗数,5月初和月末调查分蘖数,收获前调查株高、茎径、有效茎数及小区产量。工艺性状调查:从11月至次年3月采样分析甘蔗糖分、重力纯度、纤维分、还原糖分等,测定按照甘蔗制糖化学管理分析方法[25]进行。使用2新1宿的调查数据平均数进行分析。
1.4 信息熵分析方法
1.4.1 构建样本矩阵A 设有n个参试品种,m个调查性状,即由n个评价对象的m个评价指标的观测值构成样本评价矩阵X:
1.4.2 对样本矩阵进行无量纲化处理 采用比值法的3种测度将样本矩阵进行转换,以消除各指标量纲不同所造成的不具可比性,所有的变量均转换成正向变量,得到规范化矩阵R=(rij)n×m。
式中,i=1,2,…n;j=1,2,..,m,X0为性状指标最优的目标值。
1.4.4 计算第j项评价指标的熵值Ej根据熵的定义,第j项评价指标的熵值为:
式中,n为评价对象的数量,本试验为n=13。Ej∈(0,1),Ej值越趋近于0表示系统内评价指标的变异程度越大,反之Ej值越趋近于1表示系统内评价指标的变异程度越小。
2 结果与分析
2.1 13个品系材料农艺性状和工艺性状表现
将13个品系材料在两次新植一次宿根试验中各性状的平均表现列于表1,构成样本矩阵X=(Xij)n×m,n=13,m=13,其中选用11月份的甘蔗糖分指标来反映一个品种的早熟程度。
2.2 各评价性状的无量纲转化
根据育种目标,13个评价指标中的纤维分为中性指标,一般含量在10%较为适宜,如果含量太高会使甘蔗的出汁率降低而影响甘蔗糖分,含量太低又会造成甘蔗抗倒伏性和抗风折能力降低,因此选用中性测度来转化,其X0=10%。还原糖分含量越低越好,因此采用下限性测度。其余11个性状为越大越好,所以采用上限测度。经过无量纲转化后构成规范化矩阵R=(rij)n×m,见表2。
2.3 各评价性状的熵值及权重
由公式①、②、③计算得到13个性状的熵值及其权重列于表3。结果表明蔗糖产量的权重最大,为0.2099,其次是甘蔗产量,权重为0.1728;位于第3的是有效茎数,权重为0.1177;后面是11月蔗糖分、出苗率、甘蔗糖分、纤维分这4个性状的权重在0.0731至0.0564之间;紧接着是分蘖率、宿根萌苗率、还原糖、株高、茎径这5个性状的权重基本相当,在0.0496至0.0401之间;权重最小的性状是重力纯度,仅为0.0045。
表1 13个材料的农艺性状和工艺性状观察值
表2 13个材料的各性状无量纲化处理结果
表3 13个评价性状的熵值及权重
2.4 各参试品种的综合评价结果
根据公式④,计算出各品系的综合评价值Fi及排序列于表4,13个参试材料中,品系云瑞07-2446的综合评价值Fi最大,其次为云瑞07-1433,这两个品系均超过对照品种粤糖93-159(CK2,排名第3)和ROC22号(CK1,排名第4),根据信息熵原理,综合评价值Fi越大说明该品种综合性状越好,表明云瑞07-2446和云瑞07-1433的综合性状均优于两个对照种。 Fi值排名第5位的是云瑞07-928,其值较CK1小0.0002、略低于0.29%。其余8个品系材料(云瑞07-1226、云瑞07-569、云瑞07-752、云瑞07-1610、云瑞07-808、云瑞07-1914、云瑞 07-816、云瑞 07-801)的 Fi值在 0.0673~0.0614 之间,均低于 CK1和 CK2。
表4 13个品系的综台评价值和排序
3 结论与讨论
本研究应用信息熵理论计算出各评价性状的权重与文献[14-24]中多数依靠经验评判确定的权重大小趋势基本一致,即蔗糖产量的最大,甘蔗产量次之,有效茎数位居第三,之后为11月蔗糖分、出苗率、甘蔗糖分、纤维分,分蘖率、宿根萌苗率、还原糖、株高、茎径,重力纯度。其中有少数几个权重小的性状(如茎径、重力纯度等)之间的位次不一致,其原因可能是由于性状权重之间的差异太小,存在一定波动性,但主要性状总体一致,这有待进一步研究。通过深入分析与甘蔗产量性状相关的因子,发现有效茎数的权重大于出苗率,其后依次为分蘖率、宿根萌苗率,株高、茎径等,这种趋势结果与陈如凯[26]、李杨瑞[27]等学者关于甘蔗产量构成因素的研究结论基本相一致,即对甘蔗产量贡献最大的因子是有效茎数、其次为株高、茎径。分析与甘蔗品质性状相关的因子,可以看出11月糖分性状的权重大于全期甘蔗糖分的权重,说明甘蔗生长开始进入糖分积累阶段时,如果在前期就能代谢合成较多的蔗糖,有利于后期蔗糖分继续积累,最终达到其固有的水平,本试验结果符合甘蔗糖分的形成规律,即早熟的甘蔗品种其糖分一般都较高,甘蔗进入工艺成熟期,随着生长时间越长,积累的糖分就越多[27]。本试验应用信息熵理论对甘蔗品种进行综合评价,在一定程度上能克服传统的综合评价方法中指标的权重由于需要人为赋值而导致评价结果容易受主观因素影响的局限性,提高评价结果的可靠性和客观性。
根据信息熵原理,评价值Fi越大表明该品种的综合性状就越优,本研究评价出同时优于两个对照种的品系有云瑞07-2446和云瑞07-1433。比对照品种粤糖93-159差,但与对照种ROC22相当的品系有云瑞07-928。云瑞07-1433已经计划推荐参加国家甘蔗第十轮区域试验预试,云瑞07-2446和云瑞07-928已经在加速扩繁进行生产示范,其余8个材料综合表现不及对照品种,这一结果与田间表现基本一致。从各性状熵权值的大小可以看出,要选育优良的甘蔗品种,应该注重对熵权值大的性状,如蔗糖产量、甘蔗产量、有效茎数、甘蔗糖分、纤维分、株高、茎径等加大选择强度,而对于熵权值较小的性状,如重力纯度性状可从轻考虑。通过本试验对信息熵理论的实践应用,表明信息熵理论可以为甘蔗品种改良工作中评价、筛选优良育种材料和优良组合以及育种技术,提供一种新的思路和方法。
本研究仅从与甘蔗品种的产量性状和糖分性状相关的因子进行评价分析,然而影响甘蔗品种是否具有推广潜力还跟其他性状,例如脱叶性、空心蒲心程度以及抗病虫性等特性密切相关,因此本文的评价结果仅只是一方面,对于品系的综合表现尚需要进一步全面考察。
[1]傅祖芸.信息论—基础理论与应用[M].北京:电子工业出版社,2001:396-399.
[2]杨丽娟.信息熵在农业科技研究中的应用[J].安徽农业科学,2009,37(35):17781-17783.
[3]曹雯梅,路凤银,刘松涛,等.基于信息熵理论的模糊综合评价方法及其在棉花区试中的应用[J].中国农学通报,2013,29(8):212-215.
[4]万星火,李艳,檀亦丽,等.基于信息熵的赋权法研究及其应用[J].统计与决策,2008(18):153-154.
[5]周薇,李筱菁.基于信息熵理论的综合评价方法[J].科学技术与工程,2010,10(23):5839-5843.
[6]曾蓉,李俊业,王宝亮.基于熵权的模糊综合评价法在公路洪灾风险评价中的应用[J].地质灾害与环境保护,2010,21(3):83-87.
[7]严宝文,方立,李靖,等.基于信息熵理论的农业环境地质系统状态评价方法研究[J].西北农林科技大学学报(自然科学版),2007,35(11):223-229.
[8]刘丙军,邵东国,曹卫锋.基于信息熵原理的作物需水空间相似性分析[J].水利学报,2005,36(12):1439-1444.
[9]陈敬武,雷升.基于熵值赋权的上市公司投资价值灰关联评判[J].河北工业大学学报,2008,37(1):56-62.
[10]许学娜,刘金兰,王之君.基于熵权TOPSIS法的企业对标评价模型及实证研究[J].情报杂志,2011,30(1):78-82.
[11]李卫华,罗成刚,陈志强,等.熵值赋权的DTOPSIS法在烟草品种试验中的应用[J].湖北农业科学,2013,52(7):1590-1592,1595.
[12]陈贤,赵雁,龚元圣.熵权法在番茄果实商品性状评价上的应用分析[J].湖北农业科学,2008,41(11):1294-1297.
[13]张勇刚,宋朝鹏,李常军,等.熵权模糊综合评价法在烤烟感官质量评价中的应用[J].中国烟草学报,2010,12(6):33-36.
[14]刘少春,吴正焜,陈学宽,等.引进甘蔗品种主要经济性状模糊综合评判[J].甘蔗糖业,2002(1):15-18.
[15]关中秀,黄忠兴,林宇,等.甘蔗品种的模糊综合评判[J].甘蔗糖业,2003(3):10-13.
[16]刘家勇,陈学宽,范源洪,等.甘蔗品种模糊综合评判[J].亚热带农业研究,2005(1):4-7.
[17]张革民,刘海斌,容凤玉,等.高糖、高产甘蔗新品种重要性状分析及模糊综合评判[J].中国糖料,2006(1):23-25.
[18]谭芳,黎焕光,王伦旺,等.用模糊综合评判方法筛选甘蔗优良杂交组合[J].西南农业学报,2012,25(2):396-400.
[19]赵培方,吴才文,陈学宽,等.DTOPSIS 法对甘蔗新品系的综合评价[J].中国糖料,2008(1):43-45,47.
[20]昝逢刚;赵培方;杨昆,等.云南省第十套甘蔗区试开远点DTOPSIS法综合评价[J].中国糖料,2011(1):8-10.
[21]陆鑫,毛钧,苏火生,等.DTOPSIS 法综合评价甘蔗创新种质[J].中国糖料,2012(1):33-35,37.
[22]经艳芬,周清明,段惠芬,等.国家七轮区试甘蔗品种在云南瑞丽点表现的DTOPSIS法综合评价[J].西南农业学报,2012,25(4):1177-1180.
[23]马文清,郭强,李杨,等.应用DTOPSIS法综合评价甘蔗自育品系[J].中国糖料,2013(1):20-22.
[24]姚丽,陈学宽,赵培方,等.DTOPSIS法对云蔗05型甘蔗品系的综合评价[J].中国糖料,2013(2):37-39.
[25]中国轻工业总会甘蔗糖业质量监督检测中心.甘蔗制糖化学管理分析方法[M].广州:轻工业出版社,1995:33-36,70-73.
[26]陈如凯,林彦铨,张木清,等.现代甘蔗育种的理论与实践[M].北京:中国农业出版社,2003:108.
[27]李杨瑞.现代甘蔗学[M].北京:中国农业出版社,2010:80.
[28]李奇伟,陈子云,梁洪.现代甘蔗改良技术[M].广州:华南理工大学出版社,2000:121-127.