基于模糊等价关系的聚类分析方法在鱼类种群鉴定和海洋强风暴潮灾害评估中的应用研究
2013-08-14苏婷高静霞傅建军苏诚李家乐陈靓瑜黄雅馨
苏婷,高静霞,傅建军,苏诚,李家乐,陈靓瑜,黄雅馨
(1.上海海洋大学 农业部淡水水产种质资源重点实验室,上海 201306;2.国家海洋局东海信息中心,上海 200137)
模糊聚类分析是依据客观事物间的特征、亲疏程度和相似性,通过建立模糊相似关系对客观事物进行分类的数学方法(谢季坚等,2000)。其主要用途是对所研究的样本进行合理的分类,并可作为模糊识别提供模板依据,把需要识别的事物与模板进行模糊比较,从而得到所属的类别。
21世纪是人类开发利用、保护海洋的新世纪。海洋中的生物资源及各种自然过程的复杂和综合性,多伴随着模糊性。合理的统计方法有助于对海洋信息的分析,是有效利用海洋资源的前提。近年来,国内外学者利用数理统计方法对海洋生物种群、海洋化学、海洋气象、海洋物理和军事等方面进行了深入研究。Tzeng等(2001)及Turan等(2006)基于体型参数的统计模型对不同海洋生物进行了种群鉴定研究。以Beck(1987)为代表的国外学者探讨了水质评价模型的不确定性;Akpinar等(2009)应用模糊推理模型对黑海南海岸波浪参数进行预测;柯丽娜等(2013)采用基于可变模糊识别模型对以莱州湾海水环境质量进行评价;熊德琪等(1998)采用模糊识别方法对大连湾海洋富营养化程度进行分析;邱章等(1984)及卢中发(1989)利用模糊多元分析方法对黑潮水团和锋面涡旋进行分析;孙峥等(2007)通过运用模糊聚类识别方法对风暴潮灾情等级识别进行研究;邬惠国等(2013)使用模糊聚类分析方法进行海上交通事故分析。
本文选取鱼类种群鉴定和海洋强风暴灾害评估为研究实例,其共同点是在这两类样本中并没有严格的类属性和隶属关系,它们在属性等方面存在着重叠性、交叉性,具有“亦此亦彼”的性质,因此比较适合进行模糊划分。本文利用基于等价关系的模糊聚类分析方法,尝试对特定鱼类种群形态学及强风暴灾害数据进行合理分类,并利用实验及实测数据进行比较分析,以期为鱼类种群鉴定分析及强风暴灾害评估提供合理的判别分析方法,为保护海洋生物资源及开展防灾减灾工作提供有效参考。
1 材料与方法
1.1 鱼类种群鉴定实例
1.1.1 研究用鱼类种群材料
鉴于海洋鱼类的地理种群界定及采集存在较大困难,本研究采用淡水鱼类作为研究对象。利用不同地理种群草鱼及杂交组合的后代进行分析。繁殖于2008年5月进行,选择大小相近、发育成熟的长江、珠江地理种群的个体作为亲本,同步进行催产授精,混合交配方式干法授精(Fu et al,2009)。试验获得长江、珠江和杂交3个组合。
3个组合分别以相同密度用网箱培育,养到夏花规格,对3个组合进行剪鳍标记,各选60尾混养于同一网箱,做3个平行试验组。7月15日,开始试验,开始前对各组合抽样测量全长。11月15日试验结束,对试验鱼测量全长、体长等可量数据及其各框架参数。
1.1.2 数据采集
可量数据及框架参数由电子天平和游标卡尺测量获得。试验共测定形态参数26项目,包括7个可量性状和19个框架参数,90尾鱼,计2340个数据。可量性状包括全长(TL)、体长(SL)、体高(BD)、体宽(BW)、头长(HL)、吻长(SnL)及眼径(ED);框架参数由Dxy以表示点x到点y的直线距离,框架测量坐标点的选择基本依据Swain等(1999),测量框架图见图1。
图1 草鱼框架测量
1.2 强风暴潮灾害评估实例
1.2.1 研究用强风暴潮过程及灾害数据
风暴潮能否成灾,在很大程度上取决于强风暴潮过程最大增水是否与天文潮高潮相叠,尤其是与天文大潮期的高潮相叠。当然,也决定于受灾地区的地理位置、海岸形状、海底地形,尤其是受灾地区的社会及经济(承灾体)情况(包括灾害抗御能力)。本文根据1981-2000年以来对上海造成灾害的13场强风暴潮的灾情统计资料(胡德宝 等,2005),选取最大风力、过程最大增水、直接经济损失3项指标作为风暴潮灾害评估特征因素,将风暴潮灾情按其严重程度进行等级划分。
1.2.2 数据预处理
(1)可比性处理:在1981-2000年的20年中,上海地区经济实现跨越式发展,不同年份之间的物价不具有可比性,因此我们对原始数据进行了可比性处理,全部统一到1997年的物价水平(表 1)。
表1 1981-2000年上海地区典型风暴潮灾情统计表
(2)归一化处理:采用标准差标准化法将特征因素值进行标准化,以保证进行聚类的各项指标均处于同等重要的地位(表2)。
表2 1981-2000年上海地区典型风暴潮灾情数据归一化表
1.3 分析方法
1.3.1 模糊聚类分析
模糊聚类分析是把模糊数学的概念引入聚类分析中,以用来研究“物以类聚”的一种多元统计分析方法,是数值分类学的一门年轻分支。模糊聚类分析的实质一般是指根据研究对象本身的属性来构造模糊矩阵,并在此基础上根据一定的隶属度来确定聚类关系。即用模糊数学方法把样本之间的模糊关系定量的确定,从而客观且准确地进行聚类。
1.3.2 基于等价关系的聚类方法
两个集合之间的模糊关系有:自反性、对称性和传递性。如果两个集合同时具有这3个属性,则称这两个集合具有等价关系。基于等价关系的聚类方法就是在等价关系的思想上建立起来的。集合上的等价关系所构成的类,两两互不相交,而且覆盖整个集合区域。
(1)模糊相似矩阵:当集合X={x1,x2,……,xn}时,模糊相似关系R可以用模糊矩阵R=[rij]n×n。表示,而R是主对角线上的元素均为1的对称模糊矩阵,即rij=l,rij=rji,这样的模糊矩阵称为模糊相似矩阵。
(2)传递闭包:设R为论域U上的模糊关系,若U上的另一个模糊关系R′满足:
1)R′R′⊆R′(即 R′是传递的);
2)R′⊆R(即 R′包含 R);
3)若U上另有一模糊关系R"也满足1)和2),则必有R′⊆R"(即R′是包含R且可传递的最小模糊集);
则称R′是R的传递闭包,记为t(R)。
(3)模糊等价矩阵的求法:R2=R R,R4=R2R2,R8=R4R4,一直这样算下去,就必然存在一个自然数k,使R2k=RkRk,这时的Rk即为一个具有模糊等价关系的模糊相似矩阵。
2 结果
2.1 鱼类种群鉴定结果
2.1.1 聚类分析结果
如图2所示,基于3个组合可量性状与框架参数的聚类分析发现,杂交组合先与珠江组合聚在一起,然后再与长江组合聚在一起,说明杂交组合形态上接近珠江组合。
图2 聚类分析结果
2.1.2 判别分析结果
如表3所示,对3个组合26项形态参数(7个可量性状和19个框架参数)进行统计分析发现,判别效果极显著(P<0.01)。判别准确率P1为86.7%~93.3%,判别准确率P2为82.4%~100%,综合判别率为90.0%。
表3 可量性状与框架参数判别结果
为了提高公式的简便性和实用性,从上述26项参数的变量中选出对判别贡献较大的8个形态变量(ED、 D24、 SnL、 D38、 D12、 D58、 D16、D46),并进行判别分析建立函数,在判别公式中8个变量分别用V1~V8表示,3个组合的判别公式如下:
长江组合:Y1=2516V1+4378V2+2506V3+1280V4+833V5+1992V6+1788V7+571V8-1189;
珠江组合:Y2=2568V1+3871V2+2625V3+1367V4+909V5+1949V6+1713V7+617V8-1206;
杂交组合:Y3=2310V1+3809V2+2553V3+1385V4+842V5+2069V6+1732V7+637V8-1200;
通过以上3个判别公式可以判别3个组合的所属,方法是将可量参数及框架参数的校正值代入以上公式,函数值最大的即为所属。
2.2 灾害评估模型
2.2.1 聚类分析结构
(1)计算模糊矩阵:将表2建立模糊相似关系(M)后,利用平均绝对距离法计算模糊相似矩阵(R):
(2)模糊等价矩阵:经计算得R4=R2R2,故获得R的传递闭包t(R),即建立了R的一个模糊等价关系。
(3)模糊聚类:通过取不同的阈值λ∈ (0,1)得到不同的分类关系。本文结合专家经验和当地实际情况,选取λ=0.955,样品被分为3类,即对应小灾、中灾、大灾。
2.2.2 模型应用
本文构建的灾害评估模型在“数字海洋”东海分局节点中“临港新城风暴潮灾害辅助决策系统”得到了初步应用。在城市地理信息系统支持下,模型结合水动力计算及城市经济价值的空间分布,可以对强风暴灾害等级进行精确分类。在此基础上,结合灾情指标体系等对强风暴进行风险评估。综合使用其他评价模型和方法,系统还提供对灾害影响范围、灾害程度的预测,快速判断受灾单位,估算受灾人口和经济损失,评估灾害的社会经济影响,为抗灾减损工程调度,提供决策依据;灾后根据灾情实际统计数据修正估计模型,进行灾害经济损失综合评估,为城市海洋灾害综合减灾措施提供数据支持。
图3 城市风暴潮灾害经济评估系统业务流程
3 讨论
模糊聚类分析可用于不同品系的初步归类,量化品系间的差异程度,研究分析对象间的相似程度;可用于水产动物种群和品系鉴定等研究(Tzeng et al,2001;Konan et al,2010)。本研究基于体型参数变异进行多元统计分析。通过其模糊聚类分析结果,可以直观地发现杂交组合群先与珠江组合群聚在一起,说明两者形态具有更高的相似程度。
本研究聚类统计分析方法,可以作为海洋鱼类种群鉴定研究的参考,为进一步了解和利用海洋生物资源提供有效手段。
由于风暴潮灾害发生的突然性、灾害评估的不精确性,模糊理论在风暴潮灾害评估上得到了广泛的应用。将风暴潮灾害损失的各灾度等级作为灾害评估上的模糊集合,而且任一灾害损失都在一定程度上隶属于灾害评估的模糊集合。因此,可以应用模糊聚类法对灾害评估等级划分进行研究,并根据最大隶属原则确定灾害损失所属的模糊评估等级。
从根本上来说,海洋领域诸多问题实际是一个模式识别问题,而对研究对象的科学划分是进行更深层次研究的前提,现有的各种划分方法多是采用“硬划分”或定性描述的方法,带有一定的主观经验性。引入模糊的概念,能够更加准确、形象的了解样本的分类情况,更加符合人类的认知观念。
需要注意的是,海洋是一个不确定环境下的复杂系统问题,用任一方法都无法解决问题的表里始末,只有应用类似于生物医学领域里的“鸡尾酒疗法”才能对于如此困难的人类命题给出满意的回答。可引入软计算、智能计算等方法,更加全面的研究各类海洋现象。
致谢:在本文撰写过程中与东海信息中心信息技术室叶娜主任及同事进行了有益讨论,在此深表谢意。
Akpinar A,Özger M,Kömürcü M,2013.Prediction of wave parameters by using fuzzy inference system and the parametric models along the south coasts of the Black Sea.Journal of Marine Science and Technology,DOI 10.1007/s00773-013-0226-1
Beck M B,1987.Water quality modeling:A review of the analysis of uncertainty.Water Resources Research,23(8):1393-1442.
Chen W,Sui G,Tang D,2011.A fuzzy intelligent decision support system for typhoon disaster management.Proceedings 2011 IEEE International Conference on Fuzzy Systems(FUZZ-IEEE 2011):364-367.
Chen W,Sui G,Tang D,2011.Predicting the economic loss of typhoon by case base reasoning and fuzzy theory.Proceedings of the 2011 International Conference on Machine Learning and Cybernetics(ICMLC 2011):254-257.
Fu J,Wang R,Liu F,et al,2009.Comparative analysis on growth and morphology in Yangtze River♀,Zhujiang River♂and their F1 hybrids of juvenile grass carp.Agricultural Science&Technology,10(5):119-122.
Konan K M,Adépo-Gourène A B,Ouattara A,et al,2010.Morphometric variation among male populations of freshwater shrimp Macrobrachium vollenhovenii Herklots, 1851 from Côte d'Ivoire Rivers.Fisheries Research,103:1-8.
Swain D P,Foote C J,1999.Stocks and chameleons:the use of phenotypic variation in stock identification.Fisheries Research, 43:113-128.
Turan C,Oral M,Öztürk B,et al,2006.Morphometric and meristic variation between stocks of Bluefish(Pomatomus saltatrix)in the Black,Marmara,Aegean and northeastern Mediterranean Seas.Fisheries Research,79:139-147.
Tzeng T,Chiu C,Yeh S,2001.Morphometric variation in red-spot prawn(Metapenaeopsis barbata)in different geographic waters off Taiwan.Fisheries Research,53:211-217.
USGS.http://fisc.er.usgs.gov/carp_ID/html/ctenopharyngodon_idella.html
胡德宝,龚茂殉,孔亚珍,2005.强风暴潮对上海地区影响研究.华东师范大学学报(自然科学版),12(5-6):177-182.
柯丽娜,王权明,孙新国,等,2013.基于可变模糊识别模型的海水环境质量评价.生态学报,33(6):1889-1899.
卢中发,1989.模糊目标函数聚类算法及其在东海黑潮水团分析中的应用.海洋学报,11(3):165-174.
邱章,黄企洲,1984.模糊聚类法在海洋水团划分中的应用初探I,海洋湖沼通报,1:15-19.
孙峥,庄丽,冯启民,2007.风暴潮灾情等级识别的模糊聚类分析方法研究,自然灾害学报,16(4):49-54.
邬惠国,朱现场,肖英杰,等,2013.基于模糊聚类的海上交通事故分析.中国航海,36(1):80-84.
熊德琪,殷佩海,1998.一种新的海洋富营养化程度模糊评价方法.交通环保,1(16):4-7.
谢季坚,刘承平,2000.模糊数学方法及其应用.武汉:华中科技大学出版社.
张跃,邹寿平,宿芬,1992.模糊数学方法及其应用.北京:煤炭工业出版社.