中国医学昆虫区系分布的多元相似性聚类分析*
2014-11-10申琪
申 琪
(河南中医学院,郑州 450008)
具有医学(兽医学)意义的昆虫有蚊、虻、蠓、蚋、虱、蚤、白蛉、蜚蠊、蝇、丽蝇、麻蝇、厕蝇、臭虫、胃蝇、狂蝇、皮蝇、鸟虱等类群。探讨它们的分布规律、形成机制及地理区划是保证人、兽、禽健康的重要基础研究内容之一。学界前辈倾注毕生精力提出了中国植物和高等动物的地理区划系统(吴征镒等,2011;张荣祖,2011)。申效诚等(2013a)运用他们新近创建的相似性通用公式(Similarity general formula, SGF)和多元相似性聚类分析方法(Multivariate similarity clustering analysis, MSCA),定量性地提出了中国93 662种昆虫的地理区划草案,认为更接近于植物的分布。但其中的医学昆虫是否更应该相似于高等动物呢?本文将用同样方法进行尝试。
1 材料与方法
1.1 供分析的昆虫种类
参与分析的昆虫材料来自《中国动物志 昆虫纲》、《中国经济昆虫志》的有关卷册(李铁生,1978,1988;王遵明,1983,1994;柳支英等,1986;范滋德等,1988,1997;陆宝麟等,1997;吴厚永等,2007;范滋德和邓耀华,2008;马忠余等,2002),医学昆虫分类期刊,医学昆虫的类群志(薛万琦和赵建铭,1996;冯平章等,1997;陈汉彬和安继尧,2003;虞以新,2006)、地方志(马耀等,1991;陈汉彬和许荣满,1991;彭建文和刘友樵,1992;蔡振声等1994;能乃扎布,1999;黄邦侃,1999~2003;黄复生,2002;杨定,2009;陈斌等,2010;申效诚等,2014)、专著(陈世骧,1992;金大雄和李贵真,1992;王保海等,1992;杨星科,1997,2004a,2004b,2005;金大雄,1999;陆宝鳞和吴厚永,2003;黄复生,1987,1988,1993,1996)、名录(王希蒙等,1992;张永强等,1994;章士美,1994;雷朝亮和周志伯,1998;王大洲等,2000;方志刚和吴鸿,2001;孟绪武,2003;陈明和罗进仓,2007;邵广昭等,2010)、科学考察报告(李子忠和金道超,2002,2006;金道超和李子忠,2005,2006;李子忠等,2007;任国栋,2010;王新谱和杨贵军,2010)、以及数百篇医学昆虫分类区系论文(钱金泉等,1998,1999;夏立照和夏玲玲,2000)等,剔除错误名、异名,不包括未定种和种下阶元,也不包括不属于昆虫纲的蜱类和螨类。资料截止于2006年,一些类群延长至2012年。共计6目45科621属6617种,(表1)。占申效诚等(2013)建立的中国昆虫数据库种类的7.06%。
1.2 基础地理单元的划分及数据库的建立
根据全国地理条件和生态条件,共确定64个基础地理单元(Basic geographical unit, BGU),将物种的行政区域分布资料转换为基本地理单元的分布纪录,作为区系分析的基础。(表2)。用微软Access构建数据库,有分布记“1”,无分布不记。
表1 本研究的医学昆虫类群的数量Tab. 1 The medical insect groups of China in this study
1.3 多元相似性聚类分析
用Jaccard(1901)的二元相似性系数公式算出每两单元间的相似性系数,作出相似性系数的三角形矩阵。从最大的相似性系数开始建群,摒弃传统聚类分析中的逐区合并环节,用申效诚等(2008,2010,2013a,2013b)的相似性通用公式(SGF)和多元相似性聚类分析法(MSCA),直接计算3个单元、多个单元、以至全部64个单元的相似性系数,绘出聚类图。
表2 中国医学昆虫的基础地理单元及其种类Tab. 2 The BGUs and its medical insect species in China
Jacard的公式是:SI=C/(A+B-C)
式中,SI是两地理单元间的相似性系数,A、B分别是两单元的物种数,C是两单元的共有物种数。
SGF的定义是任意多个地区的相似性是各地区的共有种类的平均数占总种类数的比例。
SIn=∑Hi/nSn=∑(Si-Ti)/nSn
式中,SIn是n个地理单元间的相似性系数,Si,Hi,Ti分别是i单元的种类数、共有种类数、独有种类数,满足Hi=Si-Ti,,Sn是n个单元的总种类数。
两个公式的关系是,Jaccard的公式是本公式在n为2时的一个特例,后者可以覆盖前者,前者不能代替后者。
2 结果
使用MSCA方法得到的聚类结果如图1。
2.1 聚类结果与昆虫整体分析结果比较
图1和昆虫类群整体的聚类分析结果(图2)(申效诚等,2013a)相比,相同的是,都聚成了9个大群和20个小单元群,各单元群所辖单元在地理上相邻相连,形成一个自然的昆虫分布区群,符合地理学逻辑和生态学逻辑。而且各大单元群的组成单元及其聚类顺序基本没有改变,不同的是,只有E大群内的9、10小群之间的组成有些移动;在0.120的相似性水平上,B、C两个大单元群提前于0.149处聚合;在0.230的水平上,有16个小单元群得到区分,7、11、12、18号小群相似性水平偏低于聚合的水平线下。64个基础地理单元的总相似性系数为0.042,平均每种昆虫分布域为3.26个单元,比昆虫整体水平稍高。
2.2 聚类结果与高等动物地理区划比较
与高等动物地理区划比较(张荣祖,2011),相同的是,都有华北区(C)、青藏区(D)、西南区(G)、华南区(I),只是各区的边界线有所差异。不同的是,内蒙古不再属于蒙新区而聚入东北区(B);华中区在同等的相似性水平下分设为E(江淮区)、F(西南区)、H(华东区)三区;台湾不再属于华南区而聚入华东区。
3 讨论
这是一个令人意想不到的结果,因为医学昆虫和人类及高等动物有着密切的关系,似应与高等动物的分布有着更多的相似之处,但却和植食性昆虫没有多大差异。这是:(1)由于医学昆虫的种类分布信息较为单薄,还不能够显示和植食性昆虫的差别;(2)高等动物的地理区划方案还只是定性研究的结果,尚需要定量分析予以校正或修订;(3)其他更深层次的原因,值得进一步深入探讨。
图1 中国医学昆虫分布的MSCA聚类图Fig.1 The MSCA tree for medical insect species in China 基础地理单元及其编码同表2。 The BGUs and codes are the same as Tab. 2.
图2 中国昆虫分布的聚类图Fig.2 The MSCA tree for insect species in China 基础地理单元及其编码同表2。 The BGUs and codes are the same as Tab. 2.