应用Excel软件计算生物多样性指数
2012-03-14孔凡洲于仁成徐子钧周名江
孔凡洲,于仁成,徐子钧,周名江
(1.中国科学院 海洋研究所 海洋生态与环境科学重点实验室,山东 青岛266071;2.中国科学院 研究生院,北京 100049;3.国家海洋局 北海环境监测中心,山东 青岛 266033)
生物多样性(Biodiversity)对于维护生态系统稳定和生物资源持续利用具有重要作用,是当前海洋生态学研究关注的热点问题之一。2000年至2010年间实施的《国际海洋生物普查计划》,首次尝试在全球尺度上评估和解释海洋生物的分布、丰度和多样性状况,从种群、物种和基因三个层次建立起了海洋生物多样性研究体系[1]。在中国,海洋生物多样性研究也受到密切关注,多次大规模的海洋资源调查和专项调查为海洋生物多样性研究提供了大量资料[2]。同时,中国海洋生态系统正承受着严峻的压力,表现出物种减少、生物多样性下降等演变态势等[3],也需要大力加强海洋生物多样性的研究与保护工作。
在生物多样性研究中,研究最多的是群落多样性,并采用多样性指数来评价群落状况;其中α多样性指数用以测度群落内的物种多样性;β多样性指数用以测度群落的物种多样性沿着环境梯度变化的速率或群落间的多样性;γ多样性指数则是一定区域内总的物种多样性的度量。用于评价生物群落多样性的 α多样性指数使用最为广泛,它包含两方面的含义,即物种丰富度(表征群落中所含物种的多寡)和物种均匀度(表征群落中各个种的相对密度)。α多样性指数包括丰富度指数(如dGl、dMa、dMe、dMo)、物种多样性指数(如 Simpson指数、Shannon指数、Brillouin指数、McIntosh指数)、均匀度指数(如Pielou指数、Heip指数、Alatalo指数、Hurlbert指数)、用于分析物种优势度的 Berger-Parker指数及分析物种的多度分布规律的Fisher α指数等多种测度方法。利用 VB等计算机高级语言或各种统计学软件(如BIO-DAP,Biotools,r软件等)可计算生物多样性指数,但这些方法对于普通研究人员来说还相对繁琐。与上述方法相比,微软公司生产的 Excel软件操作简单、界面清晰、功能强大,成为应用最广泛的数据处理和分析软件,也已经应用于生物多样性指数的计算[4-5]。 但是,目前应用中往往根据多样性指数的定义,将计算过程分解成不同的步骤,分别利用简单的Excel函数如求和、平方、求平均数等先得到一些需要的中间结果,再经过中间步骤的计算后得出最终结果。另外也有运用VLOOKUP、TYPE等较为复杂的函数,或是采用 Excel “透视表”方法进行计算,但这些计算方法基于无条件限制的简单数学函数,计算繁杂,Excel真正功能强大的条件函数和数组函数尚未得到应用。为简化多样性指数的计算、减少分步计算可能带来的错误,本文利用Excel软件自带的条件函数和数组函数,创建了一种含有条件函数的数组公式,能同时计算一组样本的多种生物多样性指数。
1 计算准备
1.1 操作系统与软件版本
操作系统采用Windows XP Service Pack 3(SP3)操作系统,Excel软件为Microsoft Office Excel 2007中文版。
1.2 生物多样性指数筛选与公式计算
可用于生物群落多样性分析的指数很多[6],根据生物群落中物种丰富度和相对优势度的高低,各种生物多样性指数的适应性也有差别[7]。对此,作者选择了最为常用的 Berger-Parker指数、Margalef指数、Simpson 指数(λ、D和Dr形式)、Shannon 指数(以2或 e为底)和 Pielou均匀度指数进行分析,其中Berger-Parker指数用来表示优势度,Margalef指数用来表示丰富度,Simpson指数用来度量多样性的概率,Shannon指数用来测度群落多样性的高低,Pielou指数用来测度群落的均匀程度。各种生物多样性指数的计算公式如表1所示。
1.3 原始数据矩阵构建
在进行生物多样性指数计算前,需要对数据进行处理,构建一个样本与物种一一对应的原始数据矩阵,记作或(i=1,2,…,m;j=1,2,…,n)称为矩阵的第i行第j列的元素。在本文中用行(m)表示来自不同总体的样本(sample),列(n)表示不同物种(species),为m个样本的n个物种的集合,表示第i个样本中物种j的数量(这里的原始数据矩阵计算过程中图1所示的原始数据矩阵Am×n)。
表1 用于各种生物多样性指数计算的公式列表Tab.1 Formulae for biodiversity indices
2 计算原理与计算过程
2.1 计算原理
依据表1所列各种生物多样性指数计算定义,将Excel中的数组函数、条件函数及其他函数组合成能满足上述计算要求的数组公式后分别对各种生物多样性指数进行计算。公式以等号“=”作为开始,其内部可以包括上述各种函数、引用、运算符和常量等。数组公式在录入后需要执行Ctrl+Shift+Enter操作,此时,Excel会为输入的数组公式添加“{}”,自动执行该数组公式的计算。
数组是一组具有相同类型和名称的变量的集合,可以是一维的,也可以是多维的。如本文中每个样本的各个物种的个体数的集合即是一个一维数组,1.3节所述的原始数据矩阵可以看作是相似的多个一维数组组成的多维数组。在数组公式中允许存在多个数组,但每个数组中的维数、行列数必须相同。数组公式中可以包括Excel数组函数,如本文中名称为SUMPRODUCT的数组函数,它应用于本文中的几个数组公式中,将数组间对应元素相乘,并返回乘积之和。
数组公式默认数组中空单元格为“0”,当计算中出现“0”作分母或对“0”进行对数操作时会得到无意义的结果。另外,在计算某些指数(如Simpson指数)时,若原始数据矩阵中的元素值小于“1”,则与其定义不符,也会出现无意义的结果,这都需要使用条件函数(IF)将它们甄别出来分别进行处理,根据具体情况的不同分别赋值为 0或用“(-)”来表示无意义的结果。条件函数(IF)会根据表达式是“TRUE”或“FALSE”返回不同的值或用不同的公式计算。表2列出了经条件函数甄别,在计算各种多样性指数时出现无意义情况时的处理方法。
表2 在计算各种生物多样性指数时出现无意义情况的处理方法Tab.2 Processing methods of biodiversity indices while the results are meaningless
本文“其他函数”包括 ABS(求绝对值)、COUNTIF(返回满足给定条件的单元格的个数)、SUM(求和)、MAX(求最大值)、LN(返回一个数的自然对数)、LOG(按所指定的底数,返回一个数的对数)等,详细解释可以参考Excel 2007自带的帮助。
2.2 计算过程
计算过程的操作界面如图1所示,Excel工作表自左向右由样本目录、计算结果区和原始数据区构成。A3正下方(包含A3)为1,2,…,m个样本的名称,分别用 S001,S002……来表示。C2-J2(d-Je)表示 8种需要计算的多样性指数名称,其下方为各个样本计算后的多样性指数值―记为计算结果矩阵Bm×8,见图1计算结果区。L2(包含L2)向右的单元格为1,2,…,n个物种的名称,分别用 s001,s002……来表示,其下方为各个样本对应的物种数一记为原始数据矩阵Am×n,见图1原始数据区。现以样本(S001)为例,说明本文多样性指数的计算过程。C3-J3单元格分别为样本(S001)的8个多样性指数的计算结果,系分别由Excel自动运行多样性指数的计算公式后得到,具体过程如下:
图1 操作界面Fig.1 Operation Interface
其余样本(如 S002等)的多样性指数计算公式与样本S001多样性指数的计算公式相同。
作者在提供的工作表(Biodixcel.xlsx,见下文 3)的公式中将矩阵Am×n预设为样本数(m)为 500,物种数(n)为 500的大小,应可以满足一般海洋生态调查数据量的要求。当样本m大于500时,可以每次500个样本分多次计算,或按2.2介绍将C3-J3的多样性指数计算公式向下自动填充到大于500的项获得。当物种数n大于500时,需要参考本文2.2自行修订计算公式。
2.3 具体操作
2.4 结果验证
经对比,利用该方法计算的2009年4航次24个站位的长江口及邻近海域的浮游植物生物多样性结果与按照公式定义分步计算和利用BIO-DAP软件计算的结果完全一致,表明应用本方法计算的生物多样性指数是正确的。
2.5 兼容性检验
本文的计算过程是基于 Windows XP操作系统下的Excel 2007软件编写的,可以在Excel 2007和更高的版本Excel 2010中使用,但不适于在Excel 2003中运行(Excel 2003的用户请见下文)。
另经检验,本方法可以在 Windows Vista、Windows 7操作系统中使用,在目前很少使用的Window 2000等低版本的操作系统中未进行检验;该文件也可以在安装有 OpenOffice.org等软件的Linux操作系统下使用。
3 应用文件
为了方便研究人员应用,作者制作了一个用于同时计算上述生物多样性指数的 Excel文件Biodixcel.xlsx(Biodiversity Excel),研究人员可以在有害赤潮信息网(http://www.china-hab.cn/chinese/cclj/)下载或者通过E-mail向作者索取。
为方便 Excel 2003用户,作者另制作了一个可用于Excel 2003的Excel文件-Biodixcel for Excel 2003.xls,与上述Biodixcel.xlsx同时提供给研究者使用(n≤245),该文件也可在WPS办公软件中应用。
4 讨论
关于Shannon指数和Pielou均匀度指数,都分别有以2和e为底的两种算法,国外多以e为底进行计算,在中国《海洋监测规范》则将以2为底计算多样性指数作为标准方法[15],所以,在 Biodixcel中分别以2和e为底计算了两个Shannon多样性指数。以2和e为底计算的Pielou均匀度指数完全相同,所以只取Je进行计算。
条件函数的应用,使得各种需要逻辑判断的计算得以进行,理论上,应该可以进一步应用条件函数进行比本文更为复杂的运算,读者可以自行尝试。
[1]Tittensor D P,Mora C,Jetz W,et al.Global patterns and predictors of marine biodiversity across taxa [J].Nature,2010,466:1098-1107.
[2]周秋麟,杨圣云,陈宝红.我国海洋生物物种多样性研究[J].科技导报,2005,23(2):12-16.
[3]王斌.我国海洋生物多样性保护的进展[J].海洋开发与管理.2002,3:28-32.
[4]刘雨芳.EXCEL在群落生物多样性参数计算中的应用[J].湘潭师范学院学报:自然科学版,2003,25(2):80-82.
[5]陈俊华,文吉富,王国良,等.Excel在计算群落生物多样性指数中的应用[J].四川林业科技,2009,30(3):88-90.
[6]马克平,刘玉明.生物群落多样性的测度方法:Ⅰα多样性的测度方法(下)[J].生物多样性,1994,2(4):231-239.
[7]孙军,刘东艳.多样性指数在海洋浮游植物研究中的应用[J].海洋学报(中文版),2004,26(1):62-75.
[8]Berger W H,Parker F L.Diversity of planktonic foraminifera in deep-sea sediments[J].Science,1970,168:1345-1347.
[9]Margalef R.Information theory in ecology[J].General Systematics,1958,3:36-71.
[10]Simpson E H.Measurement of diversity[J].Nature,1949,163:688.
[11]Greenberg J H.The measurement of linguistic diversity[J].Language,1956,32:105-119.
[12]Hill M O.Diversity and evenness:a unifying notation and its consequences[J].Ecology,1973,54:427-431.
[13]Shannon C E.A mathematical theory of communication[J].Bell System Technical Journal,1948,27:379-423.
[14]Pielou E C.The measurement of diversity in different types of biological collections[J].Journal of Theoretical Biology,1966,13:131-144.
[15]中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.中华人民共和国国家标准GB17378.7-2007 海洋监测规范 第7部分:近海污染生态调查和生物监测[S].2007.