我国水质基准制定中生态毒性数据质量评估方法研究

2021-01-22黄轶闫振广张天旭郑欣

环境工程技术学报 2021年1期

黄轶，闫振广，张天旭，郑欣

1.环境基准与风险评估国家重点实验室，中国环境科学研究院 2.海洋环境与生态教育部重点实验室，中国海洋大学环境科学与工程学院

水质基准是指水环境中的污染物或有害因素对人体健康和水生态系统不产生有害效应的最大剂量或水平[1]，是制定水质标准的科学依据[2]。水质基准的建立通常需要大量的水生毒性数据，但由于数据获取时物种选择、毒性终点、推导方法及毒性数据质量评估等的差异，会导致建立的水质基准定值不同[3-4]。其中，毒性数据质量评估具有较大的不确定性，是影响水质基准的重要因素。

早在20世纪90年代Klimisch等[5]就提出了毒性数据的质量评估方法，该方法从可靠性和相关性2个方面对毒性数据进行评估，可靠性指试验方法和过程是否遵循了标准方法，以及试验结果的呈现是否符合标准，而相关性则取决于评估的目的。在可靠性方面将毒性数据分为4个等级：1)无限性可靠，即数据来自公开文献并且试验过程以及参数设计符合国际公认的实验室作业规范(good laboratory practice，GLP)[6]；2)限制性可靠，即部分信息不符合GLP标准；3)不可靠，即试验方法及参数设计不符合GLP标准；4)不确定，即没有具体的试验细节，数据来自摘要或二次引用文献。根据GLP标准[6]进行测试时，由于受到反应程度及物质中所含杂质的影响，使用不同纯度的物质可能导致不同的试验结果。尽管使用不同纯度物质均可得到较高可靠性的试验结果，但只有不含反应性杂质的试验结果才可用于风险评估。因此，相关性评估非常重要，但只有专家才能判断哪种试验结果更具有相关性。目前，Klimisch方法[5]已在国内外广泛应用，但由于其评价指标不够详细，如没有不同类别数据的评判标准，数据相关性分析方面无相应的解释说明，因此不同人员评估时得到的评判结果不同[7-8]。Durda等[9]在Klimisch方法基础上开发了两阶段的毒性数据质量评估方法，要求测试方法须由国家和国际测试机构编制[10-15]，并将测试方法和数据验收标准共同作为数据质量审查的标准；该方法提出了30个评判依据，根据质量等级将数据分为高、中、低、可靠和不可靠5个等级。此外，Markich等[16]通过修改AQUIRE数据库标准[17]开发了一套评分系统用于评估毒性数据，该系统设置了20个赋分题，将每个问题的分项得分相加得到总分，根据总分将数据分为高质量、可接受和不可接受3种类型。2009年Schneider等[18]开发了ToxRTool软件，其适用于各种类型的试验数据、研究报告以及同行评议的出版文献，与Klimisch方法相同，其评判结果将数据分为无限性可靠、有限性可靠、不可靠和不确定4种类型。上述已建立的4种毒性数据质量评估方法在方法描述和结果表达方面仍不太完整[7,19]，Ågerstrand等[7]对这4种方法进行了对比分析，发现不同的评估方法会导致不同的评估结果。

2017年，原环境保护部发布的《淡水水生生物水质基准制定技术指南》[1]明确了对生态毒性数据进行质量评估的必要性。笔者在介绍目前发达国家制定的生态毒性数据质量评估方法的基础上，提出了适用于我国水质基准制定的生态毒性数据评估方法，以期为水质基准制定中生态毒性数据评估提供参考。

1 国外生态毒性数据质量评估方法

1.1 美国

2011年，美国国家环境保护局(US EPA)发布了水质基准研究中的《生态毒性数据质量评估指南》[20]，用于指导公开发表的生态毒理学数据的识别、选择和获取，内容包括数据筛选、评估、分类和应用。该指南提出的评估因素主要包括：1)受试物质的特性；2)物种的年龄、性别、大小、生命阶段和来源；3)每个处理组所包含物种的数量和处理组的数量；4)试验暴露的方法与途径、暴露频率及暴露时间；5)对照组；6)受试生物的表现和观察；7)试验条件；8)数据统计方法。该指南也规定了需要参考的辅助因素，包括受试物质特性、水质条件、阴性对照与助溶剂对照、终点选择。基于上述因素对毒性数据进行评估，最终将毒性数据分为定量数据、定性数据和无效数据3种类型。定量数据指可用于计算风险评估中风险熵值的数据；定性数据指不足以用于计算风险熵值，但可用于支持风险评估结论的数据；无效数据指不符合科学要求，不能用于风险评估的数据。

1.2 欧盟

欧盟发表了生态毒性数据报道与评价标准(criteria for reporting and evaluating ecotoxicity data，CRED)[21]，该评估方法是在现有评估和报告方法[5,7,9,22-26]的基础上起草的，旨在提高生态毒性数据研究的可靠性和相关性，包括重现性、一致性和透明度，是一种定性评估方法。CRED包括20个可靠性标准和13个相关性标准，其中可靠性评价标准的内容和分类方法与Klimisch方法基本相同，也将数据分为无限性可靠、有限性可靠、不可靠以及不确定4种类型，但在试验设计、试验试剂、受试生物、暴露条件和试验数据的统计分析方面，CRED给出了更加详细的解释与说明；为提高生态毒性数据在生态风险评估中的应用，CRED补充了试验生物和暴露环境与生态风险评估相关性评价的标准，将数据相关性分为无限性可靠、有限性可靠、不可靠及不确定4个等级。Kase等[27]的研究表明，不同评估人员使用CRED进行评估得到的结果高度一致，并且CRED比Klimisch方法更准确和更容易理解。

1.3 澳大利亚和新西兰

2018年，澳大利亚和新西兰在前期研究[16,22,28-29]的基础上，制定与发布了对水质标准研究中生态毒性数据质量评估的技术指南[30]。该指南中提出一种定量评估方法，对毒性数据质量评估设置了20个问题，评估要素主要集中于试验设计、试验过程、水质参数的影响、数据分析等方面。将每个问题的分项得分相加，得到总分即为每个数据的合计得分，然后将合计得分与满分相除(合计得分满分)。根据不同的数据类型和污染物，满分可分成4种：金属-水生动物类数据的满分为103分；非金属-水生动物类数据的满分为94分；金属-植物类数据的满分为100分；非金属-植物类数据的满分为91分。最后根据评估结果将数据分为3类：合计得分满分≤50%时，为不可接受数据；51%≤合计得分满分≤79%时，为可接受数据；合计得分满分≥80%时，为高质量数据。

1.4 国外评估方法的比较与适用性分析

尽管美国和欧盟制定的毒性数据质量评估方法的评估标准涉及各个方面，但其均属于定性评估方法，在评估过程中会受到评估人员主观性的影响，不同评估人员的评估结果可能不同，并且这2种毒性评估方法主要用于环境风险的生态评价或化学品危害评估，与本研究水质基准制定中生态毒性数据评估的目的有所不同。澳大利亚和新西兰毒性数据质量评估方法是为水质基准制定中毒性数据评估而制定的，但我国水质基准研究有其特殊性，不能直接采用澳大利亚和新西兰毒性数据质量评估方法，因此需提出适用于我国水质基准制定的生态毒性数据评估方法。

2 我国生态毒性数据质量评估方法的建立

2.1 我国水质基准的要求

水质基准具有明显的区域环境差异，包括水的理化性质(温度、溶解氧、pH、硬度、有机质等)，水生生物的群落结构，水污染程度和污染物的环境地球化学特征等[31-33]。在保护特定的水功能或生物时，水质量控制往往局限于特定的环境条件。水体的理化性质、生物多样性和气候因素会因水环境条件的不同而不同，从而影响水质基准对各种水生态系统的保护效果[33-34]。区域物种敏感性的差异是导致水质基准差异的最重要因素，如鲑鱼科是美国的代表性鱼类，而中国一半的淡水鱼属于鲤鱼科[35]。因此，我国水质基准要结合我国环境特点和自然背景建立，明确我国与其他国家在生态环境特征、污染特征、生物区系等方面的差异。

2.2 我国生态毒性数据质量评估方法建议思路

我国《淡水水生生物水质基准制定技术指南》从数据的来源和可靠性2个方面制定了生态毒性数据的收集和筛选原则。数据的来源主要包括淡水水生生物毒性、水体理化参数、物质固有的理化性质和环境分布数据等。数据可靠性的判断依据主要包括：1)是否使用国际、国家标准测试方法和行业技术标准，操作过程是否遵循良好的GLP标准；2)对于非标准测试方法的试验，所用试验方法是否科学合理；3)试验过程和结果的描述是否详细；4)文献是否提供了原始数据。

为使生态毒性数据能够科学、合理地应用于水质基准制定中，笔者依据《淡水水生生物水质基准制定技术指南》毒性数据筛选原则，从数据来源、化学物质、受试生物、试验过程和试验结果5个方面建立了我国生态毒性数据质量评估方法，技术路线如图1所示。

图1 生态毒性数据质量评估技术路线Fig.1 Technology roadmap of ecotoxicity data quality assessment

2.3 我国生态毒性数据质量评估方法细则

借鉴国外毒性数据的评估方法，提出适用于我国水质基准制定的生态毒性数据评估方法。为尽量避免评估过程的主观性，采用定量方法进行评估，建立的生态毒性数据评估的评分系统如表1所示。评分系统设置5个方面共25个问题，以便客观、全面地进行评估。除对每个问题进行赋分外，还添加了数据无效项[20]。当评估过程中出现无效的评判结果时，意味着该数据不能用于水质基准的制定，评估终止。提出的评估要素主要包括数据来源、化学物质、受试生物、试验过程、试验结果5个方面，并根据总体赋分进行质量分级。

表1 生态毒性数据质量评估的评分系统

2.3.1数据来源

美国[36-37]、加拿大[38]、澳大利亚和新西兰[39]等国提出的水质基准推导和生态风险评价指南，以及我国发布的《淡水水生生物水质基准制定技术指南》均规定数据收集是水质基准制定的首要步骤，明确了数据来源在评估过程中的重要性。因此，设置以下4项赋分题：问题1为“数据是否来源于全文”；问题2为“文献全文是否公开”，若数据来自摘要或二次引用文献，由于无法得到全文，缺乏详细的资料，因此数据无效；问题3为“是否是生物个体水平的数据”，生物个体水平数据的使用受到当前水质基准方法学的限制，在现阶段应用其他水平(如分子、群体水平)的毒性数据推导水质基准不符合指南的要求；问题4为“是否属于中国本土生物或相关物种的数据”，水质基准的首要目标是保护本土物种，只有《淡水水生生物水质基准制定技术指南》中指出的中国本土物种或相关物种的毒性数据才可用于水质基准制定，因此不符合规定的毒性数据无效。

2.3.2化学物质

在进行毒性试验前了解测试物质的理化性质及其在相关环境中的行为十分必要，如测试物质的浓度不应超过在水中的最大溶解度，挥发性物质与疏水性物质的暴露条件应不同，同时还应考虑测试物质可能发生的水解反应。因此设置问题5“化学物质名称是否明确，化学物质的形式是否恰当”，个别化学物质溶于水中，除目标物质外，还可能产生其他有毒因子，干扰被测物质的毒性，因此有必要对化学物质的名称和形态进行明确而恰当的界定。一般情况下，测试物质的纯度应为80%或更高，除非已知杂质不会引起毒性效应，也不会影响测试物质的毒性。尽管经济合作与发展组织(Organization for Economic Cooperation and Development，OECD)测试指南[11]中对测试物质的纯度只提到了适当纯度，但使用低纯度物质进行研究的总体可靠性可能降低，因此设置问题6“所用化学试剂为分析纯或可能的最高纯度”，考虑到某些特定物质很难获得纯度很高的试剂，问题中设置了“可能的最高纯度”。

2.3.3受试生物

进行数据质量评估时，必须知道试验中使用了哪些生物体。为了使研究可靠，至少应该知道受试生物的年龄或生命阶段的名称和信息。当检查荷尔蒙物质时，生物体(如当受试生物为鱼类时)的性别可能会影响结果；当用鱼或虫做试验时，幼鱼和幼虫通常比成虫更敏感。因此，在评估测试或比较不同测试的结果时，了解测试的生命阶段十分重要。由此设置问题7“是否说明了受试生物的特征(如体长、生物量、年龄等)”、问题9“对照组生物的非致死表现是否正常”，了解受试生物明确的生物学体征以及非致死表现的正常与否并不能直接否定数据质量，但知道受试生物的年龄或生物阶段可以提高研究成果的可靠程度。受试生物应保持健康并适应试验条件(如水的类型、温度)，避免因条件变化而影响试验结果；试验条件(除非这是研究问题的一部分)或其他因素不应使生物体受到影响，若试验条件使受试生物出现高死亡率时，研究结果就不可靠了。因此设置问题8“受试生物是否免于提前暴露在受试物质中”，如果受试生物提前暴露于测试物质中，由于群落对毒性胁迫的适应，可能会影响受试生物对测试物质的敏感性，使现场收集的受试生物进行毒性试验的结果可能产生偏差，导致数据无效。

2.3.4试验过程

试验过程是数据质量评估的重点，共包括12项赋分问题。试验中对照组的设置与受试生物物种和采用的方法指南有关，对照组一般分为助溶剂对照、阴性对照和阳性对照，因此设置与对照组相关的问题10～问题12。问题10为“是否设计了适宜的对照组(如空白对照和助溶剂对照等)”，问题11为“是否检测了对照组的污染状况”。一般情况下空白对照组的死亡率不超过20%的数据才可使用，如果在试验中增加了助溶剂对照组，则对照组的助溶剂浓度应与试验中使用的最高助溶剂浓度相同，并且助溶剂对照组的死亡率最好与空白对照组的死亡率无显著差异。问题12为“对照组和试验组是否包含重复”，当研究的试验设计或执行过程存在缺陷时，即使是统计学分析结果显著也并不意味着研究是可靠的，因此各处理组都应该设置重复。在试验中使用国际、国家标准测试方法和行业技术标准，操作过程遵循良好GLP可以尽可能地保证最新结果的再现性和可接受性，因此设置与具体试验过程相关的问题13～问题21。问题13为“试验过程是否符合测试方法标准”。使用国际、国家标准测试方法和行业技术标准并不一定反映研究的可靠性，使用非指南方法进行研究时，如果能提供足够的试验设计细节，则其结果与使用指南的研究同样可靠；但若在试验设计或结果解释中存在缺陷，或结果引起怀疑，则研究不可靠。本评估方法设置该标准，目的是使评估过程更加公开、透明。美国[40-41]、欧盟[42-43]以及我国[44-45]都发布了毒性试验测定方法，对不同水质、生物、化学品的测定方法以及毒性效应测试终点的选择提出了明确的规定：如淡水生物必须在淡水中进行试验，咸水生物必须在咸水中进行试验；一般情况下，藻类暴露试验不超过3～4 d，如果试验所用藻种生长较慢，可延长至7 d；大部分测试标准建议鱼类急性试验周期为96 h；急性毒性效应测试终点〔主要包括半致死浓度(LC50)和半最大效应浓度(EC50)〕宜使用暴露时间小于等于4 d的毒性数据，慢性毒性效应测试终点〔主要包括无观察效应浓度(NOEC)和最低观察效应浓度(LOEC)〕宜使用暴露时间大于等于21 d的毒性数据。根据国际、国家标准测试方法设置该指标下的赋分题，使毒性数据的评估结果更加可靠。其中问题16(是否有适宜的暴露时间)、问题17(是否有适宜的毒理学终点)赋分分值最高，因为这2项要素直接影响了毒性值，从而影响了水质基准定值。

2.3.5试验结果

试验结果应根据测试标准要求进行统计，并对统计结果进行描述，以保证评估结果的可靠性。OECD评价指南[46]规定，用于生态风险评价的毒理数据必须具有明显的浓度-效应关系，当缺少浓度-效应关系时，通过统计分析计算出的测试终点值为限制性可靠。因此设置问题22“是否表述了剂量-效应关系”，若研究以验证剂量对毒性效应无影响为目的，则不一定需要剂量-效应关系来得出NOEC；但一般情况下，没有观察到剂量-效应关系就无法获得准确的NOEC。问题23为“是否使用了正确的统计方法获取数据”，问题24为“对于致死浓度(LC)最大效应浓度(EC)，是否提供了误差范围；对于NOECLOEC，统计学上是否有显著性(P≤0.05)”。统计分析的验证是数据评估过程的组成部分，因此，研究应说明使用了哪些统计比较方法(如T检验、方差分析、卡方检验)，并提供描述性统计数据。问题25为“水质参数的监测类别对于判断水质对物质毒性的影响是否足够”，水质参数对于不同化学物质的毒性有显著影响，如pH会影响氨氮、五氯苯酚等的毒性，部分重金属的毒性会随着水质参数的变化而变化。

2.3.6总体赋分

依据赋分标准将毒性数据获得的分数直接相加获取得分，评分系统总体赋分为100分。根据评分结果将毒性数据分为3类：得分≥80分，为高质量数据；得分60～80分，建议为可用数据；得分<60分，建议为不可用数据。

3 结语

保证毒性数据的质量是制定高质量水质基准的前提之一，由于研究目的、试验方法等差异较大，出版文献中的许多毒性数据不符合水质基准制定的技术要求，不能用于水质基准的制定。本研究依据《淡水水生生物水质基准制定技术指南》毒性数据筛选原则，借鉴国外毒性数据的评估方法，从数据来源、化学物质、受试生物、试验过程和试验结果5个方面建立了我国生态毒性数据质量评估方法，该方法可较全面地对毒性数据进行质量评估，为水质基准研究中生态毒性数据质量的评估提供了思路，同时也为进一步丰富我国水质基准制定的技术方法提供了基础。