是假设有误还是运气不佳:地震危险性图为什么需要客观检验*
2012-12-19SethSteinRobertGellerMianLiu
Seth Stein,Robert Geller,Mian Liu
1)Department of Earth and Planetary Sciences,Northwestern University,Evanston,Illinois 60208U.S.A.
2)Department of Earth and Planetary Science,Graduate School of Science,University of Tokyo,Tokyo 113-0033Japan
3)Department of Geological Sciences,University of Missouri,Columbia,Missouri 65211U.S.A.
是假设有误还是运气不佳:地震危险性图为什么需要客观检验*
Seth Stein1),Robert Geller2),Mian Liu3)
1)Department of Earth and Planetary Sciences,Northwestern University,Evanston,Illinois 60208U.S.A.
2)Department of Earth and Planetary Science,Graduate School of Science,University of Tokyo,Tokyo 113-0033Japan
3)Department of Geological Sciences,University of Missouri,Columbia,Missouri 65211U.S.A.
近年来,许多破坏性大地震都发生在地震危险性图中明确标注为危险性相对较低的地方。令人惊奇的是,虽然许多国家都在使用这样的地震危险性图,但其效果却从未得到客观验证。
第二次世界大战期间,后来的诺贝尔奖获得者Kenneth Arrow担任军事天气预报员。他写道:“我的同事负责长期天气预报,即预测未来一个月的天气情况”。“我们的统计人员对这些预报进行了验证,结果显示预报与全凭运气猜测没有什么区别。就连预报人员自己都信服了,并主动要求停止预报。他们大概是这样答复的:‘司令官明明知道预报没什么用。然而,为了作战计划,他需要这些情报。’”[1]
在编制地震危险性图(中国通常称“地震区划图”——译者注)时,地震学家往往遇到同样的情况,即期待地震危险性图能够像人们想象的那样完美地描绘一个地区的地震危险性水平,并为地震防灾减灾提供科学依据。然而,近年来许多破坏性大地震都发生在图中明确标示为危险性相对较低的地方[2]。一个突出的实例就是2011年3月的M9.1(多数文献称M9.0——译者注)东日本大地震。此次地震发生在日本国家地震危险性图中标示为危险性相对较低的一个区域。图1[3]说明了Geller的观点:
“图中被评估为最危险的区域位于3个‘假想地震’(东海、东南海和南海;见图1)的地震带上。但事实上,日本自1979年以来造成死亡10人或以上的地震都发生在被指定为概率相对较低的地方。最近呈现的这些与特征地震模型及类似的地震空区模型相悖的结果强烈表明,这种地震危险性图及其所使用的方法是有缺陷的,应该被摈弃。”
类似的与事实不符的情况在全世界范围内也时有发生。2008年中国汶川地震(M7.9)
图1 日本政府的危险性图与1979年以来死亡10人或以上地震的实际位置的比较[3]。日本政府每年出版与此类似的国家地震危险性图。但自1979年起,日本造成10人或以上死亡的地震均发生在被指定为低危险性的地方
1 对地震危险性图的评估
在上面的事例中,危险性图大大低估了地震危害。然而,编图人员可能会据理力争,认为实际发生的比预期大得多的地震及其产生的震动毕竟是偶发事件,它们不应该被用作判定危险性图不成功的标准,因为危险性图预测的是某一时间间隔内具有某种概率的最大震动。那么我们应该如何判断危险性图的性能呢?目前还没有公认的标准。令人惊奇的是,虽然许多国家都在使用这样的地震危险性图,但其效果却从未得到客观验证。
对于科学而言,一个基本原则就是,某些方法只有经过证实比那些基于零假设——通常基于随机几率——的方法更加成功才应该被采纳。否则的话,无论其假说看起来多么具有吸引力,它们也应该被摒弃。
源自其他领域(如对广泛采用的疗法进行客观评价的循证医学)的结果同样具有启示意义。例如,Moseley等[4]发现,虽然每年接受膝关节镜手术的病例超过65万、每例花费约5000美元,但一项对照实验表明“其效果并不比仅仅给予安慰剂治疗的效果好。”
天气预报,从概念上讲类似于地震危险性图的编制,它们必须接受例行评估以核定其预测与实际天气情况的吻合程度究竟有多高[5]。对天气预报的检验还包括,它们是否比利用往年同一日期的平均值来预报更加准确,或者比假定今天的天气与昨天的天气一样这种预报结果更加准确。几年来,这一运作方式使得预报方法和效果有了重大改进,并且对不确定因素给出了较明确的评估。这种概念化方法也是气候模拟人员使用的工具,他们提供一系列的模型预测、对比,并探讨建模所用的各种假设对于不确定因素有何影响。
最近发生的几次比危险性图预测的地震动强烈得多的地震事件表明,地震预报也需要一种类似的模式。这就牵涉到用于危险性图检验的客观标准的制定问题,检验所采取的方式就是将地震危险性图与其公布后实际发生的地震活动情况进行比较。这种检验方式可以显示出危险性图的实际效果如何,还可以对其真实的不确定因素作出较好的评估,并表明随着时间的推移其方法的改变能否提高危险性图的性能。对此,有多种衡量标准可以使用。其中一种合乎自然规则的标准是,将几年来在危险性图所涉及的区域内观测到的最大加速度与危险性图以及零假设所预测的最大加速度进行比较。一种简单的零假设就是假定区域地震活动的分布为均匀分布。图1表明日本的危险性图比零假设表现得还要糟糕。
检验危险性图采用的记录越长越好,这一点很重要。因此,对于这种检验而言最主要的挑战就是只能获得相对较短的地震动记录。许多方法都可以用来解决这一问题。一种方法是,除了对单个区域的危险性图进行检验外,还可以将不同区域的危险性图联合起来进行检验,这样得出的统计结果可能更有意义。
在检验过程中,重要的是应该避免一次大地震发生后编制的新危险性图引起的偏差,因为这一次大地震在早先的危险性图中是没有标注的。统计学家将这种事后对模型进行的修改称作“德克萨斯神枪手策略”(类似于中国的“事后诸葛亮”——译者注),即先在牛棚上打出一串枪眼,然后围着这些枪眼画出靶子。某些情况下,一幅新的危险性图是否能够预测未来事件、新图比旧图的质量究竟提高了多少,这些都需要相当长的一段时间来验证。
假设检验是科学方法的核心。尽管有困难,但对产生地震危险性图所用的方法进行持续、认真、客观的检验很有必要。同时,这些危险性图也应该呈献给公众和决策者,而且图中应该包含对其不确定因素的明确讨论。
2 编图所用的假设合理吗?
图2 华北地震历史。图中显示地震活动迁移范围极广,以至于在2000年内未出现同一断层区段破裂两次的情况。实心圆代表每一小图显示的时间段内发生的地震位置;空心圆代表公元前780年至前一时间段末年(图a中公元1303年)的地震位置。线条表示所选大地震的破裂长度[9]
编制地震危险性图使用了多个关键假设,其中涉及到(1)大地震将在何时何地发生,(2)地震有多大,(3)其产生的地面运动如何。前两个假设基于特征地震的复发概念,这种模型即使在“表现似乎很好”的地方——加州圣安德烈斯断层上的帕克菲尔德——也未能成功[6]。地震历史在某种程度上可能会起到引导作用,但与大地震的漫长而充满变数的复发时间相比,通过仪器和古地震记录获得的地震历史往往太短。在这种情况下,未来大地震的震级及其可能产生的震动几乎不为人知。于是,日本的编图人员没有考虑到其东北海岸附近海域发生一次M9地震的可能性[7]。由于地震记录的时间太短,所以最近发生的大地震也可以引起灾害评估的偏差——大地震在图中会产生高危险性“靶心”[8]。这些“靶心”可起误导作用,尤其是在中陆地区,因为其地震活动的时空模式比板块边界的模式更不规则。例如,华北地区2000年的记录显示,大地震在分布范围极广的断层系之间迁移,以至于在这一时段内还未发现大地震使同一断层区段发生两次破裂的情况(图2)。由此,地震记录的某个短期子集会使危险性评估产生偏差。
另一个问题是,大地震的概率究竟应该被假定为不随时间的推移而改变还是应该被假定为随时间的变化而变化。后一种假说认为地震的复发遵循地震轮回的规律,在平均复发间隔的前2/3的时间段内,预计地震发生的概率较低,而后来当推测此次地震已经逾期未发生时,则预计概率较高。这一地震重复假说颇具吸引力,也成为图1中预计东海、东南海和南海地区具有高危险性的依据。然而,大地震发生的地方往往并非那些预期的地震空区。
地震危险性图必然依赖于其编制者的假设。通过对同一地区的危险性图进行比较,这种依赖性可以变得非常明了,因为在利用不同的假设对同一地区作出的危险性图中,其预计的危险性可以相差3到4倍。这些差异显示出某些不确定因素,说明对危险性图的性能进行评估是至关重要的。
3 不可能完成的使命?
理想的危险性图既不会低估危害而导致准备不足,也不会高估危害而导致资源滥用。我们希望对一代又一代危险性图进行的客观检验将有助于提高其性能。然而,危险性图编制的水平也受到各种因素的制约。有些因素缘于知识的匮乏和地震过程固有的易变性。另一些因素则可能反映出这样一个事实,即危险性图的产生基于某些假说,如特征地震和/或地震重复模型。如果这些模型从根本上背离了实际上地震发生的非线性物理过程(这种情况的可能性很大),那么无论你对模型进行怎样的调整,也不会产生接近理想的危险性图。事情发展到这一地步似乎很令人气馁,但事实极有可能就是如此。要摸清危险性图的实际性能,客观检验是唯一的手段。
译自:Seismological Research Letters,September/October 2011,82(5):623-626
原题:Bad assumptions or bad luck:Why earthquake hazard maps need objective testing
(中国地震局地球物理研究所 左玉玲 译)
(译者电子信箱,左玉玲:yulingzuo@yahoo.com.cn)
[1]Gardner D.Future Babble:Why Expert Predictions Fail——and Why We Believe Them Anyway.McClelland &Stewart,Toronto,2010
[2]Kerr R.Seismic crystal ball proving mostly cloudy around the world.Science,2011,332:912-913
[3]Geller R J.Shake-up time for Japanese seismology.Nature,2011,472:407-409
[4]Moseley J B,O’Malley K,Petersen N J,et al.A controlled trial of arthroscopic surgery for osteoarthritis of the knee.New England Journal of Medicine,2002,347(2):81-88
[5]Stephenson D B.Use of the“Odds Ratio”for diagnosing forecast skill.Weather and Forecasting,2000,15:221-232
[6]Jackson D D,Kagan Y Y.The 2004Parkfield earthquake,the 1985prediction,and characteristic earthquakes:Lessons for the future.Bull.Seism.Soc.Am.,2006,96:S397-S409
[7]Stein S,Okal E.The size of the 2011Tohoku earthquake needn’t have been a surprise.Eos,2011,92:227-228
[8]Swafford L,Stein S.Limitations of the short earthquake record for seismicity and seismic hazard studies.In:Stein S and Mazzotti S(eds.),Continental Intraplate Earthquakes,Special Paper,2007,425:49-58.Geological Society of America,Boulder,Colorado
[9]Liu M,Stein S,Wang H.2000years of migrating earthquakes in north China:How earthquakes in mid-continents differ from those at plate boundaries.Lithosphere,2011,3(2):128-132
P315.7;
D;
10.3969/j.issn.0235-4975.2012.04.006
2011-09-22。(多数文献称M8.0——译者注)发生在一个被评估为具有低危险性的断层系上,而这种评估结果的依据就是近期地震活动稀少、滑移速率缓慢。另一个实例就是非洲与亚欧之间的会聚板块边界。1999年全球地震危险性图(Global Seismic Hazard Map)给出的是50年超越概率10%的峰值地面加速度,其“靶心”瞄准了“明显处于危险境地的”1980年阿尔及利亚阿斯南(El Asnam)M7.3地震的位置。而自那以后发生的迄今为止最大的两次地震——2003年M6.8阿尔及利亚地震和2004年M6.4摩洛哥地震——都没有发生在“靶心”地区或被指定为危险性水平很高的地区。同样,2010年M7.1海地地震也发生在2001年图中标示为危险性很低的断层上,其产生的地面运动比图中预测的要强烈得多。