全国防灾减灾日

 

 

地震预测结果的检验

中国地震局地球物理研究所  蒋长胜

 

对包括经济活动、安全事故自然灾害、生态种群演化等任何复杂系统未来后果的预测,都需要进行科学检验,地震预测也不例外。面对地震报准不准?这一类问题时的语塞,其实可以从对地震预测结果的检验上回答,尽管显得技术控一些。

预测检验的目的,除了验证预测结果的可信程度和预测效果,实际上也是研发相应的预测方法/模型的重要技术手段。没有科学的检验,对涉及未来的决策将无法操作,预言家和造谣者将横行。对涉及公共安全的地震预测,无论是回答结果的信度、发展预测技术方法,还是向政府提供决策依据,科学检验尤为重要。

 

都有哪些地震预测的检验技术?能解决哪些问题?

方法有很多,且针对不同预测的目的、预测内容可以进行不同的检验。一种是地震数检验(N-test),就是针对关注的某一级别以上的地震未来将发生多少个的预测,考察预测的地震是否太多或是太少。一种是预测震级检验(M-test),用于考察预测的震级与真实发生的震级之间的符合程度。还有可以同时考虑预测地震在地点上和震级分布关系上符合程度的Molchan检验(Molchan test)、似然检验(L-test)等等。中国地震学家们长期使用的R值评分,事实上是一种医学上使用比较多的叫做接受者操作特性曲线检验(ROC-test)方法的一种特例。

 

问题来了,谁都知道大地震很少发生,人类有限的地震观测和记录历史上,这些小样本事件能检验吗?答案是,而且检验的方式还不少

一是,可以利用随机模拟的方式创造出人工地震目录,例如生成1000套不同的这种地震目录进行检验。当然,创造不是胡来,需要一些条件约束。例如,可以将一套真实的地震目录,通过对所有的地震的发生时间、位置、震级利用随机数进行打乱、搭配;或者对真实的地震目录拟合出若干个参数(比如利用最著名的传染型余震序列模型),然后在确保这些参数不变、目录中的相对独立发生的地震保持不变的情况下,生成新的余震,从而形成一系列的新的人工地震目录

二是,用空间换时间。具体来说,就是在更大的空间范围内,让更多的地震样本能够被检验。这种空间换时间的方式,既不是新鲜玩法,也不是地震预测领域的专利。事实上,在以复杂系统为研究对象的其他自然科学中,例如生态学中采用的协同分布式实验coordinated distributed experimentsCDEs,就是在全球或大空间尺度下开展多地点的、同时、同规范的实验来验证一些科学假设。或许是受到生态学中CDEs研究方式的启发,2006年由美国南加州地震中心(SCEC)发起了全球地震可预测性合作研究CSEP)计划,就是采用统一的研究区域、统一的地震目录以及严格的统计检验,建立全球分布式的虚拟实验室,开展竞赛式的地震预测模型研发和预测检验。说白了,用空间换时间的检验方式,一方面增加了检验样本,另一方面也使得不同构造区域的不同孕震方式尽量都被覆盖。

 

地震预测的检验中,有一些非常重要的概念,包括概率(probability,简写为P)、概率增益(probability gain,简写为G)等等。其中,概率P是指在预测区域和预测时间段内,对关注的某一级别以上地震至少发生一次地震的几率。概率增益G是指,相对于某一个大家都认可的、原理清晰但简单的预测方法(也称为参考模型),我们使用的预测方法相对于参考模型,所能提供的预测信息的有效性。概率增益G是从信息论中引入的概念,它的数值,可为具体的减灾决策提供重要的参考信息。例如,意大利地震学家利用一种叫做传染型余震序列ETAS模型,2009年意大利拉奎拉Mw6.3地震发生前1的预测结果的概率增益G,相对于简单的用于长期预测的Poisson模型(这是个倒霉的模型经常被用来比较的模型)可达5~25倍,也就是说,ETAS模型所作出的短期预测结果比这个地区平时的地震危险性高出了5~25。美国地质调查局(USGS)在加州地区的地震预测中,使用一种名叫STEP的预测模型2004年这个模型新研发出来的时候,影响力如日中天)3-4小地震发生后引起更大地震的预测中,可以给出的概率增益G将达到10100

 

所有的预测意见都能检验码?有一情况没法检验,但实在很无奈

例如1977年,美国矿业局一位名叫Brian Brady的人,预测秘鲁首都利马附近发生9.9级地震(这个震级把地球撕成两半)。由于自己说不清、美国国家地震预测评估委员会专家听不懂、缺乏理论依据和观测支撑、没有严格数学推导的某种推测(但号称是基于爱因斯坦相对论、将电磁力与热力学稳定性以及引力场方程相结合的某种大理论),这种广泛宣传并造成秘鲁社会巨大震荡的地震预测,确实无法检验,当然,预测本身也不会成功。

 

地震预测的检验本身还有很多问题需要细化,还在进化发展。

例如,预测一个7级地震跟预测一个5级地震的效益是明显不同的,如何通过检验相对公正地描述这种不同?这种不同,不仅仅是两者能量相差1000倍左右,还在于震级差别很大的目标地震孕震涉及的时空尺度与前兆表现的复杂程度明显不同,开展预测的技术上的难度也就明显不同。地震学家们比较聪明地研发了一种叫做博弈评分gambling score)的方法,考虑到7级地震与5级地震的自然发生率的差异并作为权重,相对较好地解决了此类问题(见《Tectonophysics》第524-525155-164页)。

再例如,如何科学评价频繁提交预报意见(甚至是时间段上的连续预测、全覆盖,空间上到处画圈儿、画更大的圈儿)的情况?地震学家在预测检验的数学表达中,引入了惩罚项”——对越大的预测覆盖空间范围扣除适当的分值以保证对预测精度的正确评价。

再再例如,中国地震学家对地震预测检验问题中,所涉及的地震前兆的显著程度、统计规律的独立性、地震活动性模型的真实程度等等问题,也进行了深入思考与讨论(见《中国地震》24卷第3197-206页)。甚至如何对地震检验方法(的有效性)进行检验,也是地震学家们视野里的重要研究课题。精益求精,只有科学上的大量的严谨探索,才最终能凝练出可操作的、得到广泛认同的科学方法。

 

说得多不如做多,对于地震预测以及预测结果的检验,全世界的地震学家们都在努力着。

>>更多图片专区