基于微博的芦山地震前后宏观异常信息筛选与分析1
2013-11-26苏晓慧张群燕张晓东刘峻明黄健熙
苏晓慧 张群燕 张晓东 张 旭 李 林 刘峻明 黄健熙 苏 伟
(中国农业大学信息与电气工程学院,北京 100083)
引言
人的感官能直接觉察到的地震异常现象称为地震的宏观异常,主要是动物异常、地下流体异常、地声地光异常、大地电磁场异常、地震云异常以及植物异常等(和胜利,2008)。我国对地震宏观异常现象进行系统的科学考察和研究始于 1966年邢台地震(C.基斯林格等,1980;高文学等,1988;河北省地震局,1980;力武常次,1978)。宏观异常不只是短临和临震异常信息,也有不少是中短期、短期异常信息(安徽省地震局,1978;陈棋福,1988;国家地震局预测预防司,1997;中国地震局监测预报司,2000;中国科学院地震工作委员会历史组,1956)。
大规模的宏观异常,往往具有强震短临前兆的性质,对地震预报具有重要的实用意义。我国在利用宏观异常,探索地震预测方面有一些成功的例子,如1975年2月4日辽宁海城7.3级地震前1、2个月观察到很多宏观异常现象;1974年12月在辽阳、本溪、鞍山、大连、沈阳、锦州等地出现大量地下水与动物异常;1975年2月2日盘锦某乡一群小猪在圈内相互乱咬,19只小猪的尾巴被咬断,2月4日震前千山鹿场梅花鹿撞开厩门冲出厩外等(中国地震局监测预报司,2010)。这些宏观异常对成功预测地震提供了重要依据。事实充分证明,宏观异常在多次成功地震预报中发挥了不可取代的作用。根据地震现场考察,很多中强地震前,都有不同程度的宏观异常显示,这些宏观异常的收集报送主要靠群众测报队伍。例如:1976年龙陵7.3、7.4级地震;1998年宁蒗6.2级地震;1997年黄海5.1级地震;1994年台湾海峡7.3级地震;1999年台湾7.6级地震;2000年姚安6.5级地震;1999年岫岩地震等。其中群测点都发挥了重要的作用。2009年5月1日开始执行的《中华人民共和国防震减灾法》中提出“国家鼓励、引导社会组织和个人开展地震群测群防活动,对地震进行监测和预防”。“群测群防”称为防震减灾领域中的重要手段与途径之一。
随着通讯方式的改进以及手机等网络终端的普及,公众对于地震的关注热情以及关注度正在逐渐提升。2013年1月23日12时18分,辽宁省辽阳市灯塔市、沈阳市苏家屯区交界(41.5°N,123.2°E)发生5.1级地震,在12:58至13:03的短短5分钟内,新浪微博网站就有1000条新的关于此次地震的微博(苏晓慧,2013);用来发布地震速报信息的新浪微博“中国地震台网速报”,开博仅10个月粉丝数便突破百万,截止2013年5月15日,关注人数已达到159万。微博等通讯方式的发展,增加了公众关注地震与参与地震的可能性,也为防震减灾工作提供了大量的信息源。但是公众信息源的可信度也是该信息运用于研究的一个重要的限制。
地震之前有很多与之相伴随的物理、生物以及其他领域的异常现象发生,但是这些异常现象有可能当时没有被人发现,或者已经发现但未被人们重视,从而导致防震减灾工作的信息缺失。本文针对芦山地震之后,微博官方网站中用户发送的与宏观异常有关的资料进行了搜集整理。这些资料主要通过课题组研究人员在各大微博网站搜索和新浪微博官方提供两种方式获得,本研究针对这些信息提出了从完整性、真实性、信誉度和关联度等四个方面进行筛选,并对宏观异常的时空分布特征以及种类、数量等进行了研究。
1 异常信息搜集与筛选
据中国地震台网测定,北京时间2013年4月20日8时2分在四川省雅安市芦山县(北纬30.3°,东经103.0°)发生7.0级地震,震源深度13km。此次地震遇难人数196人,失踪21人,11470人受伤,累计造成231余万人受灾。震后,课题组研究人员对震前1个月内在新浪微博、腾讯微博和论坛、相关网站进行了宏观异常的搜索,共搜集到33条宏观异常信息。
本文将宏观异常的筛选分为三个步骤,分别为:初筛、复筛和精筛。首先针对搜集到的33条宏观异常进行初筛,即信息真实性的分析,信息为真则记为“T”,信息为假则记为“F”。编号为32的信息,经网上查询与验证,发现没有其他类似描述,也没有相关的图片或者更多的描述;另外,编号为29的宏观异常,成都4月13日的平均气温为16℃,最高气温为23℃,而前1天(4月12日)的平均气温为16℃,最高气温为18℃,所以信息中描述的1天之内上升10度的情况不存在,故在初筛时,将这两条信息筛除,不做后面分析之用。
接下来是复筛,复筛的指标包括完整性、信誉度和关联度。完整性的分析,即检验信息是否包含发生时间、地点以及宏观异常三项描述,如果上述三方面均包含,则记为“1”,否则记为“0”。完整性分析:序号为2、8、9、15和16这几条信息的时间不明确;序号为9、11、12、26、30的信息没有明确的地点属性;异常描述全部都有,所以根据完整性的要求,筛除掉上述信息,剩余22条信息进行下面的分析。然后针对22条信息进行信誉度的分析,因22条信息全部来自微博用户,故针对发布这些信息的微博用户查询其以往信息更新率以及对地震关注度的追踪分析,序号为13和24的用户发布的信息可信度较低,所以基于信誉度将这两条信息筛除。再然后是基于关联度的分析,编号为5、20、24和33的信息不包含地震宏观异常的指标项,而编号为27的信息,则在其发生的时空范围内未发现同类或者其他类现象,故排除。至此,经过初筛和复筛之后,宏观异常信息只剩下了16条。
最后是精筛,即对非地震原因造成的异常信息进行排除,编号为3的信息中描述在四川成都发现万只青蛙,还有相关视频进行说明,但是当时正值青蛙的繁殖时期,而且能明显看到视频中地面较湿,是雨后所录制,并且好多公众在互动中说明这是青蛙正常的生活习性,所以将该条信息归入正常。最终确定进行评价的宏观异常信息为15条。
以条件格式的方式对宏观异常信息的初筛、复筛和精筛过程进行表示,有填充色的表示不满足筛选的条件,凡是同一行中含有填充色的信息则不作后面分析之用,筛选结果记为“0”;而空填充的表格表示满足筛选的条件,筛选结果记为“1”,最终筛选的结果如图1所示。
图1 芦山地震宏观异常信息筛选结果Fig. 1 Filtering process of macroscopic anomalies for Lushan earthquake
2 宏观异常的基本统计和时间分布研究
2.1 宏观异常的种类与数量
据统计,在震后1个月,公众在微博网站发布的异常信息共计33条,经过筛选之后,有15条纳入本文的分析中,出现的宏观异常主要为两类:动物异常和天气异常;数量分别为10起和5起,共计15起。从公众提供的宏观异常种类来分析,说明普通公众对动物异常和天气异常较为敏感,这两类的宏观异常更容易引起公众的注意,也更易于人们的观察和识别。
由图2中可以看出,此次地震的宏观异常中动物异常占到了67%,而1975年的海城地震和1976年唐山地震前出现的宏观异常也是以生物异常为主(朱凤鸣等,1982;陈非比等,1979)。此外,在动物异常中,狗异常被提及的次数较多,占到动物异常总数的50%,2012年广东河源地震、新疆新源地震、江苏高邮地震、云南彝良地震和云南宁蒗地震中同样均有狗异常出现(苏晓慧,2013),说明随着人们居住环境的城镇化发展,虽然其他动物已不多见于人们的日常生活中,但狗的异常对地震预测还是有重要作用的。
芦山地震的震源深度为13km,震级为7.0级,通过微博搜集到的有效宏观异常达15条,将其与2012年发生的广东河源地震、新疆新源地震、江苏高邮地震、云南彝良地震和云南宁蒗地震进行对比,如图3所示。
图2 芦山地震各种宏观异常所占比例关系Fig. 2 The proportion of different kinds of anomalies for Lushan earthquake
图3 宏观异常数量与震级、震源深度之间的关系Fig. 3 The relationships between quantities of anomalies,magnitude and depth
图3 中横坐标表示地震的震级;纵坐标表示震源深度;每一个气泡(圆点)对应一次地震;气泡的大小表示宏观异常的数量。气泡大小呈现从左上到右下递减的趋势,说明在上述几次地震中,震级较低并且震源深度较深的情况下,宏观异常种类较多。由于数据所限,文中所选的地震次数较少,而且地震震源不属于同一地区,甚至不属于同一地震带,其内部结构差异较大,所以出现了上述的结果。
2.2 宏观异常的时间分布
从时间分布来看,震前1个月的宏观异常多集中在震前2、3天之内,如4月17日2起异常,4月18日1起,4月19日4起,在地震即将发生时(4月20日早晨),也有2起异常,震前共发生10项异常;震后的异常则集中于20日与21日2天,共5项。
从宏观异常信息的发布时间来看,15项异常中有10项异常的发布时间均为4月20日,即地震当天。本研究进行统计的15起宏观异常中,有10项是地震前发生且被公众注意到的,但是在这些信息中,地震前只有3项宏观异常是被公众发布到微博网站的,其他大多是震后公众才发布到微博网站的,这可能与地震之后公众的恐震心理有关。在地震发生之后,公众对各种异常现象有个恐慌期,回忆之前很多异常可能与地震有关,所以地震发生之后在微博网站以及其他网站都有一个喷发的量出现(图4)。
图4 地震前后宏观异常发生与发布数量对比图Fig. 4 Comparison of number of macroscopic anomalies before and after the earthquake
3 地震宏观异常的空间分布研究
本文统计了公众通过微博发布的宏观异常信息,并进行了空间展布,如图5所示。宏观异常的空间分布疏密不均,有些区域呈现丛集现象,有些区域则比较平静。造成这种现象的原因可能与各区域公众对新型通讯方式的熟悉程度、人们的关注程度、所处地质地理环境等有关。从震中距来分析,宏观异常中有5项分布在距离震中80km的范围内,9项分布在距离震中160km的范围内,位于成都市,因通讯方式等方面的影响,成都市的市民对宏观异常的反应与关注度比震中地区的关注度要高。
图5 芦山地震宏观异常分布图Fig. 5 Spatial distribution of macroscopic anomalies for Lushan MS7.0 earthquake
不同于汶川地震大部分宏观异常信息分布在龙门山地震带中(张小涛等,2009),此次芦山地震前后的宏观异常分布在鲜水河—滇东地震带、长江中游地震带和龙门山地震带三个地震带中,其中,位于长江中游地震带内的宏观异常最多,达9项;与汶川宏观异常不同的是,此次地震的宏观异常只有1项位于龙门山地震带内。此外,以活动断层周边15km做缓冲区分析,发现宏观异常发生的地点与活动断层距离较近,有8项异常均位于活动断层内(距离活动断层15km内),说明宏观异常的出现和断层是有一定的相关性的。
4 结语
本文以芦山地震前后,公众在微博网站发布的宏观异常信息为研究对象,芦山地震前后1个月,共搜集到33条异常信息,针对微博信息提出从真实性、完整性、关联度和信誉度四个方面进行筛选的方法。在筛选基础上,对微博宏观异常信息进行时间、空间角度的分析研究,得出了以下几点认识。
(1)通过微博发布的宏观异常信息种类主要为动物异常和天气异常,说明公众对上述两种异常的关注度与敏感性更强,或者说上述两种宏观异常更易于普通公众观察。
(2)芦山地震前,宏观异常发生并引起公众注意的有 10起异常,但是在微博网站发布的仅为3项,其他的7项异常均为地震后发布;地震后,共发生5项异常。说明地震发生之后,公众对宏观异常的发生更为关注。
(3)本文搜集到的宏观异常信息大多分布(60%)在距离震中较远的成都市,而非震中地区,造成这种情况的出现可能是由于两方面的原因造成的:一是距离震中较近地区的公众在地震前后,尤其是地震后更注重于救灾工作而非发布地震信息;二是此次地震的震中位于农村,智能手机或者新型通讯方式尚不普及。
(4)宏观异常数量与震级、震源深度关系的探讨应该建立在数据量充分,而且研究区域内部结构相差不大的情况下进行统计分析。
(5)微博发布的宏观异常信息具有及时性,是对其他方式提供宏观异常的一种补充,但是由于发布的公众文化程度等不同,也造成了信息质量难以保障,所以针对微博信息的筛选与剔除更为重要,这也是使用微博信息的一个限制,宏观异常信息的质量是其有效应用于地震预测工作中的前提条件。本文基于此问题,提出从真实性、完整性、关联度和信誉度四个方面进行筛选的方法,此方法与传统的现场核实方法相比较为快捷,但也有可能正是造成误差的一个原因,在以后的研究中可以加入其它指标或者其他知识对微博信息进行筛选,从而保障微博宏观异常信息的质量。同时可以加大地震宏观异常知识的宣传力度,使普通公众对异常识别与辨别有一定的认知度,从而增加宏观异常的可信度。
(6)公众通过微博发布的异常信息具有很好的及时性,如果地震行业的专家在地震预测中采用这些公众参与式的地震异常信息,则一方面可以加强公众参与的热情,增加地震的异常信息源;另一方面,公众参与式异常信息的增加,可以在地震预测决策工作中增加辅助作用。
安徽省地震局,1978. 宏观异常与地震. 北京:地震出版社.
陈棋福,1988. 中国震例(1966—1975). 北京:地震出版社.
陈非比,张建华,刘秉良等,1979. 唐山地震. 北京:地震出版社.
高文学,张存德,1988. 中国地震年鉴(1987). 北京:地震出版社.
国家地震局预测预防司,1997. 地震宏观异常预报方法. 北京:地震出版社.
河北省地震局,1980. 唐山地震目录. 北京:地震出版社.
和胜利,2008. 地震宏观异常在临震预报中的应用. 中国西部科技,7(5):4—5.
苏晓慧,2013. 公众参与式的地震异常信息提取与评价方法研究. 北京:中国农业大学.
张小涛,张永仙,许敦煌,2009. 汶川8.0级地震前后宏观异常现象分析. 地震,29(2):104—117.
中国地震局监测预报司,2000. 地震前兆异常落实工作指南. 北京:地震出版社.
中国科学院地震工作委员会历史组,1956. 中国地震资料年表(上、下). 北京:科学出版社
中国地震局监测预报司,2010. 地震宏观异常摘编. 北京:地震出版社.
朱凤鸣,吴戈,1982. 一九七五年海城地震. 北京:地震出版社.
力武常次,1978. 地震预报. 北京:地震出版社.
C. 基斯林格,铃木次郎,1980. 地震前兆. 北京:地震出版社.