地球物理台网数据实时采集与智能分析系统设计
2025-03-10高峰李永生郝永梅吴海军刘长生石伟李娇王宁
摘" 要:我国是世界上震害严重的国家之一,提高地震预测预报水平是国家和社会公众的迫切需求。地球物理台网的发展在地震预测、资源勘探和环境监测等领域发挥重要作用。该文介绍一种基于Python开发的地球物理台网数据实时采集与监控系统。该系统集成实时数据采集、智能分析和故障报警三大核心功能。数据采集利用Python的requests库,通过模拟登录获取地震观测仪器的数据。智能分析模块通过对省级数据库中的数据进行统计分析,提取关键指标并评估数据质量。故障报警功能则监测仪器的通信状态,一旦检测到异常,系统会自动触发警报,提醒值班人员及时处理。该系统不仅提升地球物理观测网络的自动化和智能化水平,还为地震监测和数据管理提供有力支持。
关键词:地震预测;地球物理台网;实时数据采集;智能分析;故障报警;Python
中图分类号:P315.73" " " 文献标志码:A" " " " " 文章编号:2095-2945(2025)06-0040-04
Abstract: China is one of the countries with serious earthquake disasters in the world. Improving the level of earthquake prediction and prediction is an urgent need of the country and the public. The development of geophysical networks plays an important role in the fields of earthquake prediction, resource exploration and environmental monitoring. This paper introduces a real-time data acquisition and monitoring system for geophysical network based on Python. The system integrates three core functions: real-time data collection, intelligent analysis and fault alarm. Data acquisition uses Python's requests library to obtain data from seismic observation instruments through simulated login. The intelligent analysis module performs statistical analysis on data in provincial databases, extracts key indicators and evaluates data quality. The fault alarm function monitors the communication status of the instrument. Once an abnormality is detected, the system will automatically trigger an alarm to remind the person on duty to deal with it in a timely manner. This system not only improves the automation and intelligence level of geophysical observation networks, but also provides strong support for earthquake monitoring and data management.
Keywords: earthquake prediction; geophysical network; real-time data acquisition; intelligent analysis; fault alarm; Python
我国是世界上震害严重的国家之一,提高地震预测预报水平是国家和社会公众的迫切需求。尽管地震监测预报工作已经取得了一些进展,但仍面临着诸多挑战[1-3]。地球物理学作为研究地球物理场和地球内部结构的科学,在地震预测、资源勘探和环境监测等领域发挥着重要作用。
地球物理学科业务人员可以通过多种技术手段实现对观测网络的高效监控和管理,以确保数据的连续性和准确性,并及时发现且解决网络问题,提高数据质量。
通过构建基于Nagios地震观测网络监控平台[4],实现对设备和服务的综合监控。赵楠、姜佳宁、赵祖虎等[5-7]通过编写自动化监控报警软件实现对网络进行监控,并对异常情况发出告警。崔博闻等[8]通过编程针对Oracle数据库的监测实现更为复杂的地球物理管理系统。这些技术的应用不仅促进了地球物理观测网络的自动化和智能化,还为地震监测和数据管理提供了强有力的支持。
本项研究是使用成熟的技术实现地球物理台网数据的实时采集和存储,并对采集的数据进行校验和数据质量的简单评价。对于数据的缺失、突跳以及超量程等问题,研究将提供及时的处理方法,以提高数据的可靠性和及时性。
1" 系统设计
本系统采用Python开发,集成了实时数据采集、智能分析和故障报警三大核心功能。地球物理台网涵盖了流体、地电、形变、重力和地磁等五大学科领域[9]。这些学科的仪器设备,如地电场、地磁、形变、流体和重力仪器,均可通过网页进行信息查询、配置调整,并能够实时读取仪器记录的数据[10]。数据采集功能通过Python的requests模块实现,该模块携带用户认证信息模拟登录过程,获取并解析仪器的实时数据输出。
智能分析模块则通过连接到省级数据库,对仪器的3至7天预处理数据进行深入分析,提取关键统计指标如平均值和标准差。对于形变类仪器,该模块还能计算当前的形变速率,并根据实时数据评估是否接近或超出量程边界。一旦检测到超量程情况,系统将自动触发警报机制。
黑龙江局的地电场仪器自2007年起便开始服役,部分仪器因使用年限较长可能出现死机或假死现象。故障报警功能通过监测数据采集情况和仪器的网络通信状态,判断仪器是否运行正常。一旦发现通信异常或数据采集中断,系统将通过声音警报提醒值班人员,以便及时采取相应措施。
2" 数据实时采集
地球物理台网各学科Web管理页面相似,需要用户名和密码,验证身份信息。验证身份后,可以读取仪器的参数、仪器状态、下载仪器中存取的数据、读取当天的数据等。这里以黑龙江省牡丹江中心站密山地震台地电场仪作为实验对象,设计地电场观测Web网页数据提取流程。密山地电场仪登录后,可以查阅当前仪器产出数据。
使用Python的requests库,模拟用户、密码登录,携带此次访问的cookies访问下载页面,直接保存数据。
对用户名和密码进行base64编码,把编码信息写入请求头,实现身份的认证,requests.Session()用于保持会话的持久性,这样可以在多个请求之间保持cookies和其他会话参数。再次请求当前数据页面,对数据解析。
使用正则表达式移除返回数据中的HTML标签,对每一行数据进行分割,第1列为时间,可以和当前日期拼接,转化成可以识别的datetime格式,便于后面的绘图,后面几列为各道数据进行分割。经过以上的操作,我们获取当前日期的仪器所采集的各测道数据。
我们采用数据融合技术,以便于更准确地展示和评估密山地震台地电场的实时监测数据。图1详细展示了我们的数据集成结果,其中黑色线条代表了从Oracle数据库中提取的历史数据,而灰色线条代表直接从监测仪器采集的实时数据。确保数据的连续性和完整性,我们收集3天的数据集。
由于在每天的0点之后至与省局地球物理台网和中心站进行数据交换之前,存在一段时间的数据缺失,这可能会影响我们对地电场变化趋势的全面理解。为了弥补这一数据空白,直接从地电场监测仪器下载前一天缺失的数据段。这种方法不仅确保了数据采集的连续性,而且提高了我们研究的可靠性和有效性。
通过将这两部分数据进行精确拼接,我们成功地构建了一个完整的数据集,并将其存储为pandas的DataFrame格式,这为后续的数据分析和可视化提供了极大的便利。
对于地磁数据,我们所处理的数据集记录的时间均以国际标准时间(UTC)为基准。考虑到地区时差的影响,将所有时间数据转换为北京时间(CST)。将数据库中的UTC时间数据统一加上8个小时,以实现时区的转换。
流体水位仪、水温仪,形变的宽频带倾斜仪(VP)、垂直摆倾斜仪(VS)、水管倾斜仪(DSQ)、铟瓦棒伸缩仪,重力的相对重力仪(PET),气象三要素等均可以通过网页形式获取当前的最新数据,方法和原理类似,这里就不做过多的介绍。
为减少仪器访问压力,我们每10分钟采集一次数据。这不仅能够降低服务器负载,还能节省计算成本。
3" 数据质量监控
数据质量监控模块,通过一系列校验和异常检测手段,全面评估和提升数据质量。我们采用基于统计和规则的异常检测。通过对异常值占比统计和数据质量评分,提供数据质量评估报告。并设定报警机制,以便于在数据质量低于预期时及时通知值班人员。
3.1" 数据完整性校验
在数据完整性校验方面,所有仪器的采样率和最新采集数据时间都是已知的。通常情况下,仪器错误数据用NULL表示,我们可以统计NULL数量来获取缺失数据量,并计算当前仪器的连续率。如果发现超过10分钟或更长时间的数据缺失,将触发报警。
连续率的计算公式是
连续率=(实际样本数/预期样本数)×100%。
3.2" 异常值检测
我们通过从数据库下载与实时数据的拼接,基于统计学方法进行检测,并对异常值进行标注。具体方法是,计算数据库中前7天数据的均方差作为阈值,如果当前产出数据的波动大于2倍均方差,则被认定为异常值,对异常值进行标注。
异常值检测还可以基于预定义的规则进行,例如,德都地磁台GM-4磁通门磁力仪Z分量设置范围为13~254 nT,H分量设置为-34~168 nT,D分量磁偏角为-67~-25分,设置地磁数据范围合理,能有效减少报警次数,检测并标注异常值。如果检测到的异常值数量超过阈值,系统将触发报警。
4" 实时报警
在数据质量监控中,可以通过声音报警、邮件通知和企业微信消息多种方式,根据不同场景提供灵活的报警手段。
4.1" 声音报警
声音报警是最直接的报警方式,当系统检测到数据完整性或异常值问题时,将通过扬声器发出警报音,提醒值班人员立即查看系统状态。
4.2" 邮件通知
邮件通知适用于需要详细记录报警信息的场景。当数据质量出现异常时,系统会自动发送邮件至相关负责人,邮件内容可包含报警详情、影响范围及建议处理措施,确保问题能够被及时关注和跟进。
4.3" 企业微信通知
如果有兼顾外部网络环境,可以通过企业微信进行消息推送。企业微信消息是一种便捷的实时通信方式,可以通过企业微信API实现报警消息的发送。
5" 结束语
本系统在地球物理台网中应用广泛,特别是电磁学科、形变学科、流体学科等领域。通过实时数据采集和智能分析,系统能够提供精准的设备状态和数据质量监控。在实际应用中,系统能够自动收集和整合各类观测数据,并通过数据融合技术展示监测结果。
对于数据的完整性和质量,系统通过实时监控、异常值检测和质量评估等功能,确保数据的可靠性。系统在发现异常情况时,会通过声音报警、邮件通知和企业微信消息等方式进行警报,帮助值班人员及时响应。此外,为了减少仪器访问压力,系统设置了每10分钟采集一次数据,优化了数据获取效率。
结合这些功能,本系统不仅提高了地球物理台网的自动化和智能化水平,还为日常工作提供了定制化服务,减少了人为干预,增强了数据管理和分析的能力。随着台网仪器的增加,系统的智能分析框架将进一步扩展,为地震监测和地球物理数据管理提供更强有力的支持。
参考文献:
[1] 刘桂萍.我国地震预测回顾与展望[J].城市与减灾,2020(6):5-9.
[2] 蒋海昆.重视预报过程反思提高地震预测水平[J].国际地震动态,2005(5):151-153.
[3] 丁鉴海,刘杰,余素荣.中国地震预报探索与实践[J].地震,2000(S1):12-17.
[4] 高东辉,孟祥龙,张守国,等.基于Nagios的网络监控系统在黑龙江地震监测网络中的应用[J].防灾减灾学报,2013,29(2):67-73.
[5] 赵楠,石英杰,江沛春.区域虚拟地震台网数据流监控软件研发[J].地震地磁观测与研究,2015,36(4):150-153.
[6] 姜佳宁,吴利军,徐磊,等.地震观测仪器自动监控软件设计与实现[J].地震地磁观测与研究,2019,40(4):167-175.
[7] 赵祖虎,吴利军,姜佳宁,等.地球物理台网仪器监控可视化系统设计与实现[J].地震地磁观测与研究,2022,43(2):233-241.
[8] 崔博闻,韩孔艳,费伯秀,等.北京市地球物理台网数据运行监控系统[J].科技创新与应用,2022,12(6):39-41,45.
[9] 王军,余丹,黄经国,等.基于大数据架构的地球物理观测数据管理系统[J].中国地震,2024,40(1):144-159.
[10] 李蒙亚,杨硕,储翔,等.基于地壳形变观测网页结构的实时数据自动获取及应用[J].地震地磁观测与研究,2022,43(5):208-212.
基金项目:黑龙江省地震局科研项目(202301);黑龙江省地震局创新团队(无编号)
第一作者简介:高峰(1976-),男,硕士,副高级工程师。研究方向为地震监测、预报与地电地磁数据综合分析应用。