基于集成学习的太阳质子事件短期预报方法*
2022-06-20邹自明
宫 哲 邹自明 陆 阳
1(中国科学院国家空间科学中心 北京 100190)
2(中国科学院大学 北京 100049)
0 引言
太阳质子事件是一种空间天气现象。太阳活动例如耀斑和日冕物质抛射(CME)等爆发时,会喷射出大量的高能粒子,其中一部分会从太阳低层大气传播到近地空间,并被地球附近的卫星或飞行器探测到[1]。当高能粒子通量达到一定标准时,便认为发生了太阳质子事件。中国空间环境预测中心将太阳质子事件定义为:在地球同步轨道上探测能量大于10 MeV 的质子,每5 min 计算一次平均积分通量,单位pfu(1 pfu=1 cm–2·s–1·sr–1)。当连续三次积分通量大于10 pfu 时,便认为发生了太阳质子事件。太阳质子事件中,大量的高能粒子会对航天器和宇航员产生严重危害,因此准确的太阳质子事件短期预报对航天活动灾害预防是非常必要的。
根据预报方法的不同,可以将太阳质子事件的预报模式分为物理预报模式和经验预报模式两种。物理预报模式是基于太阳质子事件发生的物理机制建立预报模型。例如,SOLPENCO 模型[1]根据从太阳质子事件开始到激波到达拉格朗日点(L1)的时间计算质子事件的通量变化趋势对太阳质子事件进行预报;SEPMOD 模型[2]通过计算给定位置的高能粒子通量曲线实现太阳质子事件的预报。经验预报模式是基于质子事件相关的太阳活动与现象,例如利用太阳黑子,太阳耀斑,日冕物质抛射等,对太阳质子事件进行预报。2006 年美国空军实验室(AFRL)以IMP 系列卫星于1997-2001 年观测到的21 个质子事件与对应耀斑之间的关系为基础,建立了质子预报系统(Proton Prediction System,PPS)[3],其报准率能达到85.71%,但是虚报率高达50%;2009 年,Laurenza等[4]选取了1995-2005 年的70 个太阳质子事件,以耀斑经纬度、耀斑重要性等级、软X 射线积分通量和射电噪暴积分通量等作为输入建立预报模型,该预报模型将虚报率降低至42%的同时,报准率也下降至63%;Núñez[5]提出了UMASEP 模型,该模型通过分析第22 和第23 太阳活动周期间软 X 射线和近地空间的 9~500 MeV 的微分质子通量等数据,预报太阳质子事件发生与否,其报准率为80.72%,虚报率为33.99%。Huang 等[6]使用集成学习的方法,基于耀斑和CME 相关数据建立了两个隐朴素贝叶斯模型,并将这两个模型集成对太阳质子事件进行预测,取得了78.57%的报准率和50%的虚报率。Zhong 等[7]通过分析地球静止运行环境卫星5 min 平均软X 射线通量和差分积分质子通量,预测在未来24 h 内是否会发生太阳质子事件,其报准率为80.00%,虚报率为25.85%。
现存太阳质子事件短期预报方法的局限性主要在于:在获得较高的报准率时,虚报率依然较高。针对这个问题,本文提出一种基于集成学习的太阳质子事件短期预报方法,选取了8 种具有不同特点的机器学习模型,以现存方法中广泛使用的太阳黑子数据、耀斑数据、CME 数据作为输入对模型进行训练,并通过一定的决策方式将8 个模型集成为一个协同作业系统,用以预报太阳质子事件24 h 内是否发生。本文选取了完整的第23 太阳活动周的数据进行实验,并在完整覆盖太阳活动高年和低年的数据上进行了模型构建与测试,取得了80.95%的报准率的同时,将虚报率降低至19.05%,相比现有的预报系统具有较为明显的优势。
1 数据选取
1.1 数据内容
使用包括太阳耀斑、CME、太阳黑子三类数据用于太阳质子事件的短期预报,选取依据和使用的参数如下。
(1)太阳耀斑。太阳耀斑是发生在太阳大气层局部区域的一种剧烈的爆发现象。根据Kahler[8]提出的大耀斑假说,耀斑的大小与高能粒子事件的发生有着密切的联系。Le 等[9]的研究也表明,太阳耀斑对于能量大于10 MeV 的质子加速有明显贡献。本文所使用的耀斑数据主要包括X 射线耀斑等级和耀斑位置两项参数。
(2)CME。CME 是日冕磁场以及积聚在日冕中的等离子体团在较短时间内向行星际爆发的现象。根据Kahler 等[10]的研究,CME 与太阳质子事件中高能粒子的峰值通量有很强的相关性。Wang 等[11]也曾提出,速度大且源区位置距离日面上连接地球磁力线足点近的全晕CME 极易引发太阳质子事件。本文所使用的CME 数据主要包括中心位置角、角宽度、线速度和加速度四项参数。
(3)太阳黑子。太阳黑子是太阳光球层表面深色的区域,是日面强磁场的产物,与耀斑和CME 都具有密切的联系。Mariachiara 等[12]和Aoife 等[13]曾采用太阳黑子相关数据进行耀斑预测。Howard[14]曾提出太阳黑子处的强磁场与CME 的形成紧密相关。Bai 等[15]的研究也表明了太阳黑子与太阳质子事件之间较强的相关性。本文使用的太阳黑子数据主要包括黑子群的磁极性分类、McIntosh 分类[16]、黑子群位置、黑子群面积、黑子数目以及经度范围6 项参数。
1.2 数据范围与规模
本文所使用的太阳质子事件、太阳耀斑和CME的数据来源于美国协作数据分析工作室(CDAW),太阳黑子的数据来源于美国国家地球物理数据中心(NGDC)官方网站。为了使预报系统全面地学习太阳活动高年和太阳活动低年中太阳质子事件的活动规律,选用了一个完整的太阳活动周——第23 个太阳活动周(1997-2007 年)的数据。该选择参考了Xu 等[17]对太阳活动周的划分。该活动周内有记录的太阳质子事件共105 次,由于设备的故障造成数据残缺,有25 次事件未被使用。数据的总量为654 条,每条数据由相关联的CME、太阳耀斑和太阳黑子的参数组成。数据的关联工作由CDAW 完成。其中有80 条数据对应了太阳质子事件的发生,574 条无太阳质子事件发生。
2 实验方法
选取在多个领域中广泛使用的机器学习模型,采用太阳质子事件预报中常用的评价指标,以交叉验证的方式计算每个模型的指标并依此为模型赋予权重,然后通过加权投票的方式将其集成为一个模型。集成模型能够综合所有单一模型的优点,拥有更强的预报能力。
2.1 模型选用
本质上,太阳质子事件的短期预报(发生与否)是机器学习领域中常见的二分类问题。近些年来,一些机器学习分类模型(下称模型)在太阳质子事件预报中得到了一定的应用,但是仅限于单个模型的使用,普遍存在虚报率较高的问题。表1 给出了本文选用的用于太阳质子事件的短期预报8 种模型。每个模型经过训练后,对于一条输入数据,会预报24 h 内发生质子事件的概率,当概率大于50%时,认为24 h 内会有太阳质子事件发生。
表1 本文使用的8 种机器学习模型Table 1 Machine learning models applied in this study
2.2 模型评价
2.2.1 评价指标
模型对太阳质子事件的预报能力需要一定的指标来进行衡量。目前太阳质子事件短期预报中广泛采用的评价指标包括报准率(Rpd)和虚报率(Rfa),即
其中:NTP为真正例(True Positive,TP),表示将正类(发生了太阳质子事件的数据)正确预测为正类的数量;NFP为假正例(False Positive,FP),表示将负类(未发生太阳质子事件的数据)错误预测为正类的数量;NFN(False Negative,FN) 为假负例,表示将正类错误预测为负类的数量。
但是单独使用报准率和虚报率两项指标之一,并不能完全反映一个模型对质子事件的预测能力。因此引入了F1值作为综合评价指标,其计算方式如下:
2.2.2 评价方法——交叉验证
交叉验证是用于评价一种机器学习模型是否适用于当前应用场景(在本文中是太阳质子事件短期预报)的实验方法。交叉验证的第一步即是将数据集按照特定规律划分。根据机器学习领域中的惯例,结合本文数据集规模,表2 给出了本文数据集的划分方式。
表2 实验数据的划分方式Table 2 Dataset division strategy
(1)将数据集按照约3∶1 的比例划分为训练集和测试集。这种划分并非是随机划分,而是采用时序分层划分的方式。首先将数据按照时间顺序排列,取前4 条出列,从中随机取3 条划入训练集,剩余1 条划入测试集。重复此过程,直至整个数据集被划分完毕。采用这种划分方式,可以使太阳活动高年和太阳活动低年的数据被均匀地分配到训练集和测试集中,使模型对于太阳高年和太阳活动低年的太阳质子事件均有较强的预报能力。
(2)将训练集按照4∶1 的比例进一步划分为交叉训练集和交叉验证集。需要注意的是:在训练集的划分中,交叉训练集和交叉验证集不是固定的,而是将训练集平均分为5 个子集后随机取4 个子集合并作为交叉训练集,剩余1 个子集作为交叉验证集,共有5 种不同的组合。这里的5 等分同样采用时序分层的划分方式,将数据按照时间顺序排列后,取前5 条出列,并将其随机划分到5 个子集中。重复此过程,直至整个数据集被划分完毕。因此每种组合中都等比例地包含太阳活动高年和太阳活动低年的数据。
将交叉训练集输入到某个模型对其进行训练,并将其对应的交叉验证集输入到训练后的模型中进行预报,则可以获得一组报准率,虚报率和F1值用于评价该模型的预报能力。在训练集5 种不同的组合上均进行一次实验,称为一次交叉验证。每次交叉验证,都会获得5 个报准率,虚报率和F1值,以其均值表征模型预报的准确性。
2.3 模型集成
模型评价完成后,需要根据评价结果对模型进行集成,以综合利用多个模型的优点。由于F1值综合了一个模型报准率与虚报率,更能代表一个模型的预报能力,因此选用F1值作为每个模型的权重用来对模型进行集成。集成采用了一种加权投票的方式。
设定一条数据输入集成模型后预报所得的输出(即质子事件发生的概率)为,则有
其中,N为单个模型的数量,wi为单个模型的权重,pi为单个模型的输出。预报阈值设置为0.5,若0.5则认为短期内会发生太阳质子事件;反之则认为不会。
为了使集成模型输出的取值范围在0 和1 之间,需要对每个模型的F1值做归一化处理得到权重
集成后的模型首先使用训练集数据进行训练,训练得到的模型即是最终的预报模型。使用测试集对其预报能力进行测试。测试集则是从未参与过预报模型训练的数据,预报模型对其未知,性质等同于生产环境中新到来的数据,因此可以很好地用来测试集成模型的能力。
3 实验结果
3.1 交叉验证结果
根据表2 的数据集划分,在训练集上对选用的8 种模型进行交叉验证后得到的报准率,虚报率和F1值的均值列于表3。
表3 八种模型各自在交叉验证中的表现Table 3 Performance of 8 individual models on cross-validation dataset
3.2 模型集成结果
获取到F1值的均值之后,利用2.3 节中介绍的模型集成方法,将8 种模型集成为一个最终的预报模型,在训练集上训练后,在测试集上对集成模型测试。
测试集数据共164 条,有21 条数据对应了太阳质子事件的发生。表4 为集成模型对测试集中太阳质子事件的预报结果。其中17 次被集成模型正确预测,而2001 年11 月17 日,2002 年8 月14 日,2003年12 月2 日,2004 年11 月1 日发生的4 次太阳质子事件被漏报。由表4 可以看出,漏报的4 次太阳质子事件峰值通量均在10~100 pfu 之间。
表4 集成模型对测试集中的太阳质子事件的预报结果Table 4 SPEs prediction result of the ensemble model on the test set
此外,有4 条并未对应太阳质子事件发生的数据,被虚报为有太阳质子事件发生。将测试结果汇总列于表5,计算得到报准率为80.95%,误报率为19.05%。
表5 集成模型在测试集上的预报结果Table 5 Result of the ensemble model on the test set
3.3 结果比较
为了直观地说明本文预报方法的性能,表6 给出了本文实验结果与美国空军实验室的PPS 系统,Laurenza 模型,Núñez 等开发的UMASEP 模型,以及Qiuzhen 等方法预报性能的对比情况。由表6 可以看出,本文方法在保证80%以上报准率的基础上,进一步降低了虚报率,模型综合表现(F1值)有了明显的提升。
表6 本文模型与现行其他预报方法的对比Table 6 Comparison with other current prediction methods
4 结语
根据上述的实验与结果进行分析,本文在以下几个方面取得了一定成果。
(1)提出了一种基于集成学习的太阳质子事件短期预报的方法。该方法选用了8 种广泛使用的机器学习模型,通过交叉验证评价和加权投票机制获得了一个集成的预报模型。
(2)本文模型在对太阳质子事件预报的报准率高达80.95%的同时,进一步将虚报率降低至19.05%。相比现有的预报方法性能有较大的改善。
(3)本文使用了一个完整的太阳活动周的数据,并且通过时序分层划分的方式,保证了模型训练和模型测试的数据中都包括了太阳活动高年与太阳活动低年的数据。因此,本文模型对于太阳活动高年和低年的太阳质子事件均具有较好的预报能力。
本文的集成预报模型在太阳质子事件短期预报任务中拥有较强的能力,如果能够将该集成模型进行工程化,形成功能完备的业务预报系统,并应用于实际航天任务中,则能更加有效地进行航天任务的规划,规避或减少对航天器与航天员的伤害。此外,本文中仅应用了太阳黑子、太阳耀斑、CME 相关数据进行太阳质子事件短期预报。然而太阳质子事件的形成是一个极为复杂的物理过程。高能粒子的产生,粒子的加速机制与行星际运输过程等,均受到日地空间多重因素影响。近地X 射线背景、总太阳辐照度、太阳射电通量以及射电噪暴等现象都与太阳质子事件的形成密切相关。相关输入数据集的选择、扩充和完善,则有机会获得更为精准的太阳质子事件短期预报模型。这些都将是下一步研究的方向。
致谢国家科技资源共享服务平台国家空间科学数据中心(http://www.nssdc.ac.cn)提供计算服务,美国协作数据分析工作室(CDAW)提供太阳耀斑与CME 相关数据,美国国家地球物理数据中心(NGDC)提供太阳黑子相关数据以及太阳质子事件列表。