朱雀卫星伽玛暴持续时间的分布*
2016-07-28杨恩波张志彬
杨恩波,张志彬
(贵州大学理学院,贵州 贵阳 550025)
朱雀卫星伽玛暴持续时间的分布*
杨恩波,张志彬▲
(贵州大学理学院,贵州贵阳550025)
摘要:伽玛暴持续时间的分布是对伽玛暴进行分类的一个依据。本文利用高斯混合模型和最大期望算法对朱雀卫星2005年至2014年在轨运行期间所探测到的741个伽玛暴持续时间的分布进行了分析,同时利用贝叶斯信息准则比较了具有不同高斯成分个数的模型。分析结果支持双高斯成分的模型比其他模型更好的描述了朱雀卫星所探测到的伽玛暴持续时间的分布,同时这一结论与其他卫星数据的分析结果一致,均支持存在两种类型的伽玛暴。
关键词:伽玛暴,持续时间,数据分析,统计
0引言
伽玛射线暴,简称伽玛暴(GRBs),是宇宙中一种极其强烈的恒星级的爆发现象,由美国的Vela军事卫星在1967年首次探测到。随着美国康普顿天文台在1991年成功在轨运行并取得大量伽玛暴观测数据,研究人员对伽玛暴展开了各方面的研究,如何对伽玛暴进行分类是研究热点之一。Kouveliotou等(1993)[1]统计了BATSE当时所探测到的222个伽玛暴持续时间T90(扣除背景噪声后,探测器接收到的光子数从5 %增长到95 %所用时间)的分布,他们发现logT90存在双峰分布的现象,并基于这一点提出伽玛暴按照持续时间长短,以T90=2.0 s为界限,可以分为两类,长暴(LGRBs)和短暴(SGRBs),其中长暴约占75 %,短暴约占25 %。这一分类方法被称为长短暴分类方法,且已经被研究人员广泛接受。这两类伽玛暴被认为具有不同的物理起源。短暴被认为是双致密星的产物[2],如双中子星或者一颗黑洞伴随一颗中子星,而长暴则被认为与大质量恒星的爆炸有着密切的联系[3]。
Horváth(1998)通过分析BATSE当时已探测到的797个伽玛暴的logT90分布发现可能存在第三种类型的伽玛暴,类似的证据同样在BeppoSAX卫星数据[5],Swift卫星数据[6]以及Fermi卫星数据[7]中被发现。在做类似的数据分析时的方法通常是logT90对做直方图,然后对直方图进行高斯拟合并利用卡方检验判断拟合结果优劣。拟合直方图方法的不足之处在于最终的结果会受直方图的bin影响,不同大小的bin最终会导致不同的分析结果。在本文中,将采用高斯混合模型(Gaussian Mixture Model,GMM)和最大期望算法(Expectation and Maximization Algorithm)分析朱雀卫星(Suzaku)探测到的伽玛暴的持续时间分布,从而避免受bin大小的影响。
1样本选取及分析方法
1.1样本选取
朱雀卫星上搭载的硬X射线探测器(HXD)探测能量范围为50 keV~5 MeV,拥有伽玛暴观测模式[8]。从2005年8月到2014年12月,总共有741个伽玛暴触发了HXD的伽玛暴观测模式(另有部分伽玛暴亦被HXD探测到,但因强度不足,并未触发HXD,此部分样本未被纳入本文的分析中)。这741个伽玛暴的持续时间信息可从朱雀卫星官方网站下载(http://www.astro.isas.ac.jp/suzaku/resear-
ch/HXD-WAM/)。
1.2分析方法
GMM是参数化的概率方程,它由不同比重的高斯成分相加而成,在分析一维数据时,样本整体的似然值可以表示为:
(1)
其中N代表样本的个体总数,X代表所选取的样本集合,ωi,μi,∑i分别代表第i个高斯成分的权重,中心值和相关矩阵。N(xj|μi,∑i)代表第i个高斯成分的概率密度,其计算方法为:
(2)
最佳的模型参数将通过EM算法获得,在指定高斯成分个数k后,EM算法将通过不断的在a)和b)之间进行迭代,获得最大P(X|ω,μ,∑)值的参数便是最佳参数,相应的模型便是k个高斯成分下的最佳模型。
a)估计未知参数ωi,μi,∑i的期望值,给出其参数估计。
b)重新估计分布参数,以使得数据的P(X|ω,μ,∑)最大,给出ωi,μi,∑i的期望估计。
贝叶斯信息准则(BayesianInformationCriterion,BIC)可用于比较不同高斯成分个数下最佳模型的对待分析样本的适应程度,即决定高斯成分的个数[9,10]。BIC的计算方法为:
BIC=plnN - 2lnpmax
(3)
其中N代表样本中个体数目,p和pmax分别代表待考察模型的参数个数以及该模型的最大似然值。BIC值最小的模型便是最适应样本的模型。对于其他模型,如果其BIC值超过最小值0到2之间,则其同样可适应样本;如果超过最小值2到6之间,则其对样本的适应度将变弱;若超过最值6以上,则其对样本的适应度明显下降,可以被排斥掉[11]。
2结果分析
具有2个高斯成分的GMM模型(2-G)和3个高斯成分的GMM模型(3-G)分别被用于分析朱雀卫星伽玛暴持续时间的分布,具体分析结果见图1和图2,两图中均加入背景直方图方便比较GMM模型输出结果,直方图的bin符合Knuth规则[12]。各自最佳的参数见表1。
表1 2-G模型和3-G模型的输出参数以及BIC值
从图1和图2以及表格1中可以看出,2-G模型的BIC值为1 709.705,3-G模型的BIC值则是为1 718.288,两者之差接近9,已经大于6,这说明2-G模型能够更好的描述朱雀卫星伽玛暴持续时间的分布,且3-G模型对样本的适应度明显弱于2-G模型,足以被排除,这一结果与Yang等(2016)[13]利用相同方法分析的Fermi卫星数据结论一致,与Zhang&Choi(2008)[14]对Swift卫星数据的分析也是一致的。Ohmori等(2016)[15]对朱雀卫星全部伽玛暴(包含未触发HXD的伽玛暴)的分析也得到相同结论。
图1 2-G模型输出结果(竖虚线代表T90=2.0s,
图2 3-G模型输出结果(其余与图1相同)
对于最佳的2-G模型,两个高斯成分的比例为0.217∶0.783,与Kouveliotou等(1993)[1]得到的0.25∶0.75的比例接近,考虑到本文的样本来自朱雀卫星,Kouveliotou等(1993)[1]分析的样本来自BATSE,二者在比例上的差异可能是由探测器选择效应造成[2,16]。由图1可见,2-G模型的两个高斯成分之间的分界线比2.0 s稍小,与比例的差异类似,这一点也可能来自于探测器的选择效应[2,16]。
利用相同的方法,高斯成分个数从1到9共9个模型均做了相同分析,相应的BIC值比较如图3所示,可见2-G模型的BIC值位于最低点,其余模型均不如2-G模型的更适合描述朱雀卫星的持续时间分布。
图3 不同高斯成分个数的模型BIC值比较
3总结
持续时间的分布是对伽玛暴进行分类的依据之一,本文利用高斯混合模型以及最大期望算法,分析了朱雀卫星伽玛暴持续时间的分布,分析结果显示,朱雀卫星伽玛暴的持续时间仍然服从双峰分布,双高斯成分模型能够更好的描述该分布,这一结论支持已经被广泛接受的长短暴分类方法,同时与其他卫星数据的分析结果一致。
参考文献【REFERENCES】
[1]KOUVELIOTOU C,MEEGAN C A,FISHMAN G J,et al.Iden-tification of two classes of gamma-ray Bursts[J].Astrophysical Journal,1993,413(2):L101-L104.
[2]NAKAR E.Short-hard gamma-ray bursts[J].Physics Reports,2007,442(1):166-236.
[3]WOOSLEY S·E,BLOOM J·S.The Supernova gamma-ray burst connection[J].Annual Review of Astronomy & Astrophysics,2006(44)1:507-556.
[4]Horváth I.A third class of Gamma-Ray Bursts[J].The Astrophysical Journal,1998,508(2):757.
[5]Horváth I.Classification of BeppoSAX’s gamma-ray Bursts[J].Astrophysics and Space Science,2009,323(1):83-86.
[6]Horváth I,Balázs L G,Bagoly Z,et al.Classification of swift’s Gamma-Ray Bursts[J].Astronomy & Astrophysics,2008,489(1):L1-L4.
[7]TARNOPOLSKI M.Analysis of fermi Gamma-Ray Burst Duration Distribution[J].Astronomy & Astrophysics,2015,581:A29.
[8]TASHIRO M,ABE K,ANGELINI L,et al.Strategy of the Suzaku Gamma-Ray Burst Observations[J].Advances in Space Research,2007,40(8):1255-1258.
[9]SCHWARZ G.Estimating the dimension of a model[J].The annals of statistics,1978,6(2):461-464.
[10]LIDDLE A R.Information criteria for astrophysical model selection[J].Monthly Notices of the Royal Astronomical Society:Letters,2007,377(1):L74-L78.
[11]BURNHAM K P,ANDERSOR D R.Multimodel inference understanding AIC and BIC in model selection[J].Sociological methods & research,2004,33(2):261-304.
[12]KNUTH K H.Optimal data-based binning for histograms[J].arXiv preprint physics / 0605197,2006.
[13]YANG E B,ZHANG AH B,CHOI C S et al.Classifying Gamma-Ray Bursts with gaussian mixture model[J].arXiv preprint arXiv:1603.03680,2016.
[14]ZHANG Z B,CHOI C S.An Analysis of the durations of swift Gamma-Ray Bursts[J].Astronomy & Astrophysics,2008,484(2):293-297.
[15]OHMORI N,YAMAOKA K,OHNO M,et al.Suzaku wide-band all-sky monitor measurements of duration Distributions of Gamma-Ray Bursts[J].Publications of the Astronomical Society of Japan,2016:psw009.
[16]QIN Y,LIANG E W,LIANG Y F,et al.A comprehensive analysis of fermi Gamma-Ray Burst data.III.Energy-dependent T 90 distributions of GBM GRBs and instrumental selection effect on duration classification[J].The Astrophysical Journal,2012,763(1):15.
收稿日期:
*基金项目:国家自然科学基金项目(编号U1431126),国家自然科学基金项目(编号11263002)。
作者简介:杨恩波(1990-),男,贵州大学理学院硕士研究生。研究方向:理论物理。 ▲通讯作者:张志彬(1975-),男,博士,贵州大学教授。研究方向:伽玛暴及其余辉。
中图分类号:P172.3
文献标识码:A
文章编号:1003-6563(2016)03-0053-03
The duration distribution of Suzaku GRBs*
YANG Enbo,ZHANG Zhibin▲
(CollegeofScience,GuizhouUniversity,Guiyang550025,China)
Abstract:The duration distribution of gamma-ray burst is one of the bases method to classify them.In this paper,duration distribution of 741 GRBs detected by Suzaku from 2005 to 2014 is studied by using Gaussian Mixture Model and Expectation Maximization Algorithm.Bayesian Information Criterion has been used to compare between different GMM models.The analysis results showed that two components Gaussian Mixture model performed better than other models in describing the duration distribution of Suzaku GRBs,which is consistent with the results of other satellites’ data.The results all support the 2-type classification of GRBs.
Keywords:gamma-ray bursts,duration,data analysis,statistics