中低分辨率光谱的恒星大气物理参数自动提取方法
2017-04-19卜育德
卜育德
(山东大学(威海) 数学与统计学院,山东 威海,264209)
中低分辨率光谱的恒星大气物理参数自动提取方法
卜育德
(山东大学(威海) 数学与统计学院,山东 威海,264209)
恒星大气物理参数的信息对我们研究恒星和银河系的结构和演化有重要意义。由于多目标光纤光谱仪的发展,人类获取恒星光谱的数量有了极大的增加。但由于这些光谱数量众多,天文学家快速而又精确的提取相应的恒星大气物理参数有很多困难。为此,天文学家发展了一系列新的方法提取恒星的大气物理参数。本文总结了目前主要的恒星大气物理参数估计方法,并对以后可能的重点研究方向给出了建议。
恒星大气物理参数;α元素丰度;线性回归
恒星大气物理参数是指恒星的表面温度Teff,表面重力加速度logg和金属丰度[Fe/H]以及恒星的α元素丰度[α/Fe]等。现代天文学研究的一个主要课题是理解银河系的形成和演化历史,这需要我们获取大量恒星的大气物理参数,这些信息将对银河系的演化历史和模型提供很强的观测约束。
随着多目标光纤光谱仪技术的发展,天文学家获取恒星光谱的能力有了质的飞跃。截止到2014年12月,美国的SLOAN数字巡天(SDSS)项目共释放了12批约80万条中分辨率(R~2000)的恒星光谱[1];我国大科学工程郭守敬望远镜(LAMOST)于2012年9月开始正式巡天后,截止到2016年12月,对国内科学家释放了四批数据6,898,298条恒星光谱(4,202,927条光谱有恒星大气物理参数)[2];而RAVE巡天获取了483,330个目标574,630个光谱[3]。
基于这些海量的恒星大气物理参数等信息,科学家对银河系的结构、形成和演化等问题进行了深入研究。比如,针对厚盘和薄盘是两个完全不同的结构子系,还是同一成分连续演化过程中呈现的两种极端情况这个重要问题,Bovy等人使用SDSS发布的恒星大气物理参数和视向速度等参量,通过拟合选择函数得到银河系的标高和标长,进而认为银河系不存在厚盘和薄盘之分,而是连续变化的,颠覆了传统的对银河系结构的认知,促使人们重新思考银河系的结构[4]。而针对银晕的年龄问题,Jofre和Weiss利用SDSS DR7发布的恒星有效温度和金属丰度对银晕中的场星年龄进行了估计,认为银晕的年龄为10-12Gyr,但有效温度、金属丰度等的误差会影响估计精度,误差大约在4Gyr左右[5]。针对暗物质密度问题,张岚等人利用SDSS提供的[Fe/H]和α丰度等参数对太阳系附近的暗物质密度进行了估算[6],得出暗物质密度的估计值为0.0065±0.0023M⊙pc-3。
传统的恒星大气物理参数提取是基于高分辨率光谱的人工分析方法。面对海量的光谱,传统的方法已无法满足需要,为此,需要研究新的提取方法。最近20年机器学习领域的进展为我们提供了能自动提取恒星大气物理参数的方法,可以提高恒星大气物理参数的提取效率和精度,有效满足天文数据处理的实时性和精确性的要求。
本文将对目前恒星大气物理参数的估计方法做一个总结。考虑到在实际问题中大多数研究对大气物理参数中的Teff,logg和[Fe/H]与α元素丰度分别研究,本文也将分开讨论。
1 恒星大气物理参数(Teff,log g和[Fe/H])估计方法的研究现状
模板匹配方法是使用最为广泛的方法之一。所谓模板匹配,是指计算待测光谱与光谱库中光谱的距离,而与待测光谱距离最近的光谱所对应的恒星大气物理参数值即为该待测光谱的恒星大气物理参数。不同的模板匹配方法一般使用不同的方法计算最小距离,而且往往使用不同的光谱库。SDSS光谱的恒星大气物理参数测量程序SSPP包含了两种模板匹配方法,分别使用不同的理论模板库[7]。而LAMOST恒星大气物理参数的估计方法也是模板匹配方法,所用光谱模板来自于ELODIE光谱库[8]。向茂盛等人的估计恒星大气物理参数的pipeline LSP3使用的也是模板匹配方法,所用的模板光谱来自于MILES光谱库[9]。
神经网络方法作为机器学习的一个重要方法,较早的被引入了恒星大气物理参数的估计当中。Bailer-Jones等人和Re Fiorentin等人研究了神经网络算法的恒星大气物理参数提取方法[10,11];谭鑫等人基于Lick线指数使用神经网络方法估计了恒星大气物理参数[12]。深度学习方法作为一种推广的神经网络方法,也被应用在了恒星大气物理参数的估计当中。潘儒扬&李乡儒使用DNN方法估计了SDSS的恒星大气物理参数[13]。
回归方法作为统计学的一个基本方法也被广泛的应用于恒星大气物理参数的估计。张健楠等研究了基于核回归算法(KR)的恒星大气物理参数测量方法[14];卜育德等人研究了高斯过程回归方法GPR,使用该方法估计了SDSS光谱的恒星大气物理参数[15];王杰等人研究了使用Lick线指数基于核偏最小二乘回归的恒星大气物理参数估计方法[16];李乡儒等人研究了基于小波分析和线性回归的恒星大气物理参数估计方法[17]。卢瑜等人使用稀疏回归方法LASSO估计了SDSS的恒星大气物理参数[18];Ivezic 等人利用SDSS提供的F/G型恒星的有效温度和[Fe/H]构建了一个使用颜色确定温度和[Fe/H]的多项式模型,该方法也可以看作一个回归模型[19]。
使用星震学方法估计恒星大气物理参数中的logg特别适用于巨星和类太阳恒星。所谓星震学方法,是指基于如下公式计算恒星的表面重力加速度:
其中vmax,⊙=3140.0 μHz,Teff,⊙=5777K,logg⊙=4.44dex。该方法适用于红巨星,已被用于估计LAMOST和RAVE的恒星的logg,提高了结果的估计精度[20,21]。
然而,SSPP使用的很多方法并不适用于LAMOST光谱。如无法使用颜色方法测量LAMOST恒星的温度,这是因为LAMOST没有测光数据。为此,LAMOST项目开发了自己的pipeline进行恒星大气物理参数的测量,主要基于模板匹配的方法[13]。LAMOST目前只发布了由一种方法测量的恒星大气物理参数,即模板匹配方法,是由吴悦等人在软件UlySS基础上开发的pipeline实现的[25],使用的光谱库主要是ELODIE光谱库。向茂盛等人开发了自己的程序对LAMOST光谱的恒星大气物理参数进行测量(LSP3),主要方法也是模板匹配[9],使用的光谱来自于MILES光谱库。
RAVE巡天的恒星大气物理参数提取使用了DEGAS算法和MATISSE方法,最终估计精度约为σ(Teff)=150K,σ(logg)=0.30dex,σ([Fe/H])=0.12dex。该方法的原理是把输入光谱投影到由训练集得到的几个向量中[26]。而GAIA光谱的参数估计融合了MATISSE算法,DEGAS方法和GAUGUIN方法[27]。
2 恒星的α元素丰度估计方法
α元素一般指的是化学元素 O,Mg,Si,Ca,and Ti。传统的对α元素的测量一般使用高信噪比和高分辨率(R>20,000)的光谱,此时可以对每个α元素都做精确的测量。但由于获取高分辨光谱需要较长的曝光时间,我们难以获得足够多的光谱样本,以深入研究恒星的形成和化学增丰等问题。而目前获得的海量的光谱都是中低分辨率的,为此,我们需要研究从中低分辨率的光谱中提取α元素的丰度。
Kirby等人使用模板匹配方法对中分辨率(R~6000)的波长覆盖范围为6300-9100Å的光谱进行了α元素的丰度测量,最终的测量精度为0.05dex[28]。而为处理RAVE项目得到的波长覆盖范围为8410-8795Å的分辨率为 R=7500的光谱,科学家开发了自动测量α元素丰度的程序,使用的是χ2匹配方法,最终的α元素估计精度在0.15dex 左右[29]。
为了从SDSS SEGUE发布的分辨率为R~2000的光谱中确定恒星的α元素的丰度,Lee等人开发了自动程序,通过构建理论模板,使用模板匹配方法得到α元素的丰度[30]。通过与SDSS获取的高分辨率的光谱的α元素的丰度进行对比,得到该方法的测量误差为0.062dex。但该方法对贫金属的冷巨星(Teff<4800K,logg<2.0,[Fe/H]<-2.5)的测量误差较大。
卜育德等人研究了基于ELM算法的α元素丰度估计方法[31]。通过应用ELM算法由ELODIE光谱构建的不同信噪比、不同分辨率的光谱,证实该算法对信噪比和分辨率变化不敏感,且对低分辨率光谱的α丰度的估计精度约为0.10dex;通过与ANN、核回归算法(KR)、支持向量回归(SVR)算法等对比,显示该算法精度和效率都比其他算法高。韩晨、李冀等人研究了基于模板匹配方法的LAMOST光谱的α元素丰度估计方法,精度约为Δ=0.13dex(σ=0.08dex)[32]。Ho et al.使用非线性回归的方法估计了LAMOST光谱的α丰度,训练参数为APOGEE项目提供的α丰度,最终精度在0.05dex左右[33]。向茂盛等人使用核主成分分析(KPCA)方法估计了LAMOST恒星的α丰度,结果较好[34]。为了从SDSS和LAMOST光谱中搜寻贫α恒星、邢千帆等使用模板匹配方法估计α丰度[35,36].
我们把目前广泛使用的α丰度估计方法及其特点总结在了表1里。
表1 中低分辨率光谱的α元素丰度估计方法Table 1 The method of estimating α elements abundance with low resolution spectrum
3 总结
恒星大气物理参数的估计一直是天文学家尤其是天文数据处理专家重点研究的领域。目前,有一些问题是天文学家在实际处理问题时重点关注的:
(1)如何产生和实测光谱类似的好的理论光谱模板库是核心问题之一。现在的理论模板库和实测光谱差距较大,这提高了精确估计恒星大气物理参数的难度。目前一般的解决方法是使用高分辨率的光谱。但考虑到不同的巡天项目得到的光谱特征和波长覆盖区间并不完全一致,因此这些光谱库无法完全满足需要。如果能产生和实测光谱类似的理论光谱,将会较好的解决这些问题。
(2)如何提高对某一类特殊恒星的估计精度是天文学家重点研究和关心的问题。比如,提高对贫金属星的参数估计精度,将有助于我们快速搜寻贫金属星并且分析贫金属星的元素特征。
(3)如何对某一类特殊数据进行恒星大气物理参数的估计。这类数据包括有缺失数据的光谱以及训练数据和光谱模板类型较少的数据。比如,MILES光谱库包含的类型较少,一般情形下需要进行观测以进一步扩充光谱库。是否有机器学习的方法解决这类问题,是值得探讨的。
[1]SDSS[EB/OL].http://www.sdss.org
[2]LAMOST[EB/OL].http://www.lamost.org
[3]RAVE[EB/OL].http://www.rave-survey.org/project/
[4]Bovy J,Rix H W,Hogg D W.The milky way has no distinct thick disk[J].ApJ,2012,751(2):633-1642.
[5]Jofre P,Weiss A.The age of the Milky Way halo stars from the Sloan Digital Sky Survey[J].A&A,2011,533(533):14-29.
[6]Zhang Lan,Rix H W,Ven GVD,et al.The gravitational potential near the sun from SEGUE K-dwarf kinematics[J].ApJ,2012,772(2):547-568.
[7]Ys Lee,TC Beers,T Sivarani et al.The SEGUE stellar parameter pipeline.I.Description and comparison of individual methods[J].AJ,2008,136(5):2022-2049.
[8]Luo A L,Zhao Y H,Zhao G,et al.The first data release(DR1)of the LAMOST regular survey[J].Research in Astronomy and Astrophysics,2015,15(8):1095-1124.
[9]Xiang M S,Liu X W,Yuan H B,et al.The LAMOST stellar parameter pipeline at Peking University-LSP3[J].Monthly Notices of the Royal Astronomical Society,2014,448(1):822-854.
[10]Bailerjones C A L.Stellar parameters from very low resolution spectra and medium band filters:Teff,logg and [M/H] using neural networks[J].Physics,2000,357(1):197-205.
[11]Fiorentin P R,Bailerjones C A L,Lee Y S,et al.Estimation of stellar atmospheric parameters from SDSS/SEGUE spectra[J].Astronomy & Astrophysics,2007,467(3):1373-1387.
[12]谭鑫,潘景昌,王杰,等.基于神经网络的线指数恒星大气物理参数测量方法[J].光谱学与光谱分析,2013,33(6):1701-1705.
[13]潘儒扬,李乡儒.基于深度学习技术的恒星大气物理参数自动估计[J].天文学报,2016,57(4):379-388.
[14]张健楠,吴福朝,罗阿理.核回归方法在恒星光谱物理参量自动估计中的应用[J].光谱学与光谱分析,2009,29(4):1131-1136.
[15]Bu Yude and Pan Jingchang.Stellar atmospheric parameter estimation using Gaussian process regression[J].Monthly Notices of the Royal Astronomical Society,2015,447(1):256-265.
[16]王杰,潘景昌,谭鑫.基于线指数的核偏最小二乘回归在恒星大气物理参数测量中的应用[J].光谱学与光谱分析,2014(3):833-837.
[17]Li X,Lu Y,Comte G,et al.Linearly Supporting Feature Extraction For Automated Estimation Of Stellar Atmospheric Parameters[J].Astrophysical Journal Supplement Series,2015,218.
[18]Lu Y,Li X.Estimating stellar atmospheric parameters based on LASSO and support-vector regression[J].Monthly Notices of the Royal Astronomical Society,2015,452(2):1394.
[20]Wang L,Wang W,Wu Y,et al.Calibration of LAMOST Stellar Surface Gravities Using the Kepler Asteroseismic Data[J].The Astronomical Journal,2016,152(1):6.
[21]Valentini M,Chiappini C,Davies G R,et al.RAVE stars in K2-I.Improving RAVE red giants spectroscopy using asteroseismology from K2 Campaign 1[J].arXiv:1609.03826,2016.
[22]YS Lee,TC Beers,T Sivarani,et al.The SEGUE stellar parameter pipeline.Ⅱ.Validation with galactic globular and open clusters[J].AJ,2007,136(5):2050-2069.
[23]CA Prieto,T sivarani,TC Beers,et al.The SEGUE stellar parameter pipeline.Ⅲ.Comparison with high-resolution spectroscopy of SDSS/SEGUE field stars[J].AJ,2007,136(5):2070-2082.
[24]JP smolinski,YS Lee,TC Beers,et al.The SEGUE stellar parameter pipeline.IV.Validation with an extended sample of galactic globular and open clusters[J].AJ,2011,141(3):2770-2791.
[25]吴悦.恒星光谱基本物理参数自动测量的实现及应用[D].北京:中国科学院研究生院,2010.
[26]Kordopatis G,Gilmore G,Steinmetz M,et al.The Radial Velocity Experiment(RAVE):Fourth Data Release[J].The Astronomical Journal,2013,146(5),134,36 pp.
[27]Bailer-Jones C.A.L,Andrae R,Arcay B,et al.The Gaia astrophysical parameters inference system(Apsis).Pre-launch description [J].Astronomy & Astrophysics,2013,559,A74,1-20.
[28]Kirby E N,Guhathakurta P,Sneden C.Metallicity and Alpha-Element Abundance Measurement in Red Giant Stars from Medium Resolution Spectra[J].Astrophysical Journal,2008,682(2),1217-1233.
[29]Zwitter T,Siebert A,Munari U,et al.The Radial Velocity Experiment(RAVE):second data release[J].Astronomical Journal,2008,136(1),421-451.
[30]Lee Y S,Beers T C,Prieto C A,et al.The SEGUE Stellar Parameter Pipeline.V.Estimation of Alpha-element Abundance Ratios from Low-resolution SDSS/SEGUE Stellar Spectra[J].Astronomical Journal,2010,141(3),2770-2791.
[31]Bu Y,Zhao G,Pan J,et al.ELM:an Algorithm to Estimate the Alpha Abundance from Low-resolution Spectra[J].The Astrophysical Journal,2016,817(1):78.
[32]韩晨.基于低分辨率LAMOST恒星光谱估算α元素丰度[D].石家庄:河北师范大学,2015.
[33]Ho A.Y.Q.et al.Survey Cross-Calibration with The Cannon:Apogee-scale Stellar Labels from Lamost Spectra.2016,arXiv,1602.00303.
[34]Xiang M S,Liu X W,Shi J R,et al.Estimating stellar atmospheric parameters,absolute magnitudes and elemental abundances from the LAMOST spectra with Kernel-based Principal Component Analysis[J].Monthly Notices of the Royal Astronomical Society,2016,464(3):3657-3678.
[35]Xing Q F,Zhao G,Zhang Y,et al.A search for Mg-poor stars using LAMOST survey data[J].Research in Astronomy and Astrophysics,2015,15(8):1275-1281.
[36]Xing Q F,Zhao G.Mining the Sloan Digital Sky Survey in Search of Extremely α-poor Stars in the Galaxy[J].The Astrophysical Journal,2014,790(1):33.
Automatic extraction of stellar atmospheric physical parameters in low resolution spectra
BU Yude
(School of Mathematics and Statistics,Shandong University,Weihai 264209,China)
The information of the stellar atmospheric parameters is important for us to study the structure and evolution of stars and the Galaxy.With the development of multi-object fiber spectroscopic telescope,the number of stellar spectra has greatly increased.However,it is difficult for us to extract stellar atmospheric parameters from these massive spectra data.To overcome this difficult,the astronomers have developed a series of new methods to extract the physical parameters of stars and the abundance ofαelements.In this paper,the main methods of extracting the stellar atmospheric parameter are summarized.
stellar atmospheric parameter;αabundance;linear regression.
1672-7010(2017)01-0030-06
2016-12-25
国家自然科学基金资助项目(U1431102,11603012);山东省青年基金项目(ZR2015AQ011);中国博士后
基金项目(2015M571124);山东大学青年学者未来计划资助项目(2016WHWIJH09)
卜育德(1981-),男,山东人,副教授,博士,从事天文数据挖掘与处理研究;E-mail:buyude001@163.com
P152.1 < class="emphasis_bold">文献标志码:A
A