不同城市居民头发中氧、氢稳定同位素检验和特征初探*
2022-12-22于子洋杨瑞琴郭洪玲梅宏成
于子洋 杨瑞琴 黄 阳 秦 皓 胡 灿 朱 军**王 萍 郭洪玲 梅宏成**
(1)中国人民公安大学侦查学院,北京 100038;2)公安部物证鉴定中心,北京 100038)
稳定同位素分析具有示踪指示能力强、检测速度快、测量结果准确等特点,被广泛应用于生态学和地球化学为代表的众多学科[1-4]。大气中水蒸气的氧(O)、氢(H)稳定同位素比值受同位素分馏作用的影响,表现出特定的空间变化规律[5-6]。其以降水等形式成为地表水,参与到动植物的生长和代谢活动,最终反映在动植物体组织中,由此形成的生物体内O、H稳定同位素比值分布规律可用于研究动物迁移轨迹、物证的真伪鉴定和溯源推断等[7-12]。法庭科学研究人员为探究人体组织稳定同位素在个体溯源推断领域的应用潜力,对头发、牙齿、指甲等人体组织进行了不同种类元素的稳定同位素检测和分析[13-15]。人头发主要由氨基酸组成,长出毛囊后便停止代谢,不再与其他部分和环境发生交换,化学性质稳定,因此成为记录饮食、饮水中稳定同位素信息的良好载体[16]。
目前研究人员已经针对人头发中O、H稳定同位素开展了部分研究。研究人员发现人头发中O、H稳定同位素比值与日常饮用水中O、H稳定同位素比值存在正相关关系,人头发中H 元素大约有30%左右直接来源于饮水,但当人体摄入大量含有不同δ2H值的食物时,其与当地饮水的相关关系会被极大弱化[9,17],不同地区日常饮用水对居民头发中O、H 稳定同位素的影响程度可能存在差异[18]。在溯源推断领域,Bol 等[19]检测了英格兰当地居民和外来游客头发中O稳定同位素比值,结合居民头发中碳(C)、氮(N)稳定同位素比值,利用主成分分析法区分了当地居民和外来游客。Ehleringer 等[20]和Gautam 等[21]通过大量样品测定,制作了美国和韩国居民头发的O、H稳定同位素地图,帮助实现个体活动轨迹的还原和来源地域的判定。中国地域辽阔,汇集了大量不同的气候类型及不同饮食习惯,中国居民头发稳定同位素组成必然存在特有的分布规律。但现有稳定同位素研究报道多来自美国、西欧等国家和地区,针对中国居民头发中O、H等元素稳定同位素特征的研究相对较少[22]。在溯源推断时,相关研究多聚焦于单一种类稳定同位素数据的空间分布特征对比,少有利用统计学手段进行溯源推断,导致头发稳定同位素数据的溯源推断能力未被充分发掘。
本研究对华中(郑州市、南阳市)、华东(温州市)、华南(贺州市)、西南(昆明市)和西北(哈密市)等5个地区6个城市常住居民的头发样本进行了O、H稳定同位素比值检验,探讨中国不同城市居民头发O、H稳定同位素比值差异和影响因素,考察利用不同统计方法对中国居民头发溯源推断的准确性和可靠性,拓展对中国居民头发中O、H稳定同位素分布特征及其溯源能力的认识。
1 材料与方法
1.1 仪器装置与试剂
Flash EA 2000 型元素分析仪、253 Plus 型稳定同位素比质谱仪、ConFlo Ⅳ型连续流接口装置,美国Thermo Scientific 公司产品;KQ-250 DB 型数控超声波清洗器,昆山市超声波仪器有限公司产品;202-0AB电热恒温干燥箱,北京中兴伟业仪器有限公司产品;XPR 2电子天平,Mettler Toledo公司产品。CBS(鹿蹄,δ18OVSMOW=3.8‰,δ2HVSMOW=-157‰)、USGS42 (人头发,δ18OVSMOW=8.56‰,δ2HVSMOW=-78.5‰)、USGS43(人头发,δ18OVSMOW=14.11‰,δ2HVSMOW=-50.3‰)稳定同位素标准品,购自美国Reston 稳定同位素实验室;甲醇、氯仿,色谱纯,Thermo Fisher 公司产品;实验用水,PURELAB Ultra 超纯水仪(英国ELGA 公司产品)制备;锡箔杯,瑞士Santis公司产品。
1.2 样品采集
在6个城市征集当地常住居民(至少在当地连续生活8个月以上)作为头发样本提供志愿者,共采集头发样本198 份,具体样本信息如表1 所示。所有用于O、H稳定同位素检验的头发样本均为志愿者贴近头皮3 cm 左右的头发,普通人每月头发生长速度约为1 cm,贴近头皮3 cm 左右的头发样本可以保证其为摄入当地食物和水所长成。
Table 1 Information of samples and their origin
1.3 头发样品的前处理
参照O'Connell 等[23]的研究,按照以下流程对头发样本进行清洗:用甲醇-氯仿(2∶1,v/v)超声清洗1 h;用去离子水超声清洗2 次,每次15 min;用甲醇-氯仿(2∶1,v/v)超声清洗0.5 h;用去离子水超声清洗3次,每次15 min。将清洗后的头发在85℃恒温箱中干燥3.5 h。将干燥后的头发切割成小段,称取约300 μg,用稳定同位素分析专用银杯包裹。分别称量约300 μg 的CBS、USGS42、USGS43 标准物质,用稳定同位素分析专用银杯包裹。包好的头发样本和标准物质用元素分析-稳定同位素比质谱仪进行检测。
1.4 水样的保存与处理
水样采集后于4℃以下密封保存,检测前用0.22 μm滤膜过滤。
1.5 稳定同位素比质谱仪的测试条件
元素分析仪:氦气(He)吹扫流速200 ml/min,高温裂解炉温度1 380℃,色谱柱温度80℃;接口装置ConFloⅣ:He稀释压力60 kPa。
1.6 O、H稳定同位素比值的检测
1.6.1 头发样本O、H稳定同位素比值测定
在1.5 所设定仪器条件下对头发样本和标准物质同时检测,每个样本重复检测3 次,采用Ⅰsodat3.0软件分析数据。
1.6.2 水样O、H稳定同位素比值测定
检测时,每6个样品插入一个标准样品,每个样品重复测定3 次,每次进样2 μl,利用标准样品校正得到检测结果。
1.6.3 样本O、H稳定同位素比值测定
O、H稳定同位素比值分别用δ18O和δ2H表示,两者相对标准为标准平均海水。计算公式如式(1)所示:
公式中R表示重同位素与轻同位素丰度比。
1.6.4 样本O、H稳定同位素比值的数据校正与分析
参照Qi 等[24]和刘昌景等[25]制定的O、H 稳定同位素比值数据校正方法,将CBS、USGS42和USGS43 标准物质的δ18O 和δ2H 测定值与真实值进行线性拟合,得出线性校正方程。通过线性校正方程和头发样本δ18O 和δ2H 的测定值计算出其真实值。
1.7 数据处理与统计分析
利用SPSS 20.0 软件对样本的O、H 稳定同位素比值进行统计分析。
2 结果与讨论
2.1 不同城市居民头发O、H稳定同位素比值特征
检测所得6个城市居民头发δ18O 平均值是(9.3±1.0)‰,范围为6.0‰~11.7‰。居民头发δ2H平均值是(-71.2±12.0)‰,范围为-105.2‰~-47.8‰。对比不同城市居民头发O、H稳定同位素比值数据,不同城市存在显著性差异(ANOVA,δ18O:F=72.04,P<0.01;δ2H:F=305.85,P<0.01)。
对比不同城市居民头发δ18O 和δ2H 的标准偏差,二者存在显著相关性(PCCs(皮尔逊相关系数),r=0.65,P<0.05),表明随着城市中居民头发δ18O离散程度的增加,居民头发δ2H的离散程度增加。进一步对比居民头发δ18O 和δ2H,二者存在显著正相关性(PCCs,r=0.71,P<0.01),表明二者具有相似变化趋势(图1)。居民头发δ2H会随居民头发δ18O增加而增加。
Fig.1 δ18O and δ2H values of resident hair samples in different cities
2.2 日常饮用水中O、H稳定同位素比值特征
本研究检测中国6个城市居民饮用水的O、H稳定同位素比值(暂无哈密饮用水数据),不同城市居民饮用水δ18O 平均值是(-7.7±1.6)‰,范围为-12.1‰~-4.7‰。居民饮用水δ2H 平均值是(-53.4±16.1)‰,范围为-88.9‰~-27.5‰(图2)。不同城市居民饮用水δ18O 和δ2H,二者存在显著相关性(PCCs,r=0.99,P<0.01)。Chen 等[26]研究认为,大气降水中的O、H同位素比值受空间变化的影响,存在明显的地域差异,其与纬度和海拔存在明显负相关关系。本研究并未发现饮用水δ18O、δ2H与经度、纬度存在明显相关关系,但饮用水中δ18O 和δ2H 与 海 拔 存 在 明 显 负 相 关 性(PCCs,δ18O:r=-0.84,P=0.03;δ2H:r=-0.84,P=0.01)。这表明居民居住地大气降水O、H同位素比值与饮用水可能不完全相同,不同来源水的自然或人工混合会影响居民饮用水中O、H同位素的组成。
Fig.2 Distribution of δ18O and δ2H values of drinking water samples in different cities
2.3 居民头发O、H稳定同位素比值与饮用水的关系
不同城市居民头发和饮用水中δ18O和δ2H关系如图3 所示。整体而言,居民头发中O、H 稳定同位素与水中相比完全不同。居民头发中18O 相较饮用水中18O是富集的,居民头发中2H相较饮用水2H是贫化的,表明饮用水中O、H稳定同位素在被人体组织同化的过程中出现了明显了同位素分馏[17]。不同城市居民头发δ18O、δ2H 和日常饮用水中的δ18O、δ2H 存在一定对应关系。居民饮用水δ18O、δ2H较高的贺州、温州居民头发中δ18O、δ2H同样表现出高值,居民饮用水δ18O、δ2H 最低的昆明,其居民头发中δ18O、δ2H 较低,这表明尽管在人体内存在同位素分馏现象,饮用水中O、H稳定同位素的空间分布特征还是在很大程度上保留在了居民头发当中。与饮用水中δ18O和δ2H相似,居民头发中δ18O、δ2H 与空间因素存在一定相关关系,虽与经度、纬度无明显相关关系,但与海拔存在明显负相关关系(PCCs,δ18O:r=-0.67,P=0.05;δ2H:r=-0.75,P=0.01),且相关性与饮用水相比明显减弱。这可能是因为空间因素是经由饮用水影响头发中稳定同位素组成,在此过程中空间因素的影响能力逐渐减弱。
Fig.3 Distribution of mean δ18O and mean δ2H values of resident hair and drinking water samples in different cities
对不同城市居民头发和饮用水δ18O、δ2H 平均值进行回归分析,二者存在明显的正相关关系。对于居民头发和饮用水δ18O平均值,其线性回归方程为:δ18O头发=0.4×δ18O水+12.7(R2=0.91)。对于H 稳定同位素,其线性回归方程为:δ2H头发=0.5×δ2H水-39.6(R2=0.90)。根据不同城市居民头发和饮用水δ18O、δ2H 平均值的回归方程,不同城市居民头发中O、H稳定同位素分别有40%和50%来自于日常饮用水。何亚等[22]同样发现中国居民头发中O、H 稳定同位素比值与水中的O、H 稳定同位素比值显著相关。
不同国家居民头发和饮用水中δ18O、δ2H 如表2 所示,居民头发δ18O 范围约为4‰~20‰,δ2H 为-140‰~-48‰;饮用水δ18O 范围约为-18‰~4‰,δ2H 为-140‰~-8‰。不同国家居民头发δ18O、δ2H均存在明显差异,饮用水中δ18O、δ2H 的变化是导致这种差异的重要原因。目前关于头发中稳定同位素的研究尚处于起步阶段,不同研究中样本量和采样地区的选择不同会导致所得数据存在差异(例如本研究和Thompson等[18]的研究)。另外,居民饮食数据收集受限,不同饮食习惯与居民组织中稳定同位素组成的关系尚待深入研究,导致不同地区间数据的直接比较相对困难。分析头发和饮用水中O、H稳定同位素的关联性,不同地区中二者的关联程度存在差异,美国居民头发O、H稳定同位素分别有35%和27%来自于日常饮用水[20],韩国居民头发比例分别为27%和36%[21],回归方程中较高的斜率与居民更多使用当地食物和水有关[27],本研究和Thompson 等[18]的研究中,中国居民均存在较大的斜率,意味着中国居民可能相对更多的直接或间接食用当地食物和水,这为其在溯源推断领域的应用提供了便利。
Table 2 δ18O and mean δ2H values of resident hair and drinking water samples between the Chinese and people of other countries
2.4 利用头发中稳定同位素信息进行居民居住地的溯源推断
在法庭科学领域,针对头发的检测目前主要集中于表观形态学特征和DNA 分析,对其中稳定同位素组成的分析和应用相对较少。结合人头发中多种元素稳定同位素组成进行综合分析,研究人员可以推断人的饮食习惯,进而推断居住地域乃至活动轨迹,辅助人员身份鉴定,为司法活动提供帮助。目前利用多种元素的稳定同位素进行统计学分析从而对人的居住地进行溯源推断的研究较少。本研究利用典型判别和神经网络将测得的6个城市居民头发中的O、H稳定同位素数据结合已有的碳、氮稳定同位素数据进行统计学分析,建立相应数学模型,检验模型的判别准确率,探讨这些统计方法对居民居住地推断的有效性。
2.4.1 居民头发O、H稳定同位素比值的典型判别分析
典型判别分析是在样品类别明确的前提下,建立最优化的线性组合模型来概括类间差异的统计分析方法,是一种应用广泛的多元统计技术。对所构建典型判别函数有效性的验证方法主要包括自身验证和交互验证等。典型判别函数的有效性由判别准确率表示,其数值为判别准确的样本数与总样本数的比值。
本研究对6个城市198份居民头发δ18O、δ2H进行判别分析,以考察居民头发O、H稳定同位素对居民居住城市的溯源推断能力。所得标准化的判别函数式如下:判别函数式1 为Y1=0.35XO+ 0.90XH,判别函数式2为Y2=0.93XO-0.43XH。这组判别函数特征值如表3所示,判别函数式1的方差贡献率为96.5%,携带了绝大部分的原始数据信息,判别函数式2的方差贡献率为3.5%,二者合计携带100%的可用于判别分析的原始数据信息。两个函数式P值均小于0.01,表明两个函数式在进行判别分析时均存在统计学意义,两个函数式均应当保留作为判别函数模型。
由以上两个判别函数式所构建判别函数模型对6个城市居民头发δ18O、δ2H 进行判别分析可获得各类别的联合分布图(图4)。两条坐标轴分别由函数判别式1和判别函数式2构成。
由图4 可见,各城市居民头发在判别函数式1上的区别效果较判别函数式2更为明显。哈密、昆明与其他城市明显分开,贺州分布区域与其他城市亦有较为明显的区别。南阳、郑州、温州等3个城市分布集中,区分效果相对较差。由上判别函数所得分类结果如表4 所示。6个城市居民头发样本自身验证和交叉验证的整体判别准确率分别为66.1%和63.9%,不同城市居民头发的验证判别准确率为55.2%~84.6%。
不同城市居民头发样本的自身验证判别准确率的分布趋势与交叉验证基本一致,整体略高于交叉验证。其中,哈密、温州、昆明、贺州等城市判别效果相对较好,其判别准确率均在60%以上。郑州和南阳两城市判别效果相对较差,错判主要发生在二者之间。造成错判的可能原因在于郑州和南阳距离相对较近,因此容易相互错判,而这两个城市均位于中国中部地区,与位于中国东部的温州、南部的贺州和西南部的昆明和西北部的哈密相距很远,O、H稳定同位素比值差异较大(表4),所以分类效果相对较好。值得注意的是,地理位置对头发O、H稳定同位素比值的影响并不是唯一的,哈密和昆明虽然距离远,但是其居民头发和饮用水中O、H稳定同位素比值相差不大,这是导致哈密和昆明两地居民头发错判的主要原因。
Table 3 Abstract of Fisher discriminant function of δ18O and δ2H values of resident hair
Fig.4 Distribution of hair samples in different cities on function 1 and function 2 obtained from δ18O and δ2H
Table 4 Classification results of hair samples
2.4.2 居民头发C、N、O、H稳定同位素比值的典型判别分析
结合已有的6个城市居民头发C、N 稳定同位素比值(数据未发表),本研究对6个城市居民头发δ13C、δ15N、δ18O、δ2H 等4 种稳定同位素数据进行典型判别分析。典型判别分析所得标准化的判别函数式如表5所示,判别函数式1的方差贡献率为74.8%,判别函数式2的方差贡献率为23.4%,判别函数式3的方差贡献率为1.7%,三者合计携带99.9%的原始数据信息。3个判别函数式的P值均小于0.01,表明3个函数式在进行判别分析时均存在统计学意义,3个函数式均应当保留作为判别函数模型。判别函数式4的方差贡献率仅为0.1%,P值为0.51,不具有统计学意义,因此排除判别函数式4。
Table 5 Abstract of Fisher discriminant function of δ13C,δ15N,δ18O,δ2H values of resident hair
以δ13C、δ15N、δ18O、δ2H 等4 种稳定同位素数据构建的典型判别函数模型对6个城市居民头发样本进行判别分析得到联合分布图(图5)。分别以函数判别式1和判别函数式2作为分布图的x轴和y轴。由图5 可见,各组质心在x轴和y轴均可得到较为明显的区分。昆明、哈密两城市样本可以与其他城市完全分开。各城市样品组质心之间区分程度要明显好于图4。这表明C、N、O、H 等4 种稳定同位素数据构建的判别函数模型区分效果好于以O、H两种稳定同位素数据构建的判别函数模型。
Fig.5 Distribution of hair sample on function 1 and function 2 obtained from δ13C,δ15N,δ18O,δ2H
由上判别函数所得分类结果如表6 所示。6个城市居民头发样本自身验证的整体判别准确率为86.6%,不同城市居民头发样本自身验证判别准确率为75.0%~92.7%。交互验证的整体判别准确率为76.0%,不同城市居民头发样本交互验证判别准确率为64.3%~87.8%,判别效果相对较好,对比表5,各个城市的判别准确率相较O、H两种稳定同位素数据构建的判别函数模型均有不同程度的上升,其中以哈密和昆明上升最为明显,这与图5 分布相一致。
Table 6 Discrimination accuracy of the living cities based on δ13C,δ15N,δ18O,δ2H
利用C、N、O、H 不同稳定同位素数据分别构成的判别函数模型其判别准确率如表7 所示。δ13C、δ15N、δ18O、δ2H 各自单独构建判别函数时,整体交互验证判别准确率分别为30.3%、52.0%、44.0%、50.0%。δ15N和δ2H单独构建的判别函数模型的判别效果要好于δ18O和δ13C,表明不同种类元素稳定同位素的溯源推断能力存在差异,H稳定同位素在4种元素中具有最优的溯源推断潜力。利用δ13C、δ15N和δ18O、δ2H两种稳定同位素组成的判别函数模型,其判别准确率分别为59.1%和66.1%,其判别效果要好于单一元素。利用4种稳定同位素构建判别函数的判别准确率为76.0%,相较两种元素构成的判别函数模型,其判别准确率提高了20%,优于何亚等[22]利用O、H 稳定同位素数据进行判别分析的判别准确率,这表明随着判别分析中使用的稳定同位素种类的增加,判别函数模型的判别能力逐渐增强,这与Thompson 等[18]利用多种稳定同位素进行地域区分时所得到的结论相似。
Table 7 Discrimination accuracy of the living cities based on δ13C,δ15N,δ18O,δ2H or their combination
2.4.3 居民头发C、N、O、H稳定同位素比值的神经网络分析
神经网络分析是借鉴神经元之间的联系,利用计算机的计算能力模拟神经网络的信息传递过程,构成一个大规模、非线性、自适应的动力系统,具有自组织、自适应、自学习的能力。其优点在于对变量没有假设要求,有能力自动且精确的给出复杂联系的近似表达式,具有一定容错性,为处理模糊的、数据不完全的、不精确的模式识别提供了一个全新途径,处理非线性问题的能力优于传统统计分析方法。本研究尝试利用目前应用较多的多层感知器神经网络(MLP) 和径向基函数神经网络(RBF)对6个城市居民头发中C、N、O、H 稳定同位素数据进行溯源推断,探究两种神经网络模型对居民头发的溯源推断能力。
利用SPSS 软件的MLP 对6个城市居民头发的δ13C、δ15N、δ18O、δ2H进行分类建模,所得模型摘要如表8所示。将各城市居民头发C、N、O、H稳定同位素数据按照训练集70%、验证集30%的比例构建MLP 模型,其输入层为δ13C、δ15N、δ18O、δ2H 4 种稳定同位素数据,输出层为6个城市类别。
Table 8 Abstract of MLP model
上述MLP 模型对不同城市居民头发的分类情况如表9所示。训练集中各城市居民头发的分类准确率为50.0%~100.0%,整体分类准确率为78.5%。验证集中各城市居民头发的分类准确率为50%~100%,整体分类准确率为82.8%,哈密、郑州、昆明、贺州4个城市的分类准确率相对较高,准确率为83.3%~100%。这与2.4.1中所构建判别函数模型的判别结果相似。
利用SPSS 软件RBF 对6个城市居民头发的δ13C、δ15N、δ18O、δ2H进行分类建模,所得模型摘要如表10所示。
Table 9 Discrimination accuracy of the living cities based on δ13C,δ15N,δ18O,δ2H in MLP model
Table 10 Abstract of RBF model
上述径向基函数神经网络模型对不同城市居民头发的分类情况如表11 所示。训练集中各城市居民头发的分类准确率为63.6%~93.1%,整体分类准确率为79.5%。验证集中各城市居民头发的分类准确率为69.2%~100.0%,整体分类准确率为78.8%。训练集中,哈密的分类准确率最高,准确率达到93.1%。除郑州外,其他城市的分类准确率均在70%以上。测试集中,哈密、南阳、昆明、温州的分类准确率较高。
Table 11 Discrimination accuracy of the living cities based on δ13C,δ15N,δ18O,δ2H in RBF model
对比MLP 和RBF 两种神经网络模型利用不同城市居民头发C、N、O、H 稳定同位素数据的溯源推断能力,MLP 验证集的整体分类准确率(82.8%)略优于RBF(78.8%)。需要注意的是,虽然MLP 模型在训练集中对郑州居民头发的分类准确率达到了88.9%,但在验证集中仅为50.0%,构建的两种神经网络模型对郑州居民头发的区分能力均较差,反映出神经网络模型在进行头发分类时的局限性。
本文利用不同城市居民头发C、N、O、H 稳定同位素数据所构建的典型判别函数、MLP 模型和RBF模型3种溯源推断模型,其整体判别准确率依次为76.0%(交互验证)、82.8%(测试集)、78.8%(测试集),3种溯源模型分类准确率差别不大,其中MLP 模型整体分类准确率最高,其次为RBF 函数,典型判别函数相对较差。对比不同模型所得的分类结果,即便是同一城市的头发样本,不同模型之间构建逻辑的差异会导致部分样本错判到不同的城市。虽然MLP 模型达到了最高的分类准确率,但相对典型判别函数,其出现了对某些城市样本分类准确率较低的情况,这可能与本研究数据量相对较小有关,在应用时应加以注意。
3 结 论
本文对中国6个城市常住居民头发进行了O、H稳定同位素比值分析,结果表明,部分城市间居民头发δ18O、δ2H 存在显著差异,居民头发整体δ18O 和δ2H 存在显著正相关性。居民头发O、H 稳定同位素比值与日常饮用水O、H稳定同位素比值呈显著正相关,中国城市居民头发中O、H稳定同位素分别有35%和50%来自于日常饮用水。在溯源推断中,利用居民头发中O、H稳定同位素数据进行典型判别分析,其交互验证的整体判别准确率为63.9%,结合C、N 稳定同位素数据建立判别模型,其判别准确率大幅提升,交互验证的整体判别准确率达到76.0%,且随着判别分析中使用的稳定同位素种类的增加,判别函数模型的判别能力显著增强。本文建立的多层感知器神经网络模型的整体分类准确率为82.8%,径向基函数神经网络模型整体分类准确率为78.8%,3种溯源推断数学模型中,多层感知器神经网络模型的判别准确率最高,但需注意,相对典型判别函数,神经网络模型出现了对某些城市样本分类准确率较低的情况,在应用时应加以注意。