APP下载

基于HOF-ATR-FTIR光谱学的乳腺癌的蛋白质二级结构变化及识别研究

2021-03-08唐金兰陆燕飞包一麟赵远尚林伟尹建华

光散射学报 2021年2期
关键词:非典型癌变酰胺

唐金兰,陆燕飞,包一麟,赵远,尚林伟,尹建华*

(1 南京航空航天大学生物医学工程系,南京 211106;2 中国科学院大学附属肿瘤医院(浙江省肿瘤医院),中国科学院肿瘤与基础医学研究所,杭州 310022)

1 引言

乳腺癌是威胁妇女生命健康的最常见的恶性肿瘤之一[1]。目前,常用的临床检查方法主要有影像学检查、乳腺纤维导管镜检查、穿刺活检和肿瘤标志物检测等。影像学检查有包括乳腺钼靶检查、超声检查、CT检查和MRI扫描等[2]。这些常用的乳腺癌诊断方法存在各方面的优势及不足[3],譬如,常用于无创诊断的影像学方法难于实现组织中主要成分变化的检测和研究[2-3];拉曼光谱可实现成分变化检测和分子结构研究,然而其信号通常较弱,且容易受到样本荧光的影响[4]。因此,仍然需要一种准确、高效的乳腺癌检测方法,并可以在分子水平或微观水平探索癌变机制,获取原位的癌变信息。

傅里叶变换红外(FTIR)光谱作为一种物理化学分析技术,在物理、化学和生物学领域得到了广泛的应用。在药物、血浆、微生物和临床病理学的研究中,它已被证明是一种灵敏的、方便的、具有较好重现性的技术[5-8]。然而,FTIR光谱实际检测中往往通过使用不同的测量附件来适应各种检测对象[9]。当前,衰减全反射(ATR)附件在红外光谱测试中应用十分广泛,它无需对样本进行预处理,不破坏样本,还可以检测小颗粒样本,简化实验步骤。其原理是入射红外光在晶体和样本界面发生衰减全反射,此时晶体表面的消逝波进入样本浅表面发生指数式的衰减吸收,进而使反射光携带一定的样本信息。样本浅表面(微米级深度)含水量较小,对整体光谱的影响大大降低[10]。特别是,通过光纤耦合ATR附件可以灵活地应用于远程/外置样本的实时及微小接触面的红外光谱检测[11-12]。

此外,红外光谱可以揭示生物组织的分子构成和构象,其光谱特征也可以反映分子间和分子内部的相互作用以及含量变化[5],利于进行疾病的分析和检测。因此,采用红外光谱技术可有效检测分析组织中蛋白质二级结构,特别是对分子几何形状和氢键模式的微小变化高度敏感的酰胺I带进行分析,将对蛋白质二级结构组成和构象变化的研究非常有用[13]。

乳腺组织的癌变往往伴随着组织中蛋白质的组成、构象、结构的改变,通常每种蛋白质的二级结构是不同类型二级结构的组合,组合形式复杂多样,并且,不同种类蛋白质中每种二级结构所占的比例不同[14]。因此本研究主要是通过使用自制的空心光纤(HOF)-ATR探针耦合FTIR光谱仪对健康和癌变乳腺组织进行测量,对所得红外谱图的酰胺I带进行光谱处理和分析,以研究健康和癌变组织的二级结构差异,并提供一种从分子水平上分析乳腺组织癌变机理、进行原位检测和精确识别乳腺癌的有效方法。

2 实验材料与方法

2.1 样本

实验所用的人体乳腺组织样本由江苏省肿瘤医院提供,所有患者均被告知并同意这项研究。本次实验所用样本来自12名女性患者,总共9个癌变乳腺组织和9个健康乳腺组织(部分患者仅提供癌变组织)。在实验室对新鲜样本表面脂肪组织进行清理,即用于HOF-ATR-FTIR光谱采集。

2.2 实验仪器和数据采集

2.2.1中红外空心光纤ATR耦合探头

本文采用如图1(A)所示的实验室自制的HOF-ATR探头[11,14]对样本组织进行检测。图1(B)为截锥形 ATR 晶体设计图,选择ZnSe晶体作为探头材料,外形为锥形圆台,即后段为圆柱,前段为截头圆锥(圆台),上锥面与下锥面直径分别为0.75 mm、2.5 mm,底部锥角为70°。光纤可以在困难的条件或是复杂的作业现场进行远程工作。利用全反射的原理将光束保留在光纤内,并且沿着光纤方向前进。选择型号为HWEA7501200的中红外空心光纤作为入射和出射光纤,波长范围为2.9~10.6 μm,光纤的内径为750 μm、玻璃层外径为950 μm、缓冲层外径为1200 μm。

图1 (a)HOF-ATR 探头结构示意图和(b)截锥形 ATR 晶体的设计图

2.2.2数据采集

光谱信号收集时使用FTIR光谱仪(VERTEX70, Bruker),配备了一个单点液氮制冷碲汞镉(MCT)探测器,对样本进行HOF-ATR-FTIR光谱采集。首先检测背景光谱,然后将HOF-ATR探针紧贴在组织表面进行光谱采集。光谱采集范围是4000~744 cm-1,扫描64次,分辨率为4 cm-1,每个样本至少取5个位置进行光谱检测。

2.3 光谱分析方法

采集141条光谱后,对之进行基线校正和10点平滑处理,再基于酰胺I带(1700~1600 cm-1)进行进一步分析。其中,酰胺I带各子峰的峰位根据相应的二阶导数谱以及傅里叶去卷积谱结果确定,然后用Origin8.6软件对酰胺I带光谱进行Gaussian函数拟合以验证峰位准确性。

根据酰胺I带中包含的5种蛋白质二级结构的光谱波数范围,从曲线拟合图中选择属于二级结构波数范围内的、有效的子峰。把有效的子峰面积之和记为1,分别计算5种二级结构面积所占的比例,即可得到乳腺组织酰胺I带中各种二级结构的含量[9],例如α-螺旋的含量可以用公式1计算:

α-螺旋=

(1)

式(1)中S表示面积,Sα-螺旋、Sβ-折叠、Sβ-转角、S非典型螺旋和S无规卷曲分别表示为α-螺旋、β-折叠、β-转角、非典型螺旋和无规卷曲5种二级结构的面积,通过这个公式可以分别计算出健康和癌变乳腺组织光谱酰胺I带中α-螺旋、β-折叠、β-转角、非典型螺旋和无规卷曲的含量。

2.4 偏最小二乘判别(PLS-DA)

每条光谱均进行基线校正处理。在Unscrambler X软件(CAMO Software, Inc., Woodbridge, NJ)中将收集的141个FTIR光谱作为光谱矩阵用于PLS-DA。共五个患者的75条光谱被选作训练集,其中健康对照组光谱33条,癌变组织光谱42条。分别选取酰胺I带(1700~1600 cm-1)和全波长光谱(4000~744 cm-1)构建两个PLS-DA模型以识别乳腺组织。在这项研究中,当计算的光谱分数小于1.5时,该光谱将被视为来自癌变组织,否则被视为来自健康组织。应用留一交叉验证法(LOOCV)分别衡量两个PLS-DA分类模型的性能。选择决定系数R-square(取值范围0~1)和均方根误差值RMSE以衡量稳定性,决定系数越大且越接近1,同时其均方根误差值越小,该模型的稳定性越好。然后,将来自另外四个病人的总共66条光谱(其中健康对照组28条,癌变组38条)作为预测集,以比较两个判别模型的预测效果。

3 结果与讨论

3.1 红外光谱分析

图2所示分别为健康和癌变乳腺组织的原始HOF-ATR-FTIR光谱经基线校正和十点平滑处理后得到的在1800~1000 cm-1范围的光谱图。发现两条谱线的一些特征谱带发生了位移或强度、线宽的变化。其中,癌变样本中1740 cm-1(υC=O)[15]处峰强度明显弱于健康样本,表明其对应的特征成分脂肪在发生癌变时发生了明显损耗。与核酸相关的吸收带[15]则自1100 cm-1红移至1086 cm-1,表明核酸中磷酸基团的氢键化程度增加。1162 cm-1吸收带是糖类C-O伸缩振动(υC-O)与蛋白质中丝氨酸、苏氨酸或酪氨酸R基团中的C-OH振动的重叠谱带[15],该谱带相对强度变弱,意味着随着癌细胞的分裂,大量的糖作为营养物质被消耗;该谱带同时发生蓝移,则归因于蛋白质中的C-OH的相关氢键断裂[13],其结果可能诱发β-折叠含量的减少。另一方面,癌变乳腺组织在蛋白相关特征带1636 cm-1虽然没有发生明显的位移[15],但是吸收强度和带形相比于健康乳腺组织却发生了明显变化。详细的光谱与特征成分变化分析可见作者的最新工作[16]。这些结果表明,脂肪、核酸和蛋白等主要生物成分的变化是组织癌变最重要的光谱学特征。其中,由于酰胺I带1636 cm-1富含蛋白质二级结构信息[9],因此本文主要针对酰胺I带进行蛋白质二级结构变化研究。

图2 健康和癌变乳腺组织的典型HOF-ATR-FTIR光谱(1800-1000 cm-1)

图3分别是健康组织和癌变组织在1700-1600 cm-1的典型原始谱图(a)、二阶导数谱(b)和傅里叶去卷积谱(c),由图可知,酰胺I带应由多个子峰组成。无论是健康组织还是癌变组织,其二阶导数谱和傅里叶去卷积谱几乎对称,二阶导数谱的极小值和和傅里叶去卷积谱的极大值波数位置基本一致,具有“对称相似性”。

图3 健康(a)和癌变(b)乳腺组织的酰胺I带(1700-1600 cm-1)的典型原始谱图(a)、二阶导数谱(b)和傅里叶变换去卷积谱(c)

结合二阶导数谱和去卷积谱对样本的红外光谱酰胺I带进行拟合与分峰,图4列出乳腺组织酰胺I带的典型原始谱图(a)、各拟合子谱(b)和拟合计算谱(c),每个光谱拟合的残差(Residuals)均小于0.005,且拟合后曲线与原始数据的相关系数(R-square)均大于0.99(越接近1表示其拟合效果越好)。对酰胺I带的各子峰归属如下:1620~1640 cm-1可以认为是β-折叠;1640~1650 cm-1被分配为无规卷曲;1650-1659 cm-1为α-螺旋;非典型螺旋结构在1660-1669 cm-1,含三股螺旋、310螺旋和超螺旋等;1670-1700 cm-1则是β-转角[17-19]。此外,1606 cm-1和1618 cm-1附近的子峰是侧链振动吸收形成的,不归属于β-折叠。

图4 健康(a)和癌变(b)乳腺组织酰胺I带的典型红外光谱(a)、各拟合子谱(b)和拟合计算谱(c)

3.2 健康和癌变乳腺组织酰胺I带二级结构的分析

拟合后计算的各二级结构(β-折叠、无规卷曲、α-螺旋、非典型螺旋和β-转角)的含量平均值如图5(A)所示。可发现,健康乳腺组织酰胺I带二级结构含量由大到小排列依次为β-折叠(0.415±0.013)、α-螺旋(0.207±0.010)、非典型螺旋(0.177±0.012)、无规卷曲(0.118±0.008)和β-转角(0.082±0.020);而癌变乳腺组织中酰胺I带二级结构含量由大到小的顺序为β-折叠(0.372±0.011)、α-螺旋(0.227±0.006)、β-转角(0.164±0.019)、非典型螺旋(0.151±0.007)和无规卷曲(0.087±0.010)。两者的含量大小排列相近,最多的为β-折叠和α-螺旋,总含量超过百分之五十;不同在于无规卷曲、β-转角和非典型螺旋有排列差异。

图5 健康和癌变乳腺组织的二级结构平均含量(a)和平均含量比值(b)的对比

比较健康/癌变乳腺组织中酰胺I带各二级结构的含量,发现癌变乳腺组织的β-折叠、无规卷曲和非典型螺旋含量均低于健康乳腺组织,而α-螺旋和β-转角含量高于健康乳腺组织。

健康乳腺组织和癌变乳腺组织的蛋白质二级结构含量差异主要来自于组织中各类蛋白质含量的差异性。乳腺组织包含实质成分和结缔组织为主的间质成分,而结缔组织主要成分包括以α-螺旋为主的α-角蛋白、以β-折叠结构为主的丝心蛋白和以非典型螺旋为主的胶原蛋白。因此,非典型螺旋的减少预示着胶原蛋白的减少[20-21]。相对于健康组织,癌变乳腺组织中非典型螺旋含量低于健康乳腺组织,表明癌变乳腺组织中胶原蛋白的含量低于健康组织,这是由于受病变影响,癌变组织失去了健康结构中所特有的纤维结构。癌变时蛋白合成增加以及脂质含量减少[16,22],据此推测在胶原蛋白减少及β-折叠结构为主的丝心蛋白也在减少的同时,所增加的蛋白合成应主要是α-角蛋白。推测正是因为α-角蛋白(坚韧有弹性)的增加,从而导致异变的乳腺组织肿大硬结成瘤,同时丝心蛋白(决定其分子伸展)的减少则可能导致该部分组织甚至附属的皮肤发生粘连褶皱等病理现象。

蛋白质不同二级结构的含量比值也可以用来描述蛋白质二级结构的组成的差异性。由图5(B)可见,相对于健康乳腺组织,癌变乳腺组织的α-螺旋含量升高,β-折叠和非典型螺旋含量减少,所以其α-螺旋/β-折叠的含量比值相应有明显增长,而非典型螺旋/α-螺旋比值减小。此外,α-螺旋和β-转角的含量都有升高,且β-转角/α-螺旋比值增大,可以推测出在癌变过程中α-螺旋的增长幅度小于β-转角。通过比较得出,健康和癌变乳腺组织中蛋白质二级结构的含量构成有显著的区别,从而可以用多种参数来表示蛋白质的各二级结构组成、变化强弱的具体差异。依据这些参数可进一步原位区别健康和癌变乳腺癌组织,理解其癌变过程。

3.3 PLS-DA

表1所示是训练组进行PLS-DA的分类和交叉验证结果。当选择酰胺I带建立判别模型时,训练组准确率93.3%,交叉验证组准确率89.3%,而采用全波长光谱建立的判别模型训练组和交叉验证的准确率都达到100%。另外,根据两种模型的RMSE和R-square值判断,采用全光谱建立的模型稳定性更好。表2所示为预测组的PLS-DA分类结果。由表2可见,由酰胺I带建立的判别模型识别准确率只有81.8%,而采用全光谱建立的模型识别准确率达到97.0%。此外,只采用酰胺I带建立的模型出现假阳性的概率较大。

表1 训练组分类结果

表2 预测组分类结果

以上分类识别的结果表明,虽然酰胺I带含有大量的蛋白质二级结构的信息,但只选择该波长范围建立判别模型的效果明显低于采用全光谱的效果,这是由于癌变过程中不仅有蛋白质的变化,还有其他主要生物成分如核酸、脂质和碳水化合物的变化。因此,单独依靠酰胺I带的变化去分辨癌变和健康组织显然是不充分和不全面的。采用全光谱综合计量癌变过程中蛋白质等多组分的变化才更可能实现精确判别癌变组织。

4 结论

采用HOF-ATR-FTIR光谱技术研究乳腺组织的蛋白质(酰胺I带)二级结构,发现癌变组织和健康组织的各二级结构含量和相应比值有显著差异。同时,随着乳腺癌变时胶原蛋白和丝心蛋白的减少,α-角蛋白合成明显增加,可能进而引起癌变病理。虽然酰胺I带包含大量蛋白质的二级结构信息,但单独选择该波长范围的光谱建立判别模型,其识别率及模型稳定性都低于采用全波长光谱建立的模型,这是由于癌变过程中还涉及其他主要生物成分如核酸、脂肪以及碳水化合物的变化。由此可见,对乳腺组织癌变的HOF-ATR-FTIR光谱研究不仅有助于深入理解乳腺组织发生癌变时蛋白质的构象变化,也提供了一种从分子水平上分析乳腺组织癌变机理、原位检测和精确识别乳腺癌变的有效方法。

猜你喜欢

非典型癌变酰胺
非典型内脏异位综合征1例
非典型抗精神病药物导致的代谢紊乱
双酰胺类杀虫剂Broflanilide
三氟咪啶酰胺的合成工艺研究
下咽癌的区域癌变现象研究进展及临床意义
城市边缘区“非典型传统村落”保护与开发探讨
非典型纤维黄瘤一例
Eag1 在大鼠口腔舌黏膜癌变过程中的表达
国外二硝酰胺铵的发展现状
《癌变·畸变·突变》2014年第26卷索引