基于血清拉曼光谱技术对丙型肝炎病毒诊断和6a亚型的鉴别
2021-05-11黄杰庭
陈 翀 黄杰庭
1.广州血液中心 广州市血液安全重点实验室质量控制部,广东广州 510095;2.广州血液中心 广州市血液安全重点实验室输血研究所,广东广州 510095
丙型肝炎病毒(hepatitis C virus,HCV)感染已成为全球性问题,约有1.7 亿感染者,其中中国感染者有一千多万[1-2]。HCV 感染早期病情隐匿,无典型症状,55%~85%未发现被感染而转变为慢性HCV,若不及时予以合理治疗,HCV 会加速肝纤维化,增加肝硬化的风险,一旦发展为肝硬化,则每年有1%~5%会发展至肝癌[3-5]。因此,HCV 早期筛查和分型,对预防HCV 传播和提高HCV 治疗效果有重要的临床意义[6]。本研究应用拉曼光谱(raman spectrum,RS)技术分析HCV 及健康人的血清,并评价其对HCV 诊断和6a 亚型鉴别的临床价值。
1 资料与方法
1.1 一般资料
本研究对象来源于广州血液中心,HCV 组共165 例,均为2018 年1 月至2019 年6 月在血液中心确诊HCV 感染患者,纳入标准:①符合HCV 的诊断标准[7];②初筛血清HCV 抗体阳性;③血清RT-PCR 法完成HCV DNA 定量检测,其载量>最低检测限(5×102),证实为HCV 感染。排除标准:①HBV、梅毒、HIV 等感染;②其他特殊全身性疾病;③近期急性感染;④免疫系统疾病;⑤标本不合格。另选择本中心同期无偿献血体检健康者120 例(所有检查项目未见异常者)为非HCV 组。本研究遵循《世界医学会赫尔辛基宣言》,入选对象均签署知情同意书。HCV 组年龄23 ~75 岁,平均(47.53±8.51)岁;男91 例,女74 例;基因分型:1b 87 例,3b 39 例,6a 19 例,其 他20 例。非HCV组年龄22 ~72 岁,平均(46.91±7.82)岁;男68 例,女52 例。两组一般资料比较,差异无统计学意义(P>0.05),具有可比性。
1.2 方法
1.2.1 标本采集 采集两组受试者空腹(禁食过夜8 h 以上)静脉血5 ml,室温静置0.5 h 后离心(3000 r/min)10 min,上层血清分装收集到EP 管中,-80℃冰箱保存待测。检测时将待测样本置于室温下静置0.5 h 让其充分溶解,吸取血清30 μl,静置15 min,待样本状态稳定后再进行检测,所有样本都统一进行上述预处理。
1.2.2 检测方法 使用DXR3 激光RS 仪(赛默飞公司),最低波数10 cm-1,光谱范围50 ~9000 cm-1,光谱分辨率≤0.35 cm-1,配备共焦显微镜,在50 倍镜下观察记录RS。每次检测开始前,在532 nm 激光下用质控品观察300 ~3000 cm-1位移范围内的RS 数据,仪器校准后再开始样本检测。参数设置:激光波长532 nm,光谱分辨率5 cm-1,拉曼位移范围300 ~3000 cm-1,扫描时间1.0 s。每份样本在不同位置分别检测3 次,所得图谱用Spectrum Analyzer 检测软件进行光谱记录分析。
1.3 观察指标
观察记录RS 诊断HCV 的结果和6a 亚型的鉴别结果。
1.4 统计学方法
采用Spectrum Analyzer 和Matlab 软件进行数据分析,应用自适应迭代重加权惩罚最小二乘法(airPLS)扣除所得光谱图的荧光背景,应用偏最小二乘法(PLS)进行模型构建和支持向量机分类法(SVM)判别分析,计量资料以()表示,采用t检验,计数资料以[n(%)]表示,采用χ2检验,应用受试者工作特征(ROC)曲线评价airPLS-PLS-SVM 统计模型的诊断效果,P<0.05 为差异有统计学意义。
2 结果
2.1 RS诊断HCV的结果
图1a、b、c 中虚线为HCV 组165 个样本的平均谱图,实线为非HCV 组120 个正常样本的平均谱图;图1a 使用airPLS 扣除所得光谱图的荧光背景后得到图1b,可见airPLS 扣除荧光背景前存在较大噪声干扰,这一操作是非常有必要的。进一步的数据分析比对得到图1c,可见在HCV 组与非HCV组300 ~3000 cm-1位移范围内的血清RS 图像形态相似,但部分位移处仍存在差异。
图1 HCV 组与非HCV 组拉曼数据的平均谱图
使用PLS 对扣除荧光背景后的数据进行降维、简化处理,提取9 个主成分,获得9 个(PLS-1 ~PLS-9)主成分绘制的散点图,见图2a、b、c,菱形为非HCV 组9 个主成分,圆形为HCV 组9 个主成分。由图2a、b、c 可见,HCV 组与非HCV9 个主成分在三维空间上存在部分重叠,但可区分开,这一点说明RS 技术能将HCV 患者血清与正常健康人血清区分开。
图2 HCV 组与非HCV 组PLS-1 ~PLS-9 散点图
应用SVM 对降维后的9 个主成分数据进行判别分析,采用简单随机抽样法将所有研究对象分组,大概按4 ∶3 的比例,其中训练集285 例(HCV 165 例,健康120 例),测试集122 例(HCV 70 例,健康52 例)。使用网格寻优法对SVM 中的参数惩罚因子(c)、核函数(g)进行寻优,所获结果见图3a,可见HCV 组与非HCV 组血清光谱数据被很好的区分开。应用ROC曲线评估airPLS-PLS-SVM 统计模型对测试集122 例血清的诊断效果,测试集中经RT-PCR 有70 例 确诊为HCV,非HCV 感染者52 例;本统计模型诊断正确阳性66 例,诊断正确阴性52 例,见表1,灵敏度为94.29%,特异度为96.15%,准确率为95.08%,ROC曲线见图3b,曲线下面积(AUC)为0.953。
表1 RSairPLS-PLS-SVM统计模型诊断HCV的结果
图3 3D 图及ROC 曲线图
2.2 6a亚型的鉴别分析
使用Matlab 软件对19 例6a 及146 例其他型HCV 患者的原始数据进行绘图,图4a 使用airPLS扣除所得光谱图的荧光背景后得到图4b,虚线为6a 亚型19 个样本的平均谱图,实线为146 个其他亚型样本的平均谱图,可见airPLS 扣除荧光背景前存在较大噪声干扰,这一操作是非常有必要的。进一步的数据分析比对得到图4c,可见在6a 亚型与其他亚型300 ~3000 cm-1位移范围内的血清RS图像形态相似,但部分位移处仍存在差异。
图4 6a 亚型和其他型HCVRS 的平均谱图
使用PLS 对扣除荧光背景后的数据进行降维、简化处理,提取6 个主成分,获得6 个(PLS-1 ~PLS-6)主成分绘制的散点图,见图5a、b,菱形为6a 亚型6 个主成分,圆形为其他亚型6 个主成分。由图5a、b 可见6a 亚型与其他型6 个主成分在三维空间上存在部分重叠,但可区分开,这一点说明RS 技术能将6a 亚型患者血清与其他型患者血清区分开。
应用SVM 对降维后的6 个主成分数据进行判别分析,采用简单随机抽样法将所有HCV 患者分组,其中训练集165 例(6a 19 例,其他146 例),测试集71 例(6a 9 例,其他62 例)。使用网格寻优法对SVM 中的参数惩罚因子(c)、核函数(g)进行寻优,所获等高线图见图5c,可见6a 亚型与其他型血清光谱数据被很好的区分开。应用ROC 曲线评估airPLS-PLS-SVM 统计模型对测试集71 例血清的诊断效果,本统计模型诊断正确阳性9 例,诊断正确阴性60 例,见表2,灵敏度为100%,特异度为96.77%,准确率为97.18%,AUC为0.976。
图5 6a 亚型与其他型PLS-1 ~PLS-6 散点图及等高线图
表2 RSairPLS-PLS-SVM统计模型诊断6a亚型的结果
3 讨论
RS 的光学原理为拉曼散射,是印度科学家在1928 年发现的,当一定频率的激光照射到样本表面时,一部分光被发生偏离,其波长较入射光长且短,运动方向、频率都发生变化,还有能量交换[8-9]。RS 技术具有快速、非侵入、非接触、高灵敏度、高分辨率、高特异性等独特优势,已广泛应用于生命科学、地质学、药学、考古学等领域[9-10]。血清RS 图谱一度被称为“指纹图谱”,通过RS 技术可发现患者因疾病而出现的蛋白质、核酸、脂类等的差异变化,凭借这一点血清RS 技术被用于临床疾病的鉴别诊断[11-13]。
图1 中虚线为HCV 组165 个样本的平均谱图,实线为非HCV 组120 个正常样本的平均谱图;图1a 使用airPLS 扣除所得光谱图的荧光背景后得到图1b,可见airPLS 扣除荧光背景前存在较大噪声干扰,这一操作是非常有必要的。进一步的数据分析比对得到图1c,可见在HCV 组与非HCV 组300 ~3000 cm-1位移范围内的血清RS 图像形态相似,但部分位移处仍存在差异。这些差异可能与HCV 感染后导致的机体代谢或免疫变化有关,如血清中某些物质的成分、含量或结构发生改变,与健康人相比,HCV 患者血清中胶原蛋白、核酸、磷脂含量可能增加,儿糖类、氨基酸含量可能下降[14-15]。图2 可见HCV 组与非HCV 9 个主成分在三维空间上存在部分重叠,但可区分开,这一点说明RS 技术能将HCV 患者血清与正常健康人血清区分开。图3a 可见HCV 组与非HCV 组血清光谱数据被很好的区分开,RS 诊断HCV 的灵敏度为94.29%,特异度为96.15%,准确率为95.08%,AUC 为0.953;表明文中所用统计方法较可靠。
图4a 使用airPLS 扣除所得光谱图的荧光背景后得到图4b,虚线为6a 亚型19 个样本的平均谱图,实线为146 个其他亚型样本的平均谱图,可见airPLS 扣除荧光背景前存在较大噪声干扰,这一操作是非常有必要的。进一步的数据分析比对得到图4c,可见在6a 亚型与其他亚型300 ~3000 cm-1位移范围内的血清RS 图像形态相似,但部分位移处仍存在差异。由图5a、b 可见6a 亚型与其他型6 个主成分在三维空间上存在部分重叠,但可区分开,这一点说明RS 技术能将6a 亚型患者血清与其他型患者血清区分开。图5c 可见6a 亚型与其他型血清光谱数据被很好的区分开。应用ROC曲线评估airPLS-PLS-SVM 统计模型对测试集71 例血清的诊断效果,本统计模型诊断正确阳性9 例,诊断正确阴性60 例,灵敏度为100%,特异度为96.77%,准确率为97.18%,AUC为0.976;说明RS 在6a 亚型鉴别中有较强的应用潜力。
综上所述,血清RS 可用于HCV 诊断和6a 亚型的鉴别,有望成为HCV 快速筛查及分型工具,但国内相关报道并不多,本研究为RS 在HCV 诊断和6a 亚型鉴别的应用奠定良好基础。但本研究样本量较少,数据结果可能存在部分偏倚,仍需大样本进一步证实。