APP下载

猪链球菌2型毒力预测模型的建立

2014-02-22,,,,

中国动物检疫 2014年11期
关键词:猪链球菌毒力回归方程

,,,,

(1. 中国动物卫生与流行病学中心,山东青岛 266032;2. 青岛农业大学,山东青岛 266109)

猪链球菌2型毒力预测模型的建立

刘丽蓉1,单 虎2,康京丽1,李 印1,王幼明1

(1. 中国动物卫生与流行病学中心,山东青岛266032;2. 青岛农业大学,山东青岛266109)

[目的]建立猪链球菌2型毒力强弱的预测模型,为降低养猪业的经济损失提供参考。[方法]本研究以已报道的国内猪链球菌2型分离株的6种主要毒力因子(mrp、epf、sly、orf2、fbps、gapdh)的存在情况为自变量,以毒力强弱为因变量,采用逐步回归的方法进行二分类Logistic回归分析,得出鉴别猪链球菌2型毒力强弱的数学模型,并通过ROC曲线评价其预测效能。[结果]进入回归方程的指标有:mrp(X1)和sly(X3),求得的回归方程为:P=1/〔1+e-(-5.671+4.642 X1+4.253X3)〕。ROC曲线最佳诊断点为0.5581。回归方程对毒力强弱预测的敏感度为93.8%,特异度为94.6%,准确度为94%。[结论]联合运用Logistic回归和ROC曲线预测猪链球菌2型毒力的强弱是可行的,mrp和sly 两个指标独立应用对鉴别都有诊断价值,但二者联合起来诊断价值更高且预测效果更理想。

猪链球菌2型;毒力因子;SPSS;Logistic;ROC;Wald检验;模型

猪链球菌是一种危害现代养猪业的重要病原,这在养猪业发达的国家都有报道[1]。根据荚膜抗原成分的差异,猪链球菌可分为35个血清型,其中猪链球菌2型流行最为广泛、致病性最强,不仅能引起猪关节炎、脑膜炎、肺炎、败血症及猪只的突然死亡,导致养猪业巨大的经济损失;而且还能致人发病死亡,对公共卫生尤其是从业人员的生命安全构成了严重威胁,是一种危害严重的人畜共患病病原。猪链球菌2型与猪的临床疾病有一定的相关性,但并不是所有的2型菌株都具有致病性,部分毒株对猪毒力较弱。研究表明,猪链球菌致病性强弱与毒力因子密切相关[2],主要包括溶菌酶释放蛋白(mrp)、胞外因子(epf)、溶血素(sly)、甘油醛-3-磷酸脱氢酶(gapdh)、纤连蛋白/血纤蛋白原结合蛋白(fbps)、毒力相关序列(orf2)、其他毒力因子等,其中mrp、epf 和 sly 是猪链球菌2 型菌株的主要毒力因子。

本研究旨在构建鉴别猪链球菌2型毒力强弱的Logistic回归模型,综合利用多项测量得出鉴别猪链球菌2型毒力强弱的数学模型。为及时、准确地预测我国猪链球菌2型的流行趋势,制定合理有效的防控措施提供科学依据,进一步保障相关从业人员的健康奠定科学基础。

1 研究对象及分组

收集汇总以往已发表及本单位现有的关于中国地区猪链球菌2型6种主要毒力因子:溶菌酶释放蛋白(mrp)、胞外因子(epf)、溶血素(sly)、甘油醛-3-磷酸脱氢酶(gapdh)、纤连蛋白和血纤蛋白原的结合蛋白(fbps)和毒力相关序列(orf2)的PCR鉴定结果情况[3-6]。

2 方法

2.1 Logistic回归模型的建立

以6种毒力因子mrp(X1)、epf(X2)、sly(X3)、gapdh(X4)、fbps(X5)和orf2(X6)为自变量,自变量分为阴性组和阳性组,分别赋值0和1,毒力强弱为因变量,应用SPSS17.0软件进行统计分析。P<0.05认为具有统计学显著性。得到Logistic回归方程,并在SPSS工作数据表中产生含各个体的预测值,然后以每个个体的预测值组成新变量Pre(predicted probability-1)进行ROC分析。

2.2 应用ROC曲线评价各指标对猪链球菌2型毒力强弱的预测能力

分别以新变量为检验变量,以毒力强弱为金标准,作ROC曲线分析,得出各检验变量的曲线下面积(area under the curve,AUC)。

2.3 确定最佳诊断点

根据临床实际,确定所要求的真阳性率(或假阳性率),使用线性内插法求出诊断点。R=x 为设定的假阳性率(或真阳性率),P(R=x)为(R=x)对应的诊断点,R1为恰好小于(R=x)的假阳性率(或真阳性率),R2为恰好大于(R=x)的假阳性率(或真阳性率),P1和 P2分别为R1和R2对应的诊断点,根据线性内插法有:

(R1-R2):〔R1-(R=x)〕=(P1- P2):〔P1-P(R=x)〕(1)

3 结果

3.1 数据收集情况

共收集到猪链球菌2型117株,其中强毒80株,弱毒37株。毒力因子的分布情况统计见表1。

表 1 毒力因子分布情况

3.2 Logistic回归分析结果和数学模型的建立

多因素Logistic回归分析结果详见表2:进入回归方程的指标有mrp(X1)、epf(X2)、sly(X3)、gapdh(X4)、fbps(X5)和orf2(X6)。对引入方程中的每个自变量偏相关系数进行统计检验,即回归系数的Wald检验。

回归系数的Wald检验(显著性水平为P<0.05):

表 2 多因素logistic回归分析步骤

从表2可以看出,步骤1中gapdh的Wald检验概率p值最大,且大于显著性水平,不应拒绝原假设,认为该回归系数与0无显著差异,它与logitP的线性关系是不显著的,不应保留在方程中。由于方程中包含了不显著的解释变量,考虑重新建模。

同理,步骤2中epf的Wald检验概率p值最大,且大于显著性水平,考虑重新建模;步骤3中orf2的Wald检验概率p值最大,且大于显著性水平,考虑重新建模;步骤4中fbps的Wald检验概率p值最大,且大于显著性水平,考虑重新建模。直至步骤4中各自回归系数显著性检验的Wald观测值对应的概率p值均小于显著性水平0.05,意味着他们都应保留在方程中。

OR值较大的指标为mrp,说明其对预测猪链球菌2型强毒株的价值最大,求得出的Logistic回归方程为:P=1/〔1+e-(-5.671+4.642 X1+4.253 X3)〕。其中P代表预测概率,e为自然对数。

3.3 应用ROC曲线评价各种指标对猪链球菌2型毒力强弱的预测能力。

由SPSS17.0输出的预测概率Pre 、mrp(X1)和sly(X3)的ROC曲线下面积(AUC)如表3所示。结果显示当两种因素单独检测时sly的AUC大于mrp的AUC;而两种因素联合Pre的AUC 均大于各单项检测的AUC(ROC曲线如图1所示),且其检测敏感度和特异度比单项检测的高。

表 3 Pre、mrp和sly的曲线下面积、敏感度、特异度和95%置信区间

图 1 ROC曲线

3.4 确定诊断点

从SPSS输出的表中查得Pre的ROC曲线坐标点如表4所示。

表 4 Pre的ROC曲线坐标点

取假阳性率R=10%(即取R=0.100)后设定诊断点。表4数据得出:R1=0.054,R2=0.378,P1=0.6125,P2=0.229,带入公式(1)有:(0.054-0.378):(0.054-0.1)=(0.6125-0.229):〔0.6125-P(R=0.100)〕,可得P(R=0.100)=0.5581。

取假阳性率R=10%后求得诊断点为0.5581。预测概率值大于或等于0.5581判为阳性(即诊断为强毒株),反之为阴性。

根据该临界值,强毒株80例中有75例判断正确,5例判断错误;弱毒株37例中35例判断正确,2例判断错误。求得数学模型对猪链球菌2型毒力强弱的敏感度为93.8%,特异度为94.6%,准确度为94%。

4 讨论

4.1 SS2致病性强弱相关因素分析

研究表明,SS2中存在着一些与毒力相关的基因,特别是mrp、Sly和epf,这三种毒力因子的表达对链球菌 2 型菌株的毒力强弱起着决定作用,但决定毒力的主导基因存在地区差异[7],即在某些地区以 mrp或epf基因为主,而在另一些地区则以sly 基因为主[8]。本研究得出的预测模型仅以报道较多的6种毒力因子为致病性相关的风险因素,旨在从分子水平通过二手数据分析,得出中国地区SS2毒力预测模型。其他与SS2致病性相关的因素,如带菌状态或其他毒力因子,因报道较少,很难纳入模型中,是本研究的一个缺憾。

4.2 Logistic回归分析与ROC曲线分析的意义及在本研究中运用的发现

临床上仅用一项检查指标进行鉴别诊断是片面的、不合理的。许多研究证明,综合利用多项检测指标进行诊断,能大大提高诊断的准确性和诊断效率,避免经验判断的主观性,使得诊断更为科学化、客观化[9-11]。Logistic回归分析属于概率型非线性回归,它是研究二分类观察结果与一些影响因素之间关系的一种多变量分析方法[12]。本研究中,因变量毒力强弱是一个二分类的变量,即强毒与弱毒。采用Logistic回归模型综合分析多指标变量对猪链球菌2型毒力强弱的诊断价值,证实了mrp和sly是诊断毒力强弱的两个影响因素。

有很多研究利用多项指标联合检测各种疾病时,大多筛选3~5项指标,只要其中有一项以上指标阳性就归为诊断符合,这种联合诊断能提高灵敏度,但特异性下降。本研究通过绘制ROC曲线,并比较不同检测指标的曲线下面积(AUC),同时按照AUC 原则提供“诊断点”,以保证最大限度地区别猪链球菌2型毒力的强弱,用逐步后向Logistic 回归拟合最佳曲线时,结果保留mrp和sly 两个指标,epf、gapdh、fbps和orf2(P>0.05)预测价值相对较小而被剔除。这样得到的ROC曲线可以从几何意义上直观地反映模型拟合情况,通过曲线下面积定量反映Logistic 模型的拟合效果,以此更好地对模型优度与实际资料的符合情况进评价。回归方程的预测效果比较理想,其预测新变量Pre的ROC曲线下的面积(AUC=0.950)均比任何单一指标的面积(AUCmrp=0.798,AUCsly=0.826)要大。求得的数学模型对猪链球菌2型毒力强弱预测的敏感度和特异度明显高出各单项指标预测的结果,Pre 敏感度为93.8%(mrp为97.5%,sly为95.0%),特异度为94.6%(mrp为62.2%,sly为70.3%),弥补了单一的灵敏度高、特异度低的缺陷。说明该模型的预测效能较好,能预测猪链球菌2型毒力的强弱。

应用Logistic回归综合多指标信息,根据ROC曲线确定诊断界值,以达到同时提高诊断的敏感度和特异度,是本研究尝试的一种新的诊断试验评价方法。该方法亦可应用于其他疾病诊断试验的资料分析中,有着广泛的应用前景。

[1] 耿艳红,徐军,王兆山,等.猪链球菌病[J].猪业科学,2005,22(6):30-104.

[2] 郑升博,华修国,陆伟芳,等.多重PCR方法检测猪链球菌主要致病血清型及其毒力因子[J].上海交通大学学报(农业科学版),2010,28(1):53-58.

[3] 何孔旺,倪艳秀,王继春,等.猪链球菌2型的分子流行病学研究[J].中国人寿共患病杂志,2002,18(5):45-47.

[4] 马青霞,何孔旺,陆承平.猪链球菌2型及其毒力因手检测多重PCR的建立与应用[J].中国兽医学报,2006,26(1):28-31.

[5] 白昀.广西猪链球菌2型毒力因子的研究[D].广西:广西大学,2008.

[6] 李春玲,余炜烈,王贵平,等.猪链球菌扁桃体分离株的毒力因子分布特征与致病性[J].中国预防兽医学报,2009,31(2):104-109.

[7] Gottschalk M,Lebrun A,Wisselink H J,et al. Production of muram inidase-released proteins by Canadian strains of Streptococcus suis capsular type 2 [J]. Can J Vet Res,1998,62:75-79.

[8] Wisselink H J,Smith H E,Stockhofe Z N,et al. Distribution of capsular types and production of muramidase released protein (MRP)and extracellular factor (EF) of Streptococcus suis strains isolated from diseased pigs in seven European countries [J]. Vet Microbiol,2000,74(3):237-248.

[9] 陈栎江,张文辉,唐恩燕,等. Logistic回归和ROC曲线分析多种肿瘤标志物在鉴别良恶性胸水中的应用价值[J].实用医学杂志,2009,25(2):238-240.

[10] 刘宝利,杨宝友,郑桂敏,等. Logistic回归和ROC曲线综合评价检测四种尿蛋白排泄对早期肾小球疾病的诊断价值[J].中国中西医结合肾病杂志,2011,12(8):695-697.

[11] 刘润幸.使用SPSS作多变量观察值的ROC曲线分析[J].中国公共卫生,2003,19(9):1151-1154.

[12] 孙振球.医学统计学[M].2版.北京:人民卫生出版社,2005:333.

The Development of Virulence Prediction Model for Streptococcus Suis 2

Liu Lirong1,Shan Hu2,Kang Jingli1,Li Yin1,Wang Youming1

(1. China Animal Health and Epidemiology Center,Qingdao,Shandong 266032;
2. Qingdao Agriculture University,Qingdao,Shandong 266109)

To establish the prediction model of Streptococcus Suis 2 (SS2),and provide the theoryetical reference for reducing losses of pig farming,6 virulence factors of SS2 were selected as independent variables,including mrp,epf,sly,orf2,fbps and gapdh. And the pathogenicity was selected as dependent variables. 2-stage least squares was performed. Then ROC curve was used to evaluate the diagnostic eff ciency after regression model was constructed. The results showed that mrp and sly were remained in the regression model P=1/〔1+e-(-5.671+4.642X1+4.253X3)〕. The best diagnostic point was 0.5581. The sensitivity,specificity and accuracy of the regression equation to detect the pathogenicity of SS2 were 93.8%,94.6% and 94% respectively. These results indicated that it was feasible to use regression model and ROC curve in SS2 predicting. And joint using mrp and sly combined were more effective in diagnostic value for clinical screening than using them alone.

StreptococcusSuis 2;virulence factor;SPSS;Logistic;ROC;Wald test;model

S858.28

:C

:1005-944X(2014)11-0008-04

王幼明,单 虎

猜你喜欢

猪链球菌毒力回归方程
采用直线回归方程预测桑瘿蚊防治适期
线性回归方程的求解与应用
线性回归方程要点导学
申嗪霉素和咪唑菌酮复配对几种病害的室内毒力测定研究
阿维菌素与螺螨酯对沾化冬枣截形叶螨的毒力筛选及田间防效研究
血流感染肺炎克雷伯菌pLVPK毒力质粒的分布及与耐药的关系
走进回归分析,让回归方程不再是你高考的绊脚石
猪链球菌与猪流感病毒混合感染促进溶血素基因缺失型链球菌侵入呼吸道分子机制的研究
半胱氨酸蛋白酶ApdS介导猪链球菌免疫逃逸的分子机制
商品化猪链球菌疫苗分类及特点