植物抗性基因识别中样本选择的一种新方法
2012-04-29车凯郭茂祖刘晓燕滕志霞
智能计算机与应用 2012年4期
车凯 郭茂祖 刘晓燕 滕志霞
摘要: 植物抗性基因识别中的从头预测方法可以看作机器学习中的分类问题。通常情况下,一个分类器的训练需要正确标记的正例和反例。然而,抗性基因识别中可用的信息仅有少数人工标记的抗性基因,且不具有抗性功能的基因也不明确。为了消除由于正例太少和错误的反例带来的抗性基因识别的影响,基于抗性基因和其他基因在蛋白质相互作用网中的距离,提出了一种新的样本选择方法,并对提出的样本选择方法和通常样本选择方法分别在四种分类器上进行了10倍交叉验证。结果表明,文中方法的SN值平均提高了6.9%,SP值平均提高了13.1%。因此,就敏感性和特异性而言,提出的方法获得了更高效、更可靠的结果。
关键词:
中图分类号:TP391文献标识码:A文章编号:2095-2163(2012)04-0031-04