一种新的近邻密度SVM不平衡数据集分类算法
2019-09-10刘悦婷孙伟刚张发菊
贵州大学学报(自然科学版) 2019年3期
关键词:支持向量机
刘悦婷 孙伟刚 张发菊
摘 要:针对不平衡数据集数据分布不均匀及边界模糊的特点,提出一种新的近邻密度SVM(NNDSVM)不平衡数据集分类算法。该算法先计算多数类中每个样本K近邻范围内的密度值,依据该密度值分别选出边界区域、靠近边界区域的与少数类数目相等的样本与少数类完成SVM初始分类;用所得的支持向量机和剩余的多数类样本对初始分类器迭代优化。人工数据集和UCI数据集的实验结果表明,与SVM、ALSMOTE-SVM和WSVM算法相比,本文算法分類效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能。
关键词:支持向量机;不平衡数据集;近邻密度;分布不均匀;边界区域
中图分类号:TP391
文献标识码: A