基于加权K最近邻改进朴素贝叶斯自训练算法 |
| |
引用本文: | 李婷婷,吕佳.基于加权K最近邻改进朴素贝叶斯自训练算法[J].武汉大学学报(理学版),2019(5). |
| |
作者姓名: | 李婷婷 吕佳 |
| |
作者单位: | 重庆师范大学计算机与信息科学学院;重庆师范大学重庆市数字农业服务工程技术研究中心 |
| |
摘 要: | 针对传统半监督自训练方法在学习朴素贝叶斯分类器过程中容易误标记无标记样本,且整个过程未能利用到训练样本的空间结构信息,导致正确率不高的问题,提出了一种基于加权K最近邻改进朴素贝叶斯自训练算法。该算法利用加权K最近邻算法计算出无标记样本的隶属度,通过隶属度选出与已标记样本空间结构相近的样本,使得朴素贝叶斯分类器在一个较好的空间结构上对未标记样本进行分类,充分地利用样本的空间结构信息,从而降低了自训练过程中的迭代错误。在UCI和Kaggle数据集上的对比实验结果表明,该方法的性能相对于传统半监督自训练算法有所改善。
|
本文献已被 CNKI 等数据库收录! |
|