共查询到10条相似文献,搜索用时 46 毫秒
1.
互联网时代存在大量的文本数据,为了更加有效的利用文本信息,文本分类已成为当务之急.本文介绍了朴素贝叶斯算法的原理以及解决文本分类问题的流程,分析了朴素贝叶斯用于文本分类问题的优缺点,并且提出了改进方案. 相似文献
2.
3.
4.
随着当前网络安全环境的日益严峻,针对网络入侵事件的检测至关重要。面对网络入侵检测中数据集合存在的冗余特征,提出一种改进后的朴素贝叶斯算法。该算法在原有朴素贝叶斯的基础上巧妙引入卡方检验,通过筛选数据集中占比重要的特征降低数据维度,提高了入侵检测的准确性。最后,结合实验结果证明,该方法有效提高了入侵检测的准确性。 相似文献
5.
拖动滑块验证是行为式验证码的主要方式之一。针对鼠标轨迹的识别问题,提出一种基于朴素贝叶斯的鼠标轨迹识别方法。通过比较人为轨迹和机器轨迹的差异,提取出鼠标轨迹的10个初始特征:是否回移、尾部平均速度、轨迹右半部的轨迹点密度等,构建了基于朴素贝叶斯的鼠标轨迹识别模型;采用前向序列选择算法从10个特征中找出包括8个特征的最优特征子集,采用相关概率加权方法为每个特征赋予权值,得到改进的鼠标轨迹识别模型。实验在MATLAB仿真器中进行,使用了2017年腾讯大数据挑战赛提供的鼠标轨迹数据集。仿真实验表明,与支持向量机识别模型、决策树识别模型、K最近邻识别模型相比,文章提出的改进模型具有更高的识别准确率。 相似文献
6.
7.
基于分类别PCA散度的高光谱图像分类波段选择 总被引:3,自引:0,他引:3
波段选择是去除高光谱图象段间冗余,实现降维的有效方法。该文提出了一种新的基于分类别主成分分析(PCA)散度的波段选择方法。即首先对训练集各类样本分别进行PCA变换去相关并计算散度,接着分析相应PCA变换系数获得对各类样本分类都重要的原始波段,在综合考虑波段的相关度,散度和子集规模的基础上获得最终选择波段。复杂度分析表明该方法较局部寻优的前向搜索计算量大为降低,提高了效率,并用高光谱遥感图象的分类实验进行了验证。 相似文献
8.
一种基于主成分分析的高光谱图像波段选择算法 总被引:8,自引:0,他引:8
提出了一种基于主成分分析的高光谱图像波段选择算法。该算法把每个波段被映射到主成分的信息量的大小作为是否被选择的指标,因此,可以保证选择的波段包含原始图像绝大部分信息,而且指标的计算只需要得到原始数据的协方差阵,而不必对原始数据进行真正的主成分变换,极大的降低了计算量。贝叶斯和K-均值分类实验表明.该算法是有效可行的。 相似文献
9.
10.
为降低对合法邮件的误判,提出一种基于朴素贝叶斯和层次聚类的两阶段垃圾邮件过滤方法。该方法将邮件划分为“合法邮件”、“可疑邮件”和“垃圾邮件”3类,在第一阶段,利用朴素贝叶斯算法速度快、分类性能好的优点,对邮件进行初步分类;在第二阶段,基于垃圾邮件的发送特征,利用层次聚类算法进行相似性比较。实验表明,该方法能够显著提高垃圾邮件的查准率,降低对合法邮件的误判,更加符合实际应用需求。 相似文献