首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
互联网时代存在大量的文本数据,为了更加有效的利用文本信息,文本分类已成为当务之急.本文介绍了朴素贝叶斯算法的原理以及解决文本分类问题的流程,分析了朴素贝叶斯用于文本分类问题的优缺点,并且提出了改进方案.  相似文献   

2.
焦鹏  王新政  谢鹏远 《电讯技术》2013,53(3):329-334
为提高朴素贝叶斯(Naive Bayesian)分类器的分类准确率,对朴素贝叶斯属性选择算法及假设属性概率值先验分布中的参数设置问题进行分析,提出将属性先验分布的参数设置加入到属性选择的过程中,并研究当先验分布服从Dirichlet分布及广义Dirichlet分布情况下的具体调整步骤。以UCI数据库为例进行仿真实验,结果表明当先验分布服从广义Dirichlet分布时,该方法可提高分类的准确率,如Parkinsons数据集,效率可提升13.32%。  相似文献   

3.
文章从村镇银行信用贷款风险入手,构建了基于朴素贝叶斯算法的信用贷款风险预警模型,并设计开发用户贷款风险预测系统,方便工作人员使用。经测试验证,该预警模型具有较高的准确率,能够为建立村镇银行信用贷款风险评价体系提供依据。  相似文献   

4.
欧阳广津 《通信技术》2020,(5):1273-1276
随着当前网络安全环境的日益严峻,针对网络入侵事件的检测至关重要。面对网络入侵检测中数据集合存在的冗余特征,提出一种改进后的朴素贝叶斯算法。该算法在原有朴素贝叶斯的基础上巧妙引入卡方检验,通过筛选数据集中占比重要的特征降低数据维度,提高了入侵检测的准确性。最后,结合实验结果证明,该方法有效提高了入侵检测的准确性。  相似文献   

5.
拖动滑块验证是行为式验证码的主要方式之一。针对鼠标轨迹的识别问题,提出一种基于朴素贝叶斯的鼠标轨迹识别方法。通过比较人为轨迹和机器轨迹的差异,提取出鼠标轨迹的10个初始特征:是否回移、尾部平均速度、轨迹右半部的轨迹点密度等,构建了基于朴素贝叶斯的鼠标轨迹识别模型;采用前向序列选择算法从10个特征中找出包括8个特征的最优特征子集,采用相关概率加权方法为每个特征赋予权值,得到改进的鼠标轨迹识别模型。实验在MATLAB仿真器中进行,使用了2017年腾讯大数据挑战赛提供的鼠标轨迹数据集。仿真实验表明,与支持向量机识别模型、决策树识别模型、K最近邻识别模型相比,文章提出的改进模型具有更高的识别准确率。  相似文献   

6.
7.
基于分类别PCA散度的高光谱图像分类波段选择   总被引:3,自引:0,他引:3  
黄睿  何明一 《电子与信息学报》2005,27(10):1588-1592
波段选择是去除高光谱图象段间冗余,实现降维的有效方法。该文提出了一种新的基于分类别主成分分析(PCA)散度的波段选择方法。即首先对训练集各类样本分别进行PCA变换去相关并计算散度,接着分析相应PCA变换系数获得对各类样本分类都重要的原始波段,在综合考虑波段的相关度,散度和子集规模的基础上获得最终选择波段。复杂度分析表明该方法较局部寻优的前向搜索计算量大为降低,提高了效率,并用高光谱遥感图象的分类实验进行了验证。  相似文献   

8.
一种基于主成分分析的高光谱图像波段选择算法   总被引:8,自引:0,他引:8  
提出了一种基于主成分分析的高光谱图像波段选择算法。该算法把每个波段被映射到主成分的信息量的大小作为是否被选择的指标,因此,可以保证选择的波段包含原始图像绝大部分信息,而且指标的计算只需要得到原始数据的协方差阵,而不必对原始数据进行真正的主成分变换,极大的降低了计算量。贝叶斯和K-均值分类实验表明.该算法是有效可行的。  相似文献   

9.
主题网页识别是面向主题爬虫的重要组成部分,因此网页主题识别的准确率对后续的研究工作至关重要。首先,提取出能体现网页主题的文本,然后利用改进朴素贝叶斯算法对提取的文本的主题进行识别,结果表明该方法能取得较好的识别效果。  相似文献   

10.
为降低对合法邮件的误判,提出一种基于朴素贝叶斯和层次聚类的两阶段垃圾邮件过滤方法。该方法将邮件划分为“合法邮件”、“可疑邮件”和“垃圾邮件”3类,在第一阶段,利用朴素贝叶斯算法速度快、分类性能好的优点,对邮件进行初步分类;在第二阶段,基于垃圾邮件的发送特征,利用层次聚类算法进行相似性比较。实验表明,该方法能够显著提高垃圾邮件的查准率,降低对合法邮件的误判,更加符合实际应用需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号