首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
根据新浪财经股票博客的特点,使用点互信息(PMI)方法构建了股票情感词典,在所构建的股票情感词典和现有的台湾大学情感词典基础上,结合经典贝叶斯方法对新浪财经博客的情感分析进行研究,并且在中文分词、自然语言处理(NLP)技术的基础上研究文本句法结构对股票博客文本情感分类结果的影响.实验结果表明:考虑文本中的句法细节以后,如词语搭配、否定词和连词等,使用PMI股票情感词典+贝叶斯方法,宏平均准确率从60.19%提高到80.50%,宏平均召回率从原来的59.35%提高到78.70%,宏平均F1值也由59.77%达到了79.60%.  相似文献   

2.
朴素贝叶斯分类算法是一种简单实用的分类方法,人们对它的属性间条件独立性假设做了许多研究,致力于消除冗余属性、减少属性间的关联性,以获得一些新属性来使用朴素贝叶斯算法,但新属性间的独立性却不易度量,因而改进之处的理论支撑有所不足,改进后的朴素贝叶斯算法的效果更多的是由数据实验进行佐证。本文定义了Gauss分布型数据,提出了经Gram-Schmidt正交化方法改进的朴素贝叶斯算法,使其可以方便地使用于Gauss分布型数据的分类。该改进方法不同以往显式的构造新属性集或属性变换矩阵,而是直接正交化属性的样本数据,并证明了正交后的属性数据所对应的抽象新属性的独立性。这说明对于Gauss分布型数据的分类,原朴素贝叶斯算法中的条件独立性的假设不会给算法的使用造成障碍,经Gram-Schmidt正交化后即可满足这个约束条件。  相似文献   

3.
针对传统地下目标识别算法中特征提取方法的缺陷,鉴于深度学习中的卷积神经网络(CNN)能自动从数据中提取特征,但CNN自带的分类器不能很好的解决非线性分类问题,由于SVM具有良好的泛化分类能力,为此提出基于CNN-SVM的地下目标形状识别方法。本文首先在地表面光滑场景下,利用该方法对地下圆形和矩形目标识别,然后加大场景难度,在地表面粗糙场景下进行地下目标形状识别。实验结果表明,相比传统人工设计的特征分类方法,该算法利用CNN自动提取的特征联合SVM提高了CNN的分类准确率,并且在两种场景下都具有更高的地下目标识别精度。  相似文献   

4.
针对支持向量机解决多分类问题时二分类向多分类扩展过程中的效率降低和数据集倾斜问题,提出了一种基于三元矩阵和层次分析的多分类模型的构造方法,优化支持向量机的多分类效果和效率,弥补1vs1、ECOC等主流算法的不足。该模型通过建立一种简单有效的获取样本集线性可分性构造分类器,从而减少支持向量机在处理多分类时的运算复杂程度。采用了UCI标准数据库中的Iris,Breast Tissue和Statlog等数据集对模型进行训练测试,测试结果表明所提出模型是有效的,尤其在大量数据下多分类的有效性。 更多还原  相似文献   

5.
介绍BP神经网络与多分类支持向量机等分类模型的基本原理,并基于这两种方法对水质识别与分类的准确度进行实例比较研究,随机抽取了南昌市内2010-2013年水域水质的300组数据为样本,选取了pH,氨氮,Cl-,SO2-3,总硬度,硝酸盐氮为评价的主要特征。通过把训练后的模型在测试集中进行的检验对得到的模型进行评估,表明了BP神经网络和多分类支持向量机均可以较好地解决水质识别与分类过程中存在的复杂性,多变量,非线性等问题,相比较而言多分类支持向量机有较强的鲁棒性,预测结果更为精确稳定,将其应用到水质评价中具有一定的可行性。更多还原  相似文献   

6.
为在方案设计初期与工程造价相关信息很少的条件下,准确快速地预测住宅工程造价,在分析既往相关理论和方法优劣的基础上,选取支持向量机构建住宅工程造价预测模型,并通过主成分分析对原始数据进行降噪处理.选取住宅工程造价预测指标集与样本,对输入指标的数据进行主成分分析,消除指标相关性的同时对原始数据降维,将处理后的数据分别导入到"标准支持向量机"和"最小二乘支持向量机"模型中进行训练和预测,并对预测结果进行对比分析,选取较为合理的预测模型,通过参数寻优进一步优化预测效果.所构建预测模型的相对误差均控制在±7%以内,预测精度较高,结果稳定.  相似文献   

7.
一种基于概率加权的朴素贝叶斯分类   总被引:1,自引:0,他引:1  
朴素贝叶斯分类是一种简单而高效的方法,但是它的属性独立性假设,影响了它的分类性能。为了克服该问题,提出了一种基于概率推理的加权朴素贝叶斯分类模型。通过计算属性和类之间的相关概率和不相关概率,对属性赋予不同的权重,从而在保持简单性的基础上有效地提高了朴素贝叶斯算  相似文献   

8.
交互分类是解决数据复杂分类问题的主要手段之一。在现有的大多交互分类系统中,用户能准确识别数据类别,但在有些分类场景中,类别之间的顺序关系更容易被识别,为此,提出一种排序支持的交互数据分类算法。为提升交互分类精度,引入数据的顺序信息,为降低标记难度,提出候选样本推荐策略。另外,提出一种评估分类算法性能的可视化方法,用包含基本车况、交通违法记录、交通事故记录等信息的车辆数据集进行实验验证,将相关车辆分为高危车辆、中危车辆、低危车辆3类,算法的分类结果模型一致度达近98%,验证了方法的有效性。  相似文献   

9.
核主元分析具有能较好地提取非线性特征的优势;支持向量机具有的非线性映射能力,且泛化能力强.它们在分类与识别中应用时都各有自己的优点,结合核主元分析和支持向量机的特点,提出一种基于核主元分析的支持向量机识别方法,用该方法分别对 ORL 人脸库和iris数据集中的数据进行分类与识别,结果表明:如果根据设计好的核函数的参数,可以得到极高的识别率.  相似文献   

10.
支持向量机在处理非平衡数据集时常常不能取得良好的效果,因为其分类性能只考虑了总体分类精度,而忽略了不同类别样例之间的精度权衡.本文提出了一种基于样例分布的样例惩罚支持向量机,可以针对每一个样例根据其相应的分布特性选取惩罚以获得高敏感度的分类面.实验表明,该模型比标准支持向量机在非平衡数据上具有更好的性能.  相似文献   

11.
提出了一个综合使用OLAP和OLTP技术的试卷处理分析系统方案。首先给出了基于OLAP技术的系统架构,然后详细介绍了该系统的设计思想和实现方法。OLAP技术的应用为试卷分析工作提供了一个强有力的分析手段。  相似文献   

12.
支持向量机在解决非线性及高维模式识别中表现出许多特有的优势,被广泛应用在文本分类领域。但是其核函数及其参数的选择对分类效果具有很大的影响,单一核函数难以很好地解决文本分类问题。因此,本文选取了三个常用的核函数进行两两组合,利用加权组合核的形式来弥补单核自身特点可能带来的缺点,然后利用人工免疫算法(Immune algorithm,IA)对组合核进行参数寻优,以提高文本分类效果。实验分析证明,此方法有效。  相似文献   

13.
BP网络用于模式分类时,若要求分类的模式集不平衡,则其学习的收敛速度极其缓慢,本文提出了一种改进其收敛速度的算法.  相似文献   

14.
本文旨在构建基于临床电子病历数据的冠心病预测模型.回顾性收集了2015年至2020年在宁波大学医学院附属医院住院期间,接受选择性冠状动脉造影的患者的临床数据,分别应用决策树、朴素贝叶斯和逻辑回归算法构建冠心病预测模型,比较3种模型的预测性能.共收集354例患者数据,其中冠心病患者140例,非冠心病患者214例,根据逻辑...  相似文献   

15.
与常规的白细胞亚分类方法不同,提出一种新型的白细胞分类方法,该方法采用希尔伯特黄变换将细胞光学信号自适应分解,并利用支持向量机构建细胞亚分类模型进行识别分类。实验结果:白细胞亚类可比性和相关性达到了血液分析仪行业标准要求。该方法为细胞信号分析以及亚分类提供了新思路。  相似文献   

16.
基于支持向量机设计了一种产品字符编码识别系统,该系统通过CCD视觉传感器采集图像信息,经过目标提取、字符分割、编码识别过程,最后输出识别结果.其中,识别过程采用支持向量机作为判别函数分类器,该方法能较好的解决小样本、非线性、高维数等实际问题,并且较传统的神经网络识别方法训练速度更快.实验结果表明,该方法识别率高,可以达到98.3%,并且具有较高的实时性.  相似文献   

17.
QIM-JPEG2000作为以JPEG2000图像为载体的最新隐写术,采取设置恒域的方式,保持了小波系数的直方图,很好地抵御了基于直方图攻击的隐写分析方法.针对这种隐写术,提出了一种基于JPEG2000图像小波系数主分量分析的隐写分析方法.该算法在JPEG2000图像三级小波系数上进行主分量变换,分析主分量的统计特征在信息隐写前后的变化,提取小波系数主分量的均值、方差、斜度、峰值和熵组成特征向量,利用支持向量机进行载体图像和载密图像的分类,从而检测出JPEG2000图像是否嵌入了秘密信息.实验表明了本方法的可行性.  相似文献   

18.
基于RBF核的SVM核参数优化算法   总被引:3,自引:0,他引:3  
SVM是一种新型的机器学习方法,其分类性能的优劣主要受核函数及核参数的影响,国内外学者针对SVM核参数的选择已提出许多算法.本文首先分析TRBF核参数对SVM分类性能的影响,然后又对比分析了目前存在的几种基于RBF核的SVM核参数选择方法.通过实验,发现使用遗传算法选择核参数的SVM有比较快的搜索速度.  相似文献   

19.
基于支持向量机的高炉铁水硅含量多类别分类   总被引:1,自引:0,他引:1       下载免费PDF全文
支持向量机是基于统计学习理论发展而来的一种机器学习算法,本文介绍了非线性软间隔分类机、最小二乘分类机和加权最小二乘分类机的算法.以山东莱钢1号高炉在线采集数据作为应用案例.使用C均值算法对[Si]做聚类分析将其分成5类,改进Mary分类方法实现对铁水硅质量分数[Si]的多类别分类.并对各分类机的性能作出评价.  相似文献   

20.
鉴于江海联运运量受众多因素的影响, 为了解决江海联运运量预测问题, 先对江海联运运量影响因素进行分析, 再用灰色关联度分析筛选出其中的典型因素. 在此基础上应用粒子群算法优化的支持向量机建立江海联运运量预测模型, 应用于宁波港域江海联运量的预测. 结果表明, 该模型与传统时间序列预测方法相比具有较高的拟合度和预测精度, 为解决江海联运运量等多因素非线性系统预测提供了一条新的途径.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号