首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于情感文本分析技术对股票研究报告中的投资建议进行分类.提取股票研究报告中的"组合特征";采用改进的卡方统计方法进行特征提取,并通过支持向量机(SVM)和朴素贝叶斯算法进行分类,验证分类效果;探讨了权重计算、特征维度和样本数量对分类效果的影响.基于东方财富网上采集的14 000篇股票研究报告的实验表明,通过提取"组合特征"、部分特征维度以及对训练样本重采样,可以取得较好的分类效果.  相似文献   

2.
根据新浪财经股票博客的特点,使用点互信息(PMI)方法构建了股票情感词典,在所构建的股票情感词典和现有的台湾大学情感词典基础上,结合经典贝叶斯方法对新浪财经博客的情感分析进行研究,并且在中文分词、自然语言处理(NLP)技术的基础上研究文本句法结构对股票博客文本情感分类结果的影响.实验结果表明:考虑文本中的句法细节以后,如词语搭配、否定词和连词等,使用PMI股票情感词典+贝叶斯方法,宏平均准确率从60.19%提高到80.50%,宏平均召回率从原来的59.35%提高到78.70%,宏平均F1值也由59.77%达到了79.60%.  相似文献   

3.
现阶段高频心电图(high-frequency electrocardiogram,HFECG)分类算法多为心梗(myocardial infarction,MI)与非心梗的二类分类或心梗类别分类算法,无法在心梗早期的心肌缺血阶段发现病例.基于此,本文提出了一种基于高频心电图的缺血型心脏疾病分类算法.该算法选取并改进了...  相似文献   

4.
通过对商品评论的挖掘,商家可以更好地了解消费者的需求从而及时改善产品的设计。目前,针对商品评论的挖掘大多数采用的方法是提取有效的情感特征并利用分类器进行分类。然而由于电商评论文本表述方式多样、行文不规范,口语化等特点,数据稀疏,文档特征维度过高,样本不均衡以及情感词典领域依赖性等问题都导致情感特征的提取过程愈发困难。为了解决这些问题,论文提出一整套针对电商评论挖掘方法,其融合多种策略构建电商领域情感词典;将文本长度作为特征;结合语料库对停用词表进行优化;将文档频率和TF-IDF算法结合进行特征选择和特征加权。论文以热水器评论作为语料库,以支持向量机为核心对所提出方法进行验证,实验结果证明所提出的方法能在降低文本维度的同时可大幅度提高情感分类的准确度。  相似文献   

5.
旅游文本大数据以其方便、快捷和低门槛的特点为游客情感计算提供了极大便利,已经成为旅游大数据的主要来源之一。基于大数据理论和情感理论,以文本大数据为数据源,在全面梳理国内外情感计算相关成果的基础上,利用人工智能中的逻辑/算法编程方法、机器学习方法、深度学习方法对旅游文本大数据进行挖掘,探索最佳的基于文本大数据的游客情感计算方法。研究发现:(1)基于情感词典的游客情感计算模型,其核心是构建情感词典和设计情感计算规则,方法简单,容易实现,适用语料范围广。(2)机器学习,用统计学方法抽取文本中的特征项,具有非线性特征,可靠性较线性特征的情感词典方法高。(3)基于深度学习技术的游客情感计算,效果良好,准确率在85%以上。训练多领域的文本语料易于移植,实用性强,且泛化能力好,较适合大数据时代游客情感计算研究。  相似文献   

6.
旅游文本大数据以其方便、快捷和低门槛的特点为游客情感计算提供了极大便利,已经成为旅游大数据的主要来源之一。基于大数据理论和情感理论,以文本大数据为数据源,在全面梳理国内外情感计算相关成果的基础上,利用人工智能中的逻辑/算法编程方法、机器学习方法、深度学习方法对旅游文本大数据进行挖掘,探索最佳的基于文本大数据的游客情感计算方法。研究发现:(1)基于情感词典的游客情感计算模型,其核心是构建情感词典和设计情感计算规则,方法简单,容易实现,适用语料范围广。(2)机器学习,用统计学方法抽取文本中的特征项,具有非线性特征,可靠性较线性特征的情感词典方法高。(3)基于深度学习技术的游客情感计算,效果良好,准确率在85%以上。训练多领域的文本语料易于移植,实用性强,且泛化能力好,较适合大数据时代游客情感计算研究。  相似文献   

7.
针对口语对话系统领域分类任务中传统领域分类方法如SVM需要进行大量人工标注的问题,将LDA(Latent Dirichlet Allocation)模型应用于口语对话系统领域分类;针对口语对话内容少、长度短、数据稀疏等问题,在LDA模型基础上提出了基于词嵌入文本扩充的口语对话系统领域分类方法.该方法主要特点是:1)使用词嵌入方法word2vec对类似于短文本的语音识别后的口语对话文本进行语义扩充,将短文本转化为长文本,使主题模型LDA更加有效地估计口语对话文本的隐含主题;2)采用无监督的概率生成模型LDA对扩充后的口语对话文本进行建模以及领域分类,从而降低人工标注成本.实验结果表明,与直接使用LDA模型进行口语对话系统领域分类方法对比,适当扩充长度的word2vec文本扩充方法在口语对话系统领域分类中的平均准确率、平均召回率和平均F1值分别提高了26.1%、25.5%、27.2%,且该方法具有一定的鲁棒性..  相似文献   

8.
本文提出一种基于双向IndRNN(Bidirectional Independently Recurrent Neural Network, Bi-IndRNN)的恶意URL分析与检测算法.通过对恶意URL分析与检测特点的研究,提取主机信息特征和URL信息特征.把主机信息特征与URL信息特征相融合,并利用Bi-IndRNN算法对恶意URL进行分析与检测.与k最邻近分类算法(k-NearestNeighbor, KNN)、高斯贝叶斯算法(GaussionNB)、LSTM(Long Short-Term Memory)算法、IndRNN(Independently Recurrent Neural Network)算法对比结果表明,该模型对恶意URL的分类检测准确率达到95.92%,明显高于其它算法模型.  相似文献   

9.
提出了一个改进Mask RCNN目标检测算法用以对养殖梭子蟹进行视觉特征测量. 通过在养殖区域采集梭子蟹图像, 用上位机识别梭子蟹旋转角度以及甲长和甲宽方向, 对输出的Mask进行模板修补, 提高模板内区域的置信度. 通过图像-实景对应关系换算梭子蟹的真实尺寸, 并估算其投影面积、甲宽与甲长, 结果准确率高于85%. 同时, 对视觉算法得到的梭子蟹尺寸特征与其体质量进行拟合, 引入k-means聚类, 实现双模型支持向量回归机(SVR)预测结构. 通过差分进化算法对SVR适应度函数进行寻优, 设计了随迭代次数、寻优效果同步变化的缩放因子, 以及适者更易生存策略的交叉概率因子, 以验证改进算法的寻优能力. 测试时, 对新传入的数据首先进行归一化处理, 然后判断所归属的聚类中心, 再传至相应的SVR模型进行预测. 测试结果相对误差小于18%.  相似文献   

10.
基于SVM土壤重金属污染评价的训练数据集构建   总被引:1,自引:0,他引:1  
支持向量机(support vector machine,SVM)用于土壤重金属污染评价时,其训练数据集的构建对模型准确性影响重大。本文对依据土壤环境质量国家标准生成数据集的方法(国标法)进行改进,提出实际测量数据集生成方法(实测法),并在实测法样本中添加国标法样本扩大训练数据集,进一步提高模型分类准确率。结果表明:对同一组实测样本进行分类,国标法模型准确率(53. 33%)低于实测法模型准确率(75. 56%);扩大后的数据集训练所得模型与实测法模型相比,分类60个实测样本时,准确率由88. 33%提高至98. 33%,分类45个实测样本时,准确率由75. 56%提高至82. 22%。  相似文献   

11.
为了进一步提高图像拼接篡改检测的准确率,本文通过对图像拼接技术进行分析,提出一种基于纹理描述的图像拼接篡改检测方法.该方法将局部二值模式(LBP)和共生矩阵两种现有技术相结合,在残差图像的基础上利用改进的LBP技术对图像纹理进行描述,然后借助两类共生矩阵获取不同的图像特征,通过对这些特征向量的组合来提高检测精度.提取特征后利用支持向量机(SVM)或集成分类器进行分类预测.实验结果表明,所提出的方法在IEEE IFS-TC图像取证竞赛库和中国科学院彩色图像库分别达到了0.911和0.938的最高检测准确率.  相似文献   

12.
Random Forest作为一种常见的机器学习算法,不仅具备较高的分类回归性能,而且快速高效.传统的Random Forest算法并未在决策树的生成和选择上做深入研究,在本文中笔者提出一种降序去冗的寻优方式对机器学习中监督学习算法Random Forest进行改进,在保证准确率的同时减少随机森林的冗余度,并应用于Android系统的恶意软件检测.经过五折交叉验证法验证,改进的Random Forest算法能够在较低的冗余度下保证较高的准确率,同时改进的算法准确率在与同条件下的原算法的准确率以及OOB模型下的准确率相差在1%以内,在与单模型分类算法KNN和集成式学习算法Adaboost M1的对比试验中改进的Random Forest算法要优于以上两者.  相似文献   

13.
为了利用机器学习算法快速筛查出葡萄膜炎,本文分别选取了健康人和葡萄膜炎患者的眼底OCT(Optical Coherence Tomography,OCT)图像,提取图像的形态特征、灰度差分统计特征、灰度梯度共生矩阵和小波变换等多种特征,将特征串行融合;随后用Lasso算法特征提取,用多种机器学习算法进行分类研究.结果显...  相似文献   

14.
为解决基于单节点架构的传统分类算法存在的时间效率差、分类准确率低等问题,提出了一种基于并行Adaboost-BP神经网络的海量图像分类方法.将BP神经网络作为弱分类器,由Adaboost算法组合15个BP神经网络的输出,构建了强分类器;充分利用了Hadoop平台下Map Reduce并行编程模型,提出了海量图像的自动分类模型,设计了并行Adaboost-BP神经网络算法的Map和Reduce任务.多组实验表明,相对于传统的AdaboostBP神经网络算法,提出的算法在Pascal VOC2007数据集和Caltech256数据集上的平均分类准确率分别提高了14.5%和26.0%,而且算法运行耗时少,系统加速比随集群节点个数增加而增加,在图像规模增加到20 000时,加速比几乎呈线性增长趋势.实验结果充分证明,提出的方法适合海量图像的自动分类和预测.  相似文献   

15.
为提高标准PSO算法对SVM参数优化选取的精度和速度,提出以粒子群适应度均方差为判别依据,用追逐粒子位置替代陷入局部优化时的群体最优位置,对粒子的速度进行自适应调整;利用两个距离最远的粒子位置构成的圆形区域作为最优位置的吸引域,引入位置变异因子,使粒子随着迭代次数有规律地跳出局部最优位置吸引域,从而对粒子位置进行自适应变异.通过对4种不同适应度函数迭代100次的收敛测试,并与另外2类不同粒子群算法比较,结果表明改进算法收敛精度提高了20倍以上.将改进的PSO-SVM算法与另外3种分类算法对采集的5 439组养殖水质数据按照从优到差5个级别进行水质评价分类试验,发现改进的PSO-SVM算法收敛速度和收敛精度最高,对水质评价的错误率为1.54%,能有效地满足实际水质分类需求.  相似文献   

16.
领域分类结构的抽取已成为本体工程和本体学习的关键部分,提出一种新的分类结构学习算法,将Web作为知识获取的语料库,运用迭代方法抽取相关语言学模式,再利用语言学模式抽取分类结构,并采用改进的互信息方法对结果进行评价和过滤,最后通过实验对该分类学习算法的性能进行评价.实验表明:算法具有良好的跨领域性,在准确率和召回率方面也有改善.  相似文献   

17.
随着信息技术的发展,数字技术越来越多地应用于民族文化数字化保护,民族服饰的数字化及分类问题也日益受关注。相比一般服饰,少数民族服饰具有更多的细节特征信息,对其进行分类识别具有很大挑战。选用卷积神经网络DenseNet-BC作为基础网络结构,设计并使用了多尺度密集连接单元,用不同大小的卷积提取不同尺度的特征信息,以提高网络的学习能力;此外,为进一步提高网络的鲁棒性,提出一种局部和全局注意力机制方法进行分类识别。实验结果表明,改进的DenseNet-BC模型对少数民族服饰的识别准确率达95.18%,较ResNet-18、ResNet-34和DenseNet模型的识别准确率分别提升了3.84%、2.27%和1.18%。改进的DenseNet-BC模型具有更好的特征提取能力,能够提取更多的细节特征信息,一定程度上解决了普通模型提取特征尺度单一、特征丰富度低的问题。  相似文献   

18.
针对遥感影像小目标检测难度大、准确率低、耗时长等问题,本文提出一种基于改进SSD算法以提升遥感影像小目标实时检测精度的方法.(1)采用深度可分离卷积代替普通卷积层,从而减少计算量、加快目标检测速度;(2)修改SSD网络层数,最终使用7个卷积层的SSD作为检测器,选取其中4个卷积层的输出进行检测,进一步减少模型复杂度和训练难度;(3)修改了每个检测层所产生的候选框大小,提高检测精度.实验结果表明:所提出的模型平均准确率达到82.40%,平均每张影像检测耗时1.86 s,充分验证了该方法的有效性.本文提出的基于改进的SSD算法在遥感影像小目标检测中具备有效性和实时性,在遥感影像小目标检测任务中效果良好.  相似文献   

19.
一种统一的文本与图像分类算法   总被引:2,自引:0,他引:2  
基于可变精度粗糙集提出了一种统一的文本与图像分类算法.用该方法进行教育资源的分类既可处理不确定性信息,又简化了分类规则,从而有利于提高分类能力和检索的查准率.  相似文献   

20.
为解决现有多数视频人体动作识别3D卷积方法无法区分信息中各维度的重要和非重要特征问题,提出了通过门控循环单元(GatedRecurrentUnit,GRU)和空间注意力增强模块构建时空特征处理网络的方法,基于多级特征融合和多组通道注意力特征选择构建网络,改进基础网络模型Res Net3D对视频人体动作识别中的网络模型.改进后模型在2个公开数据集UCF101和HMDB51上的准确率分别为96.42%和71.08%,与C3D、Two-stream等网络模型相比,具有更高的识别准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号