首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
多任务学习利用不同任务之间的相似性辅助决策,与单任务学习相比,多任务学习能够利用更多的信息,从而可以弥补单任务学习信息利用不足的缺陷。本文选择NTCIR-ECA数据集中的中文和英文文本数据作为实验数据,以情感原因分析作为研究任务,提出了一种结合多任务学习和深度学习的模型MTDLM(multi-task deep learning model),实现不同语种下的情感原因分析。实验结果表明,在数据不平衡的情况下,MTDLM模型对英文语种的情感原因识别的最优F值为39%,优于单任务学习(F值为0)和传统基线模型(LR的F值为33%),从而验证了模型的有效性。  相似文献   

2.
随着深度学习的发展,方面级情感分类已经在单领域和单一语言中取得了大量的研究成果,但是在多领域的研究还有提升的空间。通过对近年来文本方面级情感分类方法进行归纳总结,介绍了情感分类的具体应用场景,整理了方面级情感分类常用的数据集,并对方面级情感分类的发展进行了总结与展望,提出未来可在以下领域开展深入研究:1)探索基于图神经网络的方法,弥补深度学习方法存在的局限性;2)学习融合多模态数据,丰富单一文本的情感信息;3)开展更多针对多语言文本和低资源语言的研究。  相似文献   

3.
结合RNN和CNN层次化网络的中文文本情感分类   总被引:1,自引:0,他引:1  
中文情感分类; 深度学习; 卷积神经网络; 循环神经网络  相似文献   

4.
传统的文本分类算法都是采用期望交叉熵、信息增益和互信息等统计方法,通过设置阈值获取特征集,如果训练集的数据量较大,则容易出现特征项不明确,特征信息丢失等缺陷,为解决上述问题,提出运用“深度学习”中的稀疏自动编码器算法自动提取文本特征,然后结合深度置信网络形成SD算法进行文本分类。实验表明,在训练集较少的情况下,SD算法的分类性能低于传统的支持向量机,但是在处理高维数据时,SD算法则比支持向量机具有较高的准确率和召回率。  相似文献   

5.
首先, 基于点互信息与信息检索(PMI IR)算法, 提出一种Laplace平滑情感判定(LS-SO)算法, 对情感词典与表情符号情感词典进行自动扩充, 得到了具有一定规模、 高质量的情感词典, 包括基础情感词典、 目标情感词典、 网络用语情感词典、 表情符号情感词典、 否定词词典、 疑问词词典、 程度副词词典和连词词典. 其次, 通过细化文本语义分析规则计算文本情感值. 实验结果验证了该方法的有效性.  相似文献   

6.
将相关主题模型和神经网络相结合开展文本情感分析研究。首先,为了度量文本的主题相关程度,采用CTM模型对文本进行特征分割,得到主题与词之间的相关矩阵和文本句子的主题特征向量;其次,基于相关性理论,构造蕴含主题相关信息的词向量,采用word2vec模型进行文本词表示;最后,使用BiLSTM模型对文本句子进行表示,实现文本情感特征提取。  相似文献   

7.
本文首先利用基础情感词典以及基准词对所需研究领域的评论文本进行分析,以此获得特定领域具有感情倾向的特征词语。而后利用基准词以及获得的特征词语对评论进行分析,对于有感情词的句子,采用计算感情值来判别其感情倾向以及感情程度,对于无感情词的句子,采用连词的方法来进行感情的判别。实验结果表明,该方法能够对不同领域的评论得到较好的感情分类效果。  相似文献   

8.
遗传算法是一种基于自然选择规律的优化方法,适合解决温室控制中复杂的、非线性的优化控制问题.综合论述了遗传算法.包括差分进化算法在温室控制中的应用,以及今后的发展方向.  相似文献   

9.
免疫进化的投影寻踪模型在文本分类中的应用   总被引:1,自引:0,他引:1  
投影寻踪是通过寻找最能反映原高维数据的结构或特征的投影方向,把高维数据投影到低维子空间上,从而实现在低维空间上研究分析高维数据的目的.针对文本分类中维数灾难问题,采用投影寻踪模型,将高维的文本数据降到超低维.投影寻踪的关键是构造能够找到最佳投影方向的有效算法,本文根据免疫进化的思想提出了免疫进化的投影寻踪模型,该模型能...  相似文献   

10.
传统机器学习和深度学习模型在处理情感分类任务时会忽略情感特征词的强度,情感语义关系单薄,造成情感分类的精准度不高。本文提出一种融合情感词典的改进型BiLSTM-CNN+Attention情感分类算法。首先,该算法通过融合情感词典优化特征词的权重;其次,利用卷积神经网络(CNN)提取局部特征,利用双向长短时记忆网络(BiLSTM)高效提取上下文语义特征和长距离依赖关系;再结合注意力机制对情感特征加成;最后由Softmax分类器实现文本情感预测。实验结果表明,本文提出的情感分类算法在精确率、召回率和F值上均有较大提升。相较于TextCNN、BiLSTM、LSTM、CNN和随机森林模型,本文方法的F值分别提高2.35%、3.63%、4.36%、2.72%和6.35%。这表明该方法能够充分融合情感特征词的权重,利用上下文语义特征,提高情感分类性能。该方法具有一定的学术价值和应用前景。  相似文献   

11.
补偿型的Sleeping expert文本分类算法   总被引:4,自引:0,他引:4  
多义词是影响文本分类的重要因素 ,由于它可代表分属不同类别的多个概念 ,造成类别之间界限模糊。传统作法是对多义词的权重进行弱化以减小它们对于分类的影响 ,但文本分类是基于内容的 ,且多义词也代表组成文本内容的特定概念 ,所以简单地对多义词进行弱化是不合理的。Sleeping expert算法采用正权重和负权重较好地描述了多义词的特性 ,该文在原算法中插入了一种权重补偿模块 ,它根据上下文对关键词的统计权重进行动态修正 ,其目标是实现权重和当前概念的一致性 ,实验证明这种补偿型 Sleepingexpert具有更好的分类性能  相似文献   

12.
为解决情感分类中词间的语义关系难以表达和分析的问题,提出了一种基于词向量(word representation)和支持向量机(support vector machine)的情感分类算法,对电子商务在线评论的情感分类问题进行研究.首先使用word2vec聚类相似特征,然后使用word2vec和SVM对情感数据进行训练和分类,并分别使用基于词特征和基于词性标注的方法进行特征选择.在京东评论数据上进行的实验结果表明,与现有方法相比,分类准确率和召回率得到了提高.  相似文献   

13.
针对目前金融领域文本存在标注资源匮乏的问题,提出一种基于生成对抗网络的金融文本情感分类方法. 该方法以边缘堆叠降噪自编码器生成鲁棒性特征表示作为输入,在生成对抗过程中,通过向文本表示向量添加噪声向量再生成新样本,应用对抗学习思想优化文本特征表示. 在公开的跨领域情感评论Amazon数据集和金融领域数据集上进行实验,并与基准实验对比,结果表明,该方法在平均准确率上有显著提升.  相似文献   

14.
一种求解分类问题的优化算法   总被引:2,自引:1,他引:1  
给出了一类线性分类算法的数学描述,在求解分类问题的平分最近点法与最大间隔法的基础上,将线性分类问题转化为一类无约束不可微优化问题。设计了一种求解该问题的不可微优化算法,并证明了算法的收敛性。初步的数值例子表明该算法是有效的,且具有简单实用的特点。  相似文献   

15.
分类算法是数据挖掘中最重要的研究领域之一。通过对当前数据挖掘中具有代表性的优秀分类算法进行分析和比较,给出了每种算法的特性,为使用者选择算法或研究者改进算法提供了依据。  相似文献   

16.
基于决策树和遗传算法的模糊分类系统设计   总被引:1,自引:0,他引:1  
提出一种基于决策树初始化和遗传算法优化的模糊分类系统的设计方法.该方法首先采用分类和递归树(CART)算法进行决策树的生长,树的修剪过程简化了初始决策树;然后,把修剪后的决策树转化为模糊模型,利用匹茨堡型实数编码的遗传算法优化该模糊模型.为了提高模型的解释性,在遗传算法中利用基于相似性的模型简化方法对模型进行约简.最后利用该方法对Iris问题进行研究,仿真结果验证了该方法的有效性.  相似文献   

17.
A novel method that hybridizes genetic algorithm (GA) and expectation maximization (EM) algorithm for the classification of synthetic aperture radar (SAR) imagery is proposed by the finite Gaussian mixtures model (GMM) and multiscale autoregressive (MAR) model. This algorithm is capable of improving the global optimality and consistency of the classification performance. The experiments on the SAR images show that the proposed algorithm outperforms the standard EM method significantly in classification accuracy.  相似文献   

18.
遗传算法在组合优化中的应用   总被引:1,自引:4,他引:1  
针对组合优化中规模较大问题用传统的优化方法求解耗时较长的缺点,将遗传算法应用于0-1规划中,用基于二进制表示的罚函数法和修正方法处理背包问题;并对指派问题进行遗传算法设计,使这两个问题得到很好的解决,从而说明了遗传算法具有超越传统方法的优势,为解决此类问题提供了一种新的手段,是传统方法的补充和完善.  相似文献   

19.
在文本分类中,数据规模过大或文本分布不均匀对传统KNN算法的准确率和效率具有重要影响。为了解决该问题,文章提出一种基于粗糙KNN(k-nearest neighbor)算法的文本分类新方法。首先引入粗糙集中的上下近似概念定义各类文本的上下近似空间,将文本向量空间分为核心和混合2大区域;然后改进传统KNN算法的隶属度函数;再针对不同的文本区域,采取差异化的分类策略以提高分类的效率和准确率。实验表明,基于粗糙KNN算法的文本分类方法在提高分类准确率的同时,分类的效率也有很大提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号