共查询到19条相似文献,搜索用时 78 毫秒
1.
对电影短评数据进行情感分析的目的是为了获取观众对某部电影的情感倾向,同时还可帮助电影制作者通过了解观众的情感倾向,从而改善电影的制作。文章采用的方法是通过Python代码爬取电影网站上的评论数据,对爬取的数据进行多项数据预处理技术得到较为规范的评论数据,再利用TF-IDF算法计算出短评数据的关键词及权重并给关键字词云图,然后使用SnowNLP库计算出短评数据的情感分值,并运用LDA模型对电影网站短评数据主题分类,最终给出电影网站短评数据情感分析的可视化评价结果。 相似文献
2.
3.
LDA主题模型在提取特征时缺乏对词语关联及相关词对的理解,这会影响情感极性分类的准确率。针对这一问题,文中提出一种在LDA主题模型中引入特征情感词对抽取方法的新模型,以改善特征情感词对的抽取效果。利用依存句法分析设计特征情感词对的识别方法,随后将识别方法作为约束条件引入LDA模型对特征情感词对进行抽取。通过吉布斯采样进行参数计算,给出了模型的生成过程。最后利用随机森林分类方法对文本进行情感极性分类。为验证文中模型的有效性,将其和另外两种模型一起进行实验,当主题个数为20时,文中所提模型分类的准确率、召回率、F值分别为81.54%、83.13%和82.33%,显著高于另外两种模型。 相似文献
4.
随着电商行业的迅猛发展,网络购物如雨后春笋般迅速崛起,网购评论数据爆炸式增长,准确挖掘并利用这些能反映消费者情感倾向的信息,已成为商家改进产品质量、提升竞争力不可或缺的手段.该文以国产品牌小米手机为研究对象,利用Python软件爬取天猫商城中的评论信息,对爬取的天猫商城评论数据进行情感分析,分别对正、负面评论构建LDA... 相似文献
5.
6.
针对网络舆情情感分析主题词抽取不精确和文本静态化分析问题,论文提出了一种基于时间序列的方面级网络舆情动态情感演化模型ARMA-ALEE。通过方面级情感分类模型获取方面词和情感极性值,并对方面词使用过滤算法优化,再通过困惑度和JS散度确定最终方面词个数,进一步地还基于ARMA时间序列模型对方面词、方面词强度和方面词相关性的ARMA-ALEE模型动态地进行网络舆情情感演化分析。实验表明,该模型的情感演化研究取得了较好的结果。 相似文献
7.
针对新冠疫情期间高校疫情管控过程中所出现的舆情问题,提出一种基于词频分析与LDA模型的舆情情感分析方法。首先,从微博上挖掘与疫情防控有关的话题,采用Python爬虫爬取8219条微博留言;然后,运用情感分析与LDA模式,对正负情绪进行主题挖掘,并使用PyLDAvis进行可视化展示;最后,利用社会网络和Gephi对正面和负面的舆论影响进行相关性分析。实验结果表明,研究可为高校有效管理提供理论依据和技术支撑。 相似文献
8.
9.
郭小磊 《智能计算机与应用》2021,11(11):128-130
本文利用Python语言获取某平台医药商品评论文本,采用正负预料库进行LDA模型训练和情感分值的计算,并使用Matplotlib方法和Wordcloud对处理之后的数据进行可视化.通过这种方法可以有效、精准获取京东商品评论,并对其进行情感分析,对提高工作效率和数据分析成效均具有积极的作用. 相似文献
10.
11.
12.
现有的概念漂移算法大多建立在数据流的分类模型上,忽略了特征空间与样本空间的分布特点,以及特征选择和加权的重要性.针对此问题提出了一种基于特征项分布的信息熵及特征动态加权算法,从概念漂移的动态演化性出发,根据样本和特征空间的拟合程度,运用特征信息熵理论对数据流中的概念漂移现象进行捕捉,以实现新旧概念的过渡.利用改进的隐含Dirichlet模型特征动态加权算法,以解决当前特征与历史特征的权重确定和无效特征的裁剪问题.在公开的语料库CCERT和Trec06上的测试实验证明了所提出算法的有效性. 相似文献
13.
14.
电子商务网站中的评论数据隐含着商品特征和用户情感,现有基于方面情感分析的推荐研究大多通过抽取同一类别商品评论数据中用户对商品不同方面的情感来捕捉用户方面偏好,忽略了不同类别商品有不同方面以及用户的方面偏好随时间变化的特点。对此,该文提出一种面向时序感知的多类别商品方面情感分析推荐模型,该模型对用户、商品类别、商品、商品方面、方面情感和时间统一建模,以发现用户对不同类别商品的方面偏好随时间变化的特点,并据此做出推荐。该模型能够推断用户在任意时间对商品的方面偏好,从而为用户提供可解释的推荐。两个真实数据集的实验结果表明,与其它基于时间或方面情感分析的推荐模型相比,该文提出的模型在top-N推荐准确率和召回率评价指标上均获得显著改善。 相似文献
15.
为了快速获取网络文本中主题内容和情感信息,提出了文本情感文摘的概念,同时提出了一种基于条件随机场模型的情感文摘提取方法.首先提取文本中的句子长度、提示词以及情感词语作为基本特征,同时应用浅层狄利赫雷分配的主题模型,分析文本潜在主题信息,提取主题特征,将这两类特征同时应用到条件随机场模型中,从而获取文本的情感文摘.实验结果表明,该方法细腻刻画了文本的主题信息,同时考虑了文本主题的情感色彩,文摘提取效果较理想,能满足用户的实际需要. 相似文献
16.
在社交网络中进行意见领袖的挖掘对信息传播与演化的深度分析、舆情监控和引导具有重要意义,本文综合结构特征、行为特征和用户的情感特征对意见领袖节点挖掘问题进行研究.本文首先对微博真实文本数据进行话题识别得到主题社区,在主题社区中基于用户节点之间的关注关系构建交互网络拓扑.然后分别从结构、行为和情感三个维度对用户的影响力进行度量.最后,分析用户在主题社区中的影响力分布与传播规律,提出意见领袖识别算法MFP(Multi-Feature PageRank).实验表明,该算法可有效地挖掘潜在的意见领袖节点,能够获得较高的支持率. 相似文献
17.
本文提出了一种有监督主题模型的SLDA-TC(Supervised LDA-Text Categorization)文本分类方法,引入主题-类别概率分布参数,识别主题-类别的语义信息;提出SLDA-TC-Gibbs主题采样新方法,对每个词的隐含主题采样,只从该词所在文档的同类其它文档中采样,并给出了理论推导;另外,其主题数只需略大于类别数.实验表明,对比LDA-TC(LDA-Text Categorization)和SVM算法,本方法能提高分类精度和时间性能. 相似文献
18.