首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
微博类社交网络中信息传播的测量与分析   总被引:1,自引:0,他引:1  
为了更好地掌握在线社交网络中信息传播的特征规律和用户行为,以新浪微博为代表对社交网络中的信息传播进行了较大规模的测量、统计和分析,提出了一种三角和算法用于探测用户粉丝数阈值。该算法根据散点分布的统计规律来估计使微博热度达到某一值的粉丝数的临界值,发现为使微博热度大于10,用户粉丝数应大于150。其他测量分析结果表明:新浪微博具有很强的"名人效应",用户频繁地发帖并不能引起较大的关注,热门微博的热度几乎都以激增方式增长。这些结论对网络营销和网络监管具有参考价值。  相似文献   

2.
3.
分析了微博短文本的专有特征,介绍了微博短文本的预处理流程.以新浪微博为网络舆情数据获取平台,简述了微博文本分类处理实现过程,基于Hadoop进行了网络舆情微博分类设计,为网络舆情监控任务的完成做数据依据.  相似文献   

4.
针对微博群落的识别与形成演化机理的获取问题,提出一种基于超图的微博群落感知方法.归纳微博用户的交互关系,提出以用户为节点、交互关系为边的微博用户交互关系超图模型;分析微博用户交互环境的情境特征,通过FP-TREE方法挖掘用户交互与情境特征的关联规则;根据关联规则对超图模型进行划分,得到具有相同情境的微博群落.以新浪微博为例进行了模拟验证,结果表明该方法能够感知导致微博群落形成的情境特征,且较传统数据挖掘方法能够更加准确地识别微博群落.  相似文献   

5.
6.
网络流量识别是网络管理和安全服务的基础.随着互联网的不断扩展及其复杂性的增加,传统基于规则的识别方法或流行为特征的方法正在面临着巨大挑战.受自然语言处理(Nature Language Processing, NLP)启发,本文提出了一种多特征融合的加密流量快速分类方法.该方法通过融合数据包和字节序列特征来完成网络流的特征表示,采用双元字节编码将所选特征扩展为双字节序列,增加了字节的上下文语义特征;通过与数据包特征处理相适应的池化方法来最大限度保留数据包的特征信息,从而使所提模型具有更强的抗噪能力和更精确的分类能力.本文方法分别在ISCX-2016和一个包含66个热门应用程序的私有数据集(ETD66)上进行验证,并与其他模型展开比较.结果表明:本文所提方法在ISCX-2016及ETD66上的测试精度和性能都明显优于其他流量分类模型,分别取得了98.2%和98.6%的识别准确率,从而证明了所提方法的特征提取能力和强泛化能力.  相似文献   

7.
文本序列中各单词的重要程度及其之间的依赖关系对于识别文本类别有重要影响。胶囊网络不能选择性关注文本中重要单词,并且由于不能编码远距离依赖关系,在识别具有语义转折的文本时有很大局限性。为解决上述问题,该文提出了一种基于多头注意力的胶囊网络模型,该模型能编码单词间的依赖关系、捕获文本中重要单词,并对文本语义编码,从而有效提高了文本分类任务的效果。结果表明:该文模型在文本分类任务中效果明显优于卷积神经网络和胶囊网络,在多标签文本分类任务上效果更优,能更好地从注意力中获益。  相似文献   

8.
针对中文微博句子倾向性分类问题,在充分降低由于情感词典的扩充工作带来系统开销的基础上,抽取了中文微博句子中标点符号、情感词权重、词汇级和句法级等新型平面和结构化特征,探索了有效的特征选择方法.在基准COAE和NLP&CC中文微博语料上进行双向交叉和独立实验,并研究了有效的不平衡性语料的处理方法.实验结果表明:采用该文提出的特征后,中文微博句子倾向性分类的性能得到显著提升.  相似文献   

9.
针对微博的倾向性分析问题,提出了一种基于三元词组模式的情感分类方法。该方法通过构造情感词典及微博的三元词组模式,对未标注语料自动进行情感评分并标注情感极性,然后使用自动标注的语料训练得到情感分类器。在测试集上的实验结果表明,使用无人工参与标注的训练语料达到了79.26%的测试正确率。  相似文献   

10.
随着深度学习的发展,方面级情感分类已经在单领域和单一语言中取得了大量的研究成果,但是在多领域的研究还有提升的空间。通过对近年来文本方面级情感分类方法进行归纳总结,介绍了情感分类的具体应用场景,整理了方面级情感分类常用的数据集,并对方面级情感分类的发展进行了总结与展望,提出未来可在以下领域开展深入研究:1)探索基于图神经网络的方法,弥补深度学习方法存在的局限性;2)学习融合多模态数据,丰富单一文本的情感信息;3)开展更多针对多语言文本和低资源语言的研究。  相似文献   

11.
随着新浪微博用户的不断增长,微博网站成为很多人获取信息的平台.但是微博是一种特殊的文本,其字数受到严格限制,传统的主题模型并不能很好地分析微博的内容.本文提出了一个基于LDA的微博生成模型RT-LDA来解决微博字数受限的问题.模型采用吉布斯抽样法来推导,不仅能准确地挖掘每条微博的主题,还能归纳出用户关注的主题分布情况.在真实数据集上的实验表明,RT-LDA模型能很好地对微博进行主题挖掘.  相似文献   

12.
为了提高微博用户转发行为预测的精度,提出一种有效的基于集成学习的微博用户转发行为预测算法.首先,对影响用户转发的各种特征进行综合分析,提取出用户属性、社交关系、微博内容等影响用户转发行为的特征;然后,采用Logistic回归、支持向量机与BP(BackPropagation)神经网络等机器学习算法对用户转发行为进行预测;最后,利用"加权投票法"的集成学习方法对多个预测结果进行融合.实验结果表明,相对于BP神经网络算法,在综合评价性能的F1度量值上,集成学习算法有1.5%的性能提升.  相似文献   

13.
微博的出现打断了传统媒体对新闻报道的垄断,它能快速的发现重大事件,并迅速报道,形成一股强大的信息传播力量.本文通过从突发重大新闻事件发生时微博的反应,研究了微博对重大新闻事件感知速度和传播范围及其产生的影响.  相似文献   

14.
微博短文本蕴含着较为丰富的情感信息,基于微博数据的情感分析已成为网络舆情监测的重要任务。为提高中文微博情感分类效果,提出一种基于粒子群优化(PSO)的长短期记忆(LSTM)模型(PSO-LSTM),该模型在LSTM模型的基础上进行了参数优化,能够更有效获取微博信息。实验以新冠肺炎疫情期间的微博数据集构建PSO-LSTM模型,与其它模型进行了比对实验。实验结果表明,PSO-LSTM模型能够有效提升中文微博情感分类的性能。  相似文献   

15.
为了从微博丰富的社会事件中自动生成故事脉络,设计了一个故事脉络自动生成系统.该系统具有以下特点:(1)基于微博传播影响力的代表性事件抽取;(2)提出用图卷积网络来分类事件簇,然后利用事件的时间信息构建故事脉络;(3)提供用户事件检索接口和故事脉络可视化展示.介绍了故事脉络生成系统的关键技术并在真实微博数据集上进行了实验...  相似文献   

16.
微博的流行使公众能够更加容易也更加积极地参与到社会话题的讨论中去,识别公众对事件的情感倾向已经成为一个有价值的话题.目前已有的情感分类方法往往是选择一种分类模型(比如SVM)或者结合几种分类模型,然后将数据直接进行分类,没有考虑根据数据的不同领域来调整分类模型.基于预训练的BERT网络,可以使用无标签的时政微博语料改进...  相似文献   

17.
面向微博短文本的细粒度情感特征抽取方法   总被引:1,自引:0,他引:1  
结合TF-IDF方法与方差统计方法, 提出一种实现多分类特征抽取的计算方法。采用先极性判断, 后细粒度情感判断的处理方法, 构建细粒度情感分析与判断流程, 并将其应用于微博短文本的细粒度情感判断。通过NLP&CC2013评测所提供的训练语料对该方法有效性进行验证, 结果表明该方法具有较好的抽取效果。  相似文献   

18.
针对传统长短时记忆网络(long short-term memory,LSTM)在文本分类中无法自动选取最重要潜在语义因素的问题,提出一种改进的LSTM模型。首先,将传统LSTM的运算关系拓展为双向模式,使网络充分记忆输入特征词的前后关联关系;然后在输出层前面增加池化层,以便更好选择找到最重要的潜在语义因素。互联网电影资料库评论数据实验结果表明,该模型优于传统长短时记忆神经网络以及其他同类模型,揭示了改进方案对提高文本分类准确率是有效的。  相似文献   

19.
现有的微博社交网络社区挖掘方法多是基于网络结构进行,忽略了节点本身行为的重要性,并且不能同时实现对大规模复杂网络结构适应性和社区挖掘的高效性。为缓解上述问题,提出了一种基于网络距离和内容相似度的微博社交网络社区划分方法,该方法在考虑微博社交网络结构的同时兼顾了网络中节点的历史微博内容,通过对历史微博数据的分析提高社区划分的精确度。文中对Louvain算法和其模块性的修改使用,保证了该方法能够处理大规模网络数据,同时又能保证社区挖掘的效率。实验证明,该方法能够高效地挖掘微博网络社区结构,对学术研究和商业应用都有十分重要的意义。  相似文献   

20.
文章提出了一种基于多度量融合的微博转发行为预测方法(MRBP-MMF),该方法提取用户微博特征,设计了转发行为习惯度、历史微博认同度、微博内容相似度和转发行为相似度计算方法,并综合多种度量标准预测用户转发行为。在实际微博数据集上实验发现,MRBP-MMF方法对用户转发行为的预测灵敏度比融合前平均高出12%,分别比预测模型3:基于情感主题模型(The Third Prediction Model-Emotion topic based Model,PM3)和多异质扩散关系网络转发行为(Retweeting Behavior on Multiple Heterogeneous Diffusion Relation Networks,RBMHDRN)平均高出4%和0.7%,在训练数据较少的情况下,MRBP-MMF方法更具优越性。实验结果表明,MRBPMMF方法预测灵敏度高于基于微博正文或用户情感的转发行为预测方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号