首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
以微博、论坛等为代表的社交媒体已逐渐发展成为网络用户表达和交流观点、获取和传播信息的重要平台.然而,社交媒体文本内容具有的规模庞大、形式多样、传播迅速等特点,对传统的应用在新闻报道、舆情监控、文本挖掘、信息咨询等方面的话题检测与追踪技术提出了新的要求.针对这一背景,本文分别从离线话题检测、在线话题检测和话题演化追踪这三个方面总结当前主要的话题检测与追踪方法,分析在该领域实验中被普遍使用的评估方式,最后提出当前面临的挑战和今后的研究方向.  相似文献   

2.
在线社交网络已发展成为一个独特的电子生态系统,其应用深刻影响着人们生活的方方面面。由于在线社交网络特性复杂,分析在线社交网络形成和变化中的规律成为当前计算机科学、社会学和物理学的一项挑战。传统上,在线社交网络实证研究主要采用计算机辅助的被动数据获取和分析方式。近年来,在真实大规模在线社交网络上直接进行控制实验从而主动获取数据并开展分析研究的方式广受关注。评述了这一领域的研究进展,包括:社交网络控制实验的主要研究模式;控制实验方法在社交网络结构、信息传播、行为和心理学等领域取得的主要成果以及主要实验工具的适用条件和局限性。最后,展望了人工智能技术在社交网络控制实验中的应用潜力,分析了智能算法对降低实验成本和提高实验效率的作用。  相似文献   

3.
基于多媒体数据库的数据挖掘系统原型   总被引:22,自引:2,他引:20  
提出了一种多媒体数据挖掘的系统原型 MDMP.介绍了 MDMP原型构件和开采函数 ;描述了挖掘处理与知识表示 ,讨论了多媒体数据特征立方体构建及在线分析挖掘 OL AM机制 .MDMP用于从多媒体数据库中挖掘出隐含的用户感兴趣的知识 .  相似文献   

4.
智能化网络性能分析与预测支撑系统设计   总被引:1,自引:0,他引:1  
提出了一种将离线性能分析与在线性能实时预测相结合的网络性能分析与预测支撑系统设计方案.在离线性能分析中完成了特定网络节点的性能分析、节点间性能相关性分析以及长期网络性能历史数据的演化数学建模;在在线性能分析中则主要基于一种混合的实时预测模型来完成在线的网络性能预报,它采用模块化设计,具有良好的智能与很好的可扩展型和自适应性.实验表明,它为网络管理人员提供了强有效的网络性能分析与预测工具,是一个理想的性能分析与预测支撑平台.  相似文献   

5.
大数据及其科学问题与方法的探讨   总被引:2,自引:0,他引:2  
大数据的规模和复杂度的增长超出了计算机软硬件能力增长的摩尔定律,对现有的IT架构以及计算能力带来了极大挑战,也为人们深度挖掘和充分利用大数据的大价值带来了巨大机遇.因此,针对网络大数据的共性规律和科学问题,需要研究网络大数据定性定量分析的基础理论与方法.本文重点分析了大数据在数据关联上的复杂性、计算复杂性、系统的复杂性、学习复杂性四个方面的主要研究问题和现状,介绍小结了产业界具有代表性的实际应用IT基础架构,以形成从网络大数据的感知、挖掘获取、质量评估、数据提炼处理到融合表示的综合过程图景,最后对大数据科学、数据计算需要的新模式与新范式(第四范式)等方面的发展趋势和方向进行了展望探讨.  相似文献   

6.
计算几何中的一些几何分析问题已成为安全多方几何计算领域的一个重要研究内容.保密平面图形间的安全相似性判定是安全几何计算中一个全新的研究领域,在保护地理信息系统以及社交网络中用户隐私方面有重要的理论价值和广阔的应用前景.本文的主要工作是基于同态加密方案构建隐匿图形顶点数和边数的两方保密图形相似性判定协议(当两个图形不相似时,该协议不会泄露参与双方私有图形的顶点数和边数),目前尚未见到关于这个问题的解决方案.  相似文献   

7.
InClosPan:大型数据库中闭序列模式的增量挖掘   总被引:1,自引:0,他引:1  
许多现实数据库都以增量形式增长,不希望在每次更新了数据库之后,又重新挖掘完整数据库,增量算法成为必需.研究了当初始数据库中增加了新的事务或增加了新的顾客时,增量挖掘闭序列模式的问题.给出了一个新的频繁闭序列模式增量挖掘算法InClosPan,该算法利用已得到的结果进行增量挖掘,减少了重新挖掘数据库的费用.  相似文献   

8.
提出一种新的无监督的方法,对网络上存在的大量中文产品评论信息进行处理,生成简洁的非结构化的可读性强且具有代表性、简洁性的理解式评论微摘要.用N-gram语言模型来衡量可读性,用改进的点间互信息函数来衡量代表性,用同义词词林来计算词语相似度;将这种产品评论微摘要问题归结为优化问题,试图寻找具有可读性和代表性的简洁、低冗余的词组,并提出了一个启发式算法来解决这个优化问题.  相似文献   

9.
目前,互联网上的大部分群体性数据资源集中在微博、论坛等社交网络上.跨语言社会舆情分析是我国智能信息处理的一个研究热点.维吾尔语是我国主要少数民族语言之一,为了构建一个好的跨语言舆情分析系统,维吾尔文微博的数据获取显得尤为重要.维吾尔文微博数据获取最大的难点是微博开发商不提供API.本文以技术和经济为基础的"Guduk"微博为研究对象,提出了一种基于用户关系的维吾尔文微博数据获取爬虫系统方案,此方案解决了在不提供API情况下的数据获取难点.本文的研究为跨语言舆情分析系统提供大量的维吾尔文社交网络数据资源、数据获取方法和技术.  相似文献   

10.
从大数据中挖掘隐藏的、多维的有价值的关联规则具有广泛的应用价值。关联规则挖掘经典算法Apriori存在重复扫描数据库并产生大量候选项集的瓶颈问题,FP-growth算法虽不产生候选集,但FP-tree不支持大数据的存储与遍历,不能有效支持大数据挖掘;另外,Apriori以及FP-growth算法实施增量挖掘都需要重构关联规则,不适用于增长型事务数据挖掘。针对这些问题,设计基于关系数据库表SourceIndex的DB-growth算法,采用模式组合生成模式串的方式,更新数据库构建频繁集,有效地提高了关联规则的挖掘效率,同时对增量挖掘及深度挖掘也能得到较好的支持。更多还原  相似文献   

11.
漏洞挖掘是解决当前工业控制系统安全问题的有效途径.本文分析了现有工业控制平台漏洞挖掘的问题,提出了一种改进的Fuzzing架构.通过引入置信度的概念对测试用例进行量化,将其作为分类器的输入进行分类,从而预先筛选出可能有效的测试用例,实现了减少输入空间、增加命中率的目的.基于该架构设计的针对工业控制系统的一种通用漏洞挖掘框架,实现了集畸形数据构造、测试目标监控和测试结果管理为一体,并同时支持多目标、多协议、多平台的扩展.通过对某款工业控制器进行实际测试,证明了该架构的可行性与高效性.  相似文献   

12.
基于人工神经网络的多媒体语音特征挖掘   总被引:1,自引:1,他引:0  
提出了一种基于人工神经网络的聋儿语音训练识别的多媒体特征挖掘技术 .构造了邻域三层神经元合作竞争的动态行为神经元模型 ;实验选取了动态递减函数、动态最小覆盖矩阵和动态确定阈值形成的 SOL A挖掘算法 ;以及聚类分布的网络图技术 .解决了聋儿语音训练系统中基本语音识别的难题 .  相似文献   

13.
中国手指语的识别使听力障碍人群与听力正常人群相互交流和人机交互更加便捷.传统的手指语识别对环境背景要求较高,为了解决复杂环境下中国手指语的识别问题,构建并扩展了手指语图片训练集,提出基于改进的区域的全卷积网络R-FCN解决复杂背景下的手指语识别任务.为适应多变的复杂场景,利用在线难例挖掘技术对手指语识别过程中产生的难例进行在线学习,结合手指语特征对网络进行优化.并与SVM分类和FasterR-CNN神经网络作对比.实验结果表明,基于改进的R-FCN在复杂环境的手语识别任务上能达到较好的识别效果.  相似文献   

14.
通过对商品评论的挖掘,商家可以更好地了解消费者的需求从而及时改善产品的设计。目前,针对商品评论的挖掘大多数采用的方法是提取有效的情感特征并利用分类器进行分类。然而由于电商评论文本表述方式多样、行文不规范,口语化等特点,数据稀疏,文档特征维度过高,样本不均衡以及情感词典领域依赖性等问题都导致情感特征的提取过程愈发困难。为了解决这些问题,论文提出一整套针对电商评论挖掘方法,其融合多种策略构建电商领域情感词典;将文本长度作为特征;结合语料库对停用词表进行优化;将文档频率和TF-IDF算法结合进行特征选择和特征加权。论文以热水器评论作为语料库,以支持向量机为核心对所提出方法进行验证,实验结果证明所提出的方法能在降低文本维度的同时可大幅度提高情感分类的准确度。  相似文献   

15.
加密算法的识别对于密码分析研究有着重要的意义,目前学者们已经在此领域展开了一些研究并取得了一定的进展。然而在针对哈希函数的识别方面,所展开的理论研究较少。本文对随机性检测特征进一步挖掘,利用欧氏距离筛选出对哈希函数最有区分度的3个检测项,基于选出的检测项的核心关注点重新构建特征生成方法,并结合随机森林模型,提出了一种基于组合随机性特征的哈希函数识别方案。通过实验分析,该识别方案明显优于传统的基于随机性检测特征的识别方案。  相似文献   

16.
博客(Blog)网站作为近年来新型的网络媒体得到越来越多的个人和企业的关注,因此针对Blog数据设计了相应的数据分析系统.并介绍了Blog数据分析与传统Web挖掘的区别和联系,阐明研究了Blog数据的必要性,其次详细分析了本系统的主要功能模块及其实现方法,最后采集中国博客网的数据对本系统进行验证,实验结果显示本系统是可行且有效的.  相似文献   

17.
种质资源是作物育种的物质基础,也是研究水稻起源、进化、发育和基因功能的基本材料.本文以野生稻为对象,系统总结、分析了近年来世界范围内水稻遗传育种界对野生稻有利基因资源发掘和利用所取得的成就,以及该领域在研究技术和手段方面的最新进展.  相似文献   

18.
通信数据包含人类活动的时空以及社会关系等信息,对人类行为分析有重要的价值.为了帮助分析者对用户的行为进行分析和理解,构建了从通信数据中探索用户的时空、社交等信息以分析用户行为的可视化流程,旨在理解用户的行为模式并通过行为的对比发现用户的社会角色以及用户之间的真实社交关系,通过迭代式交互过程,对用户不同时段的行为进行有效的理解和分析.在此基础上,构建了用户行为可视分析系统,采用半年的通信数据对该方法以及系统进行评估,结果显示,本方法能够有效理解个人行为、识别用户之间的关系.  相似文献   

19.
来自国内外150多所高校和企业的近400名专家学者和研究生代表出席了本次会议. 会议围绕新能源的先进电化学储能材料与器件展开研讨, 所涉及的储能体系包括了锂离子电池、锂硫电池、超级电容器及新型二次电池等. 本次会议为推动先进能源材料与器件领域的发展提供了一个良好的学术交流平台, 大大提升了研发人员对新能源行业的发展动态、市场需求以及前沿工艺技术的深层次了解, 对于推动基础研究成果和产业化应用的紧密结合起到了积极的作用.  相似文献   

20.
用序列模式挖掘方法进行商品销售的预测,其准确率受单个算法本身限制,如果先用序列模式挖掘对原始数据进行过滤,然后再利用神经网络的自适应性,通过学习和训练,找出客户特征与购买某种商品意向的内在联系,再利用神经网络的泛化功能对未经训练客户购买意向进行预测,其预测的正确率非常高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号