共查询到16条相似文献,搜索用时 62 毫秒
1.
2.
3.
随着网络规模的不断扩大,经典的复杂网络重叠社识别算法已不能高效处理现有的大规模网络图数据.本文在GraphLab并行计算模型上提出了基于重要节点扩展的重叠社区识别算法DOCVN (Detecting the Overlapping Community algorithm based on Vital Node Expanding in GraphLab).算法选取网络中PageRank值大的节点作为重要节点,计算其他节点归属于重要节点的节点归属度,并以重要节点为中心形成核心社区及扩展社区,最后根据重要节点间的连接紧密度合并核心社区及扩展社区,并计算出每个节点在所属社区里的节点重要度,实现了大规模网络的重叠社区识别.实验表明该算法与PD (Propinquity Dynamics)等现有并行算法相比更能有效地识别大规模网络的重叠社区结构. 相似文献
4.
现实世界中的网络结构呈现出重叠社区的特征。在研究经典的标签算法的基础上,该文提出基于贡献函数的重叠社区发现算法。算法将每个节点用三元组(阈值、标签、从属系数)集合来表示。节点的阈值是每次迭代过程中标签淘汰的依据,该值由多元线性方程自动计算而来。从属系数用于衡量当前节点与标签所标识社区的相关度,从属系数的值越大说明该节点与标签所标识社区的关联性越强。在每一次迭代的过程中,算法依据贡献函数计算每个节点的从属系数,并生成新的三元组集合。然后依据标签决策规则淘汰标签,进行从属系数规范化。通过对真实的复杂网络和LFR(Lancichinetti Fortunato Radicchi)自动生成的网络进行测试可知,该算法的社区划分准确率高,而且划分结果稳定。 相似文献
5.
大数据环境下如何有效地、准确地识别复杂网络的重叠社区是近年来学者关注的重点.本文提出一种基于多标签传播方式MLPS(Multiple Label Propagation Strategy)的重叠社区识别算法,该算法首先利用影响力最大化模型选取初始种子集合并赋予它们唯一的标签,然后采用结点间的相似性和影响传播特性共同作用于标签的传播迭代过程,迭代停止后将具有相同标签的结点划分为同一社区.通过合成网络和真实网络的实验验证了MLPS算法具有较高的准确度和模块度,且具有接近线性的时间复杂度.另外,在对MLPS算法输出的重叠结构进行分析的基础上,本文提出社区间的结构洞识别算法SHCDA(Structural Holes Between Communities Detection Algorithm),该算法通过分析重叠结构和重叠结点的位置特征,计算重叠结点作为结构洞的得分,最后输出top-k结构洞.本文在不同特性的数据集上进行实验,结果证明了SHCDA算法具有最好的准确度. 相似文献
6.
7.
为了提高在大规模网络中发现社区的效率,提出一种基于流式分析的大规模网络重叠社区发现算法(Streaming-based Overlapping Community Detection algorithm,SOCD).算法对网络中的边进行流式处理,每次只处理一条边且每条边仅被处理一次.根据节点的度、节点对社区的贡献度以及节点移动前后社区间连边数量的变化等信息对节点进行划分.在人工合成网络和真实大规模网络上的一系列实验表明,SOCD算法在时间消耗和内存占用上具有较大的优势,比传统方法快10倍以上,且具有较强的鲁棒性,能够在线性时间和空间复杂度下高效、准确地挖掘网络中的重叠社区结构. 相似文献
8.
针对传统基于标签传播的复杂网络重叠社区识别算法难以准确识别重叠节点的缺陷,本文通过分析边与其邻居边的关系,提出用来评估边归属社区的归属密度函数及归属倾向性函数,并在此基础上设计一种基于边标签传播的重叠社区识别方法(OLLP).该方法首先以每条边连接2个节点中度高的节点标签作为该边的标签;然后通过分析边的归属密度与归属倾向性迭代更新边标签,最终标签相同的边属于同一社区.在基准网络与真实网络数据集上进行测试,并与多个具有代表性的算法进行比较,实验结果表明了OLLP算法的有效性和可行性. 相似文献
9.
10.
11.
随着网络结构的不断扩大和日益复杂,传统的重叠社区发现算法已经不能有效地处理大规模网络数据,发现合理的社区结构.本文提出了顶点引力的概念,引入顶点凝聚度和社区凝聚度作为满足社区的外部结构稀疏性和社区内部结构紧密性的判定指标,构造了基于结构紧密性的重叠社区发现算法OCSC.该算法经过预处理,核心子图划分以及核心社区的扩展三个步骤,能有效地发现重叠社区,通过对人工合成网络和真实网络结构的社区发现实验,运用NMI和F1Score等指标验证OCSC算法的合理性和优越性. 相似文献
12.
社区发现作为复杂社交网络中一个重要的研究方向.针对目前基于种子节点的算法在种子选取与扩展等方面的不足,提出了一种基于影响力与种子扩展的重叠社区发现算法(Influence Seeds Extension Overlapping Community Detection,简称i-SEOCD算法).首先,利用节点影响力策略找出具有紧密结构的种子社区.其次,从这些种子社区出发,计算社区邻居集节点与社区的相似度,并取出相似度超过设定阈值的节点.然后,采用优化自适应函数的策略来扩展社区.最后,对网络中的自由节点进行社区隶属划分,进而实现了整个网络的重叠社区结构挖掘.在真实社交网络和人工生成网络上实验表明,i-SEOCD算法能够准确、快速地发现复杂网络中的重叠社区结构. 相似文献
13.
The increased capacity and availability of the Internet has led to a wide variety of applications. Internet traffic characterization and application i-dentification is important for network management. In this paper, based on detailed flow data collected from the public networks of Internet Service Pro-viders, we construct a flow graph to model the in-teractions among users. Considering traffic from different applications, we analyze the community structure of the flow graph in terms of community size, degree distribution of the community, commu-nity overlap, and overlap modularity. The near line-ar time community detection algorithm in complex networks, the Label Propagation Algorithm (LPA), is extended to the flow graph for application identi-fication. We propose a new initialization and label propagation and update scheme. Experimental re-sults show that the proposed algorithm has high ac-curacy and efficiency. 相似文献
14.
针对传统微博社区发现算法内聚低重叠度不可控制等问题,以自顶向下的策略,提出一种基于核心标签的可重叠微博社区发现策略Tag Cut.先利用用户标签的共现关系及逆用户频率对标签进行加权,并基于标签之间的内联及外联关系并将用户的标签进行扩充,然后在整体社区中提取包含某一标签的用户作为临时分组并利用评价函数评估划分的优劣,最后选出最合适的核心标签根据其对应分组与其他分组距离的远近来决定将其划分为新的分组还是并入其他分组.用此策略反复迭代直到满足要求.该算法划分的组由若干个拥有核心标签的分组组成且综合利用微博用户已声明的及隐含的兴趣、用户之间的关注规律、结果的实用性对划分结果进行修正.经真实数据实验表明该方法内聚高社区重叠度可控且拥有实际意义. 相似文献
15.
16.
个人意愿对于形成网络社团和传播信息有着重要的影响力,因此本文提出一种基于个人意愿的社团结构与信息检测方案.该方案中的社团检测算法初次检测以融入节点属性的模块度,再次检测以兴趣度并能发现重叠社团,最后精细检测以个人意愿,本文社团检测算法(ε_CSDA)较之前的算法更有效的是可以发现重叠社团;同时,该方案建立的信息传播模型在指数模型基础上构建边特征向量(边属性)、节点特征向量(节点属性)和意愿向量(用户意愿、社团意愿和节点意愿),并以传播概率和传播延迟构建模型基本关系,从而使得该模型实现了基于个人意愿的信息传播.实验结果表明,加入个人意愿的社团检测和信息传播方案,能够保证社团检测的有效性和实用性,能够实现用户间信息传播的主动性和可靠性. 相似文献