首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
源代码相似性是指不同代码段功能上的相似程度,是软件工程领域一项重要的研究问题.现有的方法主要从文本、结构两方面,利用代码的统计学特征计算相似性,其最大缺点就是无法表达代码的语义特征.为解决此类问题,提出了一种融合统计信息的卷积神经网络(statistics information for code embedding convolutional neural networks, SICE-CNN)源代码相似性检测方法.该方法首先通过词嵌入对源代码进行信息表示,获取代码的词嵌入向量信息;其次,构建CNN训练模型学习源代码文档的嵌入表示;最后,计算源代码对的余弦相似值.实验表明,该方法和一般词嵌入方法相比提高了一定的性能,能较好地检测源代码的语义相似性.  相似文献   

2.
《数理统计与管理》2019,(5):873-881
链路预测是根据已有的网络结构等指标来对网络中尚未产生连边的两个节点间存在边的可能性大小进行预测。链路预测算法在社会网络中的应用是非常广泛的,且都具有很好的预测效果。但由于真实网络往往具有纷繁复杂的演化机制,这使得很难利用某一单指标去准确刻画,并且每种指标在不同网络结构中的预测效果各不相同,现有链路预测算法都是针对特定网络结构才可能有的最佳效果,缺乏普适性。本文基于均匀配方实验设计方法,构建了混合相似性指标,提出了改进的链路预测算法,并将其应用于微博社交网络和生物代谢合作网络中。研究结果表明,改进后的链路预测算法的预测准确性明显优于已有的链路预测算法,说明新构建的混合相似性指标具有一定的普适性;其次,试验设计方法大大缩减了混合相似性指标构建中最优权重确定的迭代次数及其复杂度。  相似文献   

3.
在多标度数据的分类问题中,对于分布特征不清或小样本下的数据的相似性度量仍是研究的热点.对此,建立了基于样本几何轮廓相似度的判别分析模型,并应用于采动沉陷建筑物损坏等级的评价,结果表明该模型简洁、有效,无需数据预处理,较少依赖先验信息,具有推广应用的价值.  相似文献   

4.
主要利用蛋白质统计信息和氨基酸与疏水级映射关系,提出一种基于亲疏水性的替代矩阵HB62,解决蛋白质疏水级序列相似性计算问题.采用CB513数据集,分别利用Blosum62和HB62计算蛋白质间的相似程度,结果显示,两种方法计算结果具有一致性,验证了HB62的正确性与有效性.HB62的设计,极大地简化了蛋白质疏水级序列相似性计算问题,有效地降低预测算法复杂度,提高预测准确率,推动蛋白质亲疏水性的相关理论的发展.  相似文献   

5.
模糊关系是模糊粗糙分析的基础。从属性数据生成模糊关系是模糊粗糙集实际应用中的重要问题。针对模糊属性刻画,给出了生成几种T相似性关系的方法。首先,对于每一个属性,分别生成一个T相似性关系。而后,通过聚合算子来合成这些T相似性关系,以得到一个综合的T相似性关系。  相似文献   

6.
评估两个句子的语义相似性是文本检索和文本摘要等自然语言处理任务的重要组成部分.学者利用深度神经网络执行该任务,然而它们依赖于上下文独立词向量,从而导致性能不佳.为了缓解该问题,采用预训练模型BERT替换传统的词向量,并提出交叉自注意力以增强两个句子的语义,然后与BERT结合.在提出的模型中,为了实现交叉自注意力操作,设计了向量的对齐方法.最后,将BERT输出输入一个双向循环神经网络,以稳定性能,克服BERT自身带来的波动性.实验中,采用3个公开数据集DBMI2019、CDD-ref和CDD-ful对提出的混合模型进行评价.实验结果表明,由于使用了BERT生成的语境词向量,提出模型的性能始终优于现存方法;交叉自注意力实现了彼此的语义交互而增强了句对的语义,使得相似句对的语义差异更小,而不相似句对的语义差异更大,提高了相似性评估的性能.最终,提出模型在DBMI2019、CDD-ref和CDD-ful上分别取得了0.846,0.849和0.845的皮尔逊相关系数,超越了直接以[CLS]输出向量作为评估的方法.  相似文献   

7.
提出了一种新的vague值相似性度量方法.与现有的相似性度量方法相比,方法具有区分度好、计算量小和满足相似性度量的基本性质.实践证明,提出的vague值相似度的度量方法是比较合理的.  相似文献   

8.
城乡区域协调发展是中国"十二五"计划的发展目标之一,从区域经济发展格局为视角,在相应分析法的基础上引进x~2距离度量,定义相似度,改进了变量间相似程度的具体计算方法,以此探讨东、中、西、东北四大区域城镇与农村居民的消费特征和支出结构相似性以及潜在的差异性,为城乡区域协调发展提出一些参考建议.  相似文献   

9.
研究了连锁超市供应商仓库地点合并问题.首先基于供应商仓库储存物品的种类提出了定量描述供应商仓库相似性的指标(相似度),进一步根据仓库之间的距离,对供应商仓库相似度进行了修正,得到了修正相似度.分别利用相似度和修正相似度建立了供应商仓库合并问题的数学模型,设计了求解模型的启发式算法.以某连锁超市供应商仓库地点合并问题为例进行了模拟计算和分析,结果显示,利用修正相似度模型得到的计算结果明显优于利用一般相似度模型得到的结果.  相似文献   

10.
Vague集相似度量模型   总被引:1,自引:0,他引:1  
Vague集的相似度量在模糊推理、模式识别、聚类分析、决策分析等领域的广泛运用,要求所建立的vague集相似度量模型具有较高的区分度及度量结果合乎人的直觉.基于此要求,首先对已有Vague值的相似度量模型在区分度上的不足进行了分析.然后,在分析地基础上,提出了vague值的相似度量建模须考虑的因素.最后建立了Vague集的相似度量模型.数值实验表明,新模型具有较好的区分度,能克服已有模型在区分度上的不足.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号