首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 71 毫秒
1.
进行GO(gene ontology)语义相似性度量是解决生物学数据集成中语义异构问题的重要方法. 传统方法主要是基于距离的度量和基于信息量的度量.文中提出了一种基于语义路径覆盖的度量方法,并实现了其中Combine算法.该算法首先计算出每个节点的信息量,然后分别计算两个节点的语义路径的交的节点信息量之和以及这两个节点语义路径的并的节点信息量之和,将这两者之间的比率作为相似性度量值.实验结果表明该算法具有较高的相关系数.  相似文献   

2.
随着语义Web不断发展,本体数量不断增加,为了增强Web服务语义的精确度,利用网络距离模型方法中概念层次结构树的结构信息、信息论模型方法中概念的语义信息量来进行边的权重计算,提出了一种用最短路径距离来计算概念间语义距离的简便方法.  相似文献   

3.
完善地名自动匹配更新技术,以地名属性信息为契机,采用语义相似性度量技术进行地名匹配研究.研究结果表明:语义相似性度量技术对于地名的自动化乃至智能化匹配技术有着不可替代的支撑作用,并且可以大大简化以及完善原有的地名匹配方法,值得深入研究并实践采用.该研究成果打破了原有地名匹配研究的局限性,有助于其他学者对地名匹配方法的进一步完善与拓展,展现了良好的地名匹配研究前景.  相似文献   

4.
为了提高文本语义相似性度量的准确性,该文从深度学习的角度出发提出了一种新的文本语义相似性度量框架,充分利用深度神经网络实现词级别、句子级别、文本级别的表示学习,使得学习到的表示向量能提供融合上下文信息的丰富语义信息,在此基础上,设计了相似性度量层,采用简单的三层网络实现任意两个文本向量的相似性值计算.在两个基准数据集上...  相似文献   

5.
在Vizilter图像比较方法研究工作的基础上,针对比较图像由于获取条件不同所产生的信息不确定性问题,通过引入图像的标准比较空间,对图像相似性度量问题进行了研究.提出了基于距离测度、相关系数及复合投影的图像相似性度量方法.基于图像标准比较空间的相似性度量工作不仅对Vizilter的研究成果进行了推广,同时也给出了一些新的研究思路和方法.  相似文献   

6.
为提高短文本语义相似性度量准确性,设计一种基于混合机器学习模型的短文本语义相似性度量算法.先对短文本实施预处理,基于混合机器学习模型构建短文本的字词向量模型,对短文本进行特征扩展;然后组合短文本的多样度量特征,对多样度量特征进行维度规约;最后通过构建一个集成学习模型,计算语义相似性结果,实现语义相似性的度量.使用“Quora Question Pairs”比赛数据集测试该方法的性能,测试结果表明,该方法的准确性较高,对数损失和度量均方差均较低,说明该方法的相似性度量准确性较高.  相似文献   

7.
为了在信息检索中,从语义层面全面理解用户查询意图,提高信息的查全率和查准率,提出了基于本体的语义相似性和相关性计算方法。该算法充分考虑了本体模型结构的特点和本体间语义距离、本体密集度等因素对语义相似性的影响,提高了信息检索性能。以煤炭矿井工程的知识体系为例,建立了本体库模型,并设计了本体库的树状内存数据结构。通过实验仿真计算验证了本体相似性算法的有效性。  相似文献   

8.
基于本体的语义相似性研究   总被引:2,自引:2,他引:0  
李文超  杨妮妮 《科学技术与工程》2012,12(21):5328-5330,5336
为了在信息检索中,从语义层面全面理解用户查询意图,提高信息的查全率和查准率,提出了基于本体的语义相似性和相关性计算方法。该算法充分考虑了本体模型结构的特点和本体间语义距离、本体密集度等因素对语义相似性的影响,提高了信息检索性能。以煤炭矿井工程的知识体系为例,建立了本体库模型,并设计了本体库的树状内存数据结构。通过实验仿真计算验证了本体相似性算法的有效性。  相似文献   

9.
根据综合前、后地图的几何变化情况,建立了综合地图几何相似性的度量方法.首先提出了度量几何相似性的5个指标(即传统的空间目标距离、Hausdorff距离、对称差面积、旋转函数距离和曲面距离),然后根据地图综合前后的几何变化建立了这5个几何相似性指标的度量函数,最后提出了面目标几何相似性度量的实现方法.  相似文献   

10.
基于对称KL距离的相似性度量方法   总被引:2,自引:0,他引:2  
提出了一种基于对称KL距离的空间直方图相似性度量方法.将空间直方图中的每个区间的空间分布看作一个带权重的高斯分布,其权重为该区间的概率值,均值和协方差矩阵为该区间内所有像素坐标的均值和协方差矩阵;然后计算2个空间直方图对应区间之间的相似度,即计算2个带权重的高斯分布之间的对称KL距离.理论和实验证明:提出的相似性度量方...  相似文献   

11.
Semantic similarity between Gene Ontology (GO) terms is critical in resolving semantic heterogeneousness when integrating heterogeneous biological databases. Traditionally, distance based and information content based measures are two major methods. In this paper, a new method based on semantic pathway covering is proposed and an algorithm, COMBINE algorithm, is presented, which considers information contents of two given nodes and those of all nodes included in the two nodes’ pathways. Experiments show that COMBINE algorithm obtains the highest correlation index compared with those distance based and information content based algorithms.  相似文献   

12.
Integrated semantic similarity model based on ontology   总被引:1,自引:0,他引:1  
To solve the problem of the inadequacy of semantic processing in the intelligent question answering system. an integrated semantic similarity model which calculates the semantic similarity using the geometric distance and informarion content is presented in this paper. With the help of interrelationship between concepts, the information content ofconcepts and the strength of the edges in the ontology network. we can calculate the semantic similarity between two concepts and provide information for the further calculation of the semantic similarity between user‘s question and answers in knowlegdge base. The results of the experiments on the prototype have shown that the semantic problem in natural language processing can also be solved with the help of the knowledge and the abundant semantic information in ontology. More than 90% accuracy with less than 50 ms average searching time in the intelligent question answering prototype system based on ontology has been reached. The result is vety satisfied.  相似文献   

13.
一种计算Vague集之间相似程度的新方法   总被引:5,自引:1,他引:5  
从Vague集的直觉理解出发,提出了一种新的度量Vague集(值)之间相似度量的计算方法.与文献现有的Vague集(值)之间相似度量的方法进行比较,新方法更加合理,更接近于人的直觉理解,是一种比较理想的度量Vague集(值)之间相似程度的计算方法。  相似文献   

14.
概念相似度研究是知识表示以及信息检索领域中的一个重要内容。根据概念之间错综复杂的关系,可将本体结构看成一个有向无环图。从多个角度出发考虑各种影响有向边权重的因素,通过计算有向边在本体层次图中的相对重要性计算本体中任意两概念的语义距离,由此得到它们的语义相似度。实验结果表明:该方法具有很高的效率。  相似文献   

15.
提出了一种新的语义相似度计算方法。该算法结合了被评估概念的高度、路径长度和公共细化度(specificity);改进了基于路径的语义相似度算法,利用本体结构,引入基于信息量算法的思想,使得新算法能够获取更多的语义信息,同时又不需要对于文本数据进行预处理;考虑本体中簇的粒度对本体的相似度计算有一定影响,在公式中添加概念在本体中的高度信息,达到低层次的概念间共享的信息要比高层次的概念间共享的信息更多。为了评估所提出的新方法,在实验中,用标准的生物医学系统命名法-临床术语(systematized nomenclature of medicine-clinical terms,SNOMED CT)作为输入本体,用已标注好的概念对集合作为数据集。实验结果表明,所提出的方法不仅保留了基于路径算法的简洁性,还优于现有语义相似度算法,证明了所提出方法的有效性。  相似文献   

16.
主观题阅卷系统在目前较受人们的关注。主观题评分原则常见的是对比试卷答案与参考答案的相似程度,进而得出分数。利用自然语言处理分词技术将文本切分为词的组合,然后通过改进语义相似度算法,计算句子相似度,进而得到试卷答案和参考答案的相似程度,给出分数。  相似文献   

17.
随着Web服务数量的剧增,Web服务发现是目前面向服务的体系架构中的重要部分。并且成为Web服务研究的一个热点.笔者提出了一个基于语义匹配的服务发现方法.首先,在标准WSDL中进行本体相关的语义扩充,将服务操作中必要的信息进行语义映射,包括:Web服务操作名称以及服务操作的输入消息和输出消息.其次提出了一个基于消息语义相似度二分匹配的Web服务发现方法.实验表明该方法提高了服务发现的查全率和查准率,且具有良好的可伸缩性.最后得出结论:该方法使用WSDL标准规范而不是特定的Web服务语言或模型,因而易于实施;该方法提高了计算机自动发现服务的效率.  相似文献   

18.
一种基于加权语义相似度模型的自动问答系统   总被引:26,自引:0,他引:26  
在对比传统词频相似度模型的基础上,提出并实现了一种基于加权语义相似度模型的自动问答系统.首先,利用语义树中词语间的距离和语义树的高度来计算词语间的语义相似度,然后利用词语间的语义相似度和词语的权重进一步计算用户问题与答案库中问题间的语义相似度.基于此模型的自动问答系统能够接受用自然语言描述的问题,通过语义相似度的计算,自动地返回相关答案.实验表明,本文提出的基于语义树的加权语义相似度模型与传统的词频相似度模型相比,准确率有明显提高.  相似文献   

19.
SCORM学习资源的语义相似度度量   总被引:5,自引:0,他引:5  
在支持SCORM 1.2的基础上 ,对SCORM 1.2学习资源间的联系描述进行充分的挖掘 ,给出了资源实体和资源本体的形式化定义 ,对资源实体、资源本体间的关系类型进行了划分 ,给出了 3种学习资源语义相似度度量的方法 ,并说明了语义相似度度量在导航中的一个应用  相似文献   

20.
文章提出基于语义相似度的Web文档聚类算法--WDCSS算法,依据文档关键词之间的相似度生成最小树,通过概率统计来确定最小树中相似度阚值,并对最小树中进行切割,同时对较小的子类进行划分合并.实验表明,WECSS不仅能为具有各种不同聚类形状的数据集准确地分析出数据中存在的合理聚类和例外样本,而且避免了用户参数选择所造成聚类质最降低问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号