首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
针对词语向量化表示的问题,根据词语词向量表示的思想以及借助多义词词典,在K-means聚类多义词语上下文表示的基础上,获得词语的多原型向量表示.对句子中的多义词语,通过计算词语多原型向量表示与词语上下文表示的相似度来进行词义消歧,根据2个句子集中共有词语和差异词语的词义相似度,给出一种基于词语多原型向量表示的句子相似度计算方法,实验结果显示了该方法的有效性.  相似文献   

2.
统计词义消歧的研究进展   总被引:15,自引:1,他引:15  
卢志茂  刘挺  李生 《电子学报》2006,34(2):333-343
本文参考大量的文献资料,分析了当前国内外统计词义消歧研究中采用的多种方法和技术,指出了统计词义消歧研究的关键问题,并围绕关键问题阐述了统计词义消歧的研究进展,探讨了研究中存在的问题和未来研究的重点.  相似文献   

3.
为了解决传统查询扩展时查准率低下的问题,基于词义消歧技术提出一种综合扩展语义树和词频共现率的语义查询扩展方法.针对查询词歧义所带来的查询主题漂移现象,利用WordNet知识源及其领域信息进行查询词义消歧,进而根据WordNet的层次结构生成扩展语义树,产生候选扩展词,并根据待扩展词与用户查询的整体最大相关性原则最终确定扩展词及其权重,使得扩展词能够充分表达用户查询请求,提高查询匹配准确率.实验表明,该方法在保证查全率的同时获得了较高的查准率.  相似文献   

4.
首先分析了古汉语词义义项的分布情况与特点,考察了词义消歧的难点.然后在现有的词义消歧理论和方法的基础上,基于机器自动学习的统计模型条件随机场,选择上下文的词及其词性的复合特征,并加入其他适当语言学特征,设计6个不同的模板,对"將"、"如"、"我"、"信"、"聞"、"之"等古汉语高频词进行了词义消歧实验.实验最高平均F值达到了83.04%,高于最大熵、朴素贝叶斯模型,结果表明,选择合适的特征,条件随机场模型在古汉语词义消歧方面有效可行.  相似文献   

5.
基于信息增益改进贝叶斯模型的汉语词义消歧   总被引:2,自引:0,他引:2  
词义消歧一直是自然语言处理领域的关键问题和难点之一。通常把词义消歧作为模式分类问题进行研究,其中特征选择是一个重要的环节。该文根据贝叶斯假设提出基于信息增益的特征选择方法,并以此改进贝叶斯模型。通过信息增益计算,挖掘上下文中词语的位置信息,提高贝叶斯模型知识获取的效率,从而改善词义分类效果。该文在8个歧义词上进行了实验,结果发现改进后的贝叶斯模型在消歧正确率上比改进前平均提高了3.5个百分点,改进幅度较大,效果突出,证明了该方法的有效性。  相似文献   

6.
基于等价伪译词模型的无指导译文消歧研究   总被引:1,自引:1,他引:1  
该文提出了一种基于等价伪译词进行无指导译文消歧的方法。该方法利用源语言岐义词不同语义下目标语译文的单义同义词集合,定义并构造等价伪译词。利用等价伪译词从目标语语料中自动获取大量已标注语义的目标语实例。由这些实例得到的目标语语义知识,可直接形成该等价伪译词的语义分类器。利用Hownet可将含目标歧义词的英语实例映射成汉语词集合,然后利用这个语义分类器进行译文消歧。在国际标准语义评测集上进行的测试表明,该方法优于其余两种自动获取已标注语料的系统,且与Senseval-2 ELS上可比较的最好无指导系统的性能相当。  相似文献   

7.
基于双词主题模型的半监督实体消歧方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
张雄  陈福才  黄瑞阳 《电子学报》2018,46(3):607-613
针对实体上下文信息主题漂移的问题,提出一种基于双词主题模型的实体消歧方法.方法考虑到实体在一定语义环境下具有不同的主题,且在同一文档中同时出现的其他实体在一定程度上能够帮助待消歧实体确定所指代内容,利用命名实体构建双词的思想,将协同实体关系融合到主题模型中,并在此基础上利用维基百科知识库,进行半监督消歧.本文最后在网络文本数据上进行了相关的实验,验证了所提算法的有效性.实验表明该方法有效的提高了实体消歧精度.  相似文献   

8.
9.
盛晓光  王颖  钱力  王颖 《电子与信息学报》2021,43(12):3442-3450
为解决学者与成果的精确匹配问题,该文提出了一种基于图卷积半监督学习的论文作者同名消歧方法。该方法使用SciBERT预训练语言模型计算论文题目、关键字获得论文节点语义表示向量,利用论文的作者和机构信息获得论文的合作网络和机构关联网络邻接矩阵,并从论文合作网络中采集伪标签获得正样本集和负样本集,将这些作为输入利用图卷积神经网络进行半监督学习,获得论文节点嵌入表示进行论文节点向量聚类,实现对论文作者同名消歧。实验结果表明,与其他消歧方法相比,该方法在实验数据集上取得了更好的效果。  相似文献   

10.
在英语中,多义词“go”是最为活跃的词之一,其词汇意义呈多义性。本文借助互联网语料库对其多义性进行阐释。其词义扩展机制主要体现在三方面:第一,词汇本身意义的扩展;第二,词性的转变;第三,词汇意义的虚化。  相似文献   

11.
Coding method for vector representation of engineering drawings   总被引:1,自引:0,他引:1  
Many engineering drawings exist today that are still subject to change yet do not have the benefit of computer-aided design and drafting because of the cost and difficulties associated with placing them into automated graphics systems. This paper describes a new efficient vector coding method which extracts vector information in real time from raster data acquired by optically scanning and digitizing. The resultant representation of the engineering drawing can be displayed on a CRT terminal or on a plotter as a hard copy, can be rapidly edited or revised to reflect future changes and facilitates fast transfer of drawings over telephone lines to other locations enabling remote viewing and changing. Experimental results in terms of data compaction are presented for a variety of engineering drawings, including one of the CCITT standard test documents.  相似文献   

12.
为进一步强化航道安全,解决海事CCTV人工值守、非自动化问题,提出了基于稀疏表示的船体检测方法。利用稀疏表示实现对船体的检测时,首先构建样本特征矩阵,然后利用K-SVD算法对样本特征矩阵进行学习,得到冗余字典,最后对测试样本进行重构,根据马氏距离判断测试样本属性。通过与传统方法的试验比较,实验结果表明,该算法实时性好、检测准确率高,可以很好地对CCTV视频监控的船体进行检测与跟踪,解决CCTV人工值守、非自动化问题,节省大量人力资源。  相似文献   

13.
目前计算机辅助翻译在相似度计算方面存在很大的局限性,精度较低。针对特定领域,收集领域相关的训练语料,采用Google的word2vec进行英语和汉语的词向量模型构建,设计并实现汉语句子的相似度计算方法,提出基于词向量Jaccard相似度与基于词向量依存句法相结合的相似度计算方法,实验结果显示其效果比传统方法有较大提升。最后,将相关英汉句子相似度算法以接口的形式封装,作为商品化软件华建IAT系统的相似度计算模块投入实际应用。  相似文献   

14.
针对传统短语对齐方法依赖外部资源,且较少涉及平行句对内在特征的问题,提出了融入双语词向量的韩汉名词短语对齐方法.利用平行语料,分别训练单语词向量再进行跨语言映射得到双语词向量,并构建了基于短语构成规律的短语抽取和融入双语词向量、短语长度和词性相似度的短语对齐模型.实验结果证明,融入韩汉双语词向量,能更有效地提取短语特征从而实现短语对齐.  相似文献   

15.
对于帧率上变换算法中运动矢量估计不准确的问题,文中提出了一种新的运动矢量处理算法,较好地纠正了错误的运动矢量。该算法根据前后向运动矢量的一致性程度,以及对应块的绝对差值和,对运动矢量进行了可靠性分类。针对分布在纹理相似区的错误运动矢量,利用时间和空间相关性联合纠正;对于物体边缘区域则分解为小块重搜索运动矢量,以避免边缘模糊现象。实验结果显示,算法可以较好地纠正运动矢量。  相似文献   

16.
Rayleigh信道下的支持向量机多用户检测方法   总被引:3,自引:1,他引:3  
在BPSK调制的DS-CDMA中,基于支持向量机(Support Vector Machine,SVM)的多用户检测方法采用支持向量机的分类方法将接受向量分成+1和-1两类,达到检测的目的。与MMSE方法不同的是,支持向量机分类器的目的是找出一个能将训练向量中信号为+1和信号为-1的两类数据分离的最佳分离超平面。从数值仿真结果可以看出,在Rayleigh信道,这种支持向量机的多用户检测方法与MMSE多用户检测器相比,输出能达到较低的误码率。  相似文献   

17.
提出了一种基于最佳权系数进行DOA估计的方法,构造了一种空间谱函数。利用对该空间谱谱峰进行搜索的方法代替了高次方程的求解,有效地避免了高次方程的求解过程中出现的“虚解”问题。该方法计算量小,易于实现。仿真结果表明,该方法是有效的。  相似文献   

18.
目前抑郁症的诊断手段单一、诊断率低,为此,文章提出一种基于词向量的SVM集成学习社交网络抑郁倾向检测方法。人工标注和专家校验获得训练数据,使用词向量进行文本向量化。以SVM为基分类器进行Boosting集成学习。实验结果表明,文章提出的模型可以用于抑郁倾向的检测。  相似文献   

19.
A new method for detecting and suppressing impulsive noise in color images is presented in this paper. The proposed method is a type of switching vector filters, where the impulse detection is based on the order-statistic information about the color samples in the horizontal, vertical, and diagonal directions. The new solution first uses quaternion-based representation of color differences and median deviation-based techniques to search for the edge direction with the maximum number of similar pixels, and then utilizes the samples aligning with this edge direction to judge whether the current pixel is noisy or not and control the switching between identity (no filtering) and vector median filtering actions. Extensive experimental comparisons exhibit the validity of the proposed approach by showing significant performance improvements over other well-known color image filtering techniques.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号