首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
译后编辑器是提高翻译系统译文质量的重要方法之一,它的效率影响整个翻译系统的质量和实用水平.目前,还未发现对维汉/汉维机器翻译译后编辑问题的专门研究.本文对维汉/汉维统计机器翻译系统的翻译结果进行分析,设计并实现了支持维汉/汉维编辑界面的译后编辑器,并详细介绍了编辑器的核心功能及其实现方法.该译后编辑器对维汉/汉维机器翻译系统生成的译文进行编辑,使用词干提取、拼写校对、lucence.net等技术提高了编辑效率.经编辑纠正后的译文校正稿以句子为单位保存在记忆库,人工纠正后的未登录词保存在词典数据库,进而提高机器翻译系统生成译文的质量.实验表明,此译后编辑器对基于实例和基于统计引擎的维汉/汉维翻译结果的后编辑提出了较好的解决方案.  相似文献   

2.
本文提出了一种基于规则库的多层过滤进行机器翻译的算法.该算法实现了英文人名向维吾尔文人名的自动翻译.该算法不同于传统的英维人名翻译系统所采取的方法,不需要建立丰富、全面的两种语言人名对齐词库.本算法在对已翻译的大量实例进行统计并分析的基础上,找出了英文与维文人名翻译的三层规则并设计出了本算法.  相似文献   

3.
双语短语对抽取是基于短语的统计机器翻译中短语翻译模型训练的关键步骤,但由于汉维平行语料库规模有限,数据稀疏问题严重.本文提出了一种改进的短语抽取算法,该算法首先考虑词对齐矩阵中一个汉语词对齐到多个维吾尔语词的情况(包括不连续),然后利用Och方法抽取短语对,最后考虑维吾尔语SOV语序结构特点,抽取双语短语.实验表明,该算法能够较准确地且尽可能多地抽取汉维短语对,从而提高翻译模型的质量.  相似文献   

4.
本文主要介绍基于规则的维吾尔语、哈萨克语机器翻译的设计与实现过程:(1)根据这两种语言之间的对应关系,构建了其词尾映射库、翻译规则库;(2)对源语言维吾尔语进行形态分析后,根据映射库和翻译规则,初步实现了基于规则的维吾尔语、哈萨克语机器翻译系统.在收集的维哈对齐的语料上做了实验,实验结果BLEU值为0.2,表明本文采取的方法是可行的.  相似文献   

5.
格助词在日本语和维吾尔语中都存在,有效的利用两种语言的格助词进行日-维机器翻译,研究它们的对应关系,即:-个日语格助词对应多个维语格助词的多意型问题;本文对两种语言格助词的翻译提出适当的解决方法.  相似文献   

6.
在基于实例的哈萨克语汉语机器翻译研究中,翻译质量的高低跟实例句子相似度计算方法有直接的关系.本文提出一种哈萨克语句子相似度计算方法,即采用基于词特征和基于向量特征相结合的相似度计算法,计算过程中使用了同义词替换.句子相似度计算中需要解决的关键问题是怎样快速匹配实例.为解决这个问题,所设计的快速查找模块能够快速从实例库中筛选出实例集合,进行相似度计算.实验结果表明:快速查找模块可以提高实例句子查找速度,同义词替换可以提高相似度准确性.  相似文献   

7.
维汉机器翻译词典的结构设计与实现   总被引:1,自引:1,他引:0  
机器翻译词典的设计是机器翻译系统关键之一.机器翻译词典的质量和信息量直接限定机器翻译系统的应用领域和覆盏范围.本文介绍机器翻译词典词条收集方法且讨论维汉机器翻译词典的设计原则、构造方法及其数据结构.  相似文献   

8.
维吾尔语句子边界识别算法的设计与实现   总被引:2,自引:0,他引:2  
本文分析维吾尔语的句子结束形式,研究维吾尔语句子边界规则,给出了句子划分思路,并实现了维吾尔语句子边界识别算法及程序.在对大量手工划分句子语料进行统计测试结果表明,该句子边界识别程序准确率超过98.7%.维吾尔语句子边界识别的研究对实现维吾尔语词性标注系统、维吾尔语句法分析器、机器翻译等众多领域有着很高的实际意义.  相似文献   

9.
本体论翻译在语义Web、知识联网和分布的协同工作等领域有重要作用.提出了一种基于OIL的本体论近似翻译算法ATO,旨在通过比较源、目标本体论所属对象类之间属性的相似度来实现近似翻译:将源本体论中的类翻译到目标本体论中和它最相似的类.  相似文献   

10.
双语语料库的自动对齐已成为机器翻译研究中一个十分重要的研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,本文根据汉文-维吾尔文的特点,在分析目前双语句子对齐方法的基础上,提出了基于译文的对齐方法,通过使用一部翻译较完整的词典作为桥梁,将汉维句子关联起来.根据维吾尔语文本中的单词,在词典中找到其对应的译文,并将译文到汉语句子中去匹配,根据评价函数和动态规划算法找到对齐句对.  相似文献   

11.
乳腺癌电子病历承载着丰富的乳腺癌诊断和治疗信息。对这些病历文本进行知识抽取并构建相应的知识图谱,有助于面向乳腺癌诊断的智能化数据分析及辅助决策支持系统的构建。本文以乳腺癌超声检查报告为研究样本,在知识抽取、知识图谱构建和应用开展实例研究。结合乳腺癌诊疗指南和临床专家经验,构建了乳腺癌诊断知识图谱本体及概念层;基于BiLSTM-Attention-CRF模型,开展了针对超声检查报告的知识抽取工作,模型的准确率、召回率及F1值均达到了96%以上;最后,构建知识图谱并开展可视化分析、数据查询、辅助诊断等应用研究。结果表明,所构建的知识图谱在帮助提高电子病历数据质量、提升临床诊疗效果和改善医学决策性能等方面具有较大的应用价值。  相似文献   

12.
指代消解的基本任务是识别篇章中对现实世界同一实体的不同表达.由于消解不同实体表达是自然语言理解的关键因素之一,因此许多学者在该领域做了大量的研究工作.本文将指代消解领域的经典算法综述为两大类:①基于启发式语言学规则的指代消解方法;②基于数据驱动的指代消解方法.在过去的几十年里,由于标注语料MUC,ACE和OntoNotes的出现,指代消解系统从基于启发性规则的消解方法转向基于数据驱动的消解方法.然而最近两年出现一个比较有趣的现象,只要能获取足够多的表达信息,基于启发性规则的方法也能取得很好的消解效果,基于启发性规则的方法又有兴起的趋势.随着指代消解研究的发展,它在其余自然语言处理技术中得到了广泛的应用,例如:机器翻译、信息抽取和自动文摘等领域.计算模型不精确、篇章知识匮乏以及缺少标注语料是限制指代消解发展的主要因素.未来,候选消解项的识别与抽取、跨文本指代消解、多语言的指代消解和各种深层篇章知识的联合利用将成为指代消解发展趋势.  相似文献   

13.
介绍了基于ICA(独立分量分析法)的牌照识别系统的字符识别.为了提高字符特征提取的质量,首先通过车牌图像的预处理,然后采用了基于高阶统计信息的特征提取方法,即ICA对车牌灰度图像的字符进行识别.该系统避免了二值化对字符特征的影响,识别方法简单,结果理想.  相似文献   

14.
原子事件抽取是将非结构化文本进行结构化表示的重要方法.针对新闻语料,本文提出了一种基于信息单元融合的原子事件抽取方法.在中文分词、词性标注、命名实体识别等自然语言处理技术的基础上,利用语言规则将信息单元标识出来并进行融合,达到浅层句法分析的效果,通过原子事件抽取算法将原子事件从经信息单元融合后的语料中抽取出来.基于信息单元融合的原子事件抽取方法不仅对文本长度没有严格限制,并且不受事件类型的约束;实验结果表明,基于信息单元融合的原子事件抽取方法是有效的.  相似文献   

15.
本文研讨缺乏语言资源的民族语言(如维吾尔语)中如何引用语音技术、开发应用系统问题.提出基于GMM-UBM混合SVM技术方法实现实用性说话人识别系统,通过小语料人工标注语音语料预选高精度声学根(seed)模型、再引导大语料训练生成鲁棒性声模提高连续语音识别精度实现汉民会话语音翻译系统.对维吾尔语70人发话电话语音识别实验结果显示,基于GMM-UBM -SVM方法的不特定说话人识别实验其正确识别率为94.3%,比先行GMM-UBM方法精度提升3%;基于seed声模HTK-Julius技术的维吾尔语连续语音识别实验,其识别率为72.5%,比直接使用语音文本对齐语料单靠HTK实现识别方法(63.2%)精度提高9.3%;同时本研究讨论基于Moses技术的汉维医院门诊会话语音翻译系统预测Blue值达到了57.7%.  相似文献   

16.
为适应点对点、实时城市配送对动态响应和快速决策提出的新要求, 研究了多种实时信息作用和影响下的取送货动态车辆路径问题. 采用将动态问题转化为一系列静态问题的建模方法, 建立了基于实时信息的取送货动态车辆路径模型; 设计了动态算法框架, 运用构造算法获得初始可行解, 运用禁忌搜索算法改善初始可行解质量. 实验表明, 本文的模型和算法能有效解决基于实时信息的取送货动态车辆路径问题, 将初始可行解的质量(实时物流配送成本)改善了34%.  相似文献   

17.
制药工业的一个主要趋势是整合传统意义上被认为早期阶段药物发现的分子描述.为了更好的将药物和非药物分类,本文提出了基于深度信念网络(DBN)的分类模型.首先,对分子特征进行预处理以保证有价值的信息得到保留,其次,该模型将DBN和反向传播(BP)分类器结合去对药物/非药物进行检测和分类.DBN由几个受限玻尔兹曼机(RBM)层组成,当特征向量转移到下一层时这些RBM层尽可能多的保留具有重要的影响的信息.BP层训练的最后一个RBM层生成特征分类.结果表明,该方法是提取高层次特征的药物和非药物分类任务中一种成功的方法,分类精度高达85.3%,高于传统的支持向量机和神经网络方法.同时,预处理对分子特征的提取更为有效,从而在一定程度上提高了分类的准确性.  相似文献   

18.
基于JPEG2000的压缩图像纹理信息重建   总被引:1,自引:0,他引:1  
提出了基于JPEG2000的压缩图像纹理信息重建的一种方法.该方法在编码端用高斯模型来描述图像的统计纹理信息,并对这些纹理信息进行统计和编码,在解码端根据编码的信息重建图像的纹理.通过和非线性量化扩展补偿法的结果在客观指标和主观品质上的比较,说明本文提出的方法可以通过较小的比特开销(低于10%)重建丢失的纹理信息,从而获取压缩图像的品质在主观视觉效果上的提高.  相似文献   

19.
鉴于先验信息与样本信息的不匹配, 会导致岩土参数的贝叶斯估计结果与实际产生偏差. 为解决该问题, 本文引入可信度贝叶斯估计的概念, 并结合相容性检验, 改进了基于KL散度的经典可信度计算公式. 最后, 以宁波地区典型土层的地基承载力为例, 对比改进可信度贝叶斯、经典可信度贝叶斯和经典贝叶斯的估计结果. 结果表明: 改进可信度贝叶斯方法能在充分利用先验信息的前提下, 提高样本信息在参数估计中的计算权重, 同时也避免了不匹配问题所导致的贝叶斯计算误差.  相似文献   

20.
为准确地找到最符合快衰落特性的统计分布模型,论文基于概率论和信息论设计了Kullback-Leibler距离及信息准则表达式,对几种主要的统计分布模型进行了仿真和实验,得到了各统计分布模型的正确识别率,通过统计的方式对比了各种识别模型,发现基于直方图的KL方法识别模型的可靠性比其他方法要高,而韦伯衰落模型更加适合用来对无线信道进行建模。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号