首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 10 毫秒
1.
为了将统计机器翻译技术中的规则信息引入到端到端的神经网络模型中,提出了一种将规则信息转化为近似等价的序列信息的方法.在此基础上,提出了两种融入规则信息的神经机器翻译模型,并在基于注意力机制的循环神经网络(RNN)模型上进行了验证.相对于未融入规则信息的基准模型在美国国家标准与技术研究院(NIST)评测集上的评测结果,上述两种模型的双语互译评估(BLEU)值均有所提高.实验表明,将规则等外部知识融入到神经机器翻译系统中是提升模型翻译质量的一种有效途径.  相似文献   

2.
现有的神经机器翻译模型的注意力机制仅考虑目标端对应源端的关联信息,未考虑源端单词之间的关联信息.通过在源端进行关联性建模,融入依存关联指导,以此加强源端单词之间的关联性,提高机器翻译的性能.首先构建源端隐藏层之间的关联性,其次构建依存关联损失函数,从而将依存关联指导融入基准的神经机器翻译系统.利用循环神经网络基准模型和Transformer基准模型分别在大规模的中-英测试数据集上进行实验,结果表明,相较于基准神经机器翻译系统,融入依存关联指导可以有效提升机器翻译质量.  相似文献   

3.
白桦 《科技信息》2006,(11):341-342
本文论证了汉字笔画笔顺的利用规律,创造发明了只需输入汉字头几笔画,即可检字的电脑用新输入法。  相似文献   

4.
神经机器翻译综述   总被引:1,自引:0,他引:1  
机器翻译研究在非人工干预的情况下,利用计算机自动地实现不同语言之间的转换,是自然语言处理和人工智能的重要研究领域,神经机器翻译(neural machine translation,NMT)利用神经网络实现源语言到目标语言的转换,是一种全新的机器翻译模型.神经机器翻译经过最近几年的发展,取得了丰富的研究成果,在很多语言对上超过了统计机器翻译方法.首先介绍神经机器翻译的基本思想和主要方法,然后对最新的前沿进展进行综述,最后对神经机器翻译的未来发展方向进行展望.  相似文献   

5.
提出一种基于笔画的汉字编码输入法,将汉字的所有笔画按特征分为8类,以简单的规则形成汉字的简易编码,易学易记;在此基础上增加少量几个高频部件形成高效编码,大大地降低了重码率;同时提出容错编码,使有错误笔顺习惯的人都能正确输入汉字;最后,对实现过程中的有关问题进行讨论.  相似文献   

6.
本文认为,长期以来,我们受西方语言学的影响,普遍认为"一个汉字通常表示口语里的一个语素,代表的是这个语素的声音",对汉字笔画表意作用没有正确的认识.这就使我们的识字教学不能正确阐述字形和字义的关系.就识字教学而言,笔画的表意功能是不可忽视的.其实,笔画具有表意功能是有客观依据的,正确认识笔画的表意功能也是非常必要的.  相似文献   

7.
8.
拼音笔画混合汉字输入法是一种能方便地在同一输入状态中随意使用拼音或笔画输入同一字词的数字键盘智能输入法。在概述该输入法的基础上,给出了其单字、词语输入的算法描述,以期为该输入法的应用与现实提供参考。  相似文献   

9.
对自然手写体汉字联机识别系统中笔画和字根提取问题作了深入研究,提出并改进了有关策略和算法实现。经深入分析和测试结果表明,由于充分考虑了自然手写体汉字的书写习惯和结构特征,技术策略和算法实现具有高稳定性和变形容忍度。  相似文献   

10.
现有计算机在指导手写汉字练习与测试中,指导依据大都基于全局特征,缺少基于更细粒度特征。提出一种基于局部信息的手写汉字笔画提取方法,为手写汉字评价与指导等任务提供数据支持。首先提取出汉字骨架并对骨架中的毛刺与断裂等问题进行优化;然后使用PBOD算法提取汉字交叉区域后,对交叉区域进行合并删除,消除笔画形变,通过局部信息计算笔画段的组合系数,根据组合系数提取笔画;最后根据获取到的笔画数与算法迭代次数,动态调整组合系数阈值,保证在正确连接笔画段的前提下提取到更可能多的笔画。将该方法在手写汉字数据集上进行实验,其准确率、召回率与F1值分别达到了95.91%、95.71%与95.81%,可用于后续的手写汉字评判与指导等任务。  相似文献   

11.
为了提高机器翻译模型的泛化能力,基于神经机器翻译系统,将系统融合技术应用于模型训练过程.在神经机器翻译系统的基本结构——编码器-解码器结构的基础上,提出5种融合方法(平均融合、权重融合、拼接融合、门机制融合和注意力机制融合)分别应用于多个编码器-一个解码器的融合、多个编码器-多个解码器的融合和一个编码器-多个解码器的融合.在中英翻译任务上进行实验,相对于基准系统,系统融合方法改进的机器翻译模型的机器双语互译评估(BLEU)值最终提升了0.59~3.01个百分点.实验结果表明,系统融合能有效地提升译文质量.  相似文献   

12.
构建一个提供评测工具的笔画基准测试库, 其中包含一个人工搭建的笔画数据库, 该数据库拥有4种字体的汉字图像以及对应的人工提取的笔画信息。通过比较算法自动提取的笔画结果和数据库中的标准笔画之间的差异, 测试库可以评测笔画自动提取算法的性能。还提出一种新的基于Delaunay三角剖分的方法, 可以有效地从汉字图像中提取出笔画信息。在测试库中对现有的3 种笔画提取方法进行比较, 实验数据表明, 所提出的笔画基准测试库能够对笔画提取算法给出有效的评测, 并且新的算法在汉字笔画提取的性能中效率较高。  相似文献   

13.
针对汉字字形设计和开发的困难, 提出基于特征点抽象的汉字字形描述方法和汉字字形生成方法, 研究特征点、特征表达式、特征点的权值和权矢量等在汉字字形生成中的应用技术和方法, 并以点的生成为例, 设计汉字点笔画的生成算法, 并进行验证实验。实验结果证明该算法可靠并实用, 可切实提高汉字字形设计的效率, 为汉字其他笔画的生成提供一种解决方案。  相似文献   

14.
面向字形分析的联机手写汉字笔画识别   总被引:1,自引:0,他引:1  
介绍了一种面向字形分析的联机手写输入汉字的笔画识别方法,并给出实现算法.该方法首先找出笔画的关键点,然后将笔画分割为小笔画段,再将其合并为较大的笔画段.实验表明,处理后的笔画成为类型确定的笔画段或笔画段的组合,易于规整化为内部模型.  相似文献   

15.
为了实现智能化汉字书写教学,提出一种手写汉字图像的笔画还原方法。首先提取手写汉字图像的骨架;然后从知识工程的角度出发,利用字形中稳定的拓扑信息,消除骨架中的歧义变形;最后利用A*算法建立并求解手写汉字与相应模板汉字的字形相似度模型,从而分割出手写汉字图像中的各个笔画,并输出它们与模板汉字中各个笔画的对应关系。此方法的笔画还原结果可以应用于手写汉字规范性的自动化评判等场合。  相似文献   

16.
本文选取英文段落分别让谷歌神经机器翻译系统和英语专业学生进行翻译,并对两者的翻译效果进行了分析。经对比分析,两者的翻译质量均存在一定的问题。本文对译文的问题进行了具体分析。两者译文质量的同步提升,方能保证翻译质量,顺利、高效地完成翻译任务。  相似文献   

17.
现有最先进的神经机器翻译模型大都依赖于多层神经网络结构,针对多层网络结构易导致信息退化的问题,提出通过融合层与层之间的输出信息来改善各个层之间的残差连接关系的方法,从而使得层与层之间联系更紧密.相比于原来的残差网络连接,进一步优化了深层网络的信息流动结构,使得整个结构有效信息流动更充分.在Transformer模型和序列到序列的卷积(convolutional sequence to sequence,Conv S2S)模型上进行相关实验,大规模中-英翻译任务的实验结果表明,该方法提高了Transformer和Conv S2S的翻译性能.  相似文献   

18.
针对汉语-越南语(简称汉越)平行语料受限的问题,提出了一种基于迁移学习的汉越神经机器翻译(TLNMT-CV)模型.在训练汉语-英语、英语-越南语的翻译模型的基础上,通过迁移学习方法,利用训练得到的汉语端编码器和越南语端解码器,分别对汉越翻译模型的编码器与解码器参数进行初始化,并使用小规模汉越语料进行微调优化,得到TLN...  相似文献   

19.
依赖于大规模的平行语料库,神经机器翻译在某些语言对上已经取得了巨大的成功.然而高质量平行语料的获取却是机器翻译研究的主要难点之一.为了解决这一问题,一种可行的方案是采用无监督神经机器翻译(unsupervised neural machine translation,UNMT),该方法仅仅使用两门不相关的单语语料就可以进行训练,并获得一个不错的翻译结果.受多任务学习在有监督神经机器翻译上取得的良好效果的启发,本文主要探究UNMT在多语言、多任务学习上的应用.实验使用3门互不相关的单语语料,两两建立双向的翻译任务.实验结果表明,与单任务UNMT相比,该方法在部分语言对上最高取得了2~3个百分点的双语互译评估(BLEU)值提升.  相似文献   

20.
由于神经机器翻译模型具有大规模参数且其性能极大地依赖大规模高质量平行语料,当训练数据规模小于模型复杂度时,模型易出现过拟合问题而泛化能力不足.针对此问题,研究了词级别的正则化技术,通过对模型输入句子中的单词进行随机干扰,以此削弱数据的特异性,从而抑制模型对于数据的过度学习,防止过拟合,提高模型的泛化能力.通过Trans...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号