首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
介绍了蒙古语词性标注系统的设计思想、实现方法及标注系统的主要功能.该系统采用基于规则和统计相结合的方法对蒙古语句子进行分类,并对已分类的句子进行词性自动标注.  相似文献   

2.
设计并实现了一种基于单带非线性的蒙古语词干提取自动机模型.该模型采用单输入带自动机模型,使用一种具层次的主从式非线性蒙古词语表示方式.所设计的单带非线性自动机是新的解决蒙古词干提取问题的方法.  相似文献   

3.
蒙古语语料库的研究与建设   总被引:3,自引:0,他引:3  
论述了蒙古语语料库的建设所涉及的重要问题.详细讨论了语料库的结构,包括总体框架结构和实现的表结构,语料的加工及统计分析.简单介绍了蒙古语语料库在语音合成、形码到音码的转换、文字识别后处理方面的应用.  相似文献   

4.
蒙古语中辅音的送气与不送气,向来解释为强弱之分.一般认为[p][k][t]等不送气音和[p‘][t‘][k‘]等送气音的主要区别为前者气流弱后者气流强.针对蒙古语中塞音和塞擦音的送气和不送气现象,提取蒙古语中塞音和塞擦音的声门上压力和气流量,并借实验语音学的方法对其进行对比分析,得出蒙古语辅音不送气/送气的区别,不只是简单的气流、气压的强弱之分,更主要在于辅音除阻段的长度的不同.  相似文献   

5.
针对藏语区别于英语和汉语,分析藏语的构形特征,得到词性标注集.从人工标注的语料中统计词和词性频率以及训练得到二元语法的HMM模型参数,运用Viterbi算法完成基于统计方法的词性标注.  相似文献   

6.
利用多资源转化方法进行词性标注研究, 旨在将源端资源的标注进行转化, 以符合目标端标注规范, 进而将转化后的资源与目标资源合并, 增大训练数据规模。做了两方面创新: 在转化过程中, 额外利用指导特征的置信度信息; 在转化后的资源中, 用模糊标注表示方法减少错误标注。实验表明, 利用置信度信息能有效帮助转化, 而模糊标注表示方法的影响不大。  相似文献   

7.
刘留 《科技信息》2010,(25):172-172,418
随着经济的发展和文化的交流,德语中引入了许多的英语外来词,这对德语语言本身产生了很大的影响。由于英语和德语的名词在词性方面具有差异,因此德语中引入一个名词性英语外来词时就会存在确定词性的问题。本文对德语中英语名词的词性问题进行了分析和概括,为汉语中外来词的发展规律和划分提供一个依据,也为汉语外来词的融入和应用提供借鉴。  相似文献   

8.
面向信息处理的蒙古语词语分类体系研究   总被引:2,自引:0,他引:2  
提出面向信息处理的现代蒙古语词语分类体系及其标记集,并且对分类体系中的15个词类的分布特征从形态变化、句子成分功能和短语组合功能等方面进行了描述。  相似文献   

9.
本文通过计算机的图像处理技术和计算机的自动识别功能应用到化学领域中和有机谱图解析技术有机的结合,解决了化学中有机谱图的人工比对、解析问题,实现自动识别功能,从而避免了因人为因素造成的识别效率低和解析困难等情况。具有准确、高效等特点,有非常好的实际应用价值。  相似文献   

10.
蒙古语松紧元音言语空气动力学   总被引:1,自引:0,他引:1  
基于实验的方法,对标准蒙古语松紧元音的言语空气动力特征进行了描述,找出了元音的松紧性变化和舌位的移动对于气流率、声门阻力、发声效率等6项空气动力参数的影响,并从元音的松紧和舌根位置的关系方面,验证了标准蒙古语的元音松紧和舌根位置变化有相互附带的关系。  相似文献   

11.
切分歧义是影响汉语自动分词系统精度的一个重要因素.时间语词包括指明事件发生确定时间位置的时点时间词和指明动作或状态持续一段时间的时段时间词.基于现代汉语语料库加工规范,特定类型的时间语词存在切分歧义及考察时间语词的语用,提出了基于时间语词上下文词性信息的统计语言模型和基于极大似然原理的消解这类歧义的算法,其开放测试正确率约为90%.  相似文献   

12.
一个改进的汉语词性标注系统   总被引:5,自引:0,他引:5  
汉语词性标注的难点在于确定具有多个词类的词(兼类词)在上下文中的词性。基于兼类词在词典中仅占很小的比例(约为3%),提出了具有双重状态的隐马尔可夫模型,它不但有一个常规的状态转移概率矩阵,还在逻辑上为每个具有多个词类的词保留一个专有的状态转移概率矩阵,使模型从一个状态转移到另一个状态的概率不再和观察无关,提高了模型的精确性。  相似文献   

13.
40000 new entries are added to CiLin in knowledge engineering. Statistics are presented about the sense ambiguity of Chinese words in CiLin. An automatic solution is proposed for the problem of Chinese sense disambiguation, which utilizes the heuristics of part-of-speech tagging and Naive Bayesy classification based on a partially disambiguated corpus.  相似文献   

14.
文章以维吾尔文为对象,提出了一种汉维对齐的维文语料库获取方法,通过对照汉维特点,首先对维文进行词干切分,并在此基础上借助词干表和词频表进行词性标注,然后对汉维进行对齐,从而实现汉维双语语料库的获取,对维文及其他少数民族语言的分析及研究提供一种可行的方法.  相似文献   

15.
词向量具有良好的语义特性,可用于改善和简化许多自然语言信息处理应用。本研究利用CBOW和Skip-gram两种模型架构在不同数据和不同维度下训练蒙古语词向量,然后结合蒙古语特征设计一个语义语法综合测试集,并在此测试集上用语义和语法相似度来评测词向量质量。研究结果表明,蒙古语语义和语法相似性任务上,Skip-gram模型优于CBOW模型,Skip-gram模型的窗口大小为5的情况下,词向量质量最好,且随着词向量维度或训练数据的增大,词向量质量有明显的提高。  相似文献   

16.
介绍了一个基于PSOLA合成技术的蒙古语文语转换系统,系统针对蒙古语自身的特点,采用了语音合成领域比较成熟的波形编辑合成技术,也建立了实用的蒙古语语音合成音库,音库基元都进行了基音标记,在韵律修改中也做了尝试。  相似文献   

17.
划分词类时 ,马氏既依据意义又依据位置 ,从而得出“词无定类”的结论 ;对“次”的分析 ,依据名代诸字在句读中所处的位置 ;马氏认为虚词的使用与语序的关系十分密切 ,句读卷中马氏分析了各种语序倒置的情况 ;马氏的语序分析已涉及到语用。  相似文献   

18.
针对目前存在使用条形码识读困难的问题,以条形码技术在销售、结算模块中的应用实现为例,解决了在商业POS系统应用中条形码的识读及其应用于实际商业POS系统的有关问题.  相似文献   

19.
针对目前存在使用条形码识读困难的问题,以条形码技术在销售、结算模块中的应用实现为例,解决了在商业POS系统应用中条形码的识读及其应用于实际商业POS系统的有关问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号