首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 124 毫秒
1.
语音语料库是语音识别和语音合成技术研究的基础.由于维吾尔语文字与语音特征、维吾尔语语音语料库的建立、管理、使用之工作不仅工作量巨大,且具有一定的复杂性,这就不得不开发维吾尔语语音数据库管理软件.本文首先研究维吾尔语语音语料库的设计过程,包括语音文本的设计、语音录制、语音库的标注、并在此基础上论述维吾尔语语音语料管理软件的总体功能设计以及部分关键技术的实现方法.  相似文献   

2.
本文根据现有的维吾尔文语音识别语音库的不足,以自然口语为对象研究维吾尔语的语音特征,提出了适合该语言的电话语音语料库设计方案,其中包括了维吾尔语电话语音库的文本设计、发音人的选择、语音录制、语音库的标注和后期处理方法等.本文从构建的350个说话人的维吾尔语电话语音语料库中挑选50个目标人提供给基于GMM-UBM/SVM的维吾尔语电话信道说话人识别的研究.  相似文献   

3.
Eml文件是当前流行的邮件正文格式之一,国内国际对汉、英、俄语种的识别和研究技术已比较成熟,但维吾尔语、哈萨克语及阿拉伯语研究还处于起步阶段.本文研究了包含汉、维、哈、阿拉伯、俄、英文六个语种的eml文件编码格式及编码获取算法,尤其是采用维吾尔语、哈萨克语及阿拉伯语书写的的eml邮件,正确解析邮件头信息和正文内容,实现了对eml文件的语种精确识别.  相似文献   

4.
研制《维吾尔语词语分类体系及其标记集》是维吾尔文信息处理的支柱工程.动词在维吾尔语句子构成中常常是一个句子的核心.本文在以往有关维吾尔语诃胜标注研究成果的基础上,提出了一个面向信息处理的现代维吾尔语动词体系及其标记集,并且对维吾尔语动词的形态特征、语法范畴以及短语组合功能等方面进行了详细的描述.  相似文献   

5.
本文研讨缺乏语言资源的民族语言(如维吾尔语)中如何引用语音技术、开发应用系统问题.提出基于GMM-UBM混合SVM技术方法实现实用性说话人识别系统,通过小语料人工标注语音语料预选高精度声学根(seed)模型、再引导大语料训练生成鲁棒性声模提高连续语音识别精度实现汉民会话语音翻译系统.对维吾尔语70人发话电话语音识别实验结果显示,基于GMM-UBM -SVM方法的不特定说话人识别实验其正确识别率为94.3%,比先行GMM-UBM方法精度提升3%;基于seed声模HTK-Julius技术的维吾尔语连续语音识别实验,其识别率为72.5%,比直接使用语音文本对齐语料单靠HTK实现识别方法(63.2%)精度提高9.3%;同时本研究讨论基于Moses技术的汉维医院门诊会话语音翻译系统预测Blue值达到了57.7%.  相似文献   

6.
在维吾尔语语音识别研究工作中,由于语音标注工作量大、精度要求高,人工标注之后不可避免的存在各种错误,因此通过专门的复查软件来检查已标注过的文件并修改错误是必不可少的。对已标注的语音文件进行复查操作在语音识别研究中具有十分重要的作用,本文介绍了维吾尔语语音标注复查软件的必要性及基本原理,复查软件的功能及其实现过程的一些技术。  相似文献   

7.
采用基于段长分布的非齐次隐马尔可夫模型(DDBHMM)进行维吾尔语声学建模。在新语料下由于总词汇量的成倍增加导致识别时间倍增,为缩短识别时间将耗时最长的概率计算部分采用多线程机制优化了识别模块,同时加入了端点检测进行控制,并相继设计了录音模块、特征提取模块、波形显示及结果输出显示模块等,对这些模块进行集成界面化后产生了一个基于DDBHMM的维吾尔语连续语音声学层实时识别系统,并对系统进行了测试及验证.  相似文献   

8.
维吾尔语对偶词的自动识别是维吾尔语自然语言处理中的一项基础性工作.维吾尔语对偶词的自动识别是维吾尔语自动分词的难点之一,也是一个重点.在维吾尔语中,内部成分平等连接而形成的词汇单位叫做对偶词.本文首先介绍了对偶词的基本概念和特征,然后分析了维吾尔语对偶词的结构特征和结合规则.在字符串匹配算法的基础上,提出了一种基于规则的维吾尔语对偶词的识别算法,并通过试验证明了该算法的正确性.  相似文献   

9.
维吾尔语词性标注研究,是面向信息处理的维吾尔语语法分析的核心内容.本文提出面向信息处理的现代维吾尔语词语分类体系及其标记集,并且对分类体系中的12个词类的分布特征从形态变化、句子成分功能和短语组合功能等方面进行了描述.  相似文献   

10.
本文主要介绍基于规则的维吾尔语、哈萨克语机器翻译的设计与实现过程:(1)根据这两种语言之间的对应关系,构建了其词尾映射库、翻译规则库;(2)对源语言维吾尔语进行形态分析后,根据映射库和翻译规则,初步实现了基于规则的维吾尔语、哈萨克语机器翻译系统.在收集的维哈对齐的语料上做了实验,实验结果BLEU值为0.2,表明本文采取的方法是可行的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号