首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 265 毫秒
1.
本文根据现有的维吾尔文语音识别语音库的不足,以自然口语为对象研究维吾尔语的语音特征,提出了适合该语言的电话语音语料库设计方案,其中包括了维吾尔语电话语音库的文本设计、发音人的选择、语音录制、语音库的标注和后期处理方法等.本文从构建的350个说话人的维吾尔语电话语音语料库中挑选50个目标人提供给基于GMM-UBM/SVM的维吾尔语电话信道说话人识别的研究.  相似文献   

2.
语音语料库是语音识别和语音合成技术研究的基础.由于维吾尔语文字与语音特征、维吾尔语语音语料库的建立、管理、使用之工作不仅工作量巨大,且具有一定的复杂性,这就不得不开发维吾尔语语音数据库管理软件.本文首先研究维吾尔语语音语料库的设计过程,包括语音文本的设计、语音录制、语音库的标注、并在此基础上论述维吾尔语语音语料管理软件的总体功能设计以及部分关键技术的实现方法.  相似文献   

3.
本文研讨缺乏语言资源的民族语言(如维吾尔语)中如何引用语音技术、开发应用系统问题.提出基于GMM-UBM混合SVM技术方法实现实用性说话人识别系统,通过小语料人工标注语音语料预选高精度声学根(seed)模型、再引导大语料训练生成鲁棒性声模提高连续语音识别精度实现汉民会话语音翻译系统.对维吾尔语70人发话电话语音识别实验结果显示,基于GMM-UBM -SVM方法的不特定说话人识别实验其正确识别率为94.3%,比先行GMM-UBM方法精度提升3%;基于seed声模HTK-Julius技术的维吾尔语连续语音识别实验,其识别率为72.5%,比直接使用语音文本对齐语料单靠HTK实现识别方法(63.2%)精度提高9.3%;同时本研究讨论基于Moses技术的汉维医院门诊会话语音翻译系统预测Blue值达到了57.7%.  相似文献   

4.
维吾尔语句子边界识别算法的设计与实现   总被引:2,自引:0,他引:2  
本文分析维吾尔语的句子结束形式,研究维吾尔语句子边界规则,给出了句子划分思路,并实现了维吾尔语句子边界识别算法及程序.在对大量手工划分句子语料进行统计测试结果表明,该句子边界识别程序准确率超过98.7%.维吾尔语句子边界识别的研究对实现维吾尔语词性标注系统、维吾尔语句法分析器、机器翻译等众多领域有着很高的实际意义.  相似文献   

5.
构建维吾尔语框架语义知识库是自然语言处理的基础性工程,目前大部分工作基于人工。从真实语料库中抽取包含将要描述词元的例句,为例句标注以及这些例句的配价模式进行深入研究,从标注好的维吾尔语例句中提取维吾尔语词元和例句填充到维吾尔语框架库,构建维吾尔语词元库和例句库,实现维吾尔语语义框架网络的自动构造之目的。本文对维吾尔语真实语料库中抽取的例句中标注对象进行初步分析,论述了人机交互式基于阿拉伯字符的UFN例句辅助标注系统的功能模块设计和工作流程。介绍了UFN例句辅助标注系统的例句标注界面和词元标注报告、词条报告的自动生成演示界面。  相似文献   

6.
Eml文件是当前流行的邮件正文格式之一,国内国际对汉、英、俄语种的识别和研究技术已比较成熟,但维吾尔语、哈萨克语及阿拉伯语研究还处于起步阶段.本文研究了包含汉、维、哈、阿拉伯、俄、英文六个语种的eml文件编码格式及编码获取算法,尤其是采用维吾尔语、哈萨克语及阿拉伯语书写的的eml邮件,正确解析邮件头信息和正文内容,实现了对eml文件的语种精确识别.  相似文献   

7.
本文应用语音信号的傅里叶谱的谱矩距离判决准则选择特征谱实现了语音的自动识别.实验表明,用这种方法实现的语音识别系统对三字一组的汉语数字语音串,识别精度约为99.8%。拒识率约为1%。  相似文献   

8.
采用基于段长分布的非齐次隐马尔可夫模型(DDBHMM)进行维吾尔语声学建模。在新语料下由于总词汇量的成倍增加导致识别时间倍增,为缩短识别时间将耗时最长的概率计算部分采用多线程机制优化了识别模块,同时加入了端点检测进行控制,并相继设计了录音模块、特征提取模块、波形显示及结果输出显示模块等,对这些模块进行集成界面化后产生了一个基于DDBHMM的维吾尔语连续语音声学层实时识别系统,并对系统进行了测试及验证.  相似文献   

9.
研制《维吾尔语词语分类体系及其标记集》是维吾尔文信息处理的支柱工程.动词在维吾尔语句子构成中常常是一个句子的核心.本文在以往有关维吾尔语诃胜标注研究成果的基础上,提出了一个面向信息处理的现代维吾尔语动词体系及其标记集,并且对维吾尔语动词的形态特征、语法范畴以及短语组合功能等方面进行了详细的描述.  相似文献   

10.
语谱 图在语音分析方 面 有着广泛 的应用.音素的 自动分割是语音识别过程中的一个基本阶段,它 将把语音句子按音素特征 进行分割.本文提出 了一 个音素 自动分割的方法 ;使用了两个表示 语谱图密度变化 的形变函 数,以及 自适应阂值技术来 定位每个音素段的边 缘.这个方法在 计算机 上 具体实现 后.我们对取于 一 个 语谱图数据 库的一组 实验数据,用本 文所介绍 的自动分割方法划分 音素,将所得结果与 由一 语音学家分 割的结果进行 比较,得到 的识别率高于 93 %.这 个方法作为语音识别系 统的一 部分.已经在一 个语音分析 系统中使用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号