期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

热依曼·吐尔逊依皮提哈尔·买买提吾守尔·斯拉木《新疆大学学报(理工版)》2013,(2):199-203

本文根据现有的维吾尔文语音识别语音库的不足,以自然口语为对象研究维吾尔语的语音特征,提出了适合该语言的电话语音语料库设计方案,其中包括了维吾尔语电话语音库的文本设计、发音人的选择、语音录制、语音库的标注和后期处理方法等.本文从构建的350个说话人的维吾尔语电话语音语料库中挑选50个目标人提供给基于GMM-UBM/SVM的维吾尔语电话信道说话人识别的研究. 相似文献

2.

维吾尔语语音语料库管理软件的研究与实现

热依曼·吐尔逊依皮提哈尔·买买提《新疆大学学报(理工版)》2011,28(2)

语音语料库是语音识别和语音合成技术研究的基础.由于维吾尔语文字与语音特征、维吾尔语语音语料库的建立、管理、使用之工作不仅工作量巨大,且具有一定的复杂性,这就不得不开发维吾尔语语音数据库管理软件.本文首先研究维吾尔语语音语料库的设计过程,包括语音文本的设计、语音录制、语音库的标注、并在此基础上论述维吾尔语语音语料管理软件的总体功能设计以及部分关键技术的实现方法. 相似文献

3.

语音技术在少数民族语言的应用研究

达瓦.伊德木草木合亚提.尼亚孜别克吾守尔.斯拉木《新疆大学学报(理工版)》2014,(1):88-96

本文研讨缺乏语言资源的民族语言（如维吾尔语）中如何引用语音技术、开发应用系统问题．提出基于GMM-UBM混合SVM技术方法实现实用性说话人识别系统,通过小语料人工标注语音语料预选高精度声学根（seed）模型、再引导大语料训练生成鲁棒性声模提高连续语音识别精度实现汉民会话语音翻译系统．对维吾尔语70人发话电话语音识别实验结果显示,基于GMM-UBM -SVM方法的不特定说话人识别实验其正确识别率为94.3%,比先行GMM-UBM方法精度提升3%;基于seed声模HTK-Julius技术的维吾尔语连续语音识别实验,其识别率为72.5%,比直接使用语音文本对齐语料单靠HTK实现识别方法（63.2%）精度提高9.3%;同时本研究讨论基于Moses技术的汉维医院门诊会话语音翻译系统预测Blue值达到了57.7%．相似文献

4.

维吾尔语句子边界识别算法的设计与实现 总被引：2，自引：0，他引：2

阿比达·吾买尔吐尔根·依布拉音《新疆大学学报(理工版)》2008,25(3)

本文分析维吾尔语的句子结束形式,研究维吾尔语句子边界规则,给出了句子划分思路,并实现了维吾尔语句子边界识别算法及程序.在对大量手工划分句子语料进行统计测试结果表明,该句子边界识别程序准确率超过98.7%.维吾尔语句子边界识别的研究对实现维吾尔语词性标注系统、维吾尔语句法分析器、机器翻译等众多领域有着很高的实际意义. 相似文献

5.

维吾尔语框架语义例句辅助标注系统的设计与实现

米热吉古丽·热扎克阿里甫·库尔班《新疆大学学报(理工版)》2014,(4):475-480

构建维吾尔语框架语义知识库是自然语言处理的基础性工程,目前大部分工作基于人工。从真实语料库中抽取包含将要描述词元的例句,为例句标注以及这些例句的配价模式进行深入研究,从标注好的维吾尔语例句中提取维吾尔语词元和例句填充到维吾尔语框架库,构建维吾尔语词元库和例句库,实现维吾尔语语义框架网络的自动构造之目的。本文对维吾尔语真实语料库中抽取的例句中标注对象进行初步分析,论述了人机交互式基于阿拉伯字符的UFN例句辅助标注系统的功能模块设计和工作流程。介绍了UFN例句辅助标注系统的例句标注界面和词元标注报告、词条报告的自动生成演示界面。相似文献

6.

多语种eml文件编码及语种识别算法研究

《新疆大学学报(理工版)》2010,(4)

Eml文件是当前流行的邮件正文格式之一,国内国际对汉、英、俄语种的识别和研究技术已比较成熟,但维吾尔语、哈萨克语及阿拉伯语研究还处于起步阶段.本文研究了包含汉、维、哈、阿拉伯、俄、英文六个语种的eml文件编码格式及编码获取算法,尤其是采用维吾尔语、哈萨克语及阿拉伯语书写的的eml邮件,正确解析邮件头信息和正文内容,实现了对eml文件的语种精确识别. 相似文献

7.

用谱矩分析法实现语音的识别

张礼和钱守廉《浙江大学学报(理学版)》1985,12(1):57-61

本文应用语音信号的傅里叶谱的谱矩距离判决准则选择特征谱实现了语音的自动识别.实验表明,用这种方法实现的语音识别系统对三字一组的汉语数字语音串,识别精度约为99.8%。拒识率约为1%。相似文献

8.

基于DDBHMM的维吾尔语语音声学层识别系统研究

《新疆大学学报(理工版)》2010,(4)

采用基于段长分布的非齐次隐马尔可夫模型(DDBHMM)进行维吾尔语声学建模。在新语料下由于总词汇量的成倍增加导致识别时间倍增,为缩短识别时间将耗时最长的概率计算部分采用多线程机制优化了识别模块,同时加入了端点检测进行控制,并相继设计了录音模块、特征提取模块、波形显示及结果输出显示模块等,对这些模块进行集成界面化后产生了一个基于DDBHMM的维吾尔语连续语音声学层实时识别系统,并对系统进行了测试及验证. 相似文献

9.

面向信息处理的维吾尔语词语分类体系及标记研究(Ⅱ)

阿里甫·库尔班吾买尔江·库尔班吐尔根·伊布拉音《新疆大学学报(理工版)》2010,27(1):106-112,116

研制《维吾尔语词语分类体系及其标记集》是维吾尔文信息处理的支柱工程．动词在维吾尔语句子构成中常常是一个句子的核心．本文在以往有关维吾尔语诃胜标注研究成果的基础上，提出了一个面向信息处理的现代维吾尔语动词体系及其标记集，并且对维吾尔语动词的形态特征、语法范畴以及短语组合功能等方面进行了详细的描述．相似文献

10.

语音识别中基于语谱图的语音音素分割方法

潘凌云孙达传《浙江大学学报(理学版)》1995,22(1):43-46

语谱图在语音分析方面有着广泛的应用.音素的自动分割是语音识别过程中的一个基本阶段,它将把语音句子按音素特征进行分割.本文提出了一个音素自动分割的方法 ;使用了两个表示语谱图密度变化的形变函数,以及自适应阂值技术来定位每个音素段的边缘.这个方法在计算机上具体实现后.我们对取于一个语谱图数据库的一组实验数据,用本文所介绍的自动分割方法划分音素,将所得结果与由一语音学家分割的结果进行比较,得到的识别率高于 93 %.这个方法作为语音识别系统的一部分.已经在一个语音分析系统中使用. 相似文献