首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 62 毫秒
1.
语音语料库是语音识别和语音合成技术研究的基础.由于维吾尔语文字与语音特征、维吾尔语语音语料库的建立、管理、使用之工作不仅工作量巨大,且具有一定的复杂性,这就不得不开发维吾尔语语音数据库管理软件.本文首先研究维吾尔语语音语料库的设计过程,包括语音文本的设计、语音录制、语音库的标注、并在此基础上论述维吾尔语语音语料管理软件的总体功能设计以及部分关键技术的实现方法.  相似文献   

2.
本文根据现有的维吾尔文语音识别语音库的不足,以自然口语为对象研究维吾尔语的语音特征,提出了适合该语言的电话语音语料库设计方案,其中包括了维吾尔语电话语音库的文本设计、发音人的选择、语音录制、语音库的标注和后期处理方法等.本文从构建的350个说话人的维吾尔语电话语音语料库中挑选50个目标人提供给基于GMM-UBM/SVM的维吾尔语电话信道说话人识别的研究.  相似文献   

3.
构建维吾尔语框架语义知识库是自然语言处理的基础性工程,目前大部分工作基于人工。从真实语料库中抽取包含将要描述词元的例句,为例句标注以及这些例句的配价模式进行深入研究,从标注好的维吾尔语例句中提取维吾尔语词元和例句填充到维吾尔语框架库,构建维吾尔语词元库和例句库,实现维吾尔语语义框架网络的自动构造之目的。本文对维吾尔语真实语料库中抽取的例句中标注对象进行初步分析,论述了人机交互式基于阿拉伯字符的UFN例句辅助标注系统的功能模块设计和工作流程。介绍了UFN例句辅助标注系统的例句标注界面和词元标注报告、词条报告的自动生成演示界面。  相似文献   

4.
维吾尔语词性标注研究,是面向信息处理的维吾尔语语法分析的核心内容.本文提出面向信息处理的现代维吾尔语词语分类体系及其标记集,并且对分类体系中的12个词类的分布特征从形态变化、句子成分功能和短语组合功能等方面进行了描述.  相似文献   

5.
维吾尔语词性标注研究,是面向信息处理的维吾尔语语法分析的核心内容.本文提出面向信息处理的现代维吾尔语词语分类体系及其标记集,并且对分类体系中的12个词类的分布特征从形态变化、句子成分功能和短语组合功能等方面进行了描述.  相似文献   

6.
现代哈萨克语词级标注语料库的构建研究   总被引:2,自引:0,他引:2  
建设高质量的标注语料库是现代哈萨克语自然语言信息处理领域的基础性工程,本文根据哈萨克语独特的语言特点,进行词级带标注的哈萨克语语料库构建研究,首先介绍了不同语言语料库的国内外研究现状,随后针对语料库构建中涉及的主要问题,实现了哈萨克语词级基本语料库的设计与构建.  相似文献   

7.
维吾尔语句子边界识别算法的设计与实现   总被引:2,自引:0,他引:2  
本文分析维吾尔语的句子结束形式,研究维吾尔语句子边界规则,给出了句子划分思路,并实现了维吾尔语句子边界识别算法及程序.在对大量手工划分句子语料进行统计测试结果表明,该句子边界识别程序准确率超过98.7%.维吾尔语句子边界识别的研究对实现维吾尔语词性标注系统、维吾尔语句法分析器、机器翻译等众多领域有着很高的实际意义.  相似文献   

8.
本文将清华大学中文分词和词性标注系统应用于部分微博语料数据,检测系统对微博新词识别能力及对识别错误进行了分类总结,并对识别率低的新词制定了标注规范。通过人工校对获得新的训练语料数据集,提高系统对微博文本的处理能力,为建立微博专用语料库做前期准备工作。  相似文献   

9.
维吾尔语对偶词的自动识别是维吾尔语自然语言处理中的一项基础性工作.维吾尔语对偶词的自动识别是维吾尔语自动分词的难点之一,也是一个重点.在维吾尔语中,内部成分平等连接而形成的词汇单位叫做对偶词.本文首先介绍了对偶词的基本概念和特征,然后分析了维吾尔语对偶词的结构特征和结合规则.在字符串匹配算法的基础上,提出了一种基于规则的维吾尔语对偶词的识别算法,并通过试验证明了该算法的正确性.  相似文献   

10.
本文应用语音信号的傅里叶谱的谱矩距离判决准则选择特征谱实现了语音的自动识别.实验表明,用这种方法实现的语音识别系统对三字一组的汉语数字语音串,识别精度约为99.8%。拒识率约为1%。  相似文献   

11.
本文对维吾尔语智能输入法及其关键技术进行了研究和探讨.在对当前手机中使用的维吾尔语输入法进行分析的基础上,研发了一种手机维吾尔语智能输入法,该输入法具有用户按键次数少,输入速度快等特点.在Microsoft Visual C++6.0集成开发环境下,模拟手机键盘实现了本输入法.  相似文献   

12.
在研究Android平台文本排版显示引擎和维吾尔文特点的基础上,通过分析维吾尔文本在多款阅读器上显示时出现的问题,找出不支持显示维文文本的原因。最后根据维吾尔文特点进行分析并设计维文阅读器架构,该架构的核心是在阅读器应用层进行维文显示渲染引擎的设计。  相似文献   

13.
设计并实现了备份软件H-info Backup中的Oracle数据备份与恢复模块.H-info Backup采用了模块化设计,有5个主要模块:Director(相当于其他备份软件的Server端),File Daemon(相当于其他备份软件的Client端),Storage Daemon(存储服务器端),Console(备份恢复工作控制台),Catalog DataBase(记录备份恢复Job信息的后台数据库),它们在软件运行时相互协调工作.在进行备份和恢复时,Oracle数据库备份恢复模块传递给File Daemon模块一个动态链接库(DLL),这个DLL里包含了数据库备份函数和数据库恢复函数,File Daemon通过动态加载DLL的方式调用这些函数来完成具体的数据库的备份恢复任务.本软件提供了一般备份恢复软件所不具备的逻辑备份功能,在操作系统为Windows2000,CPU为赛扬2.4 GB,内存为768 MB的测试环境下,本软件的逻辑备份恢复速度表现良好,物理备份恢复速度与现有备份恢复软件速度基本相当.  相似文献   

14.
软件复用技术实现策略研究   总被引:1,自引:0,他引:1  
首先分析和提出了一种基于OWE(ObjectWith Event)的软构件描述方法,然后深入探讨了如何利用面向对象方法实现软件复用的策略,最后着重分析了继承机制对软件复用的支持以及在分布处理环境中的改进方案.  相似文献   

15.
本文提出了一种基于规则库的多层过滤进行机器翻译的算法.该算法实现了英文人名向维吾尔文人名的自动翻译.该算法不同于传统的英维人名翻译系统所采取的方法,不需要建立丰富、全面的两种语言人名对齐词库.本算法在对已翻译的大量实例进行统计并分析的基础上,找出了英文与维文人名翻译的三层规则并设计出了本算法.  相似文献   

16.
搜索引擎网页爬行器的任务是收集网页,而收集能力的好坏直接影响搜索结果.本文提出了维、哈、柯多文种搜索引擎中网页爬行器的结构及其设计方案.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号