首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
设计和开发语料库语言资源管理平台,是对语言资源进行更有效管理的重要手段,语言资源是对各种语言现象进行深入研究的基础以及可以为语言标准和规范的制定提供详实的数据.本文阐述了哈萨克语语料库语言资源管理平台设计,介绍了语料库语言资源管理平台的总体框架结构及各个功能模块的设计与实现方法.  相似文献   

2.
面对稀缺、专业性强的汉维双语医疗平行语料库建设,本文探索数据采集、标准化、去噪、自动录入方法,进行语料库特征分析,并根据语料数据特性,设计语料库网页检索系统.目前已建成110多万字、2.6万句汉语医疗语料和3 000句对汉维双语对齐语料,不仅对构建中小型语料库有参考价值,而且奠定了医疗自然语言处理研究基础,尤其汉维双语对齐语料,将促进机器翻译技术在医疗领域突破,对新疆边远地区无汉语表达能力的少数民族群众获得医疗救助搭建桥梁.  相似文献   

3.
语音语料库是语音识别和语音合成技术研究的基础.由于维吾尔语文字与语音特征、维吾尔语语音语料库的建立、管理、使用之工作不仅工作量巨大,且具有一定的复杂性,这就不得不开发维吾尔语语音数据库管理软件.本文首先研究维吾尔语语音语料库的设计过程,包括语音文本的设计、语音录制、语音库的标注、并在此基础上论述维吾尔语语音语料管理软件的总体功能设计以及部分关键技术的实现方法.  相似文献   

4.
本文将清华大学中文分词和词性标注系统应用于部分微博语料数据,检测系统对微博新词识别能力及对识别错误进行了分类总结,并对识别率低的新词制定了标注规范。通过人工校对获得新的训练语料数据集,提高系统对微博文本的处理能力,为建立微博专用语料库做前期准备工作。  相似文献   

5.
现代哈萨克语词级标注语料库的构建研究   总被引:2,自引:0,他引:2  
建设高质量的标注语料库是现代哈萨克语自然语言信息处理领域的基础性工程,本文根据哈萨克语独特的语言特点,进行词级带标注的哈萨克语语料库构建研究,首先介绍了不同语言语料库的国内外研究现状,随后针对语料库构建中涉及的主要问题,实现了哈萨克语词级基本语料库的设计与构建.  相似文献   

6.
通过分析现有OA资源系统数据交换模式,发现在进行海量OA资源数据交换时存在性能差、速度慢和效率低等问题.文中提出云计算环境下的OA资源数据交换平台功能、结构和交换模式,针对性地解决海量OA资源数据交换问题.首先分析OA资源交换云应用系统体系,设计OA资源交换云平台的子系统和功能.其次结合云计算和大数据技术,将OA资源交换云平台子系统部署到计算与存储、大数据管理、数据服务和OA资源交换四层结构中,形成虚拟的数据交换平台.最后设计OA资源交换云平台的数据交换模式,以交换域的方式实现OA资源的云交换.  相似文献   

7.
在数字图书馆时代,如何保证数字资源的长期可用性和服务的稳定性,对数字资源进行有效的管理和服务,是当前数字图书馆研究中的一个热点前沿话题.在研究分析了国外数字图书馆仓储管理的几种典型解决方案后,提出了一种基于数字对象的通用数字图书馆仓储管理方案.结果表明:该方案实现了统一存储各种属性不同的数字资源,并提供了很好的资源管理和访问接口.  相似文献   

8.
面向汉文维吾尔文(以下简称汉维)双语科技术语抽取这一应用目标,本文提出新闻科技领域的汉维可比语料库设计方案并进行实验.将网络采集的汉维语料利用机器翻译系统进行初加工后映射到向量空间中并使用LSI算法计算出各向量间的相关性,利用计算后的向量建立索引并依次计算出源文本与候选文本的相似值.本文设计两种实验进行对比,对选取的可比语料进行评估、筛选,最终达到构建汉维可比语料库的目的.  相似文献   

9.
Windows Phone 7.5是一款最近推出的且非常有潜力的智能手机操作系统之一.本文首先分析了柯尔克孜文的文字特点、拼写特点和设计难点,应用自动选型规则解决了柯尔克孜文在Windows Phone 7.5中的输入方向问题和连接问题,解决了柯尔克孜文与中文、英文和数字的混屏显示问题,从而在Windows Phone 7.5中实现了柯尔克孜文输入法.  相似文献   

10.
本文研讨缺乏语言资源的民族语言(如维吾尔语)中如何引用语音技术、开发应用系统问题.提出基于GMM-UBM混合SVM技术方法实现实用性说话人识别系统,通过小语料人工标注语音语料预选高精度声学根(seed)模型、再引导大语料训练生成鲁棒性声模提高连续语音识别精度实现汉民会话语音翻译系统.对维吾尔语70人发话电话语音识别实验结果显示,基于GMM-UBM -SVM方法的不特定说话人识别实验其正确识别率为94.3%,比先行GMM-UBM方法精度提升3%;基于seed声模HTK-Julius技术的维吾尔语连续语音识别实验,其识别率为72.5%,比直接使用语音文本对齐语料单靠HTK实现识别方法(63.2%)精度提高9.3%;同时本研究讨论基于Moses技术的汉维医院门诊会话语音翻译系统预测Blue值达到了57.7%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号