首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
自然语言处理中,语料是语言研究的材料,语料库是存储语言资源的数据源,语料库语言资源管理平台就是将分散的语料集中管理,对其进行存储、索引,并作一些初步处理。阐述了对柯尔克孜语语料库语言资源管理平台进行的研究和已达到的现况,期盼这会为将来能更好的对柯尔克孜文语料进行科学有效的管理和柯尔克孜语言学研究提供数据资源的平台。 更多还原  相似文献   

2.
现代哈萨克语词级标注语料库的构建研究   总被引:2,自引:0,他引:2  
建设高质量的标注语料库是现代哈萨克语自然语言信息处理领域的基础性工程,本文根据哈萨克语独特的语言特点,进行词级带标注的哈萨克语语料库构建研究,首先介绍了不同语言语料库的国内外研究现状,随后针对语料库构建中涉及的主要问题,实现了哈萨克语词级基本语料库的设计与构建.  相似文献   

3.
本文根据现有的维吾尔文语音识别语音库的不足,以自然口语为对象研究维吾尔语的语音特征,提出了适合该语言的电话语音语料库设计方案,其中包括了维吾尔语电话语音库的文本设计、发音人的选择、语音录制、语音库的标注和后期处理方法等.本文从构建的350个说话人的维吾尔语电话语音语料库中挑选50个目标人提供给基于GMM-UBM/SVM的维吾尔语电话信道说话人识别的研究.  相似文献   

4.
语音语料库是语音识别和语音合成技术研究的基础.由于维吾尔语文字与语音特征、维吾尔语语音语料库的建立、管理、使用之工作不仅工作量巨大,且具有一定的复杂性,这就不得不开发维吾尔语语音数据库管理软件.本文首先研究维吾尔语语音语料库的设计过程,包括语音文本的设计、语音录制、语音库的标注、并在此基础上论述维吾尔语语音语料管理软件的总体功能设计以及部分关键技术的实现方法.  相似文献   

5.
随着信息技术的普及与推广,双语电子文本资源呈指数形式增长,这给构建大规模双语语料库提供了可能.双语对齐作为语料库加工过程中的关键技术,已经引起研究者的高度重视.针对目前可收集到的双语资源大都没有做到段落对齐,本文提出了基于回车符段落对齐基础上的多层次分段对齐思想,充分利用汉文-维吾尔文双语文本中的语言特点,根据双语文本中的数字信息,找出互为译文的句对,从而达到高质量的段落对齐目的.  相似文献   

6.
通过分析现有OA资源系统数据交换模式,发现在进行海量OA资源数据交换时存在性能差、速度慢和效率低等问题.文中提出云计算环境下的OA资源数据交换平台功能、结构和交换模式,针对性地解决海量OA资源数据交换问题.首先分析OA资源交换云应用系统体系,设计OA资源交换云平台的子系统和功能.其次结合云计算和大数据技术,将OA资源交换云平台子系统部署到计算与存储、大数据管理、数据服务和OA资源交换四层结构中,形成虚拟的数据交换平台.最后设计OA资源交换云平台的数据交换模式,以交换域的方式实现OA资源的云交换.  相似文献   

7.
土地资源多级网格平台高效处理机制研究   总被引:3,自引:2,他引:1       下载免费PDF全文
为实现海量土地资源数据多级网格管理和高效处理,设计了基于网格服务架构的土地资源多级网格化管理平台LR-MGSP(Land Resource Multi-Grid Service Platform),从网格任务分解、空间信息服务缓存和增量统计等方面探讨了提高平台处理性能的策略和方法.原型平台与非网格化的土地资源管理系统的性能对比测试结果表明,LR-MGSP达到了预期的目标,能够满足海量土地资源数据高效管理和处理的需求,也为其他行业开展跨机构协同处理海量空间数据工作提供了借鉴.  相似文献   

8.
新疆广播电视大学的网络教学平台是新疆发展远程教育的骨干力量,提供双语教学,能够满足绝大部分教学需求,但是在教学内容与平台智能方面还未实现精细化教学的目标,难以实现因材施教.本文针对上述问题,引入了个性化学习理论,在现有网络教学平台上设计网上课程个性化学习系统架构,并对系统中的资源建设与管理、个性化设计以及安全性机制进行了探讨.网上课程个性化学习系统可以在确保教学平台安全可信的前提下提高教学质量,有利于学生的个人发展.  相似文献   

9.
本文将清华大学中文分词和词性标注系统应用于部分微博语料数据,检测系统对微博新词识别能力及对识别错误进行了分类总结,并对识别率低的新词制定了标注规范。通过人工校对获得新的训练语料数据集,提高系统对微博文本的处理能力,为建立微博专用语料库做前期准备工作。  相似文献   

10.
面对稀缺、专业性强的汉维双语医疗平行语料库建设,本文探索数据采集、标准化、去噪、自动录入方法,进行语料库特征分析,并根据语料数据特性,设计语料库网页检索系统.目前已建成110多万字、2.6万句汉语医疗语料和3 000句对汉维双语对齐语料,不仅对构建中小型语料库有参考价值,而且奠定了医疗自然语言处理研究基础,尤其汉维双语对齐语料,将促进机器翻译技术在医疗领域突破,对新疆边远地区无汉语表达能力的少数民族群众获得医疗救助搭建桥梁.  相似文献   

11.
在传统的图灵回退语言模型的基础上,提出了一种增强的图灵回退语言模型.这种增强的方法通过3个算法实现,包括语言模型的实现流程,以及统计语言模型中三元语法串、二元语法串和一元语法串的概率计算的方法,并将未登录词的计算结合起来.通过利用大规模语料库进行实验,验证了这种改进的N元语法语言模型能较好解决传统语言模型中的二元语法串、一元语法串和未登录词计算等问题.  相似文献   

12.
针对目前地方政府部门信息资源交换共享中存在的交换效率低、重复建设等问题,通过分析数据交换技术、应用现状和交换需求等,研究和设计了基于云计算技术的政务数据交换云总体架构和子系统.数据交换云可实现在一个物理交换平台上运行多个可管理的虚拟交换子平台,有效地提高政府投资效益和信息交换效率,方便政府部门使用和管理,并能有效解决数据交换与应用耦合度高的问题.  相似文献   

13.
针对体育领域情感分析资源不足、分析性能不高的现状,对体育领域的情感分析开展了研究.首先从"新浪体育"和"直播吧"等平台经过人工筛选、标注,构建了中文情感标注语料库CH-SPORT,共标记评论10 000条,其中积极评论5 000条,消极评论5 000条.然后选用了SVM、TextCNN、BiLSTM、RCNN、fastText、BiLSTM+Attention等模型对CH-SPORT进行了评估.实验结果表明,BiLSTM+Attention模型在CH-SPORT上的分类效果最佳,Acc为87.75%,比基准数据集ChnSentiCorp和NLPCC2014分别高出18.65%、11.75%.本文构建的数据集能有效应用于体育情感分析研究中.  相似文献   

14.
本文对嵌入式Windows CE.Net操作系统的主要体系结构进行剖析.研究设计出了维吾尔文本地化环境,利用资源编译器编译和反编译功能,构建了基于Windows CE.Net平台的维吾尔文图形用户界面资源库,实现Windows CE.Net的界面维文化和基于Windows CE.Net的应用程序的维文支持;开发了输入法程序,实现Windows CE.Net的维吾尔文字键盘输入和软键盘输入;通过编制维吾尔文字库,为Windows CE.Net平台下维吾尔文字的显示、打印提供了基础.  相似文献   

15.
双语语料库的自动对齐已成为机器翻译研究中一个十分重要的研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,本文根据汉文-维吾尔文的特点,在分析目前双语句子对齐方法的基础上,提出了基于译文的对齐方法,通过使用一部翻译较完整的词典作为桥梁,将汉维句子关联起来.根据维吾尔语文本中的单词,在词典中找到其对应的译文,并将译文到汉语句子中去匹配,根据评价函数和动态规划算法找到对齐句对.  相似文献   

16.
基于WEBGIS公共卫生信息平台关键技术的研究   总被引:1,自引:0,他引:1  
为辅助卫生部门在处理城市公共卫生事件时及时地做出正确的决策,构建了基于万维网地理信息系统(WEBGIS)的公共卫生信息平台,并着重对该平台的功能模块、关键技术和数据库进行科学设计,且通过实例对平台运行路线进行了分析展示,并对该平台解决公共卫生管理中存在的主要问题进行案例研究.  相似文献   

17.
面向汉文维吾尔文(以下简称汉维)双语科技术语抽取这一应用目标,本文提出新闻科技领域的汉维可比语料库设计方案并进行实验.将网络采集的汉维语料利用机器翻译系统进行初加工后映射到向量空间中并使用LSI算法计算出各向量间的相关性,利用计算后的向量建立索引并依次计算出源文本与候选文本的相似值.本文设计两种实验进行对比,对选取的可比语料进行评估、筛选,最终达到构建汉维可比语料库的目的.  相似文献   

18.
精品课程资源的共享已经成为国家教育发展的重要工作之一,其建设程度已被作为衡量学校教学质量优劣的重要标尺。对目前主要的研究方法和已有架构进行了比较和研究,探讨了REST架构风格在课程平台建设方面实现的可能性和优势,提出了一种基于REST架构风格的精品课程平台建设的实现方法。该方法采用统一的操作接口和无状态特性,通过表示来处理资源状态,消除传统SOAP-WSDL-UDDI技术中不必要的交互,增强了系统平台的兼容性和扩展性,具有更好的交互性和运行性能,可对现存异构数据库进行无缝链接而降低相关开发成本投入。本研究方法对精品课程资源平台及其他相关设计和研究有一定的借鉴作用。 更多还原  相似文献   

19.
在数字图书馆时代,如何保证数字资源的长期可用性和服务的稳定性,对数字资源进行有效的管理和服务,是当前数字图书馆研究中的一个热点前沿话题.在研究分析了国外数字图书馆仓储管理的几种典型解决方案后,提出了一种基于数字对象的通用数字图书馆仓储管理方案.结果表明:该方案实现了统一存储各种属性不同的数字资源,并提供了很好的资源管理和访问接口.  相似文献   

20.
建设高水平的专业实验室是专业人才培养的重要保证.微波射频与天线实验室作为电波传播与天线等专业的专业实验室之一,其建设是专业建设的重要组成部分.本文从实验室的建设宗旨和总体规划出发,分别阐述了微波技术实验平台、射频实验平台、天线实验平台以及仿真实验平台教界4个实验平台的实验内容及平台的构成,从该实验室仪器设备的特殊性方面对实验室的管理和维护方面进行了探讨,提出了对建设微波射频与天线实验室的一些思考与实践经验.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号