首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
设计和开发语料库语言资源管理平台,是对语言资源进行更有效管理的重要手段,语言资源是对各种语言现象进行深入研究的基础以及可以为语言标准和规范的制定提供详实的数据.本文阐述了哈萨克语语料库语言资源管理平台设计,介绍了语料库语言资源管理平台的总体框架结构及各个功能模块的设计与实现方法.  相似文献   

2.
本文根据现有的维吾尔文语音识别语音库的不足,以自然口语为对象研究维吾尔语的语音特征,提出了适合该语言的电话语音语料库设计方案,其中包括了维吾尔语电话语音库的文本设计、发音人的选择、语音录制、语音库的标注和后期处理方法等.本文从构建的350个说话人的维吾尔语电话语音语料库中挑选50个目标人提供给基于GMM-UBM/SVM的维吾尔语电话信道说话人识别的研究.  相似文献   

3.
语音语料库是语音识别和语音合成技术研究的基础.由于维吾尔语文字与语音特征、维吾尔语语音语料库的建立、管理、使用之工作不仅工作量巨大,且具有一定的复杂性,这就不得不开发维吾尔语语音数据库管理软件.本文首先研究维吾尔语语音语料库的设计过程,包括语音文本的设计、语音录制、语音库的标注、并在此基础上论述维吾尔语语音语料管理软件的总体功能设计以及部分关键技术的实现方法.  相似文献   

4.
本文将清华大学中文分词和词性标注系统应用于部分微博语料数据,检测系统对微博新词识别能力及对识别错误进行了分类总结,并对识别率低的新词制定了标注规范。通过人工校对获得新的训练语料数据集,提高系统对微博文本的处理能力,为建立微博专用语料库做前期准备工作。  相似文献   

5.
构建维吾尔语框架语义知识库是自然语言处理的基础性工程,目前大部分工作基于人工。从真实语料库中抽取包含将要描述词元的例句,为例句标注以及这些例句的配价模式进行深入研究,从标注好的维吾尔语例句中提取维吾尔语词元和例句填充到维吾尔语框架库,构建维吾尔语词元库和例句库,实现维吾尔语语义框架网络的自动构造之目的。本文对维吾尔语真实语料库中抽取的例句中标注对象进行初步分析,论述了人机交互式基于阿拉伯字符的UFN例句辅助标注系统的功能模块设计和工作流程。介绍了UFN例句辅助标注系统的例句标注界面和词元标注报告、词条报告的自动生成演示界面。  相似文献   

6.
利用语言学专家人工标注的语料库对维吾尔文动词进行研究,并总结出了维吾尔文动词范畴的连接规则框架.在人工标注的实例库的基础上,收集了词缀连接规则集合,经人工纠正构建了词缀连接规则库集合.最终,结合人工标注实例库、词缀连接规则库及维吾尔文动词范畴的连接规则框架提出了维吾尔文动词词干提取方法,该方法的独立实验准确率达到了84.15%.  相似文献   

7.
在维吾尔语语音识别研究工作中,由于语音标注工作量大、精度要求高,人工标注之后不可避免的存在各种错误,因此通过专门的复查软件来检查已标注过的文件并修改错误是必不可少的。对已标注的语音文件进行复查操作在语音识别研究中具有十分重要的作用,本文介绍了维吾尔语语音标注复查软件的必要性及基本原理,复查软件的功能及其实现过程的一些技术。  相似文献   

8.
随着信息技术的普及与推广,双语电子文本资源呈指数形式增长,这给构建大规模双语语料库提供了可能.双语对齐作为语料库加工过程中的关键技术,已经引起研究者的高度重视.针对目前可收集到的双语资源大都没有做到段落对齐,本文提出了基于回车符段落对齐基础上的多层次分段对齐思想,充分利用汉文-维吾尔文双语文本中的语言特点,根据双语文本中的数字信息,找出互为译文的句对,从而达到高质量的段落对齐目的.  相似文献   

9.
针对体育领域情感分析资源不足、分析性能不高的现状,对体育领域的情感分析开展了研究.首先从"新浪体育"和"直播吧"等平台经过人工筛选、标注,构建了中文情感标注语料库CH-SPORT,共标记评论10 000条,其中积极评论5 000条,消极评论5 000条.然后选用了SVM、TextCNN、BiLSTM、RCNN、fastText、BiLSTM+Attention等模型对CH-SPORT进行了评估.实验结果表明,BiLSTM+Attention模型在CH-SPORT上的分类效果最佳,Acc为87.75%,比基准数据集ChnSentiCorp和NLPCC2014分别高出18.65%、11.75%.本文构建的数据集能有效应用于体育情感分析研究中.  相似文献   

10.
中文词性标注具有重要的作用,它的准确性和标注速度直接影响到自然语言处理的后续任务.提出一种基于CNN(convolutional neural network)和LSTM(long-short term memory)混合模型进行中文词性标注.该模型采用三层结构,用词向量和CNN的滑动窗口特性产生词语表示特征,LSTM的时序性来产生词性标注的序列标签.分别在PFR《人民日报》语料库、CTB7.0和CoNLL09语料库上对该模型进行测试,在未加入任何人工特征的条件下,对词语进行词性标注,词性标注效果好于HMM(hidden Markov model)、MLP(multi-layer perceptron)、CNN和LSTM.  相似文献   

11.
本文叙述了以大规模真实语料为事实依据的维吾尔语框架语义文档的基本结构,建立了维吾尔语框架语义文档的XML文档树数据模型及标记树,指出了树的阅读顺序,用XML标记建立维吾尔语框架语义文档的方法.  相似文献   

12.
本文研究了汉语教学软件在Android 开发平台下的开发与实现过程,系统主要由Android软件开发工具包和Eclipse集成开发环境进行开发,利用Android的API函数接口,通过自动选型规则实现了维汉英多种文字的正确显示及处理等问题,进而给用户带来更加方便的汉语学习环境。在存储及处理大量的相关图片和音频文件时,利用了Android集成的小型嵌入式轻量级数据库SQLite的开发接口。除此引用3G信息化时代中最受欢迎的语音合成技术(TTS)来实现此平台中声母韵母的标准发音,本研究为维吾尔族民众提供随时随地都能方便的学习汉语的环境,从而更好的满足新疆少数民族的应用需求。  相似文献   

13.
分析了并行加工机制下同类机排序博弈的纳什均衡的PoA(The Price of Anarchy),证明了混合纳什均衡的PoA为O(log2 m),以及纯纳什均衡的PoA为O〖JB((〗log〖JB((〗〖SX(〗s1〖〗sm〖SX)〗〖JB))〗〖JB))〗.  相似文献   

14.
研究以抑菌圈直径大小作为评价指标,利用提取分离技术对诃子进行抗嗜水气单胞茵活性成分分离追踪,并对诃子的抗菌活性单体进行安全评价.结果显示,诃子的抗嗜水气单胞茵的活性部位为乙酸乙酯萃取部位,其浓度为4mg·L^-1时,抑茵圈直径为18mm.活性部位经多次柱层析分离,得到一白色针状晶体.抑菌试验结果显示,最小抑菌浓度(MIC)和最小杀菌浓度(MBC)分别为2.8mg-L^-1和5.6mg·L^-1.急性毒性实验结果显示,活性单体对鲫鱼的96h半致死浓度为220.7mg·L^-1,其安全浓度为85.2mg·L^-1,但其化学结构还有待于进一步研究.  相似文献   

15.
以ICR雄性小鼠为实验动物、以紫外线为诱变剂,研究了温郁金对紫外线致ICR雄性小鼠免疫遗传损伤的拮抗效应.采用了小鼠骨髓嗜多染红细胞(polychromatic erythrocyte,简称PCE)微核实验等方法.测定了小鼠血象、血红蛋白含量、胸腺及脾指数,小鼠肝脏过氧化氢酶(catalase,简称CAT)活性,小鼠骨髓嗜多染红细胞(PCE)的微核率等指标.结果显示:实验剂量的温郁金均能使紫外线引起脾脏指数和胸腺指数、红细胞数、白细胞数以及血小板数、血红蛋白含量和CAT活性的下降明显回升;实验剂量的温郁金则能使紫外线引起PCE微核率的上升明显回落.结论是温郁金对紫外线引起的小白鼠免疫遗传损伤具有一定的拮抗效应.  相似文献   

16.
研制《维吾尔语词语分类体系及其标记集》是维吾尔文信息处理的支柱工程.动词在维吾尔语句子构成中常常是一个句子的核心.本文在以往有关维吾尔语诃胜标注研究成果的基础上,提出了一个面向信息处理的现代维吾尔语动词体系及其标记集,并且对维吾尔语动词的形态特征、语法范畴以及短语组合功能等方面进行了详细的描述.  相似文献   

17.
图像质量评价是图像处理研究中的热点问题之一,而质降参考图像质量评价方法作为它的一个重要研究方向,可实际应用在码率控制等领域中.对质降参考评价模型进行相关研究,根据采用特征参数提取方法以及质量分数度量方式详细讨论了现有模型的特点和局限性,并对比较经典的评价模型进行了综述,以及对质降参考质量评价方法的发展做了预测和展望.  相似文献   

18.
讨论了如下定义的带粗糙核的超奇异积分算子: TΩ,α,hf(x)=p.v.∫R^nh(|y|)(Ω(y′))/(|y|^n+a)f(x-y)dy 的(Lα^p(ω),L^p(ω))有界性,推广了已有的结果.这里0≤α〈1,1〈p〈∞,Ω为H^q(S^n-1)中的函数,q=(n-1)/(n-1+α),且h(|y|)∈△γ(R+)={supR〉0 R-1∫0^R (|h(t)|^γdt) },γ〉1,ω是某类径向权.  相似文献   

19.
引入具误差的修正Mann和Ishikawa迭代程序及多值Φ-拟伪压缩型映射,在一致光滑实Banach空间证明了此迭代序列强收敛于具广义Lipschitzian连续的(一般未必连续或有界)多值Φ-拟伪压缩型映射有限簇的唯一公共不动点,统一和发展了包括王林和王刚(2006年)、周海云(2006年)、HUANG(2002年)、曾六川(2005年)、徐裕光(2004年)、张石生(2000年)和倪仁兴(2001和2002年)等近期许多相关结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号