首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
本文叙述了以大规模真实语料为事实依据的维吾尔语框架语义文档的基本结构,建立了维吾尔语框架语义文档的XML文档树数据模型及标记树,指出了树的阅读顺序,用XML标记建立维吾尔语框架语义文档的方法.  相似文献   

2.
本文根据现有的维吾尔文语音识别语音库的不足,以自然口语为对象研究维吾尔语的语音特征,提出了适合该语言的电话语音语料库设计方案,其中包括了维吾尔语电话语音库的文本设计、发音人的选择、语音录制、语音库的标注和后期处理方法等.本文从构建的350个说话人的维吾尔语电话语音语料库中挑选50个目标人提供给基于GMM-UBM/SVM的维吾尔语电话信道说话人识别的研究.  相似文献   

3.
如何挖掘基于语义的相关模型是当前自动图像标注技术中一项重要而迫切的研究课题。本文从相关概率模型的角度分析了回归技术解决自动图像标注任务的可行性,进而提出了基于回归相关模型(Regression RelevanceModel,RRM)的自动图像标注框架。RRM通过有效地建立了图像-关键词的相  相似文献   

4.
利用语言学专家人工标注的语料库对维吾尔文动词进行研究,并总结出了维吾尔文动词范畴的连接规则框架.在人工标注的实例库的基础上,收集了词缀连接规则集合,经人工纠正构建了词缀连接规则库集合.最终,结合人工标注实例库、词缀连接规则库及维吾尔文动词范畴的连接规则框架提出了维吾尔文动词词干提取方法,该方法的独立实验准确率达到了84.15%.  相似文献   

5.
现代哈萨克语词级标注语料库的构建研究   总被引:2,自引:0,他引:2  
建设高质量的标注语料库是现代哈萨克语自然语言信息处理领域的基础性工程,本文根据哈萨克语独特的语言特点,进行词级带标注的哈萨克语语料库构建研究,首先介绍了不同语言语料库的国内外研究现状,随后针对语料库构建中涉及的主要问题,实现了哈萨克语词级基本语料库的设计与构建.  相似文献   

6.
双语短语对抽取是基于短语的统计机器翻译中短语翻译模型训练的关键步骤,但由于汉维平行语料库规模有限,数据稀疏问题严重.本文提出了一种改进的短语抽取算法,该算法首先考虑词对齐矩阵中一个汉语词对齐到多个维吾尔语词的情况(包括不连续),然后利用Och方法抽取短语对,最后考虑维吾尔语SOV语序结构特点,抽取双语短语.实验表明,该算法能够较准确地且尽可能多地抽取汉维短语对,从而提高翻译模型的质量.  相似文献   

7.
维吾尔语对偶词的自动识别是维吾尔语自然语言处理中的一项基础性工作.维吾尔语对偶词的自动识别是维吾尔语自动分词的难点之一,也是一个重点.在维吾尔语中,内部成分平等连接而形成的词汇单位叫做对偶词.本文首先介绍了对偶词的基本概念和特征,然后分析了维吾尔语对偶词的结构特征和结合规则.在字符串匹配算法的基础上,提出了一种基于规则的维吾尔语对偶词的识别算法,并通过试验证明了该算法的正确性.  相似文献   

8.
针对目前不同Web服务注册管理标准之间(如UDDI,ebXML等)无法进行互操作的问题,运用元模型互操作框架(metamodel framework for interoperability,MFI)和本体技术,建立了一种支持语义瓦操作的Web服务注册管理模型的体系架构,运用MFI中的本体演化规则保证了本体在演化前后的一致性,从而保证基于本体的不同 Web服务注册库的互操作性.构建了一个基于MFI的Web服务注册管理模型的原型系统,实验结果表明该原型系统的Web服务查全率比单一Web服务模型高.  相似文献   

9.
基于语义的服务资源描述模型RDF4S   总被引:1,自引:0,他引:1  
在已有的语义Web服务描述框架基础上,定义了一种语义Web服务资源描述模型RDF4S,该模型从功能、接口、执行和QoS 4个层面描述服务资源的语义信息,并基于该模型提出了一个语义Web服务资源发现框架.结合旅游预订系统的一个实例,展示了RDF4S 4层语义信息的描述能力和支持发现的能力,并给出RDF4S描述模型和其他语义Web服务描述模型的比较.该工作对基于语义信息进行服务的自动发现、组合和调用具有一定的参考作用.  相似文献   

10.
对数字图书馆图书按中图法分类和学科分类进行了比较,定义了新的知识元结构,利用知识元中出现的概念,通过中文Wikipedia概念库得到的丰富的语义信息,对抽取的图书概念与学科分类类目之间计算语义相似度、语义关联度,进行语义链接,最后展示了初步实现的数字图书馆学科标引系统.  相似文献   

11.
研制《维吾尔语词语分类体系及其标记集》是维吾尔文信息处理的支柱工程.动词在维吾尔语句子构成中常常是一个句子的核心.本文在以往有关维吾尔语诃胜标注研究成果的基础上,提出了一个面向信息处理的现代维吾尔语动词体系及其标记集,并且对维吾尔语动词的形态特征、语法范畴以及短语组合功能等方面进行了详细的描述.  相似文献   

12.
一种汉语语句依存关系网分析策略与生成算法研究   总被引:2,自引:0,他引:2  
本文以依存语法作为语言模型的基础,首先提出了一种全新的句子分析策略: 分析在两级上进行. 一级是基于中心动词同其他成分间的约束关系 ,通过寻找汉语语义类之间可能存在的句法关系,实现句子成分过滤,完成句子主干提取. 另一级是上下文级,将语法、语义和语境信息一体化,结合依存语法确定汉语句子中各成分间的依存关系. 之后给出了一种快速有效的用于完成句子分析的松弛匹配迭代算法. 通过实验表明了该分析策略和算法的可行性.  相似文献   

13.
维吾尔语词性标注研究,是面向信息处理的维吾尔语语法分析的核心内容.本文提出面向信息处理的现代维吾尔语词语分类体系及其标记集,并且对分类体系中的12个词类的分布特征从形态变化、句子成分功能和短语组合功能等方面进行了描述.  相似文献   

14.
面向Android手机用户,特别是其中母语为维吾尔语的少数民族群众,提供一种对新疆县域天气情况可进行维汉双语查询的动态天气服务移动GIS系统客户端.解决方案:在移动终端设备安装自主研发获取的动态天气服务移动GIS系统客户端APK文件及维吾尔文MultiLing输入法,将服务端Google Maps API地图服务组件与实时Yahoo Weather RSS天气信息集成,在微软网页自定义字体技术的支持下,为移动用户提供维汉双语的动态天气信息查询系统.  相似文献   

15.
本文研讨缺乏语言资源的民族语言(如维吾尔语)中如何引用语音技术、开发应用系统问题.提出基于GMM-UBM混合SVM技术方法实现实用性说话人识别系统,通过小语料人工标注语音语料预选高精度声学根(seed)模型、再引导大语料训练生成鲁棒性声模提高连续语音识别精度实现汉民会话语音翻译系统.对维吾尔语70人发话电话语音识别实验结果显示,基于GMM-UBM -SVM方法的不特定说话人识别实验其正确识别率为94.3%,比先行GMM-UBM方法精度提升3%;基于seed声模HTK-Julius技术的维吾尔语连续语音识别实验,其识别率为72.5%,比直接使用语音文本对齐语料单靠HTK实现识别方法(63.2%)精度提高9.3%;同时本研究讨论基于Moses技术的汉维医院门诊会话语音翻译系统预测Blue值达到了57.7%.  相似文献   

16.
基于小波变换和数学形态学的运动物体检测   总被引:1,自引:0,他引:1  
提出了一种基于帧差法和小波变换相结合的运动目标检测方法,充分利用帧差法计算简单和小波变换的多尺度特性。实验表明,这种方法可以有效地从复杂自然场景的图像序列中检测出完整的运动目标。而且能够有效的抑制噪声。同时减少计算时间,满足检测的实时性要求。  相似文献   

17.
合模机机架顶部钢板厚度对其精度的影响分析   总被引:1,自引:0,他引:1  
通过对合模机机架进行有限元分析,模拟了真实情况下机架的应力分布和位移变形情况,得到了位置变形最大和应力值最大的位置.并通过改变机架顶部方向钢板的厚度,使合模机机架的受力情况得到了较为明显的改善,各个方向的变形位移均有不同程度的减小,为改善合模机的精度提供了可供借鉴的理论基础.X  相似文献   

18.
本文提出了一种基于规则库的多层过滤进行机器翻译的算法.该算法实现了英文人名向维吾尔文人名的自动翻译.该算法不同于传统的英维人名翻译系统所采取的方法,不需要建立丰富、全面的两种语言人名对齐词库.本算法在对已翻译的大量实例进行统计并分析的基础上,找出了英文与维文人名翻译的三层规则并设计出了本算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号