首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 74 毫秒
1.
文章就藏文字处理领域对藏文校对功能的实际需要,提出了基于音节的藏文文本校对方案对藏语音节规则的详细描述.采用统计方法对藏语音节的搭配规则等做了探索性的研究,创建了音节及音节搭配规则等多种知识库,以这些知识库为基础进行音节模式匹配查错.设计实现了音节规则模型与音节库模式匹配方法相结合的音节级查错.通过借鉴藏文传统语法理论、现代语言学理论、计算机技术和统计学理论等知识,介绍了藏文文本校对的设计思想,给出了藏文文本校对系统的组成原理、关键技术及可操作的实现方法.实验结果表明,基于音节的查错方案是可行的.为进一步研究开发藏文智能校对软件提供了所需的规则特征集和统计语料等基础性的研究资料.也为将来实现基于词、语法和语义层面的校对奠定了基础.  相似文献   

2.
基于藏文音节规则的识别后处理方法,总结了音节规则的约束条件 试验表明该方法在藏文文本识别后处理中具有较高的自适应性 在《印刷藏文(汉英混排)文档识别系统》的测试中,50万字的藏文测试样本,识别率在97.3%的基础上提高了0.3%,显示出该方法具有良好的效果  相似文献   

3.
在藏文信息处理中,实现藏文字符排序的关键在于准确地判断藏文音节,而藏文音节判定的关键是对音节构件的识别.文章在借鉴藏文传统语法理论的基础上,结合现代语言学、计算机理论和统计学等知识,介绍了藏文音节的组合形式与特征,规则等问题,以藏文国际标准编码体系为依据,根据音节组件的约束关系,分析了藏文音节七元组的组合规则与类型,有利于藏文音节字符构件的研究和七元组类型的分析、识别与处理.  相似文献   

4.
基于藏文La格(??????)例句的自动分类在藏语自然语言处理领域的重要性,根据藏文La格的用法和添接规则,在对藏文La格例句进行分类并定义分类概念的基础上,提出一种融合双通道音节特征的藏文La格例句自动分类模型.该模型首先使用word2vec和Glove构建双通道藏文音节嵌入,分别在每路卷积中融合双通道音节特征,丰富...  相似文献   

5.
藏文命名实体识别是藏语自然语言处理的基础任务,是完成机器翻译、网络舆情检测和知识图谱构建等任务的前提.传统的基于深度学习的藏文命名实体识别将藏文音节(字嵌入)作为模型输入的方法容易忽略藏文音节的局部特征.针对这一问题,本文提出了一种融合构成藏文音节部件特征和藏文音节特征的藏文命名实体识别神经网络模型SL-BiLSTM-CRF(syllable level long short-term memory conditional random field).其中,SL模块对构成音节的部件信息和藏文的单个音节进行特征编码,将两种不同模态的特征融合之后送入BiLSTM模型进行特征提取并预测实体标签,再通过CRF对BiLSTM模型的预测结果进行矫正,最终输出藏文实体识别结果.实验证明,该方法在藏文命名实体识别任务中相比基于单个藏文音节(字嵌入)的BiLSTM-CRF模型的F1值提高了1.58个百分点,验证了该方法在藏文命名实体识别任务中的有效性.  相似文献   

6.
现代藏文自动校对中,对音节字( )的校对是其基础。在藏文文本中音节字是用音节点进行间隔的,由于藏文二维的书写特征和音节字形成过程中与其构件之间严格的搭配规则等诸多问题,使得对它的校对又区别于任何一种文字。文章介绍了音节字的构件、结构和搭配规则等问题,列举了藏文音节字中的错误类型,并针对其特殊性给出了一个特有的音节字校对的流程和方法。  相似文献   

7.
文章根据国际藏文编码标准,分析基本集变长序列码与藏文音节的映射关系,描述以前导字符、组合字符及元音构成变长码序列的规则,从而提出藏文音节结构的拉丁文转写模型,实现了通用的转换组件.  相似文献   

8.
浏览器的藏文字体显示的版式规范是建立在Microsoft提供的IE基础之上,利用IE的ActiveX Control扩展特性以及Windows操作系统对True Type字体的底层基础设施,在应用层上实现了浏览器中藏文字体信息的显示时的藏文版式规范.  相似文献   

9.
文章在win8操作系统支持下,设计并实现了基于音节的现代藏文文本校对功能。通过分析和研究藏文音节的拼写规则,对传统藏语中的音节拼写规则进行了详细的形式化描述。采用统计方法对藏语音节的搭配规则做了探索性的研究,创建了音节搭配规则知识库,以这些知识库为基础进行音节模式匹配查错,创建了音节规则校对模型,运用音节规则模型实现现代藏文文本的音节级校对功能。  相似文献   

10.
以藏文音节拼写检查、梵音转写藏文检查、接续关系检查、词语检查为研究内容, 提出藏文文本自动校对框架和接续关系检查算法。根据该框架及算法, 设计并实现藏文自动校对系统。通过实验证明算法和系统的可靠性和有效性。  相似文献   

11.
双门限算法是语音端点检测的一种重要方法,对藏语语音识别和处理具有重要意义。提出了用双门限端点检测技术对藏语语音进行音节分割的方法,首先根据双门限语音端点检测原理进行Matlab编程和仿真,然后结合藏语语音的音节特点和双门限算法分别在正常语速和慢语速环境下对藏语的30个辅音语音、随机抽取的双音节、三音节及句子语音进行双门限算法的音节分割和分析,实验表明双门限算法对没有太多连读音节的藏语语音和慢语速下长句的音节分割准确率较高。  相似文献   

12.
藏语基础是西藏大学汉族藏本班的一门专业课,是为培养能够使用双语的汉族干部服务的。能否学好藏语基础这门课与学习本专业其他课程有着内在的联系,文章结合教学实践,针对非藏族学生学习藏文的实际情况,就教学方法和手段等问题进行了探讨。  相似文献   

13.
音节时长的研究是韵律模型和语音合成系统的基础,本文基于词汇层面,随机挑选了单音节词、双音节词、三音节词、四音节词(成语)各200个,录制了1男1女藏语拉萨话发音人的语音,提取有效时长。研究了男女发音人不同长度词汇的时长分布,并对不同长度词汇的音节平均时长进行比较。结果表明:1)男女声的词汇时长总体分布比较集中;2)随着词汇长度的增加,音节平均时长逐渐变小,减小幅度成递减趋势;3)整体上来看,女声时长要大于男声时长。  相似文献   

14.
本文围绕网络计划技术中的方法、模型与软件开发问题进行讨论,提出了解决 象网络计划技术这类问题中面向用户软件开发的思想方法与手段,吸取专家支持系 统思想和采取集成系统结构方法,建立模型库、规则方法库,再选配方便灵活的人 机界面和利用程序自动生成的手段,建立一个计划管理支持系统。文中除论述了 系统的设计、功能以及实现方法外,还叶今后的工作提出了进一步的设想。  相似文献   

15.
在考察、借鉴上百年来国内外对德、英、汉、蒙、藏等语种所作的文字计量研究,特别是各种汉文字词频度统计研究成果的基础上,论述了基于大型藏文语料库的藏文字符、部件、音节、词汇频度与通用度统计、分析的理论与方法及其实现过程 该项研究是一项基础性研究,首次实现了大规模藏文词汇频度与通用度统计,具有一定的创新性 其成果有助于藏族基础教育和扫盲教育的语言文字教学,对藏语语言学研究和藏文信息处理领域的许多方面具有重要应用价值  相似文献   

16.
分析了法治与德治的关系,指出法治和德治作为治国方略中的二个子系统,法治是治国的基本方略,德治能够有效降低法治的成本,二者优势互补,具有密切的关系。认为我们在建设社会主义法治时要注意对公民进行道德教育,妥善谨慎地处理道德法律化问题,使法律的正义、秩序、人权等价值得到彰显。  相似文献   

17.
一种新型汉语单音节识别方法   总被引:1,自引:0,他引:1  
介绍了一种新型字基 VQ/HMM语音识别方法: VQ与 HMM分级识别算法。 使得 VQ部分可用作语音识别的第一级处理, HMM部分作第二级识别。在第一级识别中 可引进汉语的音素知识,使 VQ/HMM性能进一步提高,并可用于大字汇表的实时语音识 别,存贮量、计算量均大大减少。用此方法把汉语四声作一个 HMM模型,使汉语 400 个基本音节的识别率达 96%以上.若加上精确四声识别则可识别汉语的 1200种声音。  相似文献   

18.
宋代(10世纪中叶至13世纪中期)是藏传佛教各教派创建、发展的重要时期,这个时期的美术活动,因恰逢佛教在雪域复兴的黄金时期,从而得到了很大的推动,也因此迎来了西藏艺术史上最为百花齐放、多姿多彩的瑰丽时期。而这一时期所形成的艺术范式、艺术理念、艺术精神,更对后来的藏传佛教艺术产生了深刻的影响。宋代西藏美术的许多特点对后来的西藏艺术有直接的奠基作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号