首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
随着科技的发展,各类电子产品的日益增多,藏文文字的使用量也日益得到扩大,藏文输入法、藏文各类电子词典等软件的问世,这就迫使藏文文字需要结构化、数字化、规范化,做这些工作要了解藏文字母的信息熵。本人用扩大容量的方法统计了藏文字母的信息熵,并用zipf定律进行了理论上的说明。  相似文献   

2.
随着对语言文字信息处理研究工作的不断加深,藏文信息处理技术也逐渐从字信息处理走向了语言信息处理。跟日语、汉语、韩语等语种的信息处理相同,藏文自动分词(Tibetan Automatic Word Segmentation)是藏文信息处理中的一项必不可少的基础性工作,在此基础上才能划分短语、抽取概念以及分析主题,以至自然语言理解,最终实现智能化。对于不同应用环境,藏文自动分词需要采用最合适的算法,本文通过对藏语语料的统计分析和藏语词的分布特点、语法功能的研究,提出了设计开发基于词典库的藏文自动分词系统,力求为藏文输入法研究、藏文电子词典建设、藏文字词频统计、搜索引擎的设计和实现、机器翻译系统的开发、网络信息安全、藏文语料库建设以及藏语语义分析研究奠定基础。  相似文献   

3.
介绍了"藏文政府办公系统研发"项目的研制情况,以及系统的目标定位、体系结构、功能特点、技术路线和藏文化关键技术实现原理等内容.  相似文献   

4.
藏文软件开发专项设立过程 作为国家信息产业主管部门,信息产业部始终高度重视少数民族语言文字特别是藏文的信息处理工作.  相似文献   

5.
《现代电子技术》2017,(10):24-27
藏文音节构件识别是藏文信息处理应当特别关注的一个问题,要实现藏文排序、藏文拉丁转写、藏文文本校对等工作就必须先识别出构成藏文音节的7大构件。针对符合藏文字性组织法构件组合规则的藏文音节,依据藏文字性组织法规定的音节组合规则和组合结构,提出先确定藏文音节中作为核心构件的基字,再依据基字判断出其他构件的算法,结合此算法对藏文中出现的其他特殊音节进行了特殊的构件识别处理。通过测试验证算法的可行性,测试结果表明,该算法能够正确识别符合组合规则和结构的藏文音节,对特殊音节也有较好的识别能力。  相似文献   

6.
藏文词典查询算法是藏文信息处理的一个重要的基础部分,对系统的效率有重要的影响.提出一种快速自适应编码查询算法来指导藏文字、词、短语等编码,在任意排序状况下,快速确定所需编码在整个编码表中的具体位置.  相似文献   

7.
本文首先提出了整页文本数据集的合成方法。其次使用合成数据分析近几年4种整页文本识别算法的特点以及优劣,最后在这些模型的基础上,对识别错误率较高的模型,使用不同特征提取网络在测试集进行实验以提升准确率。实验分析了4种整页文本识别模型在藏文敦煌体识别任务上的性能,经过微调后准确率均达到了90%以上。  相似文献   

8.
本文在藏文问句预处理研究的基础上主要实现了基于知识融合的藏文分词标注,基于疑问词的藏文问句分类和基于TextRank的藏文关键词提取研究。本文形成了从问句分词标注到问句分类的整套预处理过程,且效果显著,为后续研究藏文知识问答系统提供了思路,打下来了基础。  相似文献   

9.
文本媒体是超媒体系统中非常重要媒体形式。本文讨论了超媒体系统中文本媒体的处理方法,包括文本的数据结构,文本如何在窗口下以多字体,多颜色,多大小进行显示的处理方法,以及文本媒体热字处理方法。  相似文献   

10.
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务.因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法.首先,根据二值藏文古籍文档图像中连通域的面积和真圆度去除非音节点,获得音节点图像.其次,通过水平投影音节点图像和垂直投影二值原图,得到文本行基线所处的范...  相似文献   

11.
随着中国司法信息化建设的不断推进,以各类案件卷宗、裁判文书、法律法规以及司法解释为代表的法律文本数据量迅速增长,基于深度学习的法律文本处理研究已成为法律与人工智能这一交叉领域的热点问题.为了及时跟进该领域的最新研究成果,本文分别从法律文本表示、法律文本分类、法律文本挖掘与应用等3个方面梳理了该领域中的主要研究方向和国内外学者的代表性成果,并对该领域未来的发展趋势进行了分析和展望.  相似文献   

12.
从自然语言处理以及深度学习的基本理念、原则出发,为基于中国手语的维吾尔文本信息处理研究提供数据资源,为面向手语信息的手语合成研究,为手语新闻文本编辑研究提供科学依据,对维吾尔文本进行自动分词、自动分句研究,并利用Word2Vec方法进一步建立文本词元库,通过这样保证训练语料的多元化及通用性。最后,利用词干提取方法以及分割字母的方式将维吾尔文本信息转换成手语文本信息,并在此基础上初步采集面向手语信息处理的维吾尔文本信息。实验表明该研究达到了预期目标。  相似文献   

13.
针对目前文本检索系统出现的信息重复,冗余等问题,提出了一种将布鲁姆过滤器算法与MD5有效结合的方案。对检索关键字进行MD5预处理操作,充分利用MD5的可靠性。并发挥鲁姆过滤器降低检索算法的时间复杂度和空间复杂度的特点,大大提高了检索的快速性,相关性和完备性。  相似文献   

14.
在对国内交通诱导系统现状分析的基础上,针对视觉诱导设施在效果上的不足,提出了一种基于TTS技术的交通语音诱导方法,并给出了系统设计的原理图和实现步骤。实验表明该语音诱导系统文语转换和语音合成效果理想,可在交通诱导方面发挥重要作用。  相似文献   

15.
《现代电子技术》2019,(18):45-49
传统归类方法采用自动标引主题词变换成分类号实现自动分类,该方法分类过程复杂,应用性差。因此,提出一种基于文本特征识别的电子档案自动归类系统。该系统采用电子档案语料库模块根据使用者需求挖掘语料,实现语料库构建、查询、清除和维护等操作;通过电子档案排版模块,基于内容映射的方式排版电子档案;在此基础上采用有限自动机选择法和组合特征选择法选取文本内特征词,识别电子档案文本特征后,通过SVM分类器和类别识别器两次归类过程,判断电子档案最终类别归属。封闭性归类测试和开放性归类测试结果表明,该系统的平均查全率和精度都高于95%,且不同信噪比环境下,系统平均中断概率为0.17%,低于对比系统。  相似文献   

16.
马铭惠  孙涌 《信息技术》2005,29(12):105-107,127
国内各大中城市停车信息贫乏,车辆盲目寻找停车位,增加了交通压力。为了缓解日益严峻的停车问题,必须采取先进的停车管理技术,而停车诱导系统(PGS)正是目前解决停车问题的有效途径。本文先是介绍了PGS的总体构成和各个子系统的功能,然后给出了信息处理子系统的结构,并分析了PGS中几个关键的信息处理技术,为PGS的实现提供了参考。  相似文献   

17.
FPGA由于集成了超大规模集成电路和可编程器件的诸多优点,其在现代工业生产和科学研究中的数据采集和处理的应用越来越广泛。本文针对SSI接口类传感器数据采集与数理需求,设计了以FPGA为核心处理器的多通道数据采集系统。所设计的系统通过PCI9054桥接芯片实现FPGA 局部总线到PMC/PCI总线的转换,而后再通过PMC/PCI总线完成数据采集系统与上层母板的连接和通讯。系统调试结果表明所设计的系统能够实现数据采集处理功能。  相似文献   

18.
主要叙述了TTS技术原理。提出并实现了一个可靠的文语转换系统——基于语音合成芯片和SMS模块的短消息的语音播报系统。该系统在远程监控中得到了成功应用。  相似文献   

19.
UOF文档格式的诞生,摆脱了我国长期对国外办公软件格式的依赖性,从而有效掌握在国内市场的主动权,因此国产办公软件对UOF格式的支持性就显得尤为重要。文中针对UOF文档格式的结构进行研究,提出了国产办公软件对UOF格式支持程度的测试方法,同时给出了相关的自动化测试技术。  相似文献   

20.
姜虹  李峰  俞均 《现代电子技术》2012,35(12):50-53
运用形式化方法建模在软件开发过程中可提高目标系统的正确性和可靠性,在此提出了一种利用Z语言进行语义分析的方法。该方法在序列图Z规范的基础上,用属性集表示对象状态,并将序列图的上下文表示为Z形式约束,通过检查上下文约束与对象状态间的一致性对序列图进行语义分析。在此以一个基于学分制的排课系统为例,使用面向对象的形式规格说明语言Z,描述了一个精确、完整的高校排课系统的形式化数学模型。过程显示,该方法具有精确的描述性和很强的抽象性,能为软件系统的开发和验证提供科学的框架。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号