共查询到20条相似文献,搜索用时 78 毫秒
1.
《电子技术与软件工程》2017,(15)
随着科技的发展,各类电子产品的日益增多,藏文文字的使用量也日益得到扩大,藏文输入法、藏文各类电子词典等软件的问世,这就迫使藏文文字需要结构化、数字化、规范化,做这些工作要了解藏文字母的信息熵。本人用扩大容量的方法统计了藏文字母的信息熵,并用zipf定律进行了理论上的说明。 相似文献
2.
《电子技术与软件工程》2015,(8)
随着对语言文字信息处理研究工作的不断加深,藏文信息处理技术也逐渐从字信息处理走向了语言信息处理。跟日语、汉语、韩语等语种的信息处理相同,藏文自动分词(Tibetan Automatic Word Segmentation)是藏文信息处理中的一项必不可少的基础性工作,在此基础上才能划分短语、抽取概念以及分析主题,以至自然语言理解,最终实现智能化。对于不同应用环境,藏文自动分词需要采用最合适的算法,本文通过对藏语语料的统计分析和藏语词的分布特点、语法功能的研究,提出了设计开发基于词典库的藏文自动分词系统,力求为藏文输入法研究、藏文电子词典建设、藏文字词频统计、搜索引擎的设计和实现、机器翻译系统的开发、网络信息安全、藏文语料库建设以及藏语语义分析研究奠定基础。 相似文献
3.
介绍了"藏文政府办公系统研发"项目的研制情况,以及系统的目标定位、体系结构、功能特点、技术路线和藏文化关键技术实现原理等内容. 相似文献
4.
信息产业部电子信息产品管理司 《信息技术与标准化》2007,(8):2-3
藏文软件开发专项设立过程
作为国家信息产业主管部门,信息产业部始终高度重视少数民族语言文字特别是藏文的信息处理工作. 相似文献
5.
6.
藏文词典查询算法是藏文信息处理的一个重要的基础部分,对系统的效率有重要的影响.提出一种快速自适应编码查询算法来指导藏文字、词、短语等编码,在任意排序状况下,快速确定所需编码在整个编码表中的具体位置. 相似文献
7.
本文首先提出了整页文本数据集的合成方法。其次使用合成数据分析近几年4种整页文本识别算法的特点以及优劣,最后在这些模型的基础上,对识别错误率较高的模型,使用不同特征提取网络在测试集进行实验以提升准确率。实验分析了4种整页文本识别模型在藏文敦煌体识别任务上的性能,经过微调后准确率均达到了90%以上。 相似文献
8.
本文在藏文问句预处理研究的基础上主要实现了基于知识融合的藏文分词标注,基于疑问词的藏文问句分类和基于TextRank的藏文关键词提取研究。本文形成了从问句分词标注到问句分类的整套预处理过程,且效果显著,为后续研究藏文知识问答系统提供了思路,打下来了基础。 相似文献
9.
文本媒体是超媒体系统中非常重要媒体形式。本文讨论了超媒体系统中文本媒体的处理方法,包括文本的数据结构,文本如何在窗口下以多字体,多颜色,多大小进行显示的处理方法,以及文本媒体热字处理方法。 相似文献
10.
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务.因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法.首先,根据二值藏文古籍文档图像中连通域的面积和真圆度去除非音节点,获得音节点图像.其次,通过水平投影音节点图像和垂直投影二值原图,得到文本行基线所处的范... 相似文献
11.
随着中国司法信息化建设的不断推进,以各类案件卷宗、裁判文书、法律法规以及司法解释为代表的法律文本数据量迅速增长,基于深度学习的法律文本处理研究已成为法律与人工智能这一交叉领域的热点问题.为了及时跟进该领域的最新研究成果,本文分别从法律文本表示、法律文本分类、法律文本挖掘与应用等3个方面梳理了该领域中的主要研究方向和国内外学者的代表性成果,并对该领域未来的发展趋势进行了分析和展望. 相似文献
12.
13.
14.
15.
《现代电子技术》2019,(18):45-49
传统归类方法采用自动标引主题词变换成分类号实现自动分类,该方法分类过程复杂,应用性差。因此,提出一种基于文本特征识别的电子档案自动归类系统。该系统采用电子档案语料库模块根据使用者需求挖掘语料,实现语料库构建、查询、清除和维护等操作;通过电子档案排版模块,基于内容映射的方式排版电子档案;在此基础上采用有限自动机选择法和组合特征选择法选取文本内特征词,识别电子档案文本特征后,通过SVM分类器和类别识别器两次归类过程,判断电子档案最终类别归属。封闭性归类测试和开放性归类测试结果表明,该系统的平均查全率和精度都高于95%,且不同信噪比环境下,系统平均中断概率为0.17%,低于对比系统。 相似文献
16.
国内各大中城市停车信息贫乏,车辆盲目寻找停车位,增加了交通压力。为了缓解日益严峻的停车问题,必须采取先进的停车管理技术,而停车诱导系统(PGS)正是目前解决停车问题的有效途径。本文先是介绍了PGS的总体构成和各个子系统的功能,然后给出了信息处理子系统的结构,并分析了PGS中几个关键的信息处理技术,为PGS的实现提供了参考。 相似文献
17.
FPGA由于集成了超大规模集成电路和可编程器件的诸多优点,其在现代工业生产和科学研究中的数据采集和处理的应用越来越广泛。本文针对SSI接口类传感器数据采集与数理需求,设计了以FPGA为核心处理器的多通道数据采集系统。所设计的系统通过PCI9054桥接芯片实现FPGA 局部总线到PMC/PCI总线的转换,而后再通过PMC/PCI总线完成数据采集系统与上层母板的连接和通讯。系统调试结果表明所设计的系统能够实现数据采集处理功能。 相似文献
18.
主要叙述了TTS技术原理。提出并实现了一个可靠的文语转换系统——基于语音合成芯片和SMS模块的短消息的语音播报系统。该系统在远程监控中得到了成功应用。 相似文献
19.
UOF文档格式的诞生,摆脱了我国长期对国外办公软件格式的依赖性,从而有效掌握在国内市场的主动权,因此国产办公软件对UOF格式的支持性就显得尤为重要。文中针对UOF文档格式的结构进行研究,提出了国产办公软件对UOF格式支持程度的测试方法,同时给出了相关的自动化测试技术。 相似文献