首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
维吾尔语句子边界识别算法的设计与实现   总被引:2,自引:0,他引:2  
本文分析维吾尔语的句子结束形式,研究维吾尔语句子边界规则,给出了句子划分思路,并实现了维吾尔语句子边界识别算法及程序.在对大量手工划分句子语料进行统计测试结果表明,该句子边界识别程序准确率超过98.7%.维吾尔语句子边界识别的研究对实现维吾尔语词性标注系统、维吾尔语句法分析器、机器翻译等众多领域有着很高的实际意义.  相似文献   

2.
本文采用统计和规则相结合的混合策略,提出一种维吾尔人名的自动识别方法.该方法利用知识库中的统计信息,对维吾尔人名做初步的提取,分析维吾尔人名构成的各类特征,提取特征集,总结相应的识别规则,对候选人名进行识别,并消除歧义.在此基础上构建了维吾尔人名识别系统,并对系统进行了封闭和开放测试,实验结果表明,封闭测试的准确率达到88.47%,召回率达到85.1%.  相似文献   

3.
利用语言学专家人工标注的语料库对维吾尔文动词进行研究,并总结出了维吾尔文动词范畴的连接规则框架.在人工标注的实例库的基础上,收集了词缀连接规则集合,经人工纠正构建了词缀连接规则库集合.最终,结合人工标注实例库、词缀连接规则库及维吾尔文动词范畴的连接规则框架提出了维吾尔文动词词干提取方法,该方法的独立实验准确率达到了84.15%.  相似文献   

4.
对一类具有线性约束的凸规划问题给出了一个原始-对偶内点算法, 该算法可在任一原始-对偶可行内点启动, 并且全局收敛. 当初始点靠近中心路径时, 便成为中心路径跟踪算法. 数值算例表明该算法是有效的.  相似文献   

5.
构建维吾尔语框架语义知识库是自然语言处理的基础性工程,目前大部分工作基于人工。从真实语料库中抽取包含将要描述词元的例句,为例句标注以及这些例句的配价模式进行深入研究,从标注好的维吾尔语例句中提取维吾尔语词元和例句填充到维吾尔语框架库,构建维吾尔语词元库和例句库,实现维吾尔语语义框架网络的自动构造之目的。本文对维吾尔语真实语料库中抽取的例句中标注对象进行初步分析,论述了人机交互式基于阿拉伯字符的UFN例句辅助标注系统的功能模块设计和工作流程。介绍了UFN例句辅助标注系统的例句标注界面和词元标注报告、词条报告的自动生成演示界面。  相似文献   

6.
本文根据现有的维吾尔文语音识别语音库的不足,以自然口语为对象研究维吾尔语的语音特征,提出了适合该语言的电话语音语料库设计方案,其中包括了维吾尔语电话语音库的文本设计、发音人的选择、语音录制、语音库的标注和后期处理方法等.本文从构建的350个说话人的维吾尔语电话语音语料库中挑选50个目标人提供给基于GMM-UBM/SVM的维吾尔语电话信道说话人识别的研究.  相似文献   

7.
新词识别是影响搜索准确率以及速率的重要因素.本文提出了一种基于统计模型和词语搭配的中文新词自动识别方法.采用条件概率的方法提取单字词搭配特征和临界词特征,并采用层次结构实现新词定位以及识别.首先采用双向最大匹配相结合的方法对文本进行词法粗切分,然后根据单字词搭配得到候选新词的位置,用临界词方法确定候选新词的边界,采用改进Nagao串频统计方法对新词候选词在本文内进行重复串统计,对于只在文中出现一次的新词则借助搜索引擎进行确定.对新浪网近期的网络文章进行测试,结果表明,基于本文方法设计的系统可以识别不同领域的新词,在低频词、较长的词以及新词语搭配方面取得了良好的效果.单字词搭配检查发现新词位置综合指标F值达到96.8%.  相似文献   

8.
对于经典Rough集理论中某一类决策或模式识别问题,其样本空间或决策表中客观存在的任何两个样本实例体现的决策规则不可能完全相同。本文对此进行了讨论并提出了RS邻域拓展的全局补偿RS方法。基于上述方法对脱机手写识别英文字母的模板匹配算法进行了优化,说明了其有效性。  相似文献   

9.
语音语料库是语音识别和语音合成技术研究的基础.由于维吾尔语文字与语音特征、维吾尔语语音语料库的建立、管理、使用之工作不仅工作量巨大,且具有一定的复杂性,这就不得不开发维吾尔语语音数据库管理软件.本文首先研究维吾尔语语音语料库的设计过程,包括语音文本的设计、语音录制、语音库的标注、并在此基础上论述维吾尔语语音语料管理软件的总体功能设计以及部分关键技术的实现方法.  相似文献   

10.
本文利用Wolfe对偶将一个不可微规划问题转化为一个可微的约束非线性规划问题,并证明了相应的等价性定理,给出了实用算法5,初步数值结果表明,算法是可行的。  相似文献   

11.
本文提出了一种基于规则库的多层过滤进行机器翻译的算法.该算法实现了英文人名向维吾尔文人名的自动翻译.该算法不同于传统的英维人名翻译系统所采取的方法,不需要建立丰富、全面的两种语言人名对齐词库.本算法在对已翻译的大量实例进行统计并分析的基础上,找出了英文与维文人名翻译的三层规则并设计出了本算法.  相似文献   

12.
采用基于段长分布的非齐次隐马尔可夫模型(DDBHMM)进行维吾尔语声学建模。在新语料下由于总词汇量的成倍增加导致识别时间倍增,为缩短识别时间将耗时最长的概率计算部分采用多线程机制优化了识别模块,同时加入了端点检测进行控制,并相继设计了录音模块、特征提取模块、波形显示及结果输出显示模块等,对这些模块进行集成界面化后产生了一个基于DDBHMM的维吾尔语连续语音声学层实时识别系统,并对系统进行了测试及验证.  相似文献   

13.
目的:试验研究维医沙疗对骨关节炎动物模型骨质层转移的影响.方法:采用CT扫描的手段分别四次(建立实验对象OA模型前后各一次、进沙疗第14天和第28天各一次)采集两个实验对象股骨数据.将数据导入MIMICS软件分离实验对象股骨,根据CT值范围不同把股骨分为六个骨质层并读取各层体积.分析了各骨质层的体积在股骨总骨量中所占比例的变化和股骨平均CT值的变化.结果:分析四次CT数据的变化,发现沙疗对象股骨总骨量增长,而对照对象之下降.与此同时沙疗对象股骨平均CT值上升,相比之下对照对象平均CT值下降.结论:沙疗对关节炎对象有促进骨代谢作用,使骨质从低CT值的骨质层转移至高CT值骨质层.  相似文献   

14.
讨论了使用JNI技术对本地维文代码转换方法的调用.  相似文献   

15.
为了有效地确定目标位置,提出了一种基于兴趣点检测的目标识别方法.根据像素点的灰度和边缘强度信息,确定兴趣点的分布位置.以兴趣点为中心,利用位势函数构建目标函数,目标函数取最大值的位置确定为目标位置.提出了一种改进的概率混沌优化算法求解目标函数的最大值.概率混沌优化算法将搜索空间分为原始搜索空间和精搜索空间,分别以不同的概率同时对两个空间进行搜索,并逐渐增大精搜索空间的搜索概率,从而可在确保算法具有全局寻优能力的前提下加快寻优速度.研究结果表明,该方法可有效地确定目标位置,且结果不受目标平移、旋转、缩放、甚至变形等影响,仿真结果验证了该方法的有效性.  相似文献   

16.
维吾尔语词性标注研究,是面向信息处理的维吾尔语语法分析的核心内容.本文提出面向信息处理的现代维吾尔语词语分类体系及其标记集,并且对分类体系中的12个词类的分布特征从形态变化、句子成分功能和短语组合功能等方面进行了描述.  相似文献   

17.
很多专业软件不支持标准维吾尔文Unicode字符表达,而软件本地化过程中迫切需要合适工具解决编码的转换问题.本文针对一个Visual Basic 6.0开发的地理信息系统工具软件维吾尔文本地化问题,运用了一种可将Unicode字符转换为Visual Basic 6中的Chrw函数表达式,有效解决了VB6开发工具采用ANSI编码而对Unicode编码的维吾尔文字符支持不够无法显示的问题.该转换工具用Visual C#开发,支持VB6环境下用标准维吾尔文Unicode字符编码替换各种文本,满足用标准维吾尔文Unicode编码编写程序底层代码,或是替换原有非Unicode维文字符的需求,经测试该工具达到预期目标.  相似文献   

18.
在研究Android平台文本排版显示引擎和维吾尔文特点的基础上,通过分析维吾尔文本在多款阅读器上显示时出现的问题,找出不支持显示维文文本的原因。最后根据维吾尔文特点进行分析并设计维文阅读器架构,该架构的核心是在阅读器应用层进行维文显示渲染引擎的设计。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号