首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
任何语言的基本构成成分都是词语.一个词的出现往往预示或决定着其他词的出现,脱离语境和搭配的孤立词语没有任何意义,词语只有在与其他词语的搭配运用关系中才能获得实际意义.  相似文献   

2.
陆鲸 《科技信息》2011,(26):380-380
本研究以CLEC语料库为基础,采用错误分析的主要观点,对大学生英语作文中的动名搭配错误进行分析,旨在揭示大学英语学习者动名搭配习得上的难点和问题,对错误进行归类,探究外语学习的过程,寻找错误的原因,为大学英语教学提供借鉴。  相似文献   

3.
文章以计算语言学理论为指导,在传统藏语语法理论的基础上,针对藏文信息处理领域的实际需要,依据副词内部的功能差异和语料库统计数据,把藏语副词划分为十个子类,并根据频率、结构和功能特点做了详细的属性形式化描述,建立了藏语副词语法信息字典,同时,依据互信息理论构建了藏语副词的搭配信息库,分析了搭配词序列的语言学意义.  相似文献   

4.
李成忠  李静 《科技信息》2009,(36):I0003-I0003
名词转化成动词这一现象一直是语言学家和学者研究的对象。本文主要探讨适于转化成动词的名词的类别属性、名生动词的语义变化、语体色彩及修辞作用等。  相似文献   

5.
一种基于改进互信息的文本分类方法   总被引:1,自引:0,他引:1  
用改进的互信息公式进行特征选择,通过三种文本分类方法验证了改进的公式具有较高的准确率、召回率和F1值,从而证明改进的互信息公式的有效性.  相似文献   

6.
本文力求说明汉语动名兼类词和动词名用的区别,并根据双音节复合动词与数量词组(几)“个”的组合能力来划分两者的界限。  相似文献   

7.
现有的文本自动摘要技术大多是运用向量空间模型将文本作为一个整体进行处理,忽略了段落及段落之间的关联程度,导致提取的摘要不能够全面反映所包含的主题,针对这一问题,文章提出了基于互信息的文本自动摘要方法。该方法利用互信息对文本中词语、句子及段落之间的关联程度进行计算,依据关联程度将整个文本划分成包含不同主题的较小单元,并针对每一单元运用优化的句子权重计算方法进行主题句提取,然后利用主题句生成文本摘要。实验验证了方法的有效性,在自动摘要提取方面取得了良好效果。  相似文献   

8.
基于互信息的中文姓名识别方法   总被引:4,自引:0,他引:4  
提出并实现了一个基于互信息的中文姓名识别方法,该方法充分挖掘姓名和其上下文信息的关联程度以及姓名用字之间关联程度的信息,引入互信息对其进行定量的描述;提出中文姓名的上下文互信息、内部互信息等概念,并对其建立了动态评价函数,开放测试结果表明,该方法有效地提高了中文姓名识别的效果,保证了较高的精确率和召回率。  相似文献   

9.
针对传统粗糙集算法准确率较低,精度较差,分析大规模数据时难以获得理想结果等问题,提出了基于互信息的属性约简改进算法。为了提高算法精度,引入了对条件熵的计算;采用条件概率考量属性重要性,降低了算法的复杂度;计算时,优先计算数据相容性,优化了样本计算数量;利用多组数据集,对比不同分类器和现有算法。实验结果表明,在不增加时间复杂度前提下,改进算法能得到更好的约简规则,获取理想的约简结果。  相似文献   

10.
基于改进互信息的特征提取的文本分类系统   总被引:2,自引:0,他引:2  
文章提出并实现了一种改进互信息的特征提取和支持朴素贝叶斯的文本分类系统,改进的互信息算法加强了负值单词的互信息值,弥补了原来互信息预处理算法的不足,从而提高了分类精度.实验结果表明本算法和系统具有较高的分类准确率。  相似文献   

11.
通常的线性滤波技术不能很好地解决非线性时间序列去噪问题,而现有的非线性去噪技术的参数选择往往要依赖于直觉和经验.为此,提出基于互信息判据的小波去噪方法,利用小波进行非线性去噪处理,并以互信忠作为去噪处理截止的判定条件,给出了小波去噪算法,分析了其优势,并进行了仿真实验.仿真结果表明,小波算法能更好地处理不平稳和突发的噪声;互信息所指示的优化截断尺度,既较好地保留了信号的动力结构,又有效地实现了非线性噪声过滤.  相似文献   

12.
提出一种第一特征选择的信息论方法.该方法考虑了第一特征和其他特征组合共同包含的类别信息.即使在非线性分类问题中也表现出良好的第一特征选择性能.  相似文献   

13.
一种改进的互信息特征选取预处理算法   总被引:3,自引:1,他引:3  
讨论了基于互信息的特征选取算法在文本分类中的性能问题,分析了利用这种特征选取算法存在分类精度不高的原因,认为互信息为负值的特征在分类中具有很重要的作用.在此基础上提出了一种基于互信息特征选取的改进算法,该算法加强了互信息为负值的特征在分类中的作用.实验结果表明,改进后的算法可以有效地提高文本分类精度。  相似文献   

14.
基于最大互信息的离散隐马尔柯夫模型训练方法   总被引:4,自引:1,他引:3  
在基于隐马尔柯夫模型(HMM)的语音识别系统中,模型训练最常用的算法是Baum-Welch算法,该算法具有快速收敛及保证每步迭代模型的似然概率单调增的优点,但它基于最大似然训练准则,而该准则不能将各个模型很好地分析,这直接导致了识别时的错误,鉴于最大互信息可以克服这一缺点,提出了一种基于最大互信息的训练方法,该方法借助于梯度,调整参数以使模型与训练数据的互信息最大,实验结果表明,使用该方法使系统的识别性能得到了一定的改善。  相似文献   

15.
用互信息进行图像配准可使配准的精度达到亚像素级,但该方法因计算量很大致使配准速度较慢.为了提高图像配准速度,并进一步提高配准的精度,首先运用多分辨率的方法将两幅待配准图像分别分解成n个不同分辨率的子图像,然后利用互信息先将分辨率最低的图像进行粗配准,并将此配准的结果作为下一个分辨率较高的图像配准的基础,继续这个过程直至最高分辨率图像被配准,即运用由粗到精的配准策略减小计算量,从而提高配准速度.用Visual C++6.0编程实现该配准方法,实验结果表明在图像配准过程中将多分辨率和互信息结合起来使用,配准速度得到很大的提高,并且由于多分辨率的使用有利于避免局部最大值,使得配准精度也有了一定程度的提高.  相似文献   

16.
由于网络信息的激增,如何充分利用大量的信息,并有效地为Web用户服务成为一个急需解决的问题。相关研究表明利用Web文档聚类的方法可以缩小信息检索的范围,提高查询准确率。通过分析Web文档的特征以及常用Web文档聚类方法的优缺点,提出了一种基于互信息理论的Web文档聚类的方法。在聚类的过程中,计算特征词之间的互信息值,根据阈值判断特征词是否属于同一类别。实验结果表明,该方法与K-Means聚类算法相比较,在准确率和召回率方面均有提高。  相似文献   

17.
镜头边界检测是基于内容视频检索的基础环节。由于视频类型与内容众多,目前镜头边界检测中存在阈值选取困难、查全率和查准率不高等问题。针对以上问题提出一种改进的基于互信息量的镜头边界检测算法,在字幕检测定位算法有效定位字幕区域的基础上,通过比较非字幕、非四角区域HSV空间直方图求取的相邻帧间互信息量的差异程度,实现镜头边界检测。实验表明,与当前应用最广泛且比较有效的双阈值算法相比,突变镜头检测综合性能平均提高12.4%,渐变镜头检测综合性能平均提高8.2%,通过自适应阈值的选取,有效解决了阈值依赖人工经验选取的问题;与当前已提出的基于互信息量的镜头边界检测算法相比,该算法降低了计算复杂度、几乎能检测所有的淡入淡出镜头边界,并使得镜头边界检测具有较高的查全率与查准率。  相似文献   

18.
针对信息安全风险评估训练数据少、求解最优值困难等问题,提出了基于互信息和K-means聚类的信息安全风险评估方法.用模糊评价法量化风险指标,通过互信息计算风险因素与风险等级之间的依赖性,找出风险度在每个等级的最优点作为K-means初始中心点,用K-means算法对数据分类.该方法实现简单且克服了 K-means对初始...  相似文献   

19.
基于互信息和疑义度相结合的知识约简方法   总被引:3,自引:0,他引:3  
提出一种基于互信息和疑义度相结合的知识约简方法,遵循修正的互信息准则,发展了一种类似于正交化特性的启发式算法,从决策系统中找出属性集的约简;该方法采用可增可删的双向回归算法,克服了目前前向选择或后向删除的知识约简方法中存在的属性相互依赖或依赖于决策类别的缺点,可保证分类精度不变的情况下,得到更为简化的决策属性集。最后,通过一个简单实例的仿真分析过程验证了文中所提方法的有效性。  相似文献   

20.
基于互信息量的医学图像拼合算法   总被引:2,自引:0,他引:2  
研究了基于互信息量的图像拼合方法,对现有的概率分布估计方法及搜索策略进行了比较,并提出用梯度二值化图像互相关配准做预处理方法,并就融合后图像的显示问题提出一种基于边界法向插值的新方法.应用这些方法拼合实际XA医学图像,实现序列下肢步进图像的准确拼合.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号