首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 765 毫秒
1.
反垃圾邮件及粗糙朴素贝叶斯邮件分类器   总被引:1,自引:1,他引:0  
垃圾邮件的广泛传播严重的影响的电子邮件的正常使用,对当前主要的反垃圾邮件过滤技术进行了分类和研究,并且提出了基于ROUGHSET优化的朴素贝叶斯分类邮件过滤算法。基于上述理论的反垃圾邮件过滤实验证明了算法的有效性。  相似文献   

2.
首先分析了贝叶斯单因素过滤的基本原理,指出它存在不考虑自然语言内在联系的本质错误,并给出了目前垃圾邮件散发者常用的攻击手段,然后重点分析比较了无序特征、有序特征、SBPH/BCR以及马尔可夫链匹配4种基于贝叶斯多元模型的邮件过滤的方法,实验结果表明贝叶斯多元过滤好于单因素过滤,在4种多元模型中马尔可夫链匹配过渡效果最好.  相似文献   

3.
针对传统的基于词频特征向量核方法的垃圾邮件过滤算法中忽略词汇间的序列信息而导致信息损失影响过滤精度的问题,本文将词序列核与SVM(support vector machines)算法结合,对垃圾邮件进行过滤,相应的实验表明,该方法提高召回率、正确率和精确率,从而提高了过滤精度.  相似文献   

4.
针对当前大众借助网络获取医疗信息的需求日益增强,以及通用搜索引擎获取专业领域信息时准确性差、效率低下的缺点,本文设计了基于nutch组件的医疗垂直搜索引擎。该系统实现了中文分词功能,通过文本训练得出了专业词库,运用空间向量模型算法对网页进行医疗主题相关度的计算,实现了网页过滤功能,并在排序算法中加入了主题相关因素。测试结果表明:该系统相对于通用搜索引擎,在获取医疗行业信息方面具有更高查准率,减少了不相关信息的干扰,使医疗信息的查找与定位更精确,能够为大众提供更具针对性的服务。  相似文献   

5.
抗中文主动干扰的柔性中文串匹配算法   总被引:2,自引:0,他引:2  
研究了网络内容安全领域里的恶意夹杂关键词问题,总结出中文主动干扰概念,提出了中文串匹配算法的形式化定义.在此基础上,给出了改进的柔性中文关键词模式匹配算法,并计算了算法复杂度.该算法通过中文主动干扰技术有效地避开了目前经典的中文字符串匹配算法存在的问题,使得包含这类算法的内容安全过滤/网络入侵检测手段失效,完成了恶意夹杂字符的中文关键词匹配.结果表明,用柔性中文字符串匹配方法能较好地解决恶意夹杂字符的字符串匹配难题,对遭受中文主动干扰过的网页能进行有效地安全防护.  相似文献   

6.
推荐系统中的隐私保护问题是当前的一个研究热点.为了解决推荐系统服务器不可信问题,提出了一种基于代换加密的隐私保护协同过滤算法.用户在客户端采用自定义代换加密机制,对评分信息进行加密并提交给推荐服务器,服务器根据收集的评分密文信息进行协同过滤推荐.同时,设计了一种用户模式相似度计算方法,用于在隐私保护协同过滤中确定每个用户的近邻,确保该推荐算法在无法获取用户评分语义的情况下,对用户的评分密文进行预测.采用公开的Movie Lens数据集和Netflix数据集对该算法的性能进行评估.实验结果表明,该算法能够以较小的计算代价和通信代价来实现隐私保护和精确推荐.  相似文献   

7.
本文提出了一种基于规则库的多层过滤进行机器翻译的算法.该算法实现了英文人名向维吾尔文人名的自动翻译.该算法不同于传统的英维人名翻译系统所采取的方法,不需要建立丰富、全面的两种语言人名对齐词库.本算法在对已翻译的大量实例进行统计并分析的基础上,找出了英文与维文人名翻译的三层规则并设计出了本算法.  相似文献   

8.
中文实体间的数值型关系抽取有着广泛的应用前景,目前常用的实体关系抽取一般采用有监督抽取方法,且多用于短文本和简单句,并不适合处理海量复杂句.针对来自于网络的大量复杂文本,本文提出了一种中文实体数值型关系的无监督抽取方法.在中文分词、词性标注等自然语言处理结果的基础上,首先经过句式分析并采用选择树算法构建候选集,接着利用Jaro-Winkler距离进行候选集筛选,最后抽取得到数值型三元组关系.本文在钢铁、船舶、房地产3个行业的数据上进行了实验,结果表明,该方法抽取中文实体数值型关系是有效的.  相似文献   

9.
一种汉语语句依存关系网分析策略与生成算法研究   总被引:2,自引:0,他引:2  
本文以依存语法作为语言模型的基础,首先提出了一种全新的句子分析策略: 分析在两级上进行. 一级是基于中心动词同其他成分间的约束关系 ,通过寻找汉语语义类之间可能存在的句法关系,实现句子成分过滤,完成句子主干提取. 另一级是上下文级,将语法、语义和语境信息一体化,结合依存语法确定汉语句子中各成分间的依存关系. 之后给出了一种快速有效的用于完成句子分析的松弛匹配迭代算法. 通过实验表明了该分析策略和算法的可行性.  相似文献   

10.
针对目前地址匹配算法匹配速率低、空间开销大的不足,提出了一种基于哈希和双数组trie树的多层次地址匹配算法.利用中文地址的分类、分层及组合规则,改进了地址匹配词典的构建方式,减少了词典构建的时间和空间开销.通过哈希运算,将空间坐标存储在哈希表相应的位置上,加快了空间坐标的检索效率.同时,在地址匹配的过程中,采用双向扫描及哈希运算代替传统的数据库检索方式,提高了地址匹配速率.最后,通过实验对算法的有效性进行了验证.  相似文献   

11.
针对邮局业务的自动化、信息化改革,利用图像处理和图像分析方法, 结合模式识别理论,从复杂的信封背景中提取有用字迹信息,设计了自动化的给据函件自动登单处理系统。详细介绍了该系统的软硬件结构和整个图像处理过程。对各种信封的处理实验结果表明,所提出的该图像处理方法能够很好的满足实际邮政业务的需要,提高了邮件处理的效率和水平,减轻了工作强度。  相似文献   

12.
译后编辑器是提高翻译系统译文质量的重要方法之一,它的效率影响整个翻译系统的质量和实用水平.目前,还未发现对维汉/汉维机器翻译译后编辑问题的专门研究.本文对维汉/汉维统计机器翻译系统的翻译结果进行分析,设计并实现了支持维汉/汉维编辑界面的译后编辑器,并详细介绍了编辑器的核心功能及其实现方法.该译后编辑器对维汉/汉维机器翻译系统生成的译文进行编辑,使用词干提取、拼写校对、lucence.net等技术提高了编辑效率.经编辑纠正后的译文校正稿以句子为单位保存在记忆库,人工纠正后的未登录词保存在词典数据库,进而提高机器翻译系统生成译文的质量.实验表明,此译后编辑器对基于实例和基于统计引擎的维汉/汉维翻译结果的后编辑提出了较好的解决方案.  相似文献   

13.
维吾尔语对偶词的自动识别是维吾尔语自然语言处理中的一项基础性工作.维吾尔语对偶词的自动识别是维吾尔语自动分词的难点之一,也是一个重点.在维吾尔语中,内部成分平等连接而形成的词汇单位叫做对偶词.本文首先介绍了对偶词的基本概念和特征,然后分析了维吾尔语对偶词的结构特征和结合规则.在字符串匹配算法的基础上,提出了一种基于规则的维吾尔语对偶词的识别算法,并通过试验证明了该算法的正确性.  相似文献   

14.
将免疫克隆选择算法与量子算法相结合的混合量子免疫算法应用于处理多极值和多变量的蛋白质折叠问题中.在克隆选择算法中引入免疫记忆细胞并加入量子双链编码方式以增加其搜索到全局最优值的概率.由于该算法易陷入局部最优,为改善该算法的性能而跳出局部最优解,将年龄算子引进到该算法中.实验结果表明,改进后的量子免疫算法在最低能量值和计算时间上与之前相比有明显的提高,而且年龄算子的加入在早熟收敛的改善上同样效果显著.  相似文献   

15.
现代通信系统尤其是扩频系统需要完成快速复杂的信号处理,对电路的处理速度提出了更高的要求.根据FPGA高速并行的处理能力和完全硬件实现的芯片构架及其系统实现的单片化的特点,在实现过程采用了直接数字频率合成技术(DDS)和并发处理技术,完成了系统的软件仿真和硬件电路设计和实现.仿真和测试的结果表明本系统与传统的实现方式相比,提高了系统的性能和处理速度,较大程度地减少了硬件延时.并且系统功能可以通过程序来修改和升级,具有很大的灵活性.  相似文献   

16.
土地利用变更模型及其事务处理机制是土地利用现状管理信息系统的核心.传统变更模型所支持的变更操作粒度较为单一、事务完整性差、时空语义表现过于单薄.在分析了土地利用变更特点和存在问题的基础上,提出了一种土地利用多级变更模型LU-MCM(1and use multi—level change model),模型以土地利用变迁过程为变更对象,并进一步将之划分为多级变更逻辑单元进行组合描述,而所需解决的长事务处理机制则通过扩展的多粒度树状事务模型实现.土地利用现状管理信息系统的设计和实现证明,该模型对土地利用变迁过程表达效果较好,为土地利用变更数据管理提供了思路.  相似文献   

17.
二维傅立叶变换及频域滤波被广泛地应用在数字图象处理的各个领域之中。以往要对图片进行频域滤波处理,都要用编制特定程序的方法来实现,对于不同的图片就要编制不同的程序,这样做往往许多工作都是重复性的,效率很低。本文提出了一个二维快速傅立叶变换及滤波系统的概念,以避免重复性劳动,提高工作效率。这个系统提供了一般数字图象处理中频域处理所需的功能,要对不同的图片作不同的滤波处理,只要适当地改变相应的参数即可,不必重新编制特定的程序来完成。本文提出了这个系统的设计思想、实现方法。最后在PDP-11/23计算机及与之相联的CBX-1600图象处理系统上实现了这个系统。  相似文献   

18.
并行Pareto多目标演化算法   总被引:6,自引:1,他引:5  
提出并实现了一个并行Pareto多目标演化算法(PPMEA),PPMEA算法是一个通过演化算法来解决基于Pareto的多目标优化问题的并行计算模型。在这个算法中,采用了并行演化算法中常用的全局并行模型和粗粒度并行岛模型。构成每个岛的子群体以不同的杂交概率和变异概率各自独立的演化,但是每隔一定的代数它们要交换外部集中的个体。标准测试函数的数值实验结果表明,所提出的算法能够使找到的解集快速收敛到Pareto非劣最优目标域,并且解集沿着Pareto非劣最优目标域有很好的扩展性。  相似文献   

19.
针对企业求解业务问题时方案制定不合理的问题, 设计了面向知识服务的业务问题求解模型框架以及求解方案管理系统的体系架构, 并介绍了该系统的功能模块、关键技术和实现方法. 系统通过对企业业务问题求解方案进行多层次的建模, 规范制定了企业求解方案的建模流程, 使求解方案的制定效率更高; 同时实现了业务执行过程的知识化. 系统通过分析和抽取企业内外的信息, 实现了企业知识资源的自生长, 从而提高了求解方案制定的准确性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号