首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
以字为单位处理中文邮件存在着很大困难,针对于此,笔者引进中文分词算法,设计并实现了基于分词的垃圾邮件过滤系统,并且阐述了与实现相关的3个关键算法:用于关键词匹配的多模式相似/精确匹配算法,用于中文邮件处理的中文分词算法,以及用于特征提取的N元特征提取算法.最后实验证明了该系统对中英文垃圾邮件过滤都有很高的性能.另外,文章第三部分还给出了基于分词的非垃圾邮件分类系统的设计与实现.  相似文献   

2.
反垃圾邮件及粗糙朴素贝叶斯邮件分类器   总被引:1,自引:1,他引:0  
垃圾邮件的广泛传播严重的影响的电子邮件的正常使用,对当前主要的反垃圾邮件过滤技术进行了分类和研究,并且提出了基于ROUGHSET优化的朴素贝叶斯分类邮件过滤算法。基于上述理论的反垃圾邮件过滤实验证明了算法的有效性。  相似文献   

3.
作为一种独立于具体分类算法的核函数评估标准,核极化中用核函数表示同类输入模式之间的相似性增大而异类输入模式之间的相似性减小,这将导致核极化值的增大。针对该标准未考虑同类输入模式的局部结构信息的保持性,导致限制异类数据可分性的自由度增强的问题,本文提出一种"局部化"的核函数评估标准,称为局部核校准。局部核校准是核极化的自然推广,它不仅能够保持同类输入模式之间的局部结构信息,相对于核极化方法它能够获更好保证数据的可分性。理论分析和UCI数据集上的比较实验均表明局部核校准是一种更好的核函数评估标准。  相似文献   

4.
提出了利用遗传算法对多核支持向量机的权系数进行寻优的方法GA-MKL,先选择表现能力最好的参数的单核构成多核,再利用遗传算法来对多核的核系数来寻优.采用该算法在UCI标准数据集上进行了实验,结果表明,该算法为多核SVM的系数选择提供了一种可行的方法.与单核SVM相比,该方法具有更好的分类能力,和其他多核学习算法相比,性能也有一定的提高.  相似文献   

5.
针对传统Mean-shift算法中颜色核函数直方图对目标特征描述较弱的缺点,提出了一种联合目标特征点的二维结构信息和颜色信息的Mean-shift改进算法.改进算法细化了Harris检测算子的角点响应阈值,提取出更多的目标特征点计算其方向分布,并以方向与部分颜色特征的直方图构建目标模型,该模型能显著区分目标与背景.实验对不同算法进行了仿真及性能比较,结果表明:提出的改进算法在一定的复杂场景中提高了跟踪精度,且具有较好的鲁棒性.  相似文献   

6.
基于RBF核的SVM核参数优化算法   总被引:3,自引:0,他引:3  
SVM是一种新型的机器学习方法,其分类性能的优劣主要受核函数及核参数的影响,国内外学者针对SVM核参数的选择已提出许多算法.本文首先分析TRBF核参数对SVM分类性能的影响,然后又对比分析了目前存在的几种基于RBF核的SVM核参数选择方法.通过实验,发现使用遗传算法选择核参数的SVM有比较快的搜索速度.  相似文献   

7.
本文首先介绍传统光滑粒子流体动力学(Smoothed Particle Hydrodynamics,简称SPH)方法的基本公式,用对称(Symmetric)光滑粒子流体动力学(SSPH)核近似方法函数.函数一阶导数和函数二阶导数的计算进行了研究,在SSPH方法的基础上提出了精度较高、计算量少和所占内存空间较低的降元算法.对SSPH核近似方法和降元算法的精度进行了分析,SSPH方法和本文提出算法用于一维函数的一阶导数和二阶导数的计算,并进行误差对比分析发现精度有所提高.最后本算法应用于非稳态热传导问题上,同时进行数值计算和对比分析,验证了本方法的有效性.  相似文献   

8.
支持向量机在解决非线性及高维模式识别中表现出许多特有的优势,被广泛应用在文本分类领域。但是其核函数及其参数的选择对分类效果具有很大的影响,单一核函数难以很好地解决文本分类问题。因此,本文选取了三个常用的核函数进行两两组合,利用加权组合核的形式来弥补单核自身特点可能带来的缺点,然后利用人工免疫算法(Immune algorithm,IA)对组合核进行参数寻优,以提高文本分类效果。实验分析证明,此方法有效。  相似文献   

9.
首先分析了贝叶斯单因素过滤的基本原理,指出它存在不考虑自然语言内在联系的本质错误,并给出了目前垃圾邮件散发者常用的攻击手段,然后重点分析比较了无序特征、有序特征、SBPH/BCR以及马尔可夫链匹配4种基于贝叶斯多元模型的邮件过滤的方法,实验结果表明贝叶斯多元过滤好于单因素过滤,在4种多元模型中马尔可夫链匹配过渡效果最好.  相似文献   

10.
采用薛开先的“人体末梢血微核率测试法”,检测了没有接触过任何诱变剂的100个健康维吾尔人末梢血淋巴细胞200000个,检测出有27个微核,激核率为0.14‰.不同年龄组微核率的分布范围为0~1,各组平均微核率之间没有显著性差异(P>0.05),微核在不同性别的健康维吾尔人群中的分布范围也是0~1‰,平均微率率在不同性别之间也同样无显著性差异(μ=0.5,P>0.05).因此,从健康维吾尔人群中检测出来的微核率,可作为确定健康的一项指标,这对医学、环境研究以及诱变致癌因子的遗传毒理学检测有重要意义.  相似文献   

11.
针对当前大众借助网络获取医疗信息的需求日益增强,以及通用搜索引擎获取专业领域信息时准确性差、效率低下的缺点,本文设计了基于nutch组件的医疗垂直搜索引擎。该系统实现了中文分词功能,通过文本训练得出了专业词库,运用空间向量模型算法对网页进行医疗主题相关度的计算,实现了网页过滤功能,并在排序算法中加入了主题相关因素。测试结果表明:该系统相对于通用搜索引擎,在获取医疗行业信息方面具有更高查准率,减少了不相关信息的干扰,使医疗信息的查找与定位更精确,能够为大众提供更具针对性的服务。  相似文献   

12.
一种基于指纹分类的指纹识别算法   总被引:4,自引:0,他引:4  
依据指纹特征点在指纹图像中的特性给出了一种基于指纹分类的识别算法.该算法利用中心点和三角点信息对指纹进行分类并初匹配,然后用可靠性较高的分叉点所在脊线的相似度寻找出基准点对,根据基准点与周围特征点的关系筛选基准点对、确定变换参数,有效地解决基准点筛选受噪声影响问题,最后利用可变限界盒实现指纹匹配.实验结果表明,该算法能快速、准确地定位基准点,正确有效地实现指纹匹配,同时提高匹配速度及精确度.  相似文献   

13.
一种新的运动自适应去隔行算法   总被引:1,自引:0,他引:1  
提出基于棱边方向检测的运动自适应去隔行算法,该算法能充分利用图像序列的时间和空间上的相关信息,采用新颖的相邻场运动检测方法区分视频序列中的运动和静止部分.对于运动部分,使用改进的基于棱边方向的边沿自适应插值算法;对于静止部分,采用三点中值滤波插值算法.仿真实验表明:算法无论在画面视觉效果还是视频图像信噪比,均达到良好了效果.  相似文献   

14.
手机现有拼音输入法在字库容量较大时,输入效率比较低,搜索算法和结构还不是很合理,本文设计的编码采用了树型数据结构,并根据此结构设计了1种优秀的搜索算法,添加的辅助信息,可提高用户的文本输入效率,且所占空间少,该新的拼音输入法已成功移植到3G终端开发板中。  相似文献   

15.
一种汉语语句依存关系网分析策略与生成算法研究   总被引:2,自引:0,他引:2  
本文以依存语法作为语言模型的基础,首先提出了一种全新的句子分析策略: 分析在两级上进行. 一级是基于中心动词同其他成分间的约束关系 ,通过寻找汉语语义类之间可能存在的句法关系,实现句子成分过滤,完成句子主干提取. 另一级是上下文级,将语法、语义和语境信息一体化,结合依存语法确定汉语句子中各成分间的依存关系. 之后给出了一种快速有效的用于完成句子分析的松弛匹配迭代算法. 通过实验表明了该分析策略和算法的可行性.  相似文献   

16.
一种小波域音频信息隐藏方法   总被引:1,自引:0,他引:1  
提出了一种基于量化的小波域音频隐藏算法,将保密语音隐藏到载体音频中.为提高隐藏重和保密语音传输的安全性,对保密语音进行了小波域压缩编码和m序列的扩频调制,生成待隐藏的比特序列;通过量化方法,将编码和调制后的保密语音隐藏到载体音频的小波系数中;保密语音的恢复过程不需要使用原始音频、仿真结果表明,隐藏有保密语音的载体音频听觉质量没有明显下降,提取的保密语音感知质量较好;该算法对重量化、加噪、低通滤波等攻击均有良好的鲁棒性.  相似文献   

17.
随着电力计量业务的不断扩展,迫切需要由业务信息、技术知识、行业标准及其内在联系所组成的电力计量知识图谱,为电网的决策和发展提供更为全面有效的支持。命名实体识别是构建知识图谱的基础。针对电力计量领域需要,结合中文分词技术特点,基于联合学习思想,提出了一种基于联合学习的中文电力计量命名实体识别技术。该技术联合CNN-BLSTM-CRF模型与整合词典知识的分词模型,使其共享实体类别和置信度;同时将2个模型的先后计算顺序改为并行计算,减少了识别误差累积。结果表明,在不需要人工构建特征的情况下,方法的正确率、召回率、F值等均显著优于以往方法。  相似文献   

18.
领域分类结构的抽取已成为本体工程和本体学习的关键部分,提出一种新的分类结构学习算法,将Web作为知识获取的语料库,运用迭代方法抽取相关语言学模式,再利用语言学模式抽取分类结构,并采用改进的互信息方法对结果进行评价和过滤,最后通过实验对该分类学习算法的性能进行评价.实验表明:算法具有良好的跨领域性,在准确率和召回率方面也有改善.  相似文献   

19.
针对水下图像存在的色偏、雾状模糊、低曝光和非均匀光照问题, 提出一种基于色彩衰减补偿和Retinex的水下图像增强算法. 首先, 为校正水下图像的色偏, 利用水体对不同波长光线衰减不一致的特性自适应地补偿其R、G、B通道. 然后, 使用基于多尺度导向滤波的Retinex去除雾状模糊, 增强对比度. 最后, 根据水下图像和自然图像的直方图分布特征对其进行归一化处理, 从而在保存图像主要信息的前提下增强其纹理和曝光. 实验结果表明, 该算法不但具有较优的视觉感知效果, 而且具有较高的图像质量评价分数. 该算法具有较强的适应性, 有助于计算机视觉算法在水下的应用.  相似文献   

20.
为解决深度学习在图像水印算法中计算量大且模型冗余的问题,提高图像水印算法在抵抗噪声、旋转和剪裁等攻击时的鲁棒性,提出基于快速神经网络架构搜索(neural architecture search,NAS)的鲁棒图像水印网络算法。通过多项式分布学习快速神经网络架构搜索算法,在预设的搜索空间中搜索最优网络结构,进行图像水印的高效嵌入与鲁棒提取。首先,将子网络中线性连接的全卷积层设置为独立的神经单元结构,并参数化表示结构单元内节点的连接,预先设定结构单元内每个神经元操作的搜索空间;其次,在完成一个批次的数据集训练后,依据神经元操作中的被采样次数和平均损失函数值动态更新概率;最后,重新训练搜索完成的网络。水印网络模型的参数量较原始网络模型缩减了92%以上,大大缩短了模型训练时间。由于搜索得到的网络结构更为紧凑,本文算法具有较高的时间性能和较好的实验效果,在隐藏图像时,对空域信息的依赖比原始网络更少。对改进前后的2个网络进行了大量鲁棒性实验,对比发现,本文算法在CIFAR-10数据集上对抵抗椒盐噪声和旋转、移除像素行(列)等攻击优势显著;在ImageNet数据集上对抵抗椒盐高斯噪声、旋转、中值滤波、高斯滤波、JPEG压缩、裁剪等攻击优势显著,特别是对随机移除行(列)和椒盐噪声有较强的鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号