首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 53 毫秒
1.
从排序属性的选择、匹配方法、相似度计算、检测和处理相似重复记录以及实验结果几个方面,阐述了一种有效检测汉语相似重复记录的方法。  相似文献   

2.
为消除在数据库中存在的中文相似重复记录,提出一种改进的Apriori算法,利用该算法获得数据库记录的频繁项集.基于频繁项集,消除进行比较记录的共有项,有效提高相异字符的计算权重.然后利用FRMA算法计算记录间的相似度,最终消除中文相似记录.在车辆检测数据库中对该算法进行了实验,取得了较好的实验结果,证明该算法具有较好的实用价值.  相似文献   

3.
对相似重复记录的检测是数据预处理中的关键环节。针对海量数据相似重复记录检测过程中,记录属性维度过高导致的查准率和时间效率较低的问题,提出了基于统一互信息的关键属性组查找算法,通过过滤噪音属性,降低属性维度,达到准确检测相似重复记录和提高时间效率的目的。最后,在真实数据集上通过对该算法和基于原始数据所有属性的相似重复记录检测算法在准确率和效率方面的比较,验证了所提出算法的有效性。  相似文献   

4.
为解决中文数据的重复检测问题,在SNM(Sorted-Neighborhood Method)算法的基础上提出了一种融合《同义词词林扩展版》和中文分词于一体的重复记录检测算法,通过利用《同义词词林扩展版》和Jaccard算法计算词语相似度,同时采用Python中Jieba中文分词的方式对语句进行分词,从而达到优化余弦相...  相似文献   

5.
恶意代码是构成互联网威胁的新根源,至今传统的病毒查杀方法对此也无法根治.未知恶意代码每月呈几何倍的速度增长,人们依赖的防范手段多是手工分析,其效率有限且花费巨大.阐述了基于最小距离分类器的未知恶意代码检测方法,它对未知恶意代码有着良好的判定能力,能够有效地区分病毒与可信程序.对自定义的恶意代码行为进行建模,并通过实验发现,经过改进的最小距离分类器除了良好的分类精度外,其计算代价较其他非线性方法小,因此该模型在实际反病毒工作中有较高的实战价值.  相似文献   

6.
由于现有的经典本体映射方法以及相似度计算方法无法处理模糊信息,因此它们都无法计算模糊概念之间的相似度.为此,提出了一种新的基于向量空间模型的模糊概念相似度计算方法SimFC-VSM(similarityoffuzzyconceptbasedonvectorspacemodel).SimFC-VSM方法首先利用模糊本体中的模糊关系构建向量空间模型;然后将模糊概念表示成此向量空间模型中的向量;最后通过向量运算的方法来计算模糊概念之间的相似度.因此,所提出的方法SimFC-VSM可以有效地利用向量空间模型来计算模糊概念之间的相似度.  相似文献   

7.
文章主要就图像处理的角度对简单背景下的视频对象提取工作进行了论述.提出了一种利用欧氏距离的量度作为特征进行提取的方法.采用的不同的颜色空间对这种方法进行了验证.通过试验证明了这种方法能获得较好的效果.  相似文献   

8.
文章主要就图像处理的角度对简单背景下的视频对象提取工作进行了论述。提出了一种利用欧氏距离的量度作为特征进行提取的方法。采用的不同的颜色空间对这种方法进行了验证。通过试验证明了这种方法能获得较好的效果。  相似文献   

9.
随着中文网站数量的日益庞大,中文的Deep Web信息集成已成为网络信息领域的焦点。属性相似度计算是Deep Web信息集成中模式匹配的关键一步。该文根据中文查询接口中的属性词汇常常表现为1-3个词语构成的短语的特点,提出一种更有效的基于《知网》的属性相似度计算的方法,使属性匹配的准确率得到大幅度提高。  相似文献   

10.
方欣 《科学技术与工程》2006,6(20):3287-3290
现代数字图像处理技术中处理的大多是彩色图像。很多处理场合都需要直接实时地对彩色图像进行处理,这样就可以避免彩色图像灰度化过程中的细节损失,也有利于提高算法速度。在基于色彩分布的彩色图像特征检测过程中,需要对色彩空间进行颜色的量化,也需要对不同像素点的颜色值进行比较,并作出合适的相似性和异性计算。论述了一种新的色彩距离,计算方法,大大提高了彩色图像特征提取的准确率与速度。  相似文献   

11.
向量理论在概率论中的应用   总被引:1,自引:0,他引:1  
通过在概率论中引入"零变量"概念,首次将向量空间理论应用于概率论的研究中,得到了同一样本空间Ω上的全体随机变量所成的集合是一向量空间的结论,并且证明了两个随机变量ξ,η的协方差即是向量ξ,η的内积ξ,η,继而得出同一样本空间Ω上的全体随机变量所成集合成为一欧氏空间,从代数学的角度给予了概率论中的若干概念全新的解释。  相似文献   

12.
针对传统图像检索算法依赖于图像单一特征向量、无法体现用户个人感知的不足,提出一种基于综合特征向量的图像检索算法。该算法通过对图像单一特征向量的归一化处理获取图像综合特征向量,采用体现不同特征向量检索权重的加权欧氏距离进行相似性度量,并可根据交互检索过程中用户对检索权重的调整更新检索结果。实验表明,该算法可取得较理想的检索效果。  相似文献   

13.
研究和讨论了可视人体解剖照片集的直接成像方法.由于解剖照片中的每个体素颜色值已经确定,因而主要研究如何从每个体素的R、G、B三原色组映射成特定阻光度值,即阻光度转换函数.首先计算YIQ空间中的亮度分量Y,然后基于Y分量,在RGB空间中利用矢量角与欧氏距离的联合来计算彩色体素的梯度幅值!从而得到阻光度值,最后合成、累积颜色.实验结果表明:此算法不需复杂的色彩空间变换.成像质量高,可以表现人体毛细血管、纹理信息以及体内的细微结构.  相似文献   

14.
提出了计算非规则篱笆图的最小欧几里德距离和最小乘积距离的一种有效算法,该算法是在Viterbi算法的基础上,对起始于任意状态和终止于任意状态所有参考路径上的距离进行了计算,求得最小欧几里德距离和最小乘积距离,它适用于搜索斯信道和衰落信道中的TCM好码。  相似文献   

15.
应用距离几何的理论与方法研究了n维欧氏空间En中n维单形的体积问题,建立了切点单形与旁切点单形体积的一个不等式.  相似文献   

16.
一种基于SVM的中文电子邮件过滤方法   总被引:1,自引:1,他引:1  
提出了一种基于SVM的中文邮件过滤方法,通过构造最优的支持向量机(Support Vector Machine,SVM)过滤模型,有效地提高了垃圾邮件的过滤精度,实验结果超过了网易免费邮所公布的过滤指标.  相似文献   

17.
一个求解多目标非线性规划问题的交互式方法   总被引:2,自引:0,他引:2  
本文给出一个求解多目标非线性规划问题的新的交互式方法,此法的主要特点是,通过与决策者的交互对话,来逐次缩小权向量空间,在对目标空间中的点作筛选后,得到决策者满意的解。  相似文献   

18.
提出了计算格形编码欧氏自由距离的一种有效算法,该算法是依据Viterbi算法,取全零路径为参考路径进行计算,求得准规则码的欧氏自由距离,它适用于搜索高斯信道中的TCM好码。  相似文献   

19.
轮廓匹配是图像处理中一个重要匹配方法,针对现有匹配方法中匹配搜索耗时多的局限性,提出了一种改进的轮廓匹配方法.对模板图像和待匹配图像分别提取轮廓,计算轮廓上每一点的曲率,并选择满足阈值条件的轮廓点为候选点;以此点及其两侧若干点构造特征向量,依据欧氏距离构造相似性度量函数,使用具有全局最优性的微分进化算法求解,以保证获得全局最优解.对比实验表明,所提出的方法有较快的寻优速度和较高的配准率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号