首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 6 毫秒
1.
最近邻搜索广泛应用于分类问题,其最显著的优点是分类准确率高、泛化性能好.但现有最近邻分类算法都存在着一个弱点——样本集增大分类计算量也显著增大.为了克服这一不足,本文基于一个新的思路,提出了最近邻分类方法的一种改进方法.该方法在进行最近邻分类时,不一定要找到待分类点的最近邻点,而只要知道最近邻点的类别即可,大大地减少了最近邻搜索时的计算量.用经典的分类问题双螺线问题(TSP)以及其他几个例子,就该改进方法的分类效果、分类速度和学习性能等3个方面进行了测试,并与经典的K维双叉树(KD树)最近邻搜索法以及压缩近邻法进行了比较.结果表明,就综合性能而言,本文改进方法是有竞争力的.  相似文献   

2.
K-最近邻分类技术的新发展与技术改进   总被引:1,自引:0,他引:1  
K-最近邻算法是数据挖掘分类方法中最常用的算法之一.在很多实际问题上都有应用.本文对近年来基于K-最近邻算法的各种改进技术进行了分析.从速度提高和准确度提高两个方面给予了归纳.  相似文献   

3.
图像分类作为图像处理和计算机视觉的重要组成部分,能够快速准确地对数字图像进行分析和管理.对基于bag of word(BOW)模型的分类问题进行了研究,针对图像理解中的图像相似度之间的关系,提出了一种最大间隔最近邻居分类算法,通过对成对约束的度量学习算法,在优化目标中增加原空间数据分类的约束,学习到了一个可以反映当前样本数据的距离函数,并且在k-Nearest Neighbor(KNN)分类器上使用该学习到的距离函数来构建分类器,并在多个国际标准图像数据集上进行实验,结果表明:该算法相比传统的基于欧式距离的算法具备更高的正确率.  相似文献   

4.
针对传统的SMOTE方法在类别区域重合的数据集应用时,可能产生多个更接近多数类的人工样例,甚至突破类别边界,从而影响整体分类性能的情况,提出了一种最近三角区域的SMOTE方法,使合成的人工样例只出现在少数类样例的最近三角区域内部,并且删除掉距离多数类更近的合成样例,从而使生成的样例更接近少数类,且不突破原始的类别边界。实验分别在人工数据集和改进的UCI数据集上进行,并和原始的SMOTE方法分别在G-mean和F-value的评价指标上进行了对比,实验结果验证了改进的SMOTE方法在类别区域有重合的数据集上要优于原始SMOTE方法。  相似文献   

5.
分析北京地区日降雨量资料,相较于其他降雨事件,大雨或暴雨事件发生的次数较少,因此该地区的降水量预报属于样本不均衡问题。在样本不平衡的情况下,K最近邻(PNN)算法的分类误差率将会大大提高,这也就使传统的基于K最近邻算法的降水量预报方法的应用受到了限制。针对北京地区降水量预报这一样本不均衡问题,应用伪最近邻算法构建了北京市的降水量预报模型。该方法利用北京地区日降雨量资料和美国国家环境预报中心全球格点资料,将降雨量作为类,将美国国家环境预报中心全球格点资料的各种因子场作为天气样本特征,通过决策规则实现最优分类。利用提出的降水预报模型对北京地区2010年6~8月进行了24 h降水预报,实验结果表明,提出的预报方法对于降水等级预报的预报准确率以及晴雨预报的TS评分、正样本概括率和漏报率均优于传统的K最近邻预报方法,该方法具有较好的预报效果。  相似文献   

6.
改进的神经网络最近邻聚类学习算法及其应用   总被引:17,自引:0,他引:17  
提出了一种改进的RBF(Radial Basis Functions,径向基函数)神经网络最近邻聚类学习算法。并将其应用于股市预测问题。模拟结果表明,改进算法的拟合效果与拟合误差均明显好于常规最近邻聚类学习算法,可以较大幅度提高RBF神经网络的预测性能。  相似文献   

7.
随着无线通讯及连续移动对象寻轨技术的高速发展,迫切需要提出解决大量移动对象查询的有效方法。本文提出了一个解决连续移动点反向最近邻查询的算法,同时也提出了解决连续移动点的最近邻查询算法。  相似文献   

8.
为了提高标准最近邻数据关联算法的关联效果,提出了基于多速率运动模型的多帧最近邻数据关联算法.改正了Hong提出的多速率运动模型中关于过程噪声的一处错误,然后把该模型应用于最近邻数据关联算法,并推广到多帧情况.新算法使用序列关联量测更新目标状态,有效降低了最近邻算法中误关联对跟踪效果的影响.仿真结果表明,该算法在减少计算量的同时大大减少了跟踪丢失率。  相似文献   

9.
本文针对两类个人信用数据混叠较严重的数据集,提出对数据集先利用最近邻算法进行修剪,再应用SVM算法对个人信用进行评估的NN—SVM方法。仿真实验表明基于NN—SVM算法的个人信用评估方法比直接用SVM算法进行分析来的更加准确。同时,对比RBF_LS—SVM,Linear LS-SVM,Region single tree等算法的结果,发现NN—SVM算法明显优于其它算法。  相似文献   

10.
K-最近邻的改进及其在文本分类中的应用   总被引:4,自引:0,他引:4  
采用K近邻算法(Knearest neighbors,简称KNN)进行分类时,如果训练样本数量太大,那么搜索测试样本的K个最近邻时,算法的计算量很大.本文针对KNN的不足提出了一种改进方法.改进的KNN算法通过定义样本的延拓类和延拓能力,保留延拓能力强的样本作为它延拓类中其它训练样本的代表,来缩减训练样本数量,达到减少算法计算量的目的.实验证明,改进的KNN算法具有很好的性能.  相似文献   

11.
移动查询点的最近邻查询在时空数据库查询的领域具有很重要的地位。本文提出了一个以处理动态环境下的K个最近邻居(K-NN)查询问题的有效的方法。  相似文献   

12.
针对传统径流预报精度不高、预见期不足的问题,提出基于降雨、径流相似性的径流预报方法,采用大数据挖掘在历史降雨产流过程中搜索相似过程,预测后期径流最可能的过程线。为了延长径流预报预见期,实时接入降雨预报信息,提出3种径流滚动预报方式,实现了7 d预见期的径流逐日滚动预报;针对流域在涨退水等不同阶段的产汇流特性,建立可根据实时水雨情自适应切换的降雨、径流输入模式,进一步提高径流预报精度。该研究成果在大渡河的应用表明预报效果达到预期:3 d预见期的纳什系数大于0.9,平均相对误差小于10%;7 d预见期的纳什系数大于0.8,平均相对误差小于15%。  相似文献   

13.
针对不完整基因表达数据的聚类问题,提出了一种多目标NSGA-Ⅱ框架下缺失值填补与聚类协同优化的算法.算法根据欧式距离确定不完整基因的近邻基因,以缺失值的最近邻区间为约束,采用混合编码将缺失值填补与聚类中心优化融入NSGA-Ⅱ进化过程,通过将数据集的统计信息与聚类结果共同作为缺失值填补因素,提升不完整基因表达数据的填补准...  相似文献   

14.
提出一种基于稀疏表示的时间序列最近邻分类模型,旨在通过提取时间序列的关键特征,去除冗余信息,达到减少噪声干扰的目的.该模型首先求解时序数据基于过完备字典的稀疏表示,然后利用非零系数及其对应的原子重构原始序列,最后利用基于距离的分类器进行分类.在18个时间序列公开数据集上的实验结果表明,最近邻分类模型能够提高传统的最近邻分类器的分类准确率.  相似文献   

15.
欧式空间中的反k最近邻查询算法不适用于空间网络环境,故采用任意度量空间中的M-tree索引结构,进行空间网络数据库中的反k最近邻查询处理.首先通过预计算的方法得到网络距离信息,依据此距离信息,对空间网络对象建立M-tree索引结构.然后,给出并证明了M-tree中间结点修剪定理,提出一种适用于空间网络环境的反k最近邻查询算法.最后实验验证了该算法的有效性.  相似文献   

16.
设(X,θ)是随机向量,X∈R~d、θ∈R~1;(X_i,θ_i)是(X,θ)的i.i.d.随机样本,i=1,…,(?)bjL_n是平方损失下最近邻(NN)预测的条件风险.设是L_n的估计量,其中θ_(nj),是按训练样本(X_1,θ_1),…,(X_(j-1),θ_(j-1)),(X_(j+1),θ_(j+1)),…(X_n,θ_n)与观察到的X_j对θ_j所作的NN预测。众所周知,在一定的条件下,L_n→2R~*,α,s.,其中R~*是Bayes风险。本文得到了L_n的完全收敛速度,即在E|θ|~(2+δ)<∞(δ>0)及其它条件下证明了  相似文献   

17.
本文研究了非参数回归函数最近邻估计、改良近邻估计的弱相合性及平均相合性,推广和改进了[1]中结果。  相似文献   

18.
本主讨论了把最小二乘估计与最近邻估计结合起来所得的回归函数的混合型最近邻估计的强收敛速度。  相似文献   

19.
针对传统K最近邻(KNN)分类法执行效率低的问题,提出一种改进的K最近邻分类法。先采用最短距离聚类法分别对训练样本和测试样本进行聚类,生成一些小簇和孤立点,再对小簇或孤立点使用改进的K最近邻方法进行分类。改进后的方法能极大地缩小分类样本的规模,降低计算成本,提高分类效率。  相似文献   

20.
杨梦雄  杨贯中 《科学技术与工程》2007,7(21):5544-55485566
提出基于K-最近邻算法的话务智能预测技术,利用机器学习算法从电信话务信息的历史数据中提取规律,从而预测未来的电信话务信息情况。在算法中根据时间间隔对样例的距离度量进行了特征加权。针对互联互通来话数据的实验表明,该算法具有良好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号