排序方式: 共有80条查询结果,搜索用时 15 毫秒
71.
现有的绝大多数过采样方法着重于寻找少数类样本的边界从而增强样本的可分性,忽略了样本的重叠分布与小析取问题,这导致在过采样阶段产生过多的噪声,最终无法实现对少数类样本的正确分类.针对这些问题,提出一种基于密度峰值聚类和局部稀疏度的过采样算法.首先利用改进的密度峰值聚类算法对全部样本自适应地划分出多个簇,根据簇内样本的不平衡比过滤掉不平衡比过高的簇,然后在筛选出的簇中根据少数类样本的分布情况对各簇的过采样个数进行分配,最后通过样本密度计算出各簇少数类样本的局部稀疏度,从中选择出稀疏度较高的少数类样本参与到最终的合成少数过采样.将提出的过采样算法与八种常用的过采样算法分别与三种基分类器相结合,在18个不平衡数据集上进行对比实验.实验结果表明,提出的算法总体上表现更优,能得到更好的分类性能. 相似文献
72.
城市气温是对城市气候特性评价的一个重要指标.提出核概率聚类算法并将其应用于城市气温的模式分类中,以此寻找城市发展上的共同点.该算法在概率聚类算法上引入了核学习方法的思想,能够很好地处理噪音和孤立点,实现更为准确的聚类.实验结果表明,与相关聚类算法相比,核概率聚类算法聚类效果好,且算法能够很快地收敛. 相似文献
73.
74.
75.
混合专家网络的锅炉故障诊断样本及误差分析 总被引:1,自引:0,他引:1
探讨了将混合专家网络应用于锅炉故障诊断时,影响样本训练精度的有关参数,得出了规则数、学习率、循环次数、加权指数等参数与样本训练学习误差平方和之间的关系 相似文献
76.
77.
大变异遗传算法在非线性系统参数估计中的应用 总被引:5,自引:2,他引:5
吕佳 《重庆师范大学学报(自然科学版)》2004,21(4):13-16
针对传统非线性系统模型参数估计方法的局限性及基本遗传算法存在的"早熟收敛"问题,本文提出了基于大变异操作的改进遗传算法来进行非线性系统参数的辨识,并将其应用到活性污泥动态模型的参数估计中,取得了较好的效果. 相似文献
78.
克氏原螯虾受精卵发育的温度因子数学模型分析 总被引:14,自引:0,他引:14
设置不同的温度对克氏原螯虾受精卵进行了孵化试验 ,研究了克氏原螯虾胚胎发育速度与温度之间的关系 ,引用了王如松创立的数学模型 :V(T) =(k·T +c)·(1 -exp(- (T -TH) /rH) ) ;并以此模型求算了该种群受精卵发育的最适温度和最高临界温度分别为 30 .3℃和40 .3℃ ;利用莱奥姆法则 (Reaumur’sLaw)求得最低临界温度及平均临界温度分别为 4 .7℃和5.6℃ ;最低有效积温和平均有效积温分别为 731 (℃·d)和 765 (℃·d) ;还就最适温度、耐温上限比较了高能卵与均能卵在适温能力上的差异 ,最后讨论了这些参数在集约化养殖中的实践意义 相似文献
79.
80.
【目的】针对基于密度峰值聚类的自训练算法中错误标记样本会造成分类正确率降低,以及当已标记样本分散时密度峰值聚类算法结果易受到截断距离影响的问题,提出了结合合成实例与adaboostENN的密度峰值自训练算法。【方法】首先,用合成实例方法增加已标记样本的数量并提升空间分布的可靠性;其次,通过密度峰值聚类算法揭示数据空间结构,从而选择有代表性的无标记样本进行标记预测;最后,用集成噪声滤波器来更准确地检测出被错误标记的样本并将它删除。【结果】通过12个UCI数据集上的实验验证了所提出算法的有效性。【结论】提出的算法不仅能有效地解决无标记样本被错误标记的问题,而且使得密度峰值聚类算法不易受到截断距离的影响。 相似文献