首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
引入基于指标权重的欧氏距离描述数据之间的相似程度,通过权重指标评价函数刻画随着权重ω的改变分类模糊程度的变化;运用粒子群优化算法(MPSO),极小化属性权重评价函数,自适应地求得每个指标的权重赋值;将得到的权重应用于聚类算法,将数据按照相似程度不同分类,以分类中出现的孤立点为疑似欺诈点;最后,通过人工复检的方式验证了模型的有效性和准确性。  相似文献   

2.
引入基于指标权重的欧氏距离描述数据之间的相似程度,通过权重指标评价函数刻画随着权重ω的改变分类模糊程度的变化;运用粒子群优化算法(MPSO),极小化属性权重评价函数,自适应地求得每个指标的权重赋值;将得到的权重应用于聚类算法,将数据按照相似程度不同分类,以分类中出现的孤立点为疑似欺诈点;最后,通过人工复检的方式验证了模型的有效性和准确性。  相似文献   

3.
《数理统计与管理》2015,(5):809-820
不平衡数据是指分类问题中目标变量的某一类观测值数量远大于其他类观测值数量的数据。针对处理不平衡数据算法SMOTE及其衍生算法的不足,本文提出一种新的向上采样算法SMUP(Synthetic Minority Using Proximity of Random Forests),通过样本相似度改进SMOTE算法中的距离测量方式,提高了算法的分类精度。实验结果表明,基于SMUP算法的单分类器能有效提升少数类的分类正确率,同时解决了SMOTE对定类型特征变量距离测度不佳的难题;基于SMUP算法的组合分类器分类效果也明显优于SMOTE衍生算法;最重要的是,SMUP将连续型、混合型和定类型这三种特征变量的距离测度整合到一个统一的框架下,为实际应用提供了便利。  相似文献   

4.
提出了一种基于模糊聚类的属性匹配算法。该算法采用能综合反映属性名称相似性和语义相似性的模糊相似关系,提高了属性匹配的准确率;以等价闭包法对相似属性进行模糊聚类,得到多层次属性分类结果,更客观真实地反映了属性匹配的模糊性;同时,属性匹配过程中不需要设置匹配参数,避免了人为造成的误差。  相似文献   

5.
根据神经元的空间几何特征参数,研究神经元的空间形态分类方法,将神经元根据几何形态分类识别.首次提出利用模糊C均值算法(FCM)建立了模糊聚类分析模型,对所给的神经元样本进行了分类,这一模型用来对神经元进行分类比较合理,且计算结果准确.同时,还利用相关分析原理分析了不同动物神经系统中同一类神经元的形态特征有着很高的相似度.  相似文献   

6.
聚类分析是数据挖掘的重要技术,是一种无监督的学习方式,可根据数据间的相似程度,将数据进行分类.竞争决策算法是一种基于竞争造就优化和决策左右结果的新型优化算法,针对聚类分析的特点,设计了一种竞争决策算法进行求解,经实验测试和验证,并与其它算法的结果进行比较,获得了较好的结果.  相似文献   

7.
对基本果蝇算法进行改进,求解基于工件分类的带有学习效应的置换流水车间问题.改进算法的编码方式以及搜索机制,将转移概率矩阵运用到果蝇寻优过程中.经测试实验表明,改进后的果蝇算法在寻优速度以及寻优率上较其他算法有着较明显的优势.另根据工件的相似度对生产工件进行分类,提出了基于聚类距离的置换流水车间学习效应模型,用改进的果蝇算法对其模型进行求解,分析了不同学习率和聚类距离对完工时间的影响,一方面验证了算法的有效性,另一方面说明了学习效应对企业生产调度有一定影响.  相似文献   

8.
通过提取陶瓷样品对瓷器鉴定的影响因素,采用了基于欧氏距离分析法,得到了各个因素的权重,从而能够确定影响因素的关键因素.通过关键因素作为神经网络模型输入变量,建立基于提取权重的概率神经网络算法.实例分析表明:算法通过提取权重能够提高分类准确度.在大样本实例分析中,算法比其他统计分析和相似度算法具有更快的收敛速度,并能够应用到其它数据处理中,具有广泛的适用性.  相似文献   

9.
基于模糊分类的图像颜色直方图研究   总被引:2,自引:0,他引:2  
从视觉感知特性出发,针对基本颜色直方图中区间刚性划分造成的与人类对相似颜色心理认知的不匹配问题.提出一种基于模糊分类统计的改良直方图,依次介绍该方法的基本思想、模糊直方图算法、实验分析和小结。  相似文献   

10.
模糊聚类分析中相似系数定义决定分类集合的分类结果,本文附录内有13种相似系数定义,其中有6种含有1—3个参数。对于如此广泛的选择性,分类集合的分类结果往往因人而异。本文建立相似系数定义的合理性准则,分析各种定义的优缺点,确认明氏距离法是合理的。  相似文献   

11.
It is proved that feedback classification of a linear system over a commutative von Neumann regular ring R can be reduced to the classification of a finite family of systems, each of which is properly split into a reachable and a non-reachable part, where the reachable part is in a Brunovski-type canonical form, while the non-reachable part can only be altered by similarity. If a canonical form is known for similarity of matrices over R, then it can be used to construct a canonical form for feedback equivalence. An explicit algorithm is given to obtain the canonical form in a computable context together with an example over a finite ring.  相似文献   

12.
13.
针对大规模群决策问题,提出了一种基于专家意见相似度的群体判断信息逐步集结规划的方法。首先利用备选方案序关系向量的灰色关联度和夹角余弦构造两两专家判断信息的组合相似度;其次以判断相似度为标准,采用一种广度邻居搜索算法对专家进行聚类;然后以判断偏差最小为目标,构造非线性的约束规划模型对每一类专家意见进行集结,从而获得类内专家的集结信息;最后从专家数量最多的类别开始,依次对每类专家集结后的判断信息进行再次集结,从而获得最终的评判结果。该方法将大规模的复杂群决 策转化为低复杂度的多阶段专家信息集结问题,并保证了群体结果的一致性。算例分析验证了方法的可行性和有效性。  相似文献   

14.
After a short methodological presentation of similarity aggregation in automatic classification, we will present an application to computational linguistics. We will try to explain, from an existing dictionary of synonyms, how we have
  • (a) defined what was, in our opinion, the meaning of the synonymous relation we wanted to reveal in a new optimized dictionary,
  • (b) transformed the existing dictionary into a sequence of matrices of synonymy,
  • (c) checked with an adapted algorithm (similarity aggregation technique) if the links appearing in the existing dictionary corresponded to our synonymy definition,
  • (d) tried to improve the synonymous relation,
in order to propose more accurate data facilitating the management of a new dictionary and providing a classification of synonyms according to a semic separate valuation.  相似文献   

15.
针对多观测样本分类问题,提出一种基于Kernel Discriminant CanonicalCorrelation(KDCC)来实现多观测样本分类的模型.该算法首先把原空间样本非线性的投影到高维特征空间,通过KPCA得到核子空间,然后在高维特征空间定义一个使类内核子空间的相关性最大,同时使类间核子空间的相关性最小的KDCC矩阵,通过迭代法训练出最优的KDCC矩阵,把每个核子空间投影到KDCC矩阵上得到转换核子空间,采用典型相关性作为转换核子空间之间的相似性度量,并采用最近邻准则作为多观测样本的分类决策,从而实现多观测样本的分类.在三个数据库上进行了一系列实验,实验结果表明提出的方法对于多观测样本分类具有可行性和有效性.  相似文献   

16.
现有一类分类算法通常采用经典欧氏测度描述样本间相似关系,然而欧氏测度不能较好地反映一些数据集样本的内在分布结构,从而影响这些方法对数据的描述能力.提出一种用于改善一类分类器描述性能的高维空间一类数据距离测度学习算法,与已有距离测度学习算法相比,该算法只需提供目标类数据,通过引入样本先验分布正则化项和L1范数惩罚的距离测度稀疏性约束,能有效解决高维空间小样本情况下的一类数据距离测度学习问题,并通过采用分块协调下降算法高效的解决距离测度学习的优化问题.学习的距离测度能容易的嵌入到一类分类器中,仿真实验结果表明采用学习的距离测度能有效改善一类分类器的描述性能,特别能够改善SVDD的描述能力,从而使得一类分类器具有更强的推广能力.  相似文献   

17.
For the groupGL(m, C)xGL(n, C) acting on the space ofmxn matrices over C, we introduce a class of subgroups which we call admissible. We suggest an algorithm to reduce an arbitrary matrix to a normal form with respect to an action of any admissible group. This algorithm covers various classification problems, including the wild problem of bringing a pair of matrices to normal form by simultaneous similarity. The classical left, right, two-sided and similarity transformations turns out to be admissible. However, the stabilizers of known normal forms (Smith's, Jordan's), generally speaking, are not admissible, and this obstructs inductive steps of our algorithm. This is the reason that we introduce modified normal forms for classical actions.Partially supported by Israel Science Foundation  相似文献   

18.
在非下采样Contourlet变换的基础上,综合考虑全变差扩散和正态逆高斯模型,提出一种新的图像去噪算法.首先,对图像进行非下采样Contourlet变换,得到高频子带和低频子带系数.然后,对低频子带进行全变差扩散处理,对于方向带通子带,先通过分类准则对其进行分类,将其分为重要系数和不重要系数,对重要系数采样正态逆高斯建模,不重要系数采用高斯分布模型建模.实验结果证明,本文方法在视觉效果、峰值信噪比以及平均结构性上均优于许多算法.  相似文献   

19.
Accurate estimates of efforts in software development are necessary in project management practices. Project managers or domain experts usually conduct software effort estimation using their experience; hence, subjective or implicit estimates occur frequently. As most software projects have incomplete information and uncertain relations between effort drivers and the required development effort, the grey relational analysis (GRA) method has been applied in building a formal software effort estimation model for this study. The GRA in the grey system theory is a problem-solving method that is used when dealing with similarity measures of complex relations. This paper examines the potentials of the software effort estimation model by integrating a genetic algorithm (GA) to the GRA. The GA method is adopted to find the best fit of weights for each software effort driver in the similarity measures. Experimental results show that the software effort estimation using an integration of the GRA with GA method presents more precise estimates over the results using the case-based reasoning (CBR), classification and regression trees (CART), and artificial neural networks (ANN) methods.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号