首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
为了降低原始文本特征空间的维数,获得较高的分类精度与执行效率,对多种文本特征提取方法进行了研究,如卡方、互信息、信息增益、主成分分析(PCA)等。针对传统文本特征抽取方法存在的精度不高、执行效率低等问题,提出了一种基于分块主成分分析的文本特征提取算法。该算法通过K-均值词聚类进行特征词分块,再对各分块实施PCA操作抽取出更具代表性的特征项,最后使用支持向量机分类器对文本进行分类。实验结果表明:分块主成分分析的分类指标F_(β=1)达到了88.7%,执行时间为353 s,能够有效提高文本分类精度与执行效率。  相似文献   

2.
为提高铸坯质量预测的准确率,本文提出了一种基于最大信息系数(MIC)和主成分分析(PCA)的两阶段特征降维方法。采集某钢厂铸坯生产过程数据,根据冶金原理得到铸坯夹杂类质量缺陷的影响因素,构造原始特征集。第一阶段进行特征选择,使用随机森林分类器的分类准确率来评价ReliefF、IG和MIC三种算法的特征选择效果,结果显示,基于MIC度量指标选出的特征维度更低、分类准确率更高。第二阶段使用PCA方法对特征选择后的特征集进行降维,并将其与原始特征集、MIC、PCA算法的分类准确率进行比较,结果表明,本文提出的基于MIC和PCA的两阶段降维方法优于其他算法,能有效降低原始特征集的维度并提高对铸坯夹杂类质量缺陷的预测精度。  相似文献   

3.
针对掌纹采集受外界因素和噪声的影响较大, 传统方法掌纹识别率低、 鲁棒性差等问题, 提出一种基于特征加权与核主成分分析的掌纹识别算法. 首先采用Curvelet变换对掌纹图像进行分解, 得到不同尺度和角度的轮廓系数, 并对Curvelet系数进行加权融合操作; 然后通过核主成分分析对掌纹特征进行降维处理, 实现特征提取; 最后采用相关向量机实现掌纹匹配, 并采用PolyU掌纹图像对算法的性能进行测试. 结果表明, 与其他掌纹识别算法相比, 该算法取得的掌纹识别率更高, 且掌纹匹配的时间最短, 可以满足掌纹实时识别要求.  相似文献   

4.
基于主成分分析提出一种通过属性加权的方式对特征进行预处理的改进算法,实现特征选择与特征提取的结合,从而降低计算复杂度并提高分类准确度。属性加权是通过量化样例与分类标记之间的相互依赖关系,即结合了线性判别分析的映射思想,线性拟合样例与标记,得到一组反映各属性对分类贡献大小的权值w。通过将改进算法与主成分分析法、线性判别算法、局部保持投影算法做了分类准确度、计算时间的综合实验比较,证明了改进算法的有效性。  相似文献   

5.
在二维主成分分析的基础上,考虑样本的流形分布特点,引入样本相似系数,重新定义了样本拉普拉斯散布矩阵,进而给出了基于拉普拉斯二维主成分分析的特征提取方法.在ORL,FERET人脸库上的试验证明了基于拉普拉斯二维主成分分析方法的有效性.  相似文献   

6.
基于核主成分分析的人脸识别   总被引:2,自引:0,他引:2  
核主成分分析方法是主成分分析的改进算法,其采用非线性方法提取主成分.把核主成分分析应用到人脸识别中,利用核主成分分析方法选择合适的核函数在高维空间提取人脸图像的主成分.核主成分分析与传统主成分分析相比,可以得到更好的适合分类的特征.基于ORL人脸库,识别核主成分分析提取出的主成分的相关性系数.实验结果表明,核主成分分析不仅实现了降维,而且能取得比传统主成分分析更好的识别性能,正确识别率为92.5%.  相似文献   

7.
脑力负荷识别对提高作业操作人员工作效率,减少人因事故具有重要意义。然而,由于脑电(electroencephalogram, EEG)信号的采集是由多通道脑电帽采集的,并且分布在各个频带上,因此经过特征提取得到的特征维度过高,造成后续识别模型复杂度过高。对此,通常使用主成分分析(principal component analysis, PCA)对高维特征向量进行降维处理,但是降维维度的取值很难确定。提出了一种基于主成分分析的自适应维度寻优方法,将实验数据集中的高维特征使用主成分分析降维到寻优维数范围内的各个维度,并将各个维度的分类精度绘制成维度—分类精度曲线,通过识别该曲线的“肘部”来确定该实验数据集的最优降维维度,并将该维度应用到同实验的其他实验数据上进行脑力负荷识别。结果表明,该方法可以准确识别出在同实验数据集中通用的最优降维维度,有效提高识别效率。  相似文献   

8.
 模式分类过程涉及到对原始训练样本的学习,容易导致用户隐私的泄露。为了避免模式分类过程中的隐私泄露,同时又不影响模式分类算法的性能,提出一种基于主成分分析(PCA)的模式分类隐私保护算法。该算法利用PCA 提取原始训练数据的主成分,并将原始训练样本集合转化为主成分的新样本集合,然后利用新样本集合进行分类学习。选用Adult 数据集和KDDCUP 99 数据集进行仿真实验,并采用正确率和召回率进行性能评价,结果表明,该隐私保护算法通过PCA 提取原始数据特征属性的主成分,可避免原始属性的泄露,同时PCA 在一定程度上可实现去噪,从而使分类器的分类性能优于原始数据集的分类性能。与已有算法比较,该隐私保护算法具有更好的模式分类精度和隐私保护性能。  相似文献   

9.
我国的居民收入差距呈扩大的趋势,收入差距扩大将引发一系列社会问题,关系到社会的和谐稳定,因此居民收入分配问题受到普遍关注.通过应用主成分分析法对影响收入分配的因素做了分析,得出了影响收入分配因素的主成分分析的数学模型从而得到了影响收入分配差距的主要因素.并根据所得结果探讨了减小收入差距的对策,对缩小收入分配差距有一定的参考价值.  相似文献   

10.
针对主成分分析(PCA)算法中存在不能提取非线性特征的问题,提出了利用KPCA提取图像特征,最近邻法分类的人脸识别改进方法。基于ORL数据库的相关实验表明,这样的系统能够取得比传统PCA更好的识别性能。  相似文献   

11.
一种改进的三维模型特征提取算法   总被引:1,自引:0,他引:1  
改进了一种基于正视图描述符的特征提取算法,该方法克服了Shih方法对于模型大角度旋转的敏感性。实验结果表明:改进后的方法不仅具有很好的查全率与查准率,并且对坐标系旋转变换具有较好的鲁棒性。  相似文献   

12.
针对肿瘤基因数据因维度高和冗余基因较多而导致分类精度低的问题,提出一种基于PCA和信息增益的肿瘤特征基因选择方法.该方法首先使用PCA算法剔除冗余基因,获得预选特征基因子集;然后利用信息增益算法对预选特征基因子集进行优化选取,得到特征基因子集;最后采用不同分类模型对特征基因子集进行仿真实验.实验结果表明,所提方法提高了基因表达谱的分类精度,从而表明致病基因被有效地选取出来.  相似文献   

13.
基于核的主分量分析(Kernel PCA)能够提取数据的非线性特征,但其性能受核参数的影响非常大.提出了一种新的基于特征空间中非高斯分布估计的核参数优化算法.该方法基于Kernel PCA中最优的参数应能导致特征空间中数据具有高斯分布的思想,通过对特征空间中数据的非高斯性结构进行分析,从反面估计其对高斯分布的逼近程度.采用该方法对各种数据进行实验都有很好的效果,表明了该方法的有效性.  相似文献   

14.
基于分块的网页主题信息自动提取算法   总被引:3,自引:0,他引:3  
对互联网上大量存在的基于模板的网页,根据其半结构化的特点,提出了一种网页分块和主题信息自动提取算法.该算法利用网页标记对网页进行分块,改进了传统的文本特征选择方法,把网页块表示成特征向量,并根据有序标记集识别主题内容块.用该算法改进了网页分类的预处理过程,提高了分类的速度和准确性.实验表明,对网页进行主题信息提取后再进行分类,可以提高分类系统的查全率和查准率.  相似文献   

15.
通过基于柯尔莫诺夫-斯米尔诺夫检验的自适应特征提取法,提取出对大脑ERPs信号分类具有可辨识性的特征信息.应用具有良好模式分类性能的SVM在提取的特征属性基础上构造分类器,对ERPs信号分类.实验表明:自适应特征提取法不仅能有效地提取出分类特征属性,还极大地降低了数据空间维数;自适应特征提取与SVM相结合的分类准确率达...  相似文献   

16.
通过利用方向可控滤波器(steerable filter)和轮廓波(contourlet)分解的方向性及能量变化特性,提出了一种适用于纹理图像的特征提取方法.利用基于轮廓波方向性与分解系数能量的性质可以很好地表示一个旋转纹理图像的特征,而且轮廓波的方向性和分解层次可以根据需要灵活地调节.使用这样的特征并运用简单的分类方法可以对旋转纹理图像进行较为准确的分类.最后通过对标准纹理库(Brodatz)图像的测试,验证了算法的有效性.  相似文献   

17.
在人脸识别中,基于PCA和粗糙集的联合自寻优特征选择算法首先利用PCA对人脸图像进行人脸特征的提取和约简,在此基础上利用粗糙集的自寻优约简方法进一步得到能充分体现人脸信息的最小人脸特征集合。实验证明此算法应用于人脸识别中不仅大大减少了特征的数量以及分类过程中的运算量,还有效的提高了人脸识别的正确率和减少了识别时间,并且对于一定范围内的不同取样的训练具有一定的稳定性。  相似文献   

18.
卟啉传感阵列图像特征值自动提取方法   总被引:1,自引:0,他引:1  
针对卟啉传感阵列(PSA)图像,设计了一种特征提取算法。该算法首先利用radon变换的方法实现了PSA图像倾斜自动校正;而后通过二值投影与数学统计学结合的方法来进行网格划分,根据网格划分的卟啉点区域对图像进行局部阈值分割,从而定位出卟啉点区域,最后采用比例半径法从已定位的卟啉点区域内提取出每个卟啉点的特征。该算法解决了弱信号卟啉点识别难的问题,提取的特征值最大程度的反映了卟啉点的信息。通过对NH3、异戊二烯、庚醛等气体进行试验,结果表明该算法能够很好的提取出PSA图像中卟啉点的特征值。  相似文献   

19.
就灰度图像的分割与目标提取问题,提出了一种快速区域生长和特征提取算法.该算法以水平线段作为区域的基本单元,用堆栈的方法记忆可能存在的禾生长区域的方向。因而区域生长速度快,不需要占用额外的图像缓存区,同时能方便地给出图像的拓扑性质及一些有用的特征.包括图像中物体的个数,每个物体的面积、内孔数、边界长、各阶矩及极点等特征。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号