首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 209 毫秒
1.
针对TE化工过程高度非线性、复杂性的特点,本文提出了一种基于相关分析和最小二乘支持向量机对TE过程进行多模型建模方法,以提高模型性能。首先对TE过程采用相关分析法划分为3个子系统,对每个子系统分别采用基于C-均值聚类的最小二乘支持向量机建模和基于k均值聚类的最小二乘支持向量机多模型建模。实验表明,基于K-均值聚类的多模型建模能简化计算、提高模型精度、并且能更好的预测模型输出。  相似文献   

2.
针对TE化工过程高度非线性、复杂性的特点,文章提出了一种基于相关分析和最小二乘支持向量机对TE过程进行多模型建模方法,以提高模型性能;首先对TE过程采用相关分析法划分为3个子系统,对每个子系统分别采用基于C-均值聚类的最小二乘支持向量机建模和基于K均值聚类的最小二乘支持向量机多模型建模;实验表明,基于K均值聚类的多模型建模能简化计算、提高模型精度、并且能更好的预测模型输出。  相似文献   

3.
支持向量机作为一种经典的分类方法被广泛应用于恒星光谱分类领域。该方法在实际应用中取得了较为理想的分类效果,但其面临无法解决多分类问题的挑战。在支持向量机的基础上,提出多类支持向量机,建立基于多类支持向量机的恒星光谱分类模型。该方法的最大优势是经过一次分类过程,可以确定多类样本的类属。SDSS DR8恒星光谱数据上的比较实验表明,本研究所提的方法较之已有多分类方法在分类性能上有一定的提升。  相似文献   

4.
针对水声目标-杂波数据集在有限样本下的类不平衡特性,导致代价敏感支持向量机难以逼近贝叶斯最优决策的问题,本文提出了一种基于能量统计(Energy statistics)方法的支持向量机(En-SVM)。该算法通过度量原始数据空间与有限样本空间特征函数之间的加权平方距离,量化少数类样本不完全采样过程中的信息损失,来补偿再生核希尔伯特空间中机器学习算法所需的少数类分类信息,增加少数类样本对决策的影响力。实验结果表明,En-SVM能够在保持高检测概率的同时获得较低虚警概率,即通过分类可以排除大量的杂波,性能优于标准支持向量机和代价敏感支持向量机,能够有效处理水声不平衡数据的分类问题,实现主动声呐信号处理中的杂波抑制。  相似文献   

5.
为了减少虚拟环境下大数据运行时间,数据运行时能够反映出一定的规律性和特殊的分类性,需要对虚拟环境下大数据进行智能并行聚类。当前大数据聚类方法是根据K-均值聚类方法不断地进行大数据样本分类的调整,经过多次计算调整后达到数据并行聚类的效果,但每当有新的大数据流入时,都需要对当前全部数据进行K-均值聚类,计算过程复杂,聚类效率低。为此,提出了一种基于MapReduce的虚拟环境下大数据智能并行聚类方法。首先在虚拟环境下大数据中抽取小规模数据集并确定大数据簇的质心,采用Single法对所抽样的小规模数据进行聚类,获得虚拟环境下大数据属性的均值,利用最小距离分类规则将大数据属性的均值快速地向数据簇的真实中心移动,依据Davies-bouldin指标假设一个数据簇离散度参数,在此参数值中选出大数据智能并行聚类相似度最大值,最后利用聚类相似度最大值得到Davies-bouldin指数,以Davies-bouldin指数为基础将多个类别的质心间距以及聚类离散度指定阈值合并为一个类并进行迭代计算,得到数据最佳聚类中心位置,由此完成虚拟环境下大数据智能并行聚类。仿真实验结果证明,所提方法提高了大数据智能并行聚类的灵活性和普遍适用性,减少了聚类时间,并适合应用于教育技术领域,不仅可以使教育技术网络数据更加合理化,而且更加规范化。  相似文献   

6.
单斌  秦永元  杨颖涛  王蓉  唐大林 《应用声学》2014,22(11):3780-3782
针对模拟电路多故障分类中存在拒识区域,分类效果不理想的问题,提出基于有序分割最佳偏二叉树结构的模拟电路故障诊断方法;首先分析多分类中分割次序对结果的影响,通过样本类中心欧式距离对故障分割进行排序,以此构造偏二叉树结构;然后对采样数据进行主成份分析降维压缩,最后采用支持向量机作为分类器,对故障数据进行分类;该方法可以使样本类间距离最大,提高了支持向量机模拟电路故障分类的效率和准确度;故障诊断结果表明文章提出的诊断方法在精度提高的情况下,所需训练时间和支持向量数目大大减少,更具稀疏性。  相似文献   

7.
蔡俊伟  胡寿松  陶洪峰 《物理学报》2007,56(12):6820-6827
提出了一种基于聚类的选择性支持向量机集成预测模型.为提高支持向量机集成的泛化能力,采用自组织映射和K均值聚类算法结合的聚类组合算法,从每簇中选择出精度最高的子支持向量机进行集成,可以保证子支持向量机有较高精度并提高了子支持向量机之间的差异度.该方法能以较小的代价显著提高支持向量机集成的泛化能力.采用该方法对Mackey-Glass混沌时间序列和Lorenz系统生成的混沌时间序列进行预测实验,结果表明可以对混沌时间序列进行准确预测,验证了该方法的有效性. 关键词: 支持向量机 集成 混沌时间序列 聚类  相似文献   

8.
基于复杂非线性系统相空间重构理论,提出了一种混沌背景中微弱信号检测的选择性支持向量机集成的方法,为了提高支持向量机集成的泛化能力,采用K均值聚类算法选择每簇中精度最高的子支持向量机进行集成,建立了混沌背景噪声的一步预测模型,从预测误差中检测湮没在混沌背景噪声中的微弱目标信号(包括周期信号和瞬态信号),最后分别以Lorenz系统和实测的IPIX雷达数据作为混沌背景噪声进行实验研元结果表明该方法能够有效地将混沌背景噪声中极其微弱的信号检测出来,抑制噪声对混沌背景信号的影响,与神经网络和传统支持向量机方法相比,预测精度和检测门限方面的性能有显著提高.  相似文献   

9.
电线绝缘材料老化状态的准确评估有助于减少因电线绝缘老化引起的火灾,该实验基于拉曼光谱检测平台及自行搭建的老化设备,对13种电线绝缘材料(聚偏氟乙烯、聚丙烯、聚四氯乙烯、尼龙、亚大尼龙、聚氨酯、乳胶、聚全氟乙丙烯树脂、橡胶、聚乙烯、聚氯乙烯、硅胶、进口硅胶)进行加速温度老化以及加速紫外老化试验并定期检测,温度老化10个时间段,时间间隔为32 h,每个老化时间15个样本数据,获得温度老化的每种材料共150个样本光谱数据;紫外老化13个时间段,时间间隔16 h,每个老化时间15个样本数据,获得紫外老化的每种材料共195个样本光谱数据。依据老化时间段,温度老化分为10类,紫外老化分为13类,采用线性回归分类和支持向量机对原始光谱数据进行分类,两种分类算法准确率均在80%以上的材料有尼龙、聚氨酯、特氟龙、橡胶等,但部分材料的分类准确率却低于70%,在对原始光谱数据进行支持向量机分类时,由于样本数量多以及光谱维度高,支持向量机分类所需时间较长,为进一步提升分类准确率以及分类速度,对原始光谱数据进行迭代自适应加权惩罚最小二乘法、五点三次平滑等预处理方法,采用PCA压缩,样本光谱维数从2 048维降至3维,由于降维后的样本光谱维数小于样本数量,无法满足线性回归分类要求,故采用支持向量机进行分类,经过预处理以及特征提取后,数据的分类效果得到大幅度提升,所有材料的温度老化、紫外老化均获得90%以上的分类准确率,支持向量机的分类速度亦得到大幅度提升,其结果为电线绝缘材料老化状态的有效评估提供理论依据,对预防因绝缘老化引起的事故提供技术支持。  相似文献   

10.
流形判别分析和支持向量机的恒星光谱数据自动分类方法   总被引:1,自引:0,他引:1  
尽管经典的分类方法支持向量机SVM在天文学领域广泛应用,但其只考虑类间的绝对间隔而忽略类内的分布性状,因而分类性能有待于进一步提升。鉴于此,提出一种新颖的基于流形判别分析和支持向量机的恒星光谱数据自动分类方法。该方法引入流形判别分析的两个重要概念:基于流形的类内离散度MW和基于流形的类间离散度MB。所提方法找到的分类面同时保证MW最小且MB最大。可建立相应最优化问题,然后将原最优化问题转化为QP对偶形式求得支持向量和判别函数,最后利用判别函数判断测试样本的类属。该方法的最大优势在于进行分类决策时,不仅考虑样本的类间信息和分布特征,而且还保持了各类的局部流形结构。SDSS恒星光谱数据上的比较实验表明该方法的有效性。  相似文献   

11.
反射光谱特征的土壤分类模型   总被引:2,自引:0,他引:2  
土壤反射光谱综合反映了土壤的理化性质和内部结构,高光谱遥感已被用于基于土壤反射光谱特性的土壤分类。已有研究一般利用土壤反射光谱一阶微分主成分作为输入量进行光谱分类模型构建,但主成分数据缺乏物理意义,且缺乏对比性、适用范围也有限。与反射率一阶微分数据相比,基于去包络线提取具有明确物理意义的特征参数,能够提高土壤分类的精度,并寻找到一种高精度土壤分类模型。选取吉林省农安县的四种典型土壤(风砂土、草甸土、黑土、黑钙土),将采集后的土壤样本进行风干、研磨、过2 mm筛处理,采用ASD FiledSpec®3便携式光谱仪对处理后的土壤样本的可见光近红外光谱区进行测试,从而获得土壤样本的光谱数据。对光谱数据进行九点平滑、10 nm重采样处理进行降噪,将处理后的数据分别进行一阶微分主成分以及去包络线处理。利用土壤样本的去包络线提取光谱特征参数。以一阶微分主成分数据和光谱特征参数为输入量分别代入Logistic聚类模型(LR)、人工神经网络聚类模型(ANN)、K-均值聚类模型(K-means)。首先明确了不同土类之间的反射光谱曲线、去包络线的差异大小,以及相同土壤的反射率曲线、去包络线进行土壤分类的优劣,并且在去包络线的基础上提取能够区分不同土类的光谱特征参数;其次,比较一阶微分主成分与光谱特征参数作为输入量时,三种光谱分类模型精度差异并分析不同模型精度差异的原因。结果表明:(1)四种土壤的反射光谱曲线差异较小,去包络线可以极大的增强四种土壤在430~1 210 nm之间的光谱差异,并在去包络线的基础上构建具有明确物理意义的光谱特征参数。(2)将一阶微分主成分和光谱特征参数分别代入三种聚类模型可知,以光谱特征参数为输入量的土壤光谱分类模型均超过了以一阶微分主成分为输入量的模型精度,由于光谱特征参数保留了原数据的物理意义、更准确的体现了不同土壤类型之间的差异性,而一阶微分主成分数据带有一定的模糊性不同范围之间缺乏对比性,在土壤分类中以光谱特征参数作为输入量更具有优势。(3)在三类土壤分类模型中,LR的分类精度最高为76.67%,Kappa系数为0.56;ANN的分类精度中等为72.50%,Kappa系数为0.48;K-means的分类精度最低,只有65.00%,Kappa系数为0.33。研究成果可为土壤精细制图、以及土壤分类仪器的研制提供技术支持。  相似文献   

12.
Systems biology and bioinformatics are now major fields for productive research. DNA microarrays and other array technologies and genome sequencing have advanced to the point that it is now possible to monitor gene expression on a genomic scale. Gene expression analysis is discussed and some important clustering techniques are considered. The patterns identified in the data suggest similarities in the gene behavior, which provides useful information for the gene functionalities. We discuss measures for investigating the homogeneity of gene expression data in order to optimize the clustering process. We contribute to the knowledge of functional roles and regulation of E. coli genes by proposing a classification of these genes based on consistently correlated genes in expression data and similarities of gene expression patterns. A new visualization tool for targeted projection pursuit and dimensionality reduction of gene expression data is demonstrated. The text was submitted by the authors in English.  相似文献   

13.
大规模光谱巡天项目如LAMOST等产生了海量极具研究价值的观测数据,如何对此数量级的数据进行有效的分析是当前的一个研究热点。聚类算法是一类无监督的机器学习算法,可以在不依赖于领域知识的情况下对数据进行处理,发现其中的规律与结构。恒星光谱聚类是天文数据处理中一项非常重要的工作,主要对海量光谱巡天数据按照其物理及化学性质分类。针对LAMOST巡天中的早M型矮恒星的光谱数据,使用多种聚类算法如K-Means,Bisecting K-Means和OPTICS算法做了聚类分析,研究不同聚类算法在早M型恒星数据的表现。聚类算法在一定程度依赖于其使用的距离度量算法,同时研究了欧氏距离、曼哈顿距离、残差分布距离和上述三种聚类算法搭配下的表现。实验结果表明:(1)聚类算法可以很好地辅助分析早M型矮恒星的光谱数据,聚类产生的簇心数据和MK分类吻合得非常好。(2)三种不同聚类算法表现不尽相同,Bisecting K-Means在恒星光谱细分类方面更有优势。(3) 在聚类的同时也会产生一些数量较少的簇,从这些簇中可以发现一些稀有天体候选体,相对而言OPTICS适合用来寻找稀有天体候选体。  相似文献   

14.
In the paper, an approach for decision rules construction is proposed. It is studied from the point of view of the supervised machine learning task, i.e., classification, and from the point of view of knowledge representation. Generated rules provide comparable classification results to the dynamic programming approach for optimization of decision rules relative to length or support. However, the proposed algorithm is based on transformation of decision table into entity–attribute–value (EAV) format. Additionally, standard deviation function for computation of averages’ values of attributes in particular decision classes was introduced. It allows to select from the whole set of attributes only these which provide the highest degree of information about the decision. Construction of decision rules is performed based on idea of partitioning of a decision table into corresponding subtables. In opposite to dynamic programming approach, not all attributes need to be taken into account but only these with the highest values of standard deviation per decision classes. Consequently, the proposed solution is more time efficient because of lower computational complexity. In the framework of experimental results, support and length of decision rules were computed and compared with the values of optimal rules. The classification error for data sets from UCI Machine Learning Repository was also obtained and compared with the ones for dynamic programming approach. Performed experiments show that constructed rules are not far from the optimal ones and classification results are comparable to these obtained in the framework of the dynamic programming extension.  相似文献   

15.
The rock near-infrared spectrum contains information of its composition and structure. The interpretation of rock near-infrared spectrum is one of the important approaches in the qualitative and quantitative analyses of the alteration minerals in rock. The rock near-infrared spectra are classified using optimized fuzzy C-means clustering algorithm, and the main mineral composition is obtained for different rock samples through the analysis of cluster centers. The minimum Spectral Correlation Coefficient is used as the objective function to classify the simulation data. In this study, the classification method was first tested for parameter setting using simulation data, which was the mixture of several standard mineral spectra quantified in terms of reflectivity in the near-infrared band. Classification accuracies under different fuzzy index values are compared. When the fuzzy index value is 1.5, the classification accuracy of the simulation samples is 83%. The initial values of different cluster centers were shown to affect the classification result. In the practical application, the initial values of cluster centers need to be rationally chosen based on the knowledge of mineral spectroscopy. This method is applied in the clustering analysis of the rock near-infrared spectra, which were also quantified in terms of reflectivity in the near-infrared band. These actual rock near-infrared spectra were measured by a spectrometer, while the classification results were compared with X-ray diffraction analysis to show the effectiveness of our algorithm. Our study has shown that, with the optimized fuzzy C-means clustering algorithm, the interpretation of rock near-infrared spectra can help us obtain information of the mineral composition and structure more effectively in terms of accuracy and speed. This method is suitable for the rapid processing of massive rock near-infrared spectra and may become an important technology in geological survey and geological prospecting.  相似文献   

16.
随着飞机系统结构的复杂化,维修系统仿真模型的多样化,飞机维修系统仿真模型的集成存在基础层直接集成难度大和复用性差等问题。基于逆向推理的系统仿真模型集成算法以目标问题为导向逆向推理模型数据,经不同知识层次匹配查询目标模型,将模型集成过程转变为问题求解过程,降低了直接对目标建模的复杂程度,最终建立集成网络,实现决策、模型和数据的综合集成。经验证,该算法在飞机维修训练器的仿真系统模型集成中具有良好的性能。  相似文献   

17.
马姣婷  贾世英  吴伟霖 《应用声学》2016,24(9):195-197, 202
针对模糊C-均值聚类算法的单一隶属度不能充分描述图像不确定性,且聚类过程中忽略像素空间关系的问题,提出一种基于空间信息的直觉模糊C-均值算法;该算法选取3×3的模板计算邻域像素灰度均值;并引入权重项,来控制灰度信息和空间信息各自所占的比重,同时用犹豫度更新直觉模糊集的隶属度函数;对常用标准图像的仿真结果表明,该算法能更好地保留图像细节信息,得到更加理想的图像分割效果。  相似文献   

18.
高光谱图像分类是高光谱研究的重要内容,也是许多其他应用的前提。针对传统高光谱图像分类仅考虑光谱信息而忽略空间信息的问题,对距离依赖的中餐馆模型(distance dependent Chinese restaurant process, ddCRP)进行改进,提出一种基于空-谱约束的中餐馆过程混合模型(spatial-spectral Chinese restaurnt process, ssCRP)用于高光谱图像聚类。该模型充分考虑像素邻域的空间和光谱信息,并将其统一纳入模型的建模及求解过程中,得到一般基于像素的聚类方法无法实现的效果,可在一定程度上满足高光谱图像聚类分析的需求。首先,为利用高光谱图像的空间和光谱信息,定义基于像素空间距离和光谱角的指数衰变函数作为像素间相似性的度量。然后,在考虑像素相似性的基础上利用基于餐桌的构造形式为每个像素确定所在的餐桌。最后,对每张餐桌分配一道菜作为聚类类别,从而达到聚类的目的。利用航空可见-近红外成像光谱仪AVIRIS高光谱影像评估该模型性能,实验结果表明:ssCRP模型可较好地实现高光谱图像的自动聚类,与传统的K-means和ISODATA方法相比,该模型结果斑块规整,“椒盐效应”得到抑制,具有较高的空间一致性,分类精度高,其总体精度达到63.57%,Kappa系数为0.632 3,能很好反映真实地物分布。同时,分类结果的地物间边界清晰,能很好保持图像边缘。  相似文献   

19.
基于谱聚类与类间可分性因子的高光谱波段选择   总被引:1,自引:0,他引:1  
随着遥感技术和成像光谱仪的发展,高光谱遥感图像的分辨率不断提高,其庞大的数据量在提高其遥感探测能力的同时,也给分析和处理带来了很大的困难。高光谱波段选择可以有效减少数据冗余,提高分类识别精度和处理效率。因此如何从多达数百个波段的高光谱图像中选择出具有较好分类识别能力的波段组合是亟待解决的问题。针对上述问题,采用基于图论的谱聚类算法,将原始高光谱图像中的波段作为待聚类的数据点,利用互信息描述两两波段间的相似度,生成相似度矩阵。再根据图谱划分理论,将相似度矩阵生成的非规范化图拉普拉斯矩阵进行谱分解,得到类间相似度小且类内相似度大的类簇;然后根据地物类型计算各波段的类间可分性因子,将其作为类簇内进一步选择代表性波段的参考指标,达到降维的目的;最后通过支持向量机与最小距离分类方法对波段选择后的图像分类。该方法区别于传统的无监督聚类方法,采用基于图论的谱聚类算法,并根据先验知识计算类间可分性因子来选择波段。通过与自适应波段选择算法和基于自动子空间划分的波段指数算法的对比实验,结果表明:两组实验当聚类数目达到相对最佳时,该波段选择方法支持向量机图像总分类精度达到94.08%和94.24%以上,最小距离分类图像总分类精度达到87.98%和89.09%以上,有效保留了光谱信息,提高了分类精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号