首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
基于主成分分析的汉语连续语音切分算法   总被引:1,自引:0,他引:1       下载免费PDF全文
张永锋  杨影  肖莹莹 《应用声学》2011,30(5):366-369
连续语音切分是汉语连续语音识别中的一项重要技术。本文将通常用于图像处理的主成分分析(PCA)方法引入汉语连续语音切分领域,目的是通过PCA,降低语音帧之间的频谱相关性。再利用相邻语音帧特征构成的三维子空间的大小,实现连续语音切分,取得了不错的切分效果。  相似文献   

2.
训练样本构成是影响光谱重建精度的一个重要因素,针对学习型光谱重建算法中训练样本选择问题,提出了一种基于主成分分析的训练样本选择方法。为了保证训练样本与重建样本的相似度,首先根据欧式距离最小原则从待选样本集中选择与重建样本相机响应值相似的样本,并去掉其中的重复样本;然后进行主成分分析;设定阈值筛选各主成分系数较大的样本作为训练样本,最后得到与主成分个数相同的训练样本子集。为验证该方法的有效性,通过在镜头前加载宽带滤色片搭建多通道图像获取系统采集多通道图像信息,将得到的各样本子集用作训练样本,利用伪逆法重建光谱信息,最后将重建的光谱精度与常用的训练样本及训练样本选择方法得到的重建光谱精度进行比较。实验结果表明:提出的方法显著提高了光谱重建的色度精度和光谱精度,优于常用的样本选择方法,能较大程度满足高精度颜色复制要求。  相似文献   

3.
基于光谱技术和连续投影算法的润滑油品牌快速鉴别研究   总被引:1,自引:0,他引:1  
为了实现润滑油品牌的快速无损检测,提出了一种基于可见/近红外光谱透射技术与连续投影算法相结合的润滑油品牌快速鉴别新方法。采用连续投影算法对6种润滑油的可见/近红外光谱数据进行波长变量的筛选,再结合偏最小二乘法建立润滑油品牌的鉴别模型。结果表明,鉴别模型的相关系数r为0.9721,预测均方根误差RMSEP为0.4055,鉴别正确率为91.7%。说明提出的连续投影算法结合偏最小二乘算法具有很好的预测效果。  相似文献   

4.
应用遗传算法结合连续投影算法近红外光谱检测土壤有机质研究。采集浙江省文城地区农田土壤样品近红外光谱数据,土壤样品数为394个。为简化模型,采用遗传算法结合连续投影算法挑选出18个特征波长建模,应用偏最小二乘回归建立有机质预测模型,建模集的决定系数为0.81,均方根预测误差为0.22, 剩余预测偏差为2.31,预测集的决定系数为0.83,均方根预测误差为0.20,剩余预测偏差为2.45。研究发现,遗传算法结合连续投影算法在简化模型同时,模型的预测评价指标同采用全谱波长建模并没有明显降低。因此,遗传算法结合连续投影算法挑选的特征波长可以应用于近红外光谱检测土壤有机质含量。  相似文献   

5.
基于主成分分析的复杂光谱定量分析方法的研究   总被引:4,自引:0,他引:4  
针对超短脉冲激光与气体相互作用产生的非线性荧光光谱的特点,提出了光谱分析的预处理、特征提取以及定量分析的有效方法.采用小波算法对光谱数据进行压缩和降噪处理,使光谱数据由3979点压缩降噪至664点.对处理后的光谱特征峰团的强度进行主成分分析,结果表明2个主成分即可包含98%的光谱信息.采用第一主成分对不同浓度下的谱线强度进行拟合与误差计算,有效地提取了与气体浓度有关的特征参量.实现了气体的定量分析.同已有的定量分析方法相比,定量分析的精度有较大提高,特别在所关心的低浓度情况下,定量分析的精度改善更为明显.3种气体的拟合与计算显示同以往方法相比误差由0.2694降为0.02.  相似文献   

6.
近红外漫反射光谱的主成分分析   总被引:6,自引:1,他引:6  
本文研究了主成分分析的应用,说明了在主成分分析过程中所产生的新变量如何提供新的光谱信息,该信息能改善对原光谱的解释。  相似文献   

7.
基于抽取和连续投影算法的可见近红外光谱变量筛选   总被引:1,自引:0,他引:1  
大多数短波CCD硅检测器为2 048或3 648像元,相邻波长间隔小,预处理算法对其适用性差.本文在600.09~980.47 nm光谱范围内,采用等间隔抽取方法重构光谱矩阵.经不同光谱预处理后,分别采用遗传算法(GA)和连续投影算法(SPA),筛选偏最小二乘法(PLS)建模变量.采用留一法交叉验证评价模型的预测能力,...  相似文献   

8.
对近红外技术在烟草中的应用作了简要的概述,报道了两种基于近红外光谱主成分的投影矢量求解方法,分别简称为PPF_PCA和PPF_Eig,并对两种方法在复烤配方中的应用与评价做了比较研究.对9类烟叶工业分级样品光谱进行一维投影分析的结果表明:PPF_PCA方法得到的一维投影值的类间差异性和类内差异性均大于PPF_Eig方法,其中各类间投影均值的平均绝对偏差前者约为后者的1.26倍.同时应用第一维投影值所占贡献率的情况对此结果进行了解释,PPF_PCA方法一维投影值所占贡献率为93%,PPF_Eig方法一维投影值所占贡献率为77%,前者约为后者的1.21倍,因此,PPF_PCA方法得到的一维投影值中包含更多类间和类内的差异性信息.应用烟叶各类工业分级样品的一维投影图能客观的评价各类样品之间的相似性及各类内样品之间的差异性,可方便的作为烟叶复烤配方的参考依据,同时在其他农产品(如中药等)配方中也具有较好的应用前景.  相似文献   

9.
连续投影算法及其在小麦近红外光谱波长选择中的应用   总被引:7,自引:0,他引:7  
采用全谱建立多元校正模型时,通常计算量大,模型不够稳健,而且模型的预测精度往往也不能达到最优。文章介绍一种新的波长选择方法:采用连续投影算法(successive projections algorithm),并将其集成偏最小二乘(partial least squares)多变量校正技术构成SPA-PLS方法,用于谷物小麦近红外光谱波长优化选择及其与水分含量的定量分析。结果表明:在经SPA算法后,光谱波数可削减97.72%,后继的定量校正模型结构得到显著简化,模型的稳健性也大大增强;同时,被选取的波长物理意义明确,模型的解释能力增强,而模型的预测性能也与GA-PLS方法相当。  相似文献   

10.
曹前 《光学技术》2023,(2):250-256
基于主成分或者权重主成分的多光谱降维方法实现高维多光谱数据和低维空间数据之间相互转换,但低维空间数据含有大量负值,不能和色度空间如CIELAB等连接起来,给光谱颜色复制的后续研究带来困扰;建立XYZ三刺激到多光谱数据的转换,在多光谱数据降维到XYZ三刺激值过程中保留更多的颜色信息;通过二阶多项式回归建立XYZ三刺激值与多光谱通过权重主成分降维的得到的三维空间数据对应关系,实现XYZ三刺激值到多光谱数据转换;在不同的训练样本,不同的测试样本时,相对于主成分和权重主成分,推荐的方法在多种照明条件下色度重建精度得到提高,可以较好地应用到多光谱图像的高保真降维和压缩。  相似文献   

11.
连续投影算法在油菜叶片氨基酸总量无损检测中的应用   总被引:4,自引:0,他引:4  
应用近红外光谱技术结合连续投影算法(SPA)实现了油菜叶片氨基酸总量(TAA)的快速无损检测.对150个油菜样本进行光谱扫描,通过比较不同预处理,建立油菜叶片氨基酸总量预测的最优偏最小二乘法(PLS)模型.同时应用SPA提取有效波长,作为多元线性回归(MLR),PLS和最小二乘-支持向最机(LS-SVM)的输入变量,分别建立SPA-MLR,SPA-PLS和SPA-ISSVM模型.以决定系数(R2)和均方根误差(RMSE)作为模型评价指标.结果表明,SPA-MLR和SPA-PLS均优于全波段的PLS模型,SPA-LS-SVM获得了最优的预测结果,其预测的R2和RMSEP分别为0.983 0和0.396 4,获得了满意的预测精度.说明应用光谱技术枪测油菜叶片TAA是可行的,并能获得满意的预测精度,为进一步应用光谱技术进行油菜生长对逆境胁迫的反应及大田监测提供了新的方法.  相似文献   

12.
PCA和SPA的近红外光谱识别白菜种子品种研究   总被引:2,自引:0,他引:2  
为了实现对不同品种白菜种子的快速无损鉴别,应用近红外光谱技术获取白菜种子的光谱反射率,首先采用变量标准化校正和多元散射校正对原始光谱进行预处理;其次,采用主成分分析法(PCA)对光谱数据进行聚类分析,从定性分析的角度得到三种不同白菜种子的特征差异,并采用连续投影算法(SPA)选取特征波长;最后,分别基于全波段光谱、PCA分析得到的前3个主成分变量以及SPA算法选取的特征波长,建立了最小二乘支持向量机(LS-SVM)和偏最小二乘判别(PLS-DA)模型进行白菜种子不同品种的鉴别。从主成分PC1、PC2得分图中可以看出,主成分1和2对不同种类白菜种子具有很好的聚类作用。基于特征波长建立的PLS-DA和LS-SVM模型的判别结果优于基于主成分变量建立的模型,其中基于特征波长建立的LS-SVM模型识别效果最优,建模集和预测集的品种识别率均达到100%。结果表明,通过SPA算法选取的6个特征波长变量能够很好的反映光谱信息,提出的SPA算法结合LS-SVM预测模型能获得满意的分类结果,为白菜种子品种的识别提供了一种新方法。  相似文献   

13.
提出了应用光谱和纹理特征的高光谱成像技术早期检测番茄叶片早疫病的方法。利用高光谱图像采集系统获取380~1 030 nm范围内71个染病和88个健康番茄叶片的高光谱图像,同时采用主成分分析法(PCA)对高光谱图像进行处理。选取染病和健康叶片感兴趣区域(region of interest, ROI)的光谱反射率值,同时分别从前8个主成分的每幅主成分图像的ROI中提取对比度(Contrast)、 相关性(Correlation)、 熵(Entropy)和同质性(Homogeneity)4个灰度共生矩阵的纹理特征值,再通过PCA和连续投影算法(SPA)结合最小二乘支持向量机(LS-SVM)构建番茄叶片早疫病的早期鉴别模型。建立的6个模型中,采用光谱反射率值的LS-SVM模型对番茄叶片早疫病的识别率最高,达到100%。结果表明,应用高光谱成像技术检测番茄叶片早疫病是可行的。  相似文献   

14.
赤霉病是小麦的一种主要病害,它会导致小麦减产甚至绝收,严重影响小麦种子质量,此外小麦受侵染分泌的真菌毒素危害人类身体健康。因此,小麦赤霉病籽粒的识别具有非常重要的意义。起初普遍采用色谱法和酶联免疫法进行赤霉病检测,这些方法设备昂贵、检测速度慢、准确性低。近年来,高光谱成像技术被广泛应用于农作物的识别与检测中,但是在小麦赤霉病检测的应用研究中,大多采用抽样检测的方法,图像采集完成后需要通过ENVI软件手动选取感兴趣区域。前期准备工作冗杂,而且容易发生漏检,漏检的小麦籽粒在存储运输过程中向周边籽粒快速侵染,难以保障小麦安全健康。鉴于此,利用高光谱成像系统结合机器学习提出了一种用于对大量小麦赤霉病籽粒样本快速可视化识别的算法,以降低漏检率并提升检测效率。实验分别采集健康小麦和染病小麦469~1 082 nm波段的高光谱图像,通过直方图线性拉伸结合图像分割的方法获取小麦样本的掩膜图像信息。利用Savitzky-Golay平滑去噪法与标准正态变量变换法(SNV)进行数据预处理,通过主成分分析法(PCA)和连续投影法(SPA)进行特征变量提取,筛选特征变量个数分别为4个和8个。在掩膜图像位置采集健康小麦样本与染病小麦样本各400份,其中75%用于建模集,25%用于测试集。采用十折交叉验证法结合线性判别分析法(LDA) 、K-近邻算法(KNN)、支持向量机(SVM)分别建立分类模型,测试集准确率都达到90%以上。随后比较了网格法(GRID)、粒子群算法(PSO)、遗传算法(GA)三种核参数寻优方法对SVM模型的影响,其中,SG-SPA-SVM(PSO)模型分类效果最优,建模集准确率为95.5%,均方根误差为0.212 1,测试集准确率为98%,均方根误差为0.141 4。基于样本点预测的基础之上,对掩膜获得所有小麦样本的光谱曲线进行预测并将识别结果反馈回掩膜中再进行伪彩色显示,实现染病籽粒可视化识别。结果表明,高光谱成像结合SG-SPA-SVM(PSO)算法建立的分类模型可以高效快速、准确无损、可视化的实现小麦赤霉病籽粒识别,为研制小麦赤霉病自动识别设备提供了算法基础。  相似文献   

15.
研究了不同分辨近红外光谱对汽车差速器油品牌鉴别的效果与影响。分别采集了五种不同品牌汽车差速器油在4, 8, 16和32 cm-1分辨率下的透射光谱。去除采集波段范围两端噪声明显部分后采用10 522.28~4 443.425 cm-1范围光谱进行分析。不同分辨率光谱的主成分分析(principal component analysis, PCA)结果表明不同品牌差速器油可以被鉴别。同时基于不同分辨率光谱全谱所建立的偏最小二乘判别分析(partial least squares-discriminant analysis, PLS-DA)以及支持向量机(support vector machine, SVM)模型所获得的判别正确率相近且均高于90%。其中以8 cm-1分辨率下PLS-DA与SVM模型的判别正确率最高。上述研究结果表明分辨率对判别分析结果的影响较小。进一步对不同分辨率下的近红外光谱采用连续投影算法(successive projections algorithm,SPA)选择特征波数,发现不同分辨率下得到的特征波数均不相同,表明分辨率影响特征波数的选择。以不同分辨率特征波数建立的PLS-DA以及SVM模型取得了较好的判别分析效果,与以不同分辨率下全谱建立的判别分析模型效果相当。研究结果表明,分辨率对差速器油品牌鉴别影响较小,而对特征波数的选择影响较大,在实际应用中应考虑到分辨率对特征波数选择的影响。总体而言,不同分辨率的近红外光谱全谱与对应的特征波数都能有效的实现对汽车差速器油品牌的鉴别。  相似文献   

16.
贮存时间是影响生菜品质的一项重要因素,传统的贮存时间鉴别方法主要依靠人工经验,但是这种方法的准确率和可信度并不高。研究的目标是建立一种基于模糊识别的模型进行生菜光谱分析以实现生菜贮存时间的鉴别,并与其他鉴别方法作比较。为此,在当地超市购买60份新鲜生菜样品,存放于冰箱中待用。首先,通过AntarisⅡ近红外光谱检测仪采集生菜样品的近红外光谱数据,每隔12小时检测一次,每个样本检测重复三次,并取三次平均值作为实验数据。其次,利用多元散射校正(MSC)减少近红外光谱中的冗余信息。为了进一步去除近红外光谱中的无用信息以及简化随后的数据分类过程,分别运用主成分分析(PCA)和排序主成分分析(PCA Sort)。其中,PCA Sort通过改进对主成分的排序方法能提高分类准确率,同时便于模糊线性鉴别分析(FLDA)进一步提取特征。PCA和PCA Sort的计算仅运用了前15个主成分(能充分反映光谱的主要信息)。最后,利用模糊线性鉴别分析算法(FLDA)和K近邻算法(KNN)进一步分类所得的低维数据。基于PCA和KNN算法的模型鉴别准确率达到43%,而基于PCA, FLDA和KNN算法的模型鉴别准确...  相似文献   

17.
太阳光谱观测是研究太阳大气活动现象有效手段之一。提出了一种基于主成分分析的太阳光谱特征信息提取和重构方法,分析了重构数据噪声抑制程度和主成分阶数的关系,计算了不同主成分阶数下重构数据的谱线信噪比以及多普勒速度测量精度。结果显示特征信息提取后,重构数据较大程度保留了原始光谱数据信息,光谱数据信噪比明显提高,谱线多普勒速度测量精度也显著提高,并且三维光谱数据存储和传输量大幅缩减。该方法能够满足一米新真空太阳望远镜当前数据规范发布需求和科学目标要求,为中国在建的光纤阵列太阳望远镜以及未来的巨型太阳望远镜光谱数据处理提供参考。  相似文献   

18.
基于光子计数探测器的X射线能谱CT,通过增加能谱分辨率实现了CT图像由灰度向彩色的转变,提高了材料识别能力。然而随着能谱通道数量的增加,通道中的噪声也显著增加,降低了材料识别的准确性。为充分利用能谱CT图像的稀疏性以及能谱通道之间图像的相关性,提出一种多约束窄谱CT迭代重建算法,可在降低噪声的同时有效保留图像的边缘及细节部分。进一步利用主成分分析对窄谱CT图像中的能谱信息进行估计,并建立主成分图像与R,G和B颜色分量之间的映射关系,最后获取彩色CT图像。该方法通过材料组分的彩色表征可以有效识别材料,同时降低图像中的背景噪声。仿真实验和实际实验结果验证了多约束窄谱CT迭代重建算法的有效性以及利用主成分分析进行材料组分彩色表征的可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号