首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
采用支持向量机(support vector machine,SVM)建立了鱼糜样品中水分和蛋白质含量的近红外光谱校正模型,并采用独立样本集进行了预测。光谱数据经间隔两点一阶导数(DB1G2)、标准正态变换(SNV)、多元散射校正(MSC)相结合的方法预处理后,用偏最小二乘(PLS)降维处理,取前15个投影变量为自变量。获得水分模型的校正相关系数Rc、预测相关系数Rv、定标标准差SEE、预测标准差SEP; 蛋白质模型的校正相关系数Rc、预测相关系数Rv、定标标准差SEE、预测标准差SEP,有较好的预测准确性。基于SVM算法的近红外光谱技术可用于鱼糜水分和蛋白质含量的快速检测。  相似文献   

2.
为了提高对蓝莓果渣的开发利用,探索了近红外光谱测定三种蓝莓(北陆、蓝美1号、灿烂)果渣中花色苷含量的可行性。通过DA7200采集三种蓝莓果渣的近红外光谱,利用PCA-MD对北陆、蓝美1号、灿烂果渣分别剔除1, 4和8个异常样本。运用K-S划分样本集得到校正集(686个样本)和验证集(171个样本)。对样本集分别进行归一化、变量标准化(SNV)、多元散射校正(MSC)、 Norris一阶导数(NFD)、 Norris二阶导数(NSD)、 SG卷积一阶导数(SGCFD)、 SG卷积二阶导数(SGCSD)、 Savitzky-Golay(SG)卷积平滑、正交信号校正预处理,并建立相应全谱PLS模型。比较并选择MSC、 SGCSD、 SG卷积平滑、正交信号校正,进行预处理方法顺序组合的比较,结果显示,全谱PLS模型中最优预处理方法为正交信号校正+SGCSD+SG卷积平滑,其R■为0.940 0、R■为0.886 7、 RMSEC为0.722 5、 RMSECV为0.246 2、 RMSEP为1.000 5、 RPD为2.970 8。利用SPA和CARS对预处理过的光谱数据分别进行波长变量的筛选,依次建立PLS回归模型,并定量分析其对蓝莓果渣花色苷的预测能力。在所有预处理方法进行波长变量筛选中, SPA与CARS算法均可以有效地筛选出波长变量,但SPA筛选出的波长变量,无法全部建立PLS回归模型,而CARS算法筛选出的波长变量,均可建立PLS回归模型。数据表明, CARS-PLS最佳组合为正交信号校正+MSC+SG卷积平滑+SGCSD,选择波长数为25个,相较于原始光谱,其R■从0.900 8增长到0.940 3,R■从0.881 8增长到0.885 7, RMSEC从0.929 1减少到0.720 9, RMSECV从0.317 6减少到0.245 6, RMSEP从1.021 8减少到1.004 9, RPD从2.908 8增长到2.957 5。近红外光谱的蓝莓果渣花色苷含量测定中,正交信号校正表现出强大的去噪效果, CARS算法具有简化模型、适用性较好和预测精度较高等优点。研究结果表明,应用近红外光谱技术可以较好地实现三种不同品种蓝莓果渣中花色苷含量的测定,可为蓝莓果渣品质分级提供一种快速、支持大样本量的检测方法。  相似文献   

3.
为了满足果蔬品质快速安全无损检测,基于可见-近红外漫透射原理,设计了番茄专用环形光源,自行搭建了番茄可见-近红外漫透射多品质检测系统,并以可溶性固形物含量(SSC)和总糖(TS)作为内部品质指标,对58个番茄样品进行了快速无损检测研究。基于自主搭建的系统对每个番茄进行四点的光谱采集,对平均后的光谱分别用15点SG卷积平滑(SG-Smooth)、标准正态变量变换(SNV)、多元散射校正(MSC)、一阶导数(FD)等方法进行了预处理,分别建立了SSC及TS的偏最小二乘预测模型,并对该模型进行了验证。结果表明:采用15点SG平滑预处理后的SSC预测模型校正集和预测集相关系数分别为0.995 6和0.976 0,均方根误差分别为0.052 4°Brix和0.082 3°Brix。采用SG平滑后一阶导数预处理的TS预测模型校正集和预测集相关系数分别为0.969 1和0.972 9,均方根误差分别为0.423 8%和0.454 9%。模型验证结果显示,番茄SSC和TS模型预测结果与标准理化值相关系数分别为0.985 5和0.944 9,均方根误差分别为0.066 3°Brix和0.571 5%。利用自行搭建的可见-近红外漫透射光谱检测系统完全可以实现番茄可溶性固形物及总糖含量的快速无损预测,为番茄内部品质的评价提供了实时、无损、快速的检测方法,为其在线分级提供理论基础。  相似文献   

4.
为了实现甜菜依据含糖量定等分级,甜菜收购环节的按质论价,促进甜菜制糖行业的良好健康发展,应用近红外光谱技术对甜菜糖度的快速检测进行了系统研究,确定了一种快速、无损、准确的测量甜菜糖度的方法。采集具有代表性的28个甜菜品种,820个甜菜样品作为校正集,70个样品作为预测集,扫描得到甜菜校正集样品的近红外原始光谱,选择合适的光谱预处理方法,采用偏最小二乘法建立甜菜糖度的定量预测数学模型,以校正模型的内部交互验证均方根误差(RMSECV)、决定系数(R2)和外部预测标准误差(SEP)为指标对模型的性能进行评价,并对模型的预测效果进行了比较。采用一阶导数和标准正态变量变换对光谱进行预处理并结合偏最小二乘法所建立的定量预测数学模型的预测能力较好。甜菜糖度定量校正数学模型的模型决定系数为0.908 3,内部交互验证预测均方根误差为0.376 7。用此数学模型对预测集70个样品进行预测,预测值与实测值的相关系数达到0.921 4,预测标准误差为0.439,预测值和实测值之间不存在显著性差异(p>0.05)。结果表明:近红外光谱法作为一种简单、快速、无损、环保的检测方法,能够良好的评价甜菜的糖度。建立的模型具有很高的精确性,可以满足甜菜糖含量测定的需要,该方法可以实现甜菜收购环节的定等分级和按质论价。  相似文献   

5.
基于近红外光谱的淡水鱼新鲜度在线检测方法研究   总被引:1,自引:0,他引:1  
新鲜度是反映鱼类品质以及可否食用的重要指标,在线检测直接关系到食品质量与安全的实施应用,因此对淡水鱼新鲜度进行在线无损检测具有重要意义。应用近红外光谱对淡水鱼新鲜度进行在线检测,试验装置采用自行搭建的淡水鱼近红外光谱在线采集装置,试验时样品在输送链上以0.5 m·s-1的速度运动,采集其近红外漫反射光谱(900~2 500 nm),并用支持向量机(support vector machine, SVM)建立淡水鱼新鲜度在线检测模型。采用光谱理化值共生距离(sample set partitioning based on joint X-Y distance algorithm, SPXY)算法对样本集进行划分,其中校正集111条(新鲜57条,变质54条)、测试集37条(新鲜19条,变质18条),通过对比不同的光谱预处理方法对预测结果的影响,明确了一阶导结合标准化预处理为最优光谱预处理方法,经过该方法预处理后所建模型对校正集的正确识别率为97.96%,对测试集的识别率为95.92%。为了提高模型运行速度对建模所用光谱变量进行优化,分别采用遗传算法(genetic algorithm, GA)、连续投影算法(successive projection algorithm, SPA)和竞争性自适应重加权算法(competitive adaptive reweighed sampling algorithm, CARS) 三种不同的特征变量选择方法对特征波长进行筛选,通过建模比较分析确定CARS为最优波长选择方法,以所选的10个特征波长建立淡水鱼新鲜度支持向量机检测模型,模型对校正集的正确识别率为100%,对测试集的识别率为93.88%。该研究可为近红外光谱用于淡水鱼新鲜度在线检测提供技术支持。  相似文献   

6.
木材的种类识别是木材加工和贸易的一个重要环节,传统的木材种类识别方法主要有显微检测法和木材纹理识别法,其操作繁琐,耗时长,成本高,不能满足当前需求。本研究利用木材的近红外光谱(NIRS)结合模式识别方法,以期实现木材种类的快速准确识别。采用近红外光谱结合主成分分析法(PCA)、偏最小二乘判别分析法(PLSDA)和簇类独立软模式法(SIMCA)三种模式识别对58种木材进行种类鉴别研究;5点平滑、标准正态变量变换(SNV)、多元散射校正(MSC)、Savitzky-Golay一阶导数(SG 1st-Der)和小波导数(WD)五种光谱预处理方法用于木材光谱的预处理;校正集和测试集样品的正确识别率(CRR)用于模型的评价。采用PCA方法,通过样品的前三个主成分空间分布图分辨木材种类的聚类情况。在建立PLSDA模型,原始光谱的正确识别率最高,分别为88.2%和88.2%;5点平滑处理的光谱校正集和测试集的CRR分别为88.1%和88.2%;SNV处理的光谱校正集和测试集的CRR分别为84.4%和84.5%;MSC处理的光谱校正集和测试集的CRR分别为83.1%和84.2%;SG 1st-Der处理的光谱校正集和测试集的CRR分别为81.8%和82.7%;WD(小波基为“Haar”,分解尺度为80)处理的光谱校正集和测试集的CRR分别为87.3%和87.2%。可知,在PLSDA模型中,木材光谱未经预处理种类识别效果最后好。在建立SIMCA模型过程中,原始光谱的校正集和测试集的CRR分别为99.7%和99.4%;5点平滑处理的光谱校正集和测试集的CRR分别为100%和100%;SNV处理的光谱校正集和测试集的CRR分别为99.5%和99.1%;MSC处理的光谱校正集和测试集的CRR分别为99.0%和98.4%;SG 1st-Der的光谱校正集和测试集的CRR分别为81.8%和82.7%;WD处理的光谱校正集和测试集的CRR分别为100%和100%。可知,在SIMCA模型中,木材光谱经平滑和小波导数处理后的识别效果最好,且光谱的校正集和测试集CRR都为100%。采用三种模式结合五种不同的预处理方法对木材近红外光谱进行定性建模识别时,由于木材样本属性复杂,主成分分布图相互交织,PCA无法识别出58种木材;原始光谱的PLSDA模型可以得到较好的判别模型,但校正集和测试集的CRR只有88.2%和88.2%;木材光谱经过5点平滑或WD预处理后的SIMCA模型可达到最好的识别效果,校正集和测试集的CRR均为100%,且WD-SIMCA模型因子数比5点平滑SIMCA模型小,模型更为简化,故WD-SIMCA为58种木材种类识别的最优模型。研究表明光谱预处理方法可以有效的提高木材种类识别精度,有监督模式识别方法SIMCA可以用来建立有效的木材识别模型,近红外光谱结合模式识别可以为木材种类的识别提供一种快速简便的分析方法。  相似文献   

7.
高光谱图谱融合检测羊肉中饱和脂肪酸含量   总被引:3,自引:0,他引:3  
为探究高光谱成像(400~1000 nm)对羊肉中饱和脂肪酸(SFA)含量检测的可行性,提出一种基于特征光谱信息和图像纹理特征融合的SFA含量预测模型,实现对羊肉中SFA含量的快速检测及分布可视化。利用分段阈值法构建掩膜图像,获取羊肉样本感兴趣区域(ROI),结合SPXY法对样本集进行划分并对相关光谱信息进行预处理,分别采用连续投影算法(SPA)、变量组合集群分析法(VCPA)和β权重系数法提取特征光谱;通过获取羊肉样本主成分图像,结合灰度共生矩阵(GLCM)算法提取图像纹理信息;分别对特征光谱、图像信息及图谱融合信息建立的偏最小二乘回归(PLSR)与最小二乘支持向量机(LS-SVM)预测模型进行对比分析。利用5种不同对原始光谱数据进行预处理,经SNV法预处理后的光谱其校正集与预测集相关系数分别为0.921和0.875,较原始光谱分别增加了0.001和0.04,均方根误差模型分别为0.244和0.268,较原始光谱模型分别减少了0.003和0.06;对SNV法预处理后的光谱数据进行特征波长提取,SPA法、VCPA法及β权重系数法分别提取出12,10和9个特征波长;获取羊肉样本的前5个主成分图像,选择所含信息量最多的第一主成分图像进行纹理特征提取,依次提取0,45°,90°和135°方向下的能量、熵、同质性和相关性共4个主要纹理特征。利用SPA法提取的特征波长建立的PLSR与LS-SVM模型性能较好,PLSR模型校正集与预测集相关系数分别为0.8849和0.8807,均方根误差分别为0.3001和0.2606;LS-SVM模型校正集与预测集相关系数分别为0.8987和0.8926,均方根误差分别为0.2767和0.2476;图谱信息融合模型中,PLSR模型校正集与预测集相关系数分别为0.9071和0.9078,较特征光谱模型分别增加了0.02和0.03,均方根误差分别为0.3269和0.2992,较特征光谱模型分别增加了0.03和0.04;LS-SVM模型校正集与预测集相关系数分别为0.9206和0.8946,较特征光谱模型分别增加了0.02和0.002,均方根误差分别为0.2519和0.2458,较特征光谱模型分别减少了0.02和0.002。光谱预处理中经SNV法处理后的光谱所建模型性能优于其他预处理方法;采用SPA法提取的12个特征波长简化了光谱模型,提高了模型性能,特征光谱建模的最优方法为SPA-LS-SVM;图谱信息融合模型较特征光谱模型,模型相关系数增加较少,表明图像纹理信息虽携带了部分有效信息,但这些信息与羊肉中SFA含量之间的相关性有待进一步研究。基于图谱信息融合模型的预测性能最优,其次为光谱信息模型。择优选取SPA-PLSR模型计算羊肉样本中每个像素点的SFA含量,利用伪彩色图直观表示了羊肉样本中SFA的含量分布。实现对羊肉样本SFA含量的无损检测及分布可视化表达。  相似文献   

8.
在近红外光谱多元校正方法实际应用中,经常遇到这样的情况,近红外光谱校正模型仅适用于建模时的测量条件,而在测量条件稍有变化时就无法实现样品的准确预测。文章主要研究采用数字傅里叶滤波预处理方法提高近红外光谱多元校正模型稳健性。文章将数字傅里叶滤波预处理方法应用于葡萄糖水溶液的温度实验,实验1和实验2分别在恒温25 ℃和恒温30 ℃进行光谱测量;实验3在未控温的室内环境下进行光谱测量。采用实验1和实验2的样品作为训练集进行模型训练和优化,模型建立完毕之后,采用实验3的样品作为验证集进行模型预测能力评价。结果表明,如果训练集样品未经过预处理而直接建立偏最小二乘(PLS)多元校正模型,则验证集样品均方根预测误差(RMSEP)为664.47 mg·dL-1。而训练集和验证集样品经过傅里叶滤波预处理之后分别进行PLS建模和预测,验证集样品均方根预测误差(RMSEP)降低为58.43 mg·dL-1,样品预测值与参考值的相关性也得到提高。可见,采用数字傅里叶滤波预处理方法可以提高多元校正模型的稳健性。  相似文献   

9.
叶绿素荧光参数F_v/F_m是探究逆境胁迫对植物光合作用影响的重要指标,已有研究表明植被指数与F_v/F_m线性相关,但直接将植被指数与F_v/F_m拟合存在精度不足的问题。为实现对该参数的准确预测,本文以茄子为研究对象,提出一种基于可见-近红外光谱的F_v/F_m预测方法。试验获取不同生长状态茄子叶片的可见-近红外光谱数据和荧光参数,使用蒙特卡洛采样法(MCS)去除明显异常样本,采取3种光谱预处理方法及5种特征波长选择算法进行光谱数据处理,并建立偏最小二乘回归(PLSR)模型进行方法评估。基于提取出的最优特征波长组合,分析误差反传(BP)神经网络、径向基函数(RBF)神经网络、极限学习机(ELM)及回归型支持向量机(SVR)共4种机器学习算法对F_v/F_m预测模型精度的影响,从而确定基于最优方法组合的叶绿素荧光参数F_v/F_m预测方法。结果表明:茄子叶片光谱反射率随F_v/F_m的增加呈明显下降趋势,表明利用光谱信息反演F_v/F_m的可行性。基于393组试验样本,使用多元散射校正(MSC)、标准正态变量变换(SNV)进行光谱预处理,以竞争性自适应重加权采样法结合连续投影法(CARS+SPA)进行特征波长筛选的效果最优。其中, MSC-CARS-SPA-PLSR和SNV-CARS-SPA-PLSR的测试集决定系数分别为0.896 1和0.881 2,均方根误差为0.011 8和0.012 6,两者精度皆高于全光谱数据对应的PLSR模型;同时,两方法提出的特征波长个数均为12个,仅占全光谱波长个数(1 358)的0.88%。该结果表明以上两种方法有效提取出了对模型预测有利的少量波长。基于上述波长建立机器学习模型,发现SVR建模效果最优。以SNV-CARS-SPA-SVR的预测精度最高,其测试集决定系数为0.911 7,均方根误差为0.010 8。综上, SNV-CARS-SPA-SVR建模方法提高了模型精度,有效降低了模型复杂度,为基于可见-近红外光谱的F_v/F_m准确预测提供了实现方法。该方法可应用于作物生长状态的快速、无损检测,为农情预警提供有效手段。  相似文献   

10.
近红外漫反射光谱法测定黄芩中总黄酮及黄芩苷的含量   总被引:8,自引:0,他引:8  
文章建立了近红外漫反射光谱技术快速测定中药黄芩中主要活性成分黄芩苷和总黄酮含量的方法.对黄芩苷含量在12.24%~21.34%,总黄酮含量在16.08%~26.52%范围内的61个不同产地的黄芩,选择在8 000~4 000 cm-1范围内的近红外吸收光谱,采用偏最小二乘算法(PLS)比较不同光谱预处理方法建市的校正模型,结果表明一阶导数和最小最大归一化的数据预处理方法分别为黄芩苷和总黄酮最优预处理建模方法.黄芩苷校正集相关系数(r)为0.902 4,校正集标准偏差(SEC)为1.01,预测集标准偏差(SEP)为0.876 4;总黄酮校正集相关系数(r)为0.952 7,校正集标准偏差(SEC)为0.785,预测集标准偏差(SEP)为0.521 1,该方法快速简便,适合于黄芩中主要活性成分的快速分析.  相似文献   

11.
为了实现兰州百合关键营养物质蛋白质和多糖的快速无损检测,在12 000~4 000 cm-1光谱范围内采集了59份兰州百合粉的近红外光谱(NIRS)。首先运用SG、 Normalize、 SNV、 MSC、 Detrend、 OSC、 SG+1D、 SG+Normalize、 SG+SNV和SG+Detrend十种预处理方法对原始光谱数据进行处理,确定蛋白质的最佳预处理方法为SG+Detrend、多糖的最佳预处理方法为Detrend;然后运用CARS、 SPA和PCA三种算法对预处理的光谱数据进行特征波长筛选,确定蛋白质和多糖的最佳特征波长提取方法均为SPA算法;最后采用PLSR法建立了兰州百合关键营养物质蛋白质和多糖含量的预测模型,结果显示,经过SG+Detrend_SPA处理所建立的蛋白质PLSR模型中,预测集相关系数Rp为0.810 6,预测集均方根误差RMSEP为1.195 3;经过Detrend_SPA处理所建立的多糖PLSR模型中,预测集相关系数Rp为0.810 9,预测集均方根误差RMSEP为2.0946。...  相似文献   

12.
利用光谱信息快速、无损和准确的检测水稻冠层叶片叶绿素含量,对水稻的长势评估、精准施肥、科学管理都具有非常重要的现实意义。以东北粳稻为研究对象,以小区试验为基础,获取关键生长期的水稻冠层高光谱数据。首先采用标准正态变量校正法(SNV)对光谱数据进行预处理,针对处理后光谱数据,以随机蛙跳(RF)算法为基础,结合相关系数分析法(CC)和续投影算法(SPA),提出一种融合两种初选波段的改进型随机蛙跳算法(fpb-RF)筛选叶绿素含量的特征波段,并分别与标准RF,CC 和SPA方法进行对比。以提取的特征波段作为输入,结合线性模型和非线性模型各自优势,提出一种高斯过程回归(GPR)补偿偏最小二乘(PLSR)的叶绿素含量混合预测模型(GPR-P):利用PLSR法对水稻叶绿素含量初步预测,得到叶绿素含量的线性趋势,然后利用具有较好非线性逼近能力的GPR对PLSR模型偏差进行预测,两者叠加得到最终预测值。为了验证所提方法优越性,以不同方法提取的特征波段作为输入,分别建立PLSR、最小二乘支持向量机(LSSVM)、BP神经网络预测模型。结果表明:相同预测模型条件下,改进fpb-RF算法提取特征波段作为输入可较好的降低模型复杂性、提高模型预测性能,各模型测试集的决定系数(R2P)和训练集的决定系数(R2C)均高于0.704 7。另外,在各算法提取特征波段进行建模时,GPR-P模型的R2CR2P均高于0.755 3,其中,采用fpb-RF方法提取的特征波段作为输入建立的GPR-P模型预测精度最高,R2CR2P分别为 0.781 5和0.779 6,RMSEC和RMSEP分别为0.904 1和0.928 3 mg·L-1,可为东北粳稻叶绿素含量的检测与评估提供有价值的参考和借鉴作用。  相似文献   

13.
糖度(SSC)是苹果内部品质主要评价指标之一,近红外光谱技术是预测苹果SSC的首选技术,优化近红外光谱采集装置的参数,可以提升模型的性能。采用本课题组自主研发的动态在线设备采集苹果的近红外光谱(350~1 150 nm),研究不同参数条件下(运动速度、积分时间和光照强度)对近红外光谱预测苹果糖度模型的影响,优化动态在线装置的参数。210个红富士苹果被分为两批,第一批90个苹果样品,经过Kennard-Stone算法(K-S)算法分为建模集和预测集,用于研究不同运动速度、不同积分时间对苹果SSC含量在线预测模型的影响。在0.3和0.5 m·s-1两种运动速度下,使用多元散射校正(MSC)、小波变换(WT)、标准正态变量变换(SNV)对采集到的光谱进行预处理,对不同移动速度的光谱构建糖度的偏最小二乘回归模型(PLS),结果表明:装置的运动速度为0.5 m·s-1所建立的预测模型性能较优,在四种不同积分时间中,积分时间为120 ms时,经SNV预处理所建立的模型性能最优,其预测集的相关系数和均方根误差分别为0.968和0.331。第二批苹果120个...  相似文献   

14.
蛋白粉是健身者必备的营养补剂,市场需求在不断增加,一些不法商家为了谋取利益,在蛋白粉中加入廉价的粉末售卖。传统的蛋白粉掺杂的检测方法费时、费力,操作复杂,且成本昂贵。高光谱技术具有易于操作、在不损害实验样本的情况下可快速检测等优点,因此,提出使用高光谱技术以实现蛋白粉掺假检测。在蛋白粉中分别加入质量百分数5%~60%,浓度间隔5%的三类掺假物(玉米粉、大米粉和小麦粉),并采集所有样本的光谱信息。在对蛋白粉中的玉米粉、大米粉和小麦粉三类掺假物进行定性判别时,首先分别采用卷积平滑(SG)、标准化(Normalize)、多元散射校正法(MSC)、基线校正(Baseline)和标准正态变换(SNV)的预处理方法对光谱数据进行处理,然后建立基于主成分回归(PCR)、反向传播神经网络(BPNN)和随机森林(RF)的模型,其中基于全波段光谱MSC预处理方法下建立的RF模型最优,其整体准确率达到了100%,其对应的RP和RMSEP分别为0.997 9和0.018 9。在对蛋白粉中不同掺假物浓度进行定量分析时,对三类掺假样本的光谱分别进行SG,Normalize,MSC,Baseline和SNV的预处理,并建立LSSVM模型;比较不同预处理方法下的各模型之间的性能,在蛋白粉中掺玉米粉、大米粉和小麦粉的LSSVM预测模型最佳预处理方法分别是无、Baseline和Normalize,然后,采用连续投影算法(SPA)和竞争性自适应重加权算法(CARS)对其筛选,并建立LSSVM模型,三类掺假样本的SPA-LSSVM模型对应的RP为0.989 0,0.986 0和0.997 9,CARS-LSSVM模型对应的RP为0.991 0,0.994 6和0.999 1,故三类掺假样本的CARS-LSSVM模型预测效果更佳。研究表明:高光谱技术可以实现对蛋白粉掺假的定性、定量的检测,并且操作简单、检测快速和无损。  相似文献   

15.
可见/近红外光谱技术是土壤成分检测的有效工具。波长筛选对可见/近红外模型土壤属性的预测精度有重要影响。以宁夏吴忠地区75个水稻土样为研究对象,利用可见/近红外光谱技术采集土壤样品光谱,采用SPXY (Sample set partitioning based on joint X-Y distance)方法选取了校正集和预测集样本,比较了分别采用Savitzky Golay平滑(SG smoothing)、多元散射校正(Multiple scatter correction,MSC)、标准正态变量变换(Standard normal variate,SNV)3种预处理方法对光谱数据处理后建立土壤碱解氮偏最小二乘法模型和原始光谱数据建模的效果。在此基础上,分别采用遗传算法(Genetic gorithms,GA)、连续投影算法(Successive projections algorithm,SPA)、竞争性自适应重加权算法(Competitive adaptive reweighted Sampling,CARS)、随机蛙跳(Random frog,RF)进行波长筛选,最后应用偏最小二乘法建立基于不同波长筛选方法的土壤碱解氮含量预测模型。研究表明,由于仪器性能稳定,样品的颗粒度比较小和均匀,本次实验原始光谱数据建模效果最好;各种波长筛选方法均可有效减少参与建模的波长数,且连续投影算法优于全谱建模,所选波长数仅为全谱波长数的1%,其预测决定系数(R2)、预测均方根误差和相对分析误差值分别为0.726,3.616,1.906。这表明连续投影算法可以有效筛选水稻土碱解氮敏感波段,为土壤碱解氮传感器开发提供技术支持。  相似文献   

16.
采用可见-近红外高光谱成像技术结合化学计量学方法检测灵武长枣维生素C(VC)含量,探究一种全新的水果内部成分的快速无损检测方法。采用高效液相色谱法(HPLC)测得长枣的VC含量化学值,可见-近红外高光谱成像系统采集164个灵武长枣400~1 000 nm的高光谱图像,利用ENVI4.8软件提取图像的感兴趣区域(region of interest,ROI),计算其平均光谱,获得光谱值,将化学值与光谱值通过The UnsecramblerX 10.4软件建立模型。利用蒙特卡洛交叉验证法剔除异常值,采用光谱理化值共生距离法(sample set partitioning based on joint x-y distance,SPXY)进行样本划分以提高模型的预测性能;对光谱采用移动平滑(moving average)、中值滤波(median filter)、归一化(normalize)、基线校准(baseline)、多元散射校正(multiple scattering correction,MSC)、去趋势(detrending)和标准正态变量变换(standard normal variate,SNV)等7种方法进行预处理;为进一步减少数据量,降低维度,提高运算速度,使用竞争性自适应加权算法(competitive adaptive reweighted sampling,CARS)、无信息变量消除算法(uninformative variable elimination ,UVE)和连续投影算法(successive projections algorithm,SPA)提取特征波长,以期实现以少数波段代替全波段;将全波段光谱(full spectrum,FS)以及CARS, UVE和SPA三种方法提取的特征波长分别建立偏最小二乘(partial least squares wavelength regression,PLSR)和支持向量机(support vector machine,SVM)模型,从而确定最优的建模模型。利用蒙特卡洛交叉验证法共剔除7个异常样本,采用SPXY法将剔除异常样本后的157个数据区分为校正集和预测集,校正集中样本个数为117,预测集中样本个数为40。将未经光谱预处理的建模结果与分别经过七种光谱预处理的建模结果相比,选择未经光谱预处理的数据进行后续分析;将未经光谱预处理的光谱值采用CARS,UVE,SPA方法进行提取特征波长,CARS共优选出406,415,487,631,636,655,660,665,670,684,689,694,723,732,747和881 nm下的光谱变量16个,利用CARS提取出的特征波长占总波长的12.8%;UVE共优选出406,415,627,631,636,651,655,660,665,670,675,679,684,689,694,699,703,708,742,747,751,756,761,766,771,775,780,785,790,795,919和924 nm下的32个特征波长,利用UVE提取出的特征波长占总波长的25.6%;SPA共优选出401,665,684 nm三个特征波长,利用SPA提取出的特征波长占总波长的2.4%。将全波段光谱与提取出的特征波长建立PLSR模型和SVM模型,对比模型结果显示UVE-SVM模型最优,其R2c为0.847 1,R2p为0.714 9,说明UVE有效地对光谱进行降维,简化了数据处理过程。本研究对高光谱成像技术在水果领域的应用进行了有益探索,探究了一种全新的灵武长枣VC含量的无损检测方法,相应建立的可见-近红外高光谱模型为其他水果成分的快速检测提供了理论基础。  相似文献   

17.
矿井水害对煤矿安全生产存在巨大威胁,所以快速识别矿井突水水源,对煤矿水灾预警及灾后救援工作开展都有重大意义。激光诱导荧光(LIF)技术具有快速、高效、灵敏度高等特点,克服了传统水化学方法识别时间长的缺点。循环神经网络(RNN)在解决长序列训练过程中产生的梯度消失、梯度爆炸等问题上存在明显不足,而特殊变体RNN即长短期记忆(LSTM)神经网络很好地弥补了RNN的短板及缺陷。提出了将LIF技术与LSTM算法相结合,应用在矿井突水水源快速识别中。实验样本采自淮南矿区,以砂岩水和老空水为原始样本,并将砂岩水和老空水按照不同比例混合配置成5种混合水样,共7种待测水样进行实验。首先采用最大最小值归一化(MinMaxScaler)、平滑滤波(SG)以及标准正态变量变换(SNV)三种预处理方法对原始光谱数据进行预处理,减少原始光谱数据存在的噪声和干扰信息。之后为防止数据量过大,维度过高,将包括原始光谱数据在内的四组数据再进行LDA降维至3维。最后分别搭建LSTM识别模型,从测试集预测准确率、训练集准确率变化趋势以及训练集损失函数变化趋势三个方面进行比较,选择最优模型。其中SG+LDA+LSTM和Original+LDA+LSTM在测试集预测准确率上都能达到100%,MinMaxScaler+LDA+LSTM测试集预测准确率在98.57%,SNV+LDA+LSTM准确率最低,只有87.14%;在训练集准确率变化趋势表现上,SG+LDA+LSTM能够保持良好的学习,很快达到100%,Original+LDA+LSTM和MinMaxScaler+LDA+LSTM也能达到100%的准确率,但在前几次训练过程中会有准确率下降的情况出现,SNV+LDA+LSTM训练集准确率在训练次数内并未达到100%;SG+LDA+LSTM损失函数变化趋势也具有很好的收敛性和稳定性,Original+LDA+LSTM,MinMaxScaler+LDA+LSTM以及SNV+LDA+LSTM在损失函数变化趋势上表现并不出色。结果表明,4组模型中,SG+LDA+LSTM模型是最适合应用于矿井突水识别,该方法补充了矿井突水水源识别工作的内容,为矿井突水识别提供了新的思路。  相似文献   

18.
基于高光谱成像技术的滩羊肉新鲜度快速检测研究   总被引:1,自引:0,他引:1  
滩羊肉的新鲜度是其品质安全的一个重要衡量指标,也是肉品品质安全控制的关键环节。挥发性盐基氮(TVB-N)是表征肉品腐败过程主要的化学信息,能有效地评价出滩羊肉的新鲜度。然而,TVB-N的传统检测过程繁琐且人为影响因素大,检测结果缺乏客观性和一致性,不能满足当今肉品检测过程无损、快速、高效的需求。高光谱成像技术符合现代检测技术向多源信息融合方向发展的需求,已在食品安全领域得到广泛应用。利用可见/近红外高光谱成像技术(400~1 000 nm)结合动力学和化学计量学方法以及计算机编程技术,将同时实现滩羊肉贮存期内(15 ℃环境)TVB-N 浓度的快速检测和贮藏期的预测。研究中提取每个样品感兴趣区域的平均光谱数据,选用蒙特卡洛算法剔除异常样本。采用X-Y共生距离(SPXY)法划分为校正集和预测集,分别选用多元散射校正(multiplicative scatter correction, MSC)、卷积平滑(savitzky-golay, SG)、标准变量变换(standard normalized variate, SNV)、归一化(normalization)、基线校准(baseline)五种方法对原始光谱数据进行预处理,优选出最佳预处理方法。采用竞争性自适应重加权法(campetitive adaptive reweighted sampling, CARS)和连续投影算法(successive projections algorithm, SPA)分别提取了21个和6个特征波长。为优化模型并提高其模型精度,采用SPA算法对 CARS 所选特征波长进行二次提取,优选出14个特征波长。基于所提取的特征波长建立TVB-N浓度的PLSR模型,优选出 SNV-CARS-SPA-PLSR 模型具有较高的预测能力(R2c=0.88,RMSEC=2.51, R2p=0.65, RMSEP=2.11)。同时,建立了滩羊肉TVB-N变化与贮藏时间的动力学模型,并将优化后的光谱模型和动力学反应模型相结合建立了滩羊肉光谱吸光度值与贮藏时间的高光谱动力学模型,实现对贮藏时间的预测,并通过 PLS-DA判别模型对滩羊肉贮藏时间进行判别分析(校正集判别准确率为100%,预测集为97%)。研究表明,利用可见/近红外高光谱成像技术结合动力学和化学计量学方法以及计算机编程技术,可以有效地实现滩羊肉品质智能监控与质量安全快速无损分析,为开发实时在线检测装备提供理论参考。  相似文献   

19.
高光谱成像的油菜和杂草分类方法   总被引:3,自引:0,他引:3  
利用高光谱成像技术结合化学计量学方法对油菜中的杂草进行分类识别。采用近红外高光谱技术,通过正态变量变换(SNV)、去趋势化(De-trending)、多元散射校正(MSC)、移动平均平滑法(MA)、多项式卷积平滑法(SG)、基线校正(baseline)及归一化(normalize)算法对光谱数据进行预处理,采用主成分载荷(PCA loadings)、载荷系数法(x-LW)、回归系数法(RC)、连续投影算法(SPA)分别进行特征波长提取,采用偏最小二乘判别分析(PLS-DA)、极限学习机(ELM)和支持向量机(SVM)建立分类模型。结果表明,基于De-trending 预处理,通过PCA loadings,x-loading weights及SPA特征波长提取方法,基于极限学习机ELM算法建立的模型取得了最优的分类效果,建模集和预测集的分类精度均达到100%,另引入平均分类精度的指标,发现不同试验时间下,模型分类精度变化不大,表明应用近红外高光谱成像技术对油菜和杂草进行分类是可行的。  相似文献   

20.
赤霉病是小麦的一种主要病害,它会导致小麦减产甚至绝收,严重影响小麦种子质量,此外小麦受侵染分泌的真菌毒素危害人类身体健康。因此,小麦赤霉病籽粒的识别具有非常重要的意义。起初普遍采用色谱法和酶联免疫法进行赤霉病检测,这些方法设备昂贵、检测速度慢、准确性低。近年来,高光谱成像技术被广泛应用于农作物的识别与检测中,但是在小麦赤霉病检测的应用研究中,大多采用抽样检测的方法,图像采集完成后需要通过ENVI软件手动选取感兴趣区域。前期准备工作冗杂,而且容易发生漏检,漏检的小麦籽粒在存储运输过程中向周边籽粒快速侵染,难以保障小麦安全健康。鉴于此,利用高光谱成像系统结合机器学习提出了一种用于对大量小麦赤霉病籽粒样本快速可视化识别的算法,以降低漏检率并提升检测效率。实验分别采集健康小麦和染病小麦469~1 082 nm波段的高光谱图像,通过直方图线性拉伸结合图像分割的方法获取小麦样本的掩膜图像信息。利用Savitzky-Golay平滑去噪法与标准正态变量变换法(SNV)进行数据预处理,通过主成分分析法(PCA)和连续投影法(SPA)进行特征变量提取,筛选特征变量个数分别为4个和8个。在掩膜图像位置采集健康小麦样本与染病小麦样本各400份,其中75%用于建模集,25%用于测试集。采用十折交叉验证法结合线性判别分析法(LDA) 、K-近邻算法(KNN)、支持向量机(SVM)分别建立分类模型,测试集准确率都达到90%以上。随后比较了网格法(GRID)、粒子群算法(PSO)、遗传算法(GA)三种核参数寻优方法对SVM模型的影响,其中,SG-SPA-SVM(PSO)模型分类效果最优,建模集准确率为95.5%,均方根误差为0.212 1,测试集准确率为98%,均方根误差为0.141 4。基于样本点预测的基础之上,对掩膜获得所有小麦样本的光谱曲线进行预测并将识别结果反馈回掩膜中再进行伪彩色显示,实现染病籽粒可视化识别。结果表明,高光谱成像结合SG-SPA-SVM(PSO)算法建立的分类模型可以高效快速、准确无损、可视化的实现小麦赤霉病籽粒识别,为研制小麦赤霉病自动识别设备提供了算法基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号