首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 203 毫秒
1.
在法庭科学实践中,往往需要通过对文件中字迹墨水的成分分析来精确判定检材和样本文件的同一性。该文利用高光谱成像技术结合机器学习对喷墨打印墨水的种类进行区分,分别采集14套不同品牌、型号的4色(黑、青、品红和黄色)喷墨打印墨水打印的文件在400~1 000 nm范围的高光谱图像,共提取56种样品墨迹的光谱数据。使用均匀流形逼近与投影技术(UMAP)和T分布随机近邻嵌入技术(t-SNE)两种算法对高光谱喷墨打印墨水数据进行降维处理,然后建立极致梯度提升(XGBoost)、轻量级梯度提升机器学习(LightGBM)和支持向量机(SVM)3种分类模型,以1∶4的比例确定测试集和训练集,分别对原始数据和降维后的数据进行分类。实验结果显示,UMAP降维算法结合SVM模型对喷墨打印墨水分类的效果最优,黑色墨水样品的分类精度为90%左右,其余颜色墨水样品的分类精度均为100%。该研究为喷墨打印文件的检验鉴定提供了一种新的、无损、准确的鉴别方法。  相似文献   

2.
为了实现对法庭科学领域重质矿物油物证的快速、准确、无损的鉴定,该文基于光谱分析技术提出了一种多阶导数光谱数据组合分析的方法。收集了80种不同型号、不同厂家的重质矿物油样本,利用傅里叶变换拉曼光谱分析法采集样本的原始光谱数据和导数光谱数据,并通过结合化学计量学构建分类模型。在构建的主成分分析(PCA)结合径向基函数神经网络(RBF)分类模型中,对单独的原始光谱、一阶导数谱和二阶导数谱数据的训练集准确率分别为80.0%、86.7%和86.2%,测试集准确率分别为73.3%、80.0%和72.7%;对组合后的原始光谱+一阶导数谱、原始光谱+二阶导数谱和一阶导数谱+二阶导数谱数据的分类中,训练集准确率分别为97.0%、96.7%和100%,测试集准确率分别为85.7%、90.0%和100%。结果表明,对组合后的导数光谱与原始光谱构建分类模型,准确率更高。其中,基于一阶导数谱+二阶导数谱数据构建的PCA结合RBF分类模型的结果最为理想,准确率达100%。而K最近邻算法模型由于受到样本不均匀的影响,整体分类准确率均较低。利用组合的导数光谱与原始光谱数据构建分类模型能够实现对重质矿物油样本的快速、准确、无损鉴别,可为光谱组合技术在法庭科学及其他分析测试领域的应用提供一定的借鉴和参考。  相似文献   

3.
借助衰减全反射红外光谱结合K近邻算法和层次聚类,建立记号笔墨水种类鉴别的分类模型,为记号笔的种类鉴别提供有效的新方法。研究基于记号笔墨水的外光谱矩阵数据,通过建立主成分和判别分析分析模型和K近邻算法分类模型,实现对模型性能的比较和对模型分类结果的验证。实验结果表明,以水性和油性作为分类标准,模型对样本的区分能力好,其正确率为100%。借助红外谱图进一步分析水性油性样本时,其最强峰与其对应溶剂相符合。借助K近邻算法进行验证性分析,按重要性加权特征给不同的样本施加不同的权重,运用训练样本即为测试样本的方法交互验证,选取K值为1,训练集∶保持集=3∶1,建立分类模型,模型总分类准确率达100%,区分效果良好,不同品牌的油性、水性样本能被聚类为一组。综上,衰减全反射红外光谱结合K近邻算法和层次聚类可作为记号笔墨水种类鉴别的一种快速准确的分析方法。  相似文献   

4.
木器漆碎片的检验鉴定是微量物证检验中一项重要工作,实验借助红外光谱分析技术和判别分析,对木器漆的品牌归属实现了高效、准确的鉴别。实验收集了北京梅菲特、天津裕北等18个品牌的78种木器漆样本的红外指纹光谱图,选择自动基线校正预处理谱图,分别对每一种品牌的全部样本数据进行降维处理,对原始数据与降维后数据进行判别分析建立分类模型。经降维处理后的样本数据判别准确率达100%,而仅使用Fisher判别的结果为81.8%,表明采用降维法对数据预先处理可以一定程度提高木器漆分类的准确性。结果表明,红外指纹光谱结合判别分析模型对不同品牌水性木器漆的样本进行识别是可行的,为水性木器漆种类的快速鉴别提供理论支持。  相似文献   

5.
该文提出了高光谱成像技术结合机器学习快速无损鉴别黑色签字笔墨水种类的新方法。采集36支不同品牌型号的黑色签字笔笔迹的高光谱图像,对每支签字笔笔迹的高光谱图像选取18个感兴趣区域,共提取648个平均光谱作为样本集。对450~950 nm的原始光谱进行Savitzky-Golay平滑、Z-Score标准化和两种组合方法光谱预处理,使用线性判别分析(LDA)和随机子空间-线性判别分析(RSM-LDA)分别构建黑色签字笔墨水种类鉴别模型。实验结果表明:不同预处理方法对RSM-LDA模型的鉴别准确率影响较小,而对于LDA模型,组合预处理具有更优的鉴别准确率;相比LDA模型,RSM-LDA模型分类效果更佳,训练集的平均分类准确率达100%,交叉验证平均分类准确率达99.09%,测试集的平均分类准确率达90.70%,每类样本的准确率、精准率、召回率均高于LDA模型分类结果,模型的接受者操作特征曲线下方面积(AUC值)达0.998 3,模型性能良好。因此,采用高光谱成像技术结合RSM-LDA可实现不同品牌型号黑色签字笔墨水的快速无损鉴别。  相似文献   

6.
汽车灯罩碎片是交通肇事案件现场经常出现的物证。为了实现对汽车灯罩物证的准确检验,该文提出一种将原始光谱与导数光谱相结合的光谱融合技术。收集不同类别和多种品牌的汽车灯罩共计44个,采用傅里叶变换红外光谱技术对样本进行分析,提取其原始光谱数据和一阶导数光谱数据,并结合化学计量学构建分类模型。在对汽车灯罩类别进行分类的Fisher判别分析模型中,单独的原始光谱数据和一阶导数光谱数据的分类准确率分别为86.40%和84.10%,融合后的光谱数据分类准确率达到93.20%,分类准确率明显提高。通过主成分分析优化模型后,融合光谱的分类准确率达到97.70%,且在进一步对汽车灯罩品牌进行分类时,分类准确率达到100.00%,实验结果理想。而在K近邻算法模型中,由于受到样本不均匀的影响,分类准确率较低。结果表明,基于原始光谱与导数光谱的光谱融合技术能够实现对汽车灯罩样本的准确分类,可以为光谱融合技术在分析检测领域的应用提供借鉴和参考。  相似文献   

7.
在法庭科学实践中,往往需要通过对文件中字迹墨水的成分分析来精确地判定检材和样本文件的同一性。利用高光谱成像和分光光度技术结合化学计量法,提出了一种对喷墨打印墨水分类的方法。采集14台不同品牌、型号的四色喷墨打印墨水高光谱数据和色度值。计算出平均色度值后进行PCA降维处理和K-Means聚类分析,将样品初步分类。之后应用LightGBM模型、XGBoost模型和SVM模型共三种分类模型,以1:4的比例确定测试集和训练集,对聚类分析结果中每一类别的样品进行逐一鉴别。结果表明,LightGBM和XGBoost对四色样品的分类精度都能达到95%以上,SVM的分类精度为100%。提出的方法能够做到无损、准确、快速地将不同品牌乃至型号的喷墨打印墨水进行区分。  相似文献   

8.
建立一种基于红外光谱的快速无损地检验洗发用品的分析方法。利用傅里叶红外光谱对60个常见的洗发用品样品进行检验,分别采用Savitzky-Golay(S-G)平滑、快速傅里叶变换(FFT)、降噪等方法对光谱数据进行预处理,并结合主成分分析法对光谱数据进行降维处理。同时建立多层感知器神经网络和贝叶斯判别分析两种分类模型,对光谱数据进行分析验证。多层感知器神经网络对原始数据、经过S-G平滑、FFT、降噪后的分类准确率分别为86.67%、88.33%、80%、90%,贝叶斯判别的分类准确率为83.33%、85%、83.33%、95%。结果显示,降噪处理效果较佳,贝叶斯判别具有更高的准确率。该方法重现性好、样品用量少、无损样品,可为洗发用品类物证鉴定提供科学依据。  相似文献   

9.
利用拉曼光谱技术建立了4种常见食源性致病菌的分类鉴别方法。在600~1800 cm-1光谱范围内,对蜡样芽胞杆菌、副溶血性弧菌、小肠结肠炎耶尔森菌与金黄色葡萄球菌共186个单细菌进行光谱信息的采集。使用Savitzky-Golay卷积平滑算法与一阶导数对原始光谱数据进行预处理,采用主成分分析方法(PCA)并结合多层感知器(MLP)神经网络构建对4种致病菌的分类识别模型,探究了不同光谱预处理方法下的PCA-MLP模型预测效果,经平滑算法与一阶导数处理过的光谱数据训练集准确率为98.5%,测试集准确率为99.2%。本文建立的光谱技术结合PCA-MLP模型可实现对食品中常见致病菌的快速鉴别。  相似文献   

10.
气溶胶是大气中的重要组分,对气候、生态环境等均有重要的影响。激光诱导击透光谱(LIBS) 在用于气溶胶检测时,由于气溶胶的离散分布,导致采集到大量无效光谱。本文提出一种结合字典学习对有效光谱数据进行筛选的方法——K-SVD-SVM。通过制备7种不同浓度的NaCl气溶胶样品,选取10% NaCl溶液的5000条光谱数据进行分类,其中70%作为训练集,30%作为测试集。当字典基向量数设置为3时,模型分类性能最优,准确率(accuracy),精确率(precision),召回率(recall),精确率和召回率的调和平均(F1)分别达到96%,95%,95%,0.95。此外,采用K-SVD-SVM方法对7种不同浓度的气溶胶样品进行筛选后,输入GA-ELM模型开展定量分析,同时将未筛选的原始光谱数据输入定量模型进行对比。未筛选的原始数据测试集RMSE和R2分别是0.0303和0.8726,筛选光谱后,分别提升至0.0187和0.9809。结果表明,K-SVD-SVM方法有着较好的分类性能,且采用此方法筛选出的有效数据可以为气溶胶中元素定量分析提供数据支撑。  相似文献   

11.
差分拉曼光谱结合SVM对便签纸的鉴别分析   总被引:1,自引:0,他引:1  
刘津彤  张岚泽  姜红  陈相全  段斌  刘峰 《化学通报》2022,85(2):259-263,246
基于差分拉曼光谱技术与支持向量机(SVM)模型,提出了一种对便签纸类检材的快速可视化鉴别方法。实验获取了40组不同品牌便签纸样本的差分拉曼光谱数据,利用BP神经网络和差分技术完成谱图的除噪与基线校正后,借助F检验与主成分分析提取谱段信息,构建出SVM分类模型。实验结果表明,当设置Linear为SVM模型的核函数时,可以实现对样本测试集的完全准确划分,K折交叉验证的结果理想。相比于传统聚类分析手段,本方法可以在原始高维光谱数据中筛选出有效特征矩阵,且SVM模型兼具高效性和准确性,为公安实践中纸张类物证的区分鉴别提供一种新思路。  相似文献   

12.
为了对卷烟牌号进行准确分类鉴别,提出了一种基于近红外光谱(NIRS)分析技术结合有监督的模式识别快速鉴别卷烟牌号的新方法。利用标准正态变量变换(SNV)、多元散射校正(MSC)、一阶导数(FD)、二阶导数(SD)和Savitzky-Golay平滑(SG)及其相结合的光谱预处理方法对烟丝光谱进行预处理,通过近红外光谱结合主成分分析(PCA)、偏最小二乘判别分析(PLS-DA)和正交偏最小二乘判别分析(OPLS-DA) 3种模式识别方法对不同牌号烟丝进行分类识别研究,并采用分类识别正确率作为评价指标。实验结果表明:(1)烟丝近红外光谱主成分得分图交叉重叠,区分不明显,PCA无法识别出5种牌号的成品烟丝;(2)烟丝光谱经MSC+FD预处理后的PLS-DA模型可得到较好的识别效果,校正集和测试集的分类识别正确率分别为100%和98.3%;(3)烟丝光谱经MSC+SD预处理后的OPLS-DA模型的模式识别效果最好,模型对自变量拟合指数(R2X),因变量的拟合指数(R2Y)和模型预测指数(Q2)分别为0.485、0.907 和0.748,近红外光谱校正集和测试集的分类识别正确率均为100%。说明近红外光谱技术结合有监督模式识别方法OPLS-DA建立的烟丝牌号分类模型具有高效快速、准确无损的优点,为卷烟烟丝分类提供了一种新的快速鉴别方法。  相似文献   

13.
Based on a so-called ensemble strategy, an algorithm is proposed for near-infrared (NIR) spectral calibration of complex beverage samples. This algorithm is a combination of a novel training set/test set sample-selection procedure based on a Kohonen self-organizing map (SOM) with a simple procedure to calculate an average partial least-squares (PLS) calibration model, which is therefore named SOMEPLS. In order to verify the proposed SOMEPLS, two NIR beverage datasets involving the determination of sugar content are considered, and three kinds of reference algorithm, i.e., conventional PLS (CPLS), the Kennard-Stone (KS) algorithm in combination with PLS (KSPLS), and sample set partitioning based on the joint x-y distance (SPXY) algorithm in combination with PLS (SPXYPLS), are used. Of these, both KS and SPXY are well-known representative sample-selection algorithms. By comparison, it was found that when there is a training set of appropriate size, SOMEPLS can achieve better prediction accuracy than the three reference algorithms, but without increasing the complexity of the corresponding calibration model for the future application, indicating that SOMEPLS can serve as a promising tool for NIR spectral calibration.  相似文献   

14.
Crude oil fingerprints were obtained from four crude oils by laser desorption/ionization mass spectrometry (LDI-MS) using a silver nitrate cationization reagent. Replicate analyses produced spectral data with a large number of features for each sample (>11,000 m/z values) which were statistically analyzed to extract useful information for their differentiation. Individual characteristic features from the data set were identified by a false discovery rate based feature selection procedure based on the analysis of variance models. The selected features were, in turn, evaluated using classification models. A substantially reduced set of 23 features was obtained through this procedure. One oil sample containing a high ratio of saturated/aromatic hydrocarbon content was easily distinguished from the others using this reduced set. The other three samples were more difficult to distinguish by LDI-MS using a silver cationization reagent; however, a minimal number of significant features were still identified for this purpose. Focus is placed on presenting this multivariate statistical method as a rapid and simple analytical procedure for classifying and distinguishing complex mixtures.  相似文献   

15.
基于浓度参量同步荧光光谱技术,对不同溢油类型不同油源原油样品集、引入外扰相似油源样品集进行光谱数据采集,获取其浓度同步荧光光谱矩阵Concentration-Synchronous-Matrix-Fluorescence(CSMF),利用主成分分析方法对两套不同层次的原油相关样品集进行了多类分类识别。结果表明:主成分载荷图可以很好地反映各个原油相关样品在油源上的相似程度,结合支持向量机可以实现不同溢油类型及不同油源原油的准确分类,对于引入风化和海水外扰相似油源溢油样品集,两类分类区分的结果远远高于多类分类识别的结果。通过详细的主成分分析讨论,为溢油油种鉴别提供了一种利用多类分类识别,逐步缩减嫌疑样本数量,最后通过两两分类实现溢油样品准确识别的新思路。  相似文献   

16.
This article describes the classification of biodiesel samples using NIR spectroscopy and chemometric techniques. A total of 108 spectra of biodiesel samples were taken (being three samples each of four types of oil, cottonseed, sunflower, soybean and canola), from nine manufacturers. The measurements for each of the three samples were in the spectral region between 12,500 and 4000 cm−1. The data were preprocessed by selecting a spectral range of 5000-4500 cm−1, and then a Savitzky-Golay second-order polynomial was used with 21 data points to obtain second derivative spectra. Characterization of the biodiesel was done using chemometric models based on hierarchical cluster analysis (HCA), principal component analysis (PCA) and soft independent modeling of class analogy (SIMCA) elaborated for each group of biodiesel samples (cotton, sunflower, soybean and canola). For the HCA and PCA, the formation of clusters for each group of biodiesel was observed, and SIMCA models were built using 18 spectral measurements for each type of biodiesel (training set), and nine spectral measurements to construct a classification set (except for the canola oil which used eight spectra). The SIMCA classifications obtained 100% accurate identifications. Using this strategy, it was feasible to classify biodiesel quickly and nondestructively without the need for various analytical determinations.  相似文献   

17.
A detailed comparison of six multivariate algorithms is presented to analyze and generate Raman microscopic images that consist of a large number of individual spectra. This includes the segmentation algorithms for hierarchical cluster analysis, fuzzy C-means cluster analysis, and k-means cluster analysis and the spectral unmixing techniques for principal component analysis and vertex component analysis (VCA). All algorithms are reviewed and compared. Furthermore, comparisons are made to the new approach N-FINDR. In contrast to the related VCA approach, the used implementation of N-FINDR searches for the original input spectrum from the non-dimension reduced input matrix and sets it as the endmember signature. The algorithms were applied to hyperspectral data from a Raman image of a single cell. This data set was acquired by collecting individual spectra in a raster pattern using a 0.5-??m step size via a commercial Raman microspectrometer. The results were also compared with a fluorescence staining of the cell including its mitochondrial distribution. The ability of each algorithm to extract chemical and spatial information of subcellular components in the cell is discussed together with advantages and disadvantages.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号