排序方式: 共有24条查询结果,搜索用时 18 毫秒
1.
拉曼光谱检测方法依赖于化学计量学算法,深度学习是当下最炙手可热的方向,可应用于拉曼光谱进行建模。但是深度学习需要大样本进行训练,而拉曼光谱采集受制于器材和人力成本,获取大批量的样本需要更大成本,且易受荧光等因素干扰,这些问题都制约了将深度学习应用于拉曼光谱。针对以上问题,通过引入深度卷积生成对抗网络(DCGAN)提取拉曼光谱内部特征,对抗生成新的拉曼光谱,从而达到扩充数据集目的。同时和另一个扩充数据集的方法--偏移法进行对比,证明DCGAN的可靠性。设计生成光谱选取标准,选取高相似性的光谱填充数据集,为深度学习在拉曼光谱中的应用奠定基础。为了验证生成的光谱比原始光谱有更好的适用性,设计四组实验:(1)使用原始拉曼光谱输入到SVM进行分类,得到51.92%的分类准确率;(2)使用原始拉曼光谱输入到CNN进行分类,得到75.00%的分类准确率;(3)采用偏移法生成光谱,输入到CNN里进行分类,得到91.85%的分类准确率;(4)使用DCGAN生成光谱,输入到CNN里进行分类,得到98.52%分类准确率。实验结果表明,DCGAN能在只有少量拉曼光谱的情况下,通过对抗学习得到较好的生成光谱,且生成的光谱相比原光谱更加清晰,减少了可能的干扰因素,具有光谱预处理效果。通过DCGAN对抗生成大量高质量的数据填充到原有拉曼光谱数据集,扩充数据集的样本量,使得深度学习模型能够得到更好的训练,从而提高模型的准确率。该研究为深度学习方法应用于拉曼光谱分析技术提出了一个可行的方案。 相似文献
2.
近红外光谱(NIR)分析具有分析高效、样品无损、环境无污染以及可现场检测等优点,特别适合药品的快速建模分析。但NIR存在吸收强度弱以及谱带重叠等缺点,需要建立稳健可靠的化学计量学模型对其进行分析。深度卷积神经网络是深度学习方法中一个重要分支,它通过逐层抽取数据特征并进行组合、转换,形成更高层的语义特征,具有极强的建模能力,广泛应用于计算机视觉、语音识别等领域,而在药品NIR分析方面尚未见报道。基于深度卷积网络模型,对药品NIR多分类建模进行研究。针对药品NIR数据的特点,设计若干个面向多品种、多厂商药品NIR分类的一维深度卷积网络模型。模型中卷积层和池化层交叠排列用于逐层抽取NIR数据特征,输出层连接softmax分类器,对药品NIR数据进行分类概率预测。在输出层之前采用全局最大池化层,将特征图进行整体池化,形成一个特征点,用于解决全连接层存在的限制输入维度大小,参数过多的问题。同时,在网络模型中引入批处理操作和dropout机制,以防止梯度消失和减小网络过拟合的风险。在网络模型的设计过程中,通过设计不同的卷积网络层数以及不同的卷积核尺寸大小,分析其对建模效果的影响,同时分析五种经典数据预处理方法对NIR分析的影响。以我国7个厂商生产的头孢克肟片和11个厂商生产的苯妥英钠片样本NIR为实验对象, 建立药品的多品种、多厂商分类模型,该模型在二分类、多分类实验中取得了良好的分类效果。在十八分类实验中,当训练集与测试集比例为7∶3时,分类准确率为99.37±0.45,比SVM, BP, AE和ELM算法取得更优的分类性能。同时,深度卷积神经网络模型推理速度较快,优于SVM和ELM算法,但训练速度慢于二者。大量实验结果表明,深度卷积神经网络可对多品种、多厂商药品NIR数据准确、可靠地判别分类,且模型具有良好的鲁棒性和可扩展性。该方法也可推广到烟草、石化等其他领域的NIR数据分类应用中。 相似文献
3.
提出一种稀疏降噪自编码结合高斯过程的近红外光谱药品鉴别方法。首先对近红外光谱数据进行小波变换以消除基线漂移,然后用稀疏降噪自编码(SDAE)网络提取光谱特征并降维表示,最后采用高斯过程(GP)进行二分类,其中GP选用光谱混合(SM)核函数作为协方差函数,记此分类网络为wSDAGSM。自编码网络具有很强的模型表示能力,高斯过程分类器在处理小样本数据时具有优势。wSDAGSM网络通过稀疏降噪自编码学习得到维数更低但更有价值的特征来表示输入数据,同时将具有很好表达力的光谱混合核作为高斯过程的协方差函数,有利于更准确的光谱数据分类。以琥乙红霉素及其他药品的近红外光谱为实验数据,将该方法与经过墨西哥帽小波变换的BP神经网络(wBP)、支持向量机(wSVM),SDAE结合Logistic二分类(wSDAL)、SDAE结合采用平方指数(SE)协方差核的GP二分类(wSDAGSE),以及未采用小波变换的SDAGSM网络等方法进行对比。实验结果表明,对光谱数据进行墨西哥帽小波变换预处理能有效提升SDAGSM网络的分类准确率和稳定性。wSDAGSM方法无论从分类准确率还是分类结果稳定性方面,都优于其他分类器。 相似文献
4.
偏最小二乘(PLS)算法是常用的光谱建模算法,然而对于海量光谱处理情形,在单台计算机上建模及优化时间开销很大。基于MapReduce编程模式,提出了并行MapReduce PLS回归算法,包括并行数据标准化和并行主成分提取两个过程。在多台普通计算机上搭建Hadoop云计算集群平台,以近红外光谱处理为例,开展了算法验证实验。实验结果表明,基于MapReduce编程模式的并行PLS算法对海量近红外光谱数据集进行回归建模时,能有效提高建模速度,随计算机台数的增多可得到接近线性的加速比,并具有良好的扩展性。 相似文献
5.
利用挥发物红外光谱鉴别牛肉变质状态 总被引:2,自引:0,他引:2
牛肉在运输过程中极易受到微生物的感染而变质,对牛肉变质的监测十分重要。我们利用长光程FTIR光谱检测牛肉变质时产生的挥发性物质。证明了牛肉在变质过程中产生的主要挥发性物质是氨气和二氧化碳。并定量分析牛肉变质产生的氨气和二氧化碳的变化规律,以判断牛肉的状态。采用主成分分析法(PCA)实现对挥发性物质的红外光谱分类,进而可以准确的区分新鲜和变质的牛肉。我们采用化学计量学方法软独立建模聚类分析法(SIMCA)和偏最小二乘判别分析(PLS-DA)对特征波段内的光谱进行分类,两种方法具有很好的判断率。结果表明长光程FTIR结合化学计量学方法能够区分新鲜和变质的牛肉。 相似文献
6.
NIR光谱的LLE-PLS非线性建模方法及应用 总被引:4,自引:1,他引:4
传统的偏最小二乘(PLS)建模方法不能有效反映近红外(NIR)光谱与分析样本的物理化学性质之间存在的非线性关系.局部线性嵌入(LLE)是一种新的非线性降维方法,属于流形学习方法,它能有效地发现高维数据中的本真低维结构.结合LLE和PLS,提出一种近红外光谱非线性建模的新方法,并用于建立丹参多酚酸盐柱层析过程中丹酚酸B含量的回归校正模型.该方法首先用LLE对NIR光谱数据降维,再用PLS建立校正模型.结果表明,与多元散射校正、一阶导等预处理方法结合PLS建模比较,参数优化后的LLE-PLS方法能更准确地预测丹酚酸B的含量,其交叉验证均方根误差为0.128 mg·mL-1、决定系数为0.998 8.基于NIR光谱及LLE-PLS建模,可实现丹参多酚酸盐柱层析过程的在线检测. 相似文献
7.
由于近红外光谱在药品鉴别应用中具有分析速度快、样品无损、可现场检测等突出优点,目前已在众多领域中广泛应用。但近红外光谱存在信噪比低,吸收强度弱且谱峰重叠等缺点,无法从光谱中直接得到定性/定量的物质信息,因而近红外光谱分析技术常作为一种间接分析技术,并且光谱的化学计量学建模方法成为近红外光谱分析的核心内容。深度学习是机器学习的一个新的分支,并已经成功运用于多个领域。深度学习的网络结构和非线性的激活能力,使其模型特别适合高维、非线性的大规模数据建模。为进一步丰富近红外光谱建模方法,并提高近红外光谱分析技术的回归精度或分类准确率,将深度学习方法应用于近红外光谱分析,发展新的建模方法十分必要。面向近红外光谱定性分析技术,提出一种基于堆栈压缩自编码网络(SCAE)光谱定性分析方法,并应用于多类别药品的光谱分析,以区分或鉴别不同厂家生产的同种药品。压缩自编码网络(CAE)以自编码网络(AE)为基础,进一步加入雅克比矩阵作为约束项。自编码网络最初是用实现数据降维,以学习数据内部特征,而雅克比矩阵包含数据在各个方向上的信息,将其作为AE的约束项则可使提取到的特征对输入数据在一定程度下的扰动具有不变性,从而提高AE提取特征的能力。SCAE是一种由多层CAE构成的神经网络。前一层CAE的隐藏层作为后一层CAE的输入层,网络的全部参数是通过采用逐层贪婪的训练方式来获取的,训练结束后将所有网络视为一个整体,通过反向传播算法进行微调,最后使用Logistic/Softmax分类器进行定性分析。实验数据均为中国食品药品检定研究院采集,以头孢克肟胶囊作为二分类实验数据,硝酸异山梨酯片作为多分类实验数据。通过Bruker Matrix光谱仪测定每个样本在不同波长下的吸光度值得到其光谱曲线,再通过OPUS软件消除漂移等因素对光谱样本之间产生的偏差。接下来通过实验确定约束项雅克比矩阵的系数λ为0.003之后建立模型。建模过程分为五个阶段,分别为: 预处理阶段,预训练阶段,微调阶段,测试阶段和对比阶段。为了验证SCAE在分类准确性、算法稳定性和建模时间等方面的性能,与BP神经网络、SVM算法、稀疏自编码(SAE)和降噪自编码(DAE)开展对比实验研究。分类准确性方面,在不同的训练集与测试集的比例下,SCAE均有最佳的分类准确性与算法稳定性。建模时间方面,由于SVM算法不需要预训练和特征提取,所以运行时间方面比其他算法有大的优势,但是SCAE建模速度优于除SVM之外的其他对比算法。综合而言,使用SCAE进行药品鉴别有效可行。 相似文献
8.
保证多指标成分含量稳定的中药材最优化调配方法 总被引:2,自引:0,他引:2
提出了一种利用HPLC指纹图谱测定中药材多指标成分含量, 再运用线性、非线性最优化理论调配中药材, 从而保证中药材调配物多指标成分含量稳定的新方法. 方法的核心是所提出的7种最优化调配目标函数及相应的约束条件. 实验验证, 以10批板蓝根药材为基础, 在7种最优化目标下, 控制5个主要HPLC色谱峰面积稳定均一, 结果显示, 峰面积最大相对偏差的绝对值为6.3%. 相似文献
9.
近红外(NIR)光谱一般具有较多的波长变量数,对其直接或间接地进行变量选择是提高模型稳定性能及预测性能的关键。最小角回归(LAR)是一种相对较新和有效的机器学习算法,常用于进行回归分析和变量选择。面向光谱建模应用,提出一种LAR结合遗传偏最小二乘法(GA-PLS)的变量选择方法,可有效筛选出少数特征波长点。首先在全光谱区利用LAR消除变量间的共线性得到初筛波长点,然后用GA-PLS对LAR筛选出的波长点进一步优选从而得到最终建模用的特征波长点。为验证本文方法的有效性,以药片和汽油的近红外光谱回归分析作为应用案例,对原光谱进行预处理后,采用该方法进行变量筛选,然后分别建模其中的活性成分含量和C10含量。结果显示,在这两个应用中,最终优化得到的特征波长点数均只需七个,而两者的预测决定系数R2p分别达到0.933 9和0.951 9,与全光谱、无信息变量消除法(UVE)和连续投影算法(SPA)等方法相比,特征波长点更少,同时R2p和预测均方根误差RMSEP值更优。因此,LAR结合GA-PLS,能有效地从近红外光谱中选择出信息变量从而减少建模波数,提高预测精度,拥有较好的模型解释性。该方法可为特定领域的专用光谱仪设计提供有效的波长筛选工具。 相似文献
10.
提出一种基于堆栈稀疏自编码融合核极限学习机(Stacked sparse auto-encoders combine kernel extreme learning machine,SSAE-KELM)的近红外药品鉴别方法,通过引入核极限学习机代替SSAE的Softmax分类和BP微调阶段,减少了模型的训练步骤、训练参数以及训练时间,提高了深度学习网络的实际应用能力,核函数的引入提高了模型的分类能力。其中,SSAE用于初始化整个网络模型,并且从输入数据中学习到有用的特征,KELM用于实现分类任务。研究了SSAE-KELM模型对不同厂商生产的同一包装形式(铝塑或非铝塑)药品鉴别的预测能力、稳定性及训练时间,以实现药品的二分类和多分类的无损鉴别。同时,与ELM、SSAE、BP、SVM及随机隐退深度信念网络(Dropout-DBN)进行对比。结果表明,无论是二分类还是多分类,SSAE-KELM不仅具有更优的分类能力和稳定性、还减少了训练时间。因此,SSAE-KELM是一种有效的光谱分类建模工具。 相似文献