首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
近红外光谱药品鉴别作为识别假冒伪劣药品的一种有效技术手段,已被广泛应用到各大医疗行业和药品监督管理机构,并结合模式识别建模方法在基层药品打假中得到较好的推广。由于传统建模方法很难满足药品鉴别中大规模、多分类、快速建模等问题,因此采用一种基于波形叠加极限学习机(SWELM(CS))分类方法对光谱数据进行鉴别。通过选用极限学习机(ELM)作为光谱药品分类器,使得分类模型具有快速学习能力以及对训练样本不敏感的特点;由于极限学习机的连接权值和隐层神经元阈值是随机生成导致网络稳定性差,因此结合布谷鸟搜索算法优化分类模型参数;采用反双曲线正弦函数与Morlet小波函数叠加的激励函数代替ELM原有的单一激励函数改善了分类模型的收敛速度和稳健性。通过上述改进方法使得SWELM(CS)具有对训练样本不敏感性,布谷鸟参数优化的分类稳定性、波形叠加函数的强收敛性与信号特征提取能力。该方法为核函数提供的信号特征提取及拟合的思想,可推广到其他学习算法中以获取更高的分类准确度及稳定性。该实验选定西安杨森制药厂生产的249个近红外光谱药品样本作为研究的主要对象,重点研究光谱药品的二分类和多分类实验,实验证明SWELM(CS)分类器相比BP神经网络、标准ELM以及粒子群优化ELM等传统分类器算法具有更高的分类准确度、分类稳定性及更小的训练样本敏感性。  相似文献   

2.
近红外光谱分析技术对检测样品无损伤且检测速度快、精度高,因此被广泛应用在了药品检测、石油化工等领域,尤其近年来机器学习和深度学习建模方法的深入应用使其具备了更准确的检测性能。然而,样品的近红外光谱数据具有比较高的维度且存在谱间重合、共线性和噪声等问题,对近红外光谱模型的性能产生消极影响,此时样品有效特征波长的筛选极为重要。为了提高近红外光谱定量和定性分析模型的准确性和可靠性,提出了一种近红外光谱变量选择方法,其结合了最小角回归(LAR)和竞争性自适应重加权采样(CARS)的优点,具有更优的性能。该方法利用LAR初步筛选样品全谱区的特征波长,接着利用CARS对筛选出来的特征波长进一步选择,从而有效去除无关特征波长。为验证该方法的有效性,从定量和定性分析两个方面评价该方法。在定量分析实验中,以FULL,LAR,CARS,SPA和UVE作为对比方法,以药品样品数据集为实例建立PLS回归分析模型,经LAR-CARS筛选出的变量建立的PLS模型在药品数据集表现出较高的预测决定系数和较低的预测标准偏差。在定性分析实验中,以SVM,ELM,SWELM和BP作为对比方法、不同比例训练集的药品数据集为实例建立分类模型,经LAR-CARS筛选出的变量建立的SVM分类模型精度最高达100%。从实验结果可见,LAR-CARS可有效的筛选出表征样品特征的波长,利用其筛选出的波长建立的定量、定性分析模型具有更好的鲁棒性,可用于样品光谱的特征波长筛选。  相似文献   

3.
为了对鸡种蛋胚胎进行雌雄识别,探究利用紫外-可见-近红外透射光谱进行鸡胚雌雄识别的可行性,搭建了鸡种蛋透射光谱检测系统,采用横向和竖向大头朝上2种放置方式获取210枚鸡种蛋孵化0~15 d的光谱,光谱范围为360~1 000 nm。构建极限学习机(ELM)鸡胚雌雄识别模型,通过比较不同放置方式和孵化天数下模型的识别准确率,发现竖向放置且孵化第7 d的识别效果最好;将竖向放置孵化第7 d的光谱初步分为紫外(360~380 nm)、可见光(380~780 nm)、近红外(780~1 000 nm)、紫外-可见光(360~780 nm)和全波段(360~1 000 nm)5个不同的波段范围来分析,预测集准确率分别为82.86%,77.14%,75.71%,84.29%和81.43%,筛选出360~780 nm的紫外-可见光波段为有效波段;在紫外-可见光(360~780 nm)波段,采用多元散射校正(MSC)去噪,并用竞争性自适应重加权采样算法(CARS)和连续投影算法(SPA)筛选特征波长降维,建立不经筛选特征波长、CARS筛选特征波长和SPA筛选特征波长的3种ELM模型。其中不经筛选特征波长的ELM模型识别效果最好,但输入变量最多,隐含层神经元为680且激活函数为sig时,预测集准确率为84.29%。SPA筛选特征波长的ELM模型识别效果次之,输入变量有9个,隐含层神经元为840且激活函数为hardlim时,预测集准确率为81.43%。CARS筛选特征波长的ELM模型识别效果最差,输入变量有27个,隐含层神经元为100且激活函数为sig时,预测集准确率为78.57%;用遗传算法(GA)优化ELM模型的权值变量和隐含层阈值,不经筛选特征波长建立的GA-ELM模型,预测集准确率为87.14%,SPA筛选特征波长建立的GA-ELM模型,预测集准确率为87.14%,CARS筛选特征波长建立的GA-ELM模型,预测集准确率为81.43%。紫外-可见光波段不经筛选特征波长的GA-ELM模型识别效果和经SPA筛选特征波长的GA-ELM模型相同,表明SPA筛选的特征波长变量能够有效反映360~780 nm波段的信息,SPA使用的变量数仅占紫外-可见光波段的2.14%,因此,雌雄识别最佳模型为紫外-可见光波段经SPA筛选特征波长的GA-ELM模型,预测集准确率为87.14%,其中,雌性识别率为88.57%,雄性识别率为85.71%,单个样本平均判别时间0.080 ms。结果表明紫外-可见透射光谱技术和ELM模型为孵化早期鸡胚蛋雌雄识别提供了一种可行方法。  相似文献   

4.
双孢蘑菇质地柔嫩、营养丰富,具有很好的降血压、降血脂、消炎护肝等多种保健价值,其新鲜度是反映内外部品质的重要指标之一。目前双孢蘑菇新鲜度鉴别大多依据其外观品质变化(褐变),缺乏精准的量化评价指标与方法,因此提出了以贮藏天数为新鲜度检测的量化指标,并利用近红外光谱技术对双孢蘑菇新鲜度进行检测分析。依据存储天数不同,将双孢蘑菇样本分为1~5组,每组40个样本,依次采集每组双孢蘑菇的近红外光谱数据。针对采集的原始光谱数据,首先选用卷积平滑滤波(SG)与多元散射校正(MSC)消除原始光谱噪声、基线平移以及光散射的影响,并选取399.81~999.81 nm的光谱波段作为数据处理范围;然后分别使用主成分分析(PCA)和连续投影算法(SPA)进行光谱降维和特征波长选择,继而建立极限学习机(ELM)分类模型;同时考虑到ELM模型中初始值对分类准确率影响较大,分别选用粒子群优化算法(PSO)、海鸥优化算法(SOA)对ELM中初始权值及阈值进行寻优,形成PSO-ELM,SOA-ELM优化组合分类模型;最后分别将全光谱、提取主成分以及所选的特征波长{556.87,445.51,481.15,885.10,802.25,720.90,861.34,909.79,924.44,873.17 nm}输入到分类模型中,建立不同输入、不同分类模型的双孢菇新鲜度检测模型。最终试验结果表明,当ELM为分类模型,以全光谱、主成分以及特征波长为输入时的预测精度分别为75%,95%,88%;以SPA优选特征波长作为输入的PSO-ELM、SOA-ELM分类模型训练集精度为96.25%,93.25%,预测集精度为92.5%,94%。可知,SPA波长选择算法可以有效降低光谱信息中存在的冗余信息,加快建模效率,同时海鸥优化算法能较好的优化ELM分类模型的初始参数,分类精度较ELM模型提高了6.8%,同时不产生过拟合现象。因此,利用光谱特征可以快速、准确无损的识别双孢蘑菇的新鲜度,研究结果为便携式双孢蘑菇新鲜度快速无损检测设备的开发提供了理论依据。  相似文献   

5.
葡萄籽油掺假种类繁多,手段隐蔽,成为食品安全检测的重要难点之一,为规范食用油市场,提供一种方便、可靠的葡萄籽油品质鉴别方法尤为重要。针对色谱和质谱等传统品质分析方法的耗时、试剂消耗大、专业性强等不足,以及实现无损分析的近红外光谱仪价格昂贵、操作环境要求高等缺点,研究设计一套低成本、高准确度的可见/近红外光谱仪检测系统来实现葡萄籽油品质掺假鉴别。首先,依托USB6500-Pro探测器搭建可见/近红外光谱仪硬件平台,并基于Qt设计一套简洁的人机交互界面,用以实现光谱数据的采集、处理以及葡萄籽油掺假鉴别结果的显示;其次,针对硬件和检测环境带来的光谱噪声,系统采用小波变换滤除噪声,减小光谱失真;最后,考虑到现有的基于机器学习的品质鉴别模型往往依赖已知的油类训练样本集来实现对不同掺假类别油类的预测,而利益驱使下层出不穷的掺假手段使得新的、未出现在原训练集中的掺假类别样本不断涌现,现有的品质鉴别方法将很难给出准确的判别结果。因此,研发的检测系统中设计一种能实现已知和新的掺假油品光谱的鉴别方法,该方法分为分类和校正两步:先用建模数据库中的训练集建立极限学习机(ELM)分类器模型,实现初步掺假类别的分类;然后再利用自动聚类算法对分类结果进一步校正。若与校正数据集产生一个聚类中心,则证明分类结果正确且属于建模数据库中的已知掺假类别;若产生两个聚类中心,则分类结果不正确,样本为新掺假类别,未出现在建模数据库中,最终得到准确的掺假类别结果。为检验系统性能,用搭建的可见/近红外光谱仪硬件平台采集了纯葡萄籽油和掺入不同比例的大豆油、玉米油、葵花籽油和调和油的葡萄籽油的5类光谱数据,每一类30组共计150组数据,将得到的可见/近红外光谱数据先进行小波阈值法去噪和多元散射校正(MSC)预处理后输入到设计的检测系统中。假定前4类作为建模数据库中的已知掺假类别以及第5类作为新掺假类别,先利用K-S算法将已知掺假类别的每类样本划分成训练集20组和测试集10组,用训练集共80组样本建立ELM分类模型,将40组测试集输入到ELM实现初步判别,判别结果再进一步聚类分析校正,只有一个聚类中心,说明了模型判别准确,且对已知类别能够100%识别;当30组新掺假类别样本输入到ELM模型时,均判别成了纯葡萄籽油,进一步聚类分析校正,产生了两个聚类中心点,说明ELM模型误判,定性判定第5类为新掺假类别。实验结果表明,研发的葡萄籽油掺伪检测系统操作简单、快速,不仅对已知掺假类别能够100%识别,而且对新掺假类别能够实现定性判别。  相似文献   

6.
高光谱图像技术在农产品检测及识别方面有广阔的应用前景。野生黑枸杞经济效益显著,经常被种植黑枸杞冒充。提出一种利用高光谱图像对野生黑枸杞无损快速识别的方法。主要内容和结果如下:(1)共采集256份(野生、种植各128份)黑枸杞在900~1 700 nm范围的高光谱反射光谱,每份平均光谱作为此样品的光谱;(2)采用标准正态变换(SNV)对采集的光谱预处理;基于Kennard-Stone法,按照校正集和预测集比例为2∶1对样品划分,用连续投影算法(SPA)对光谱进行降维处理,提取特征波长30个;分别将全光谱和SPA 提取的30个特征波长作为模型输入,建立支持向量机(SVM)、极限学习机(ELM)和随机森林(RF)识别模型。(3)结果表明,在识别野生黑枸杞模型中,基于全光谱和SPA建立的SVM,ELM和RF模型校正集识别率均高于98.8%,基于全光谱和SPA建立的SVM,ELM和RF模型预测集识别率均高于97.7%。基于全光谱(FS)建立的三种识别模型略优于基于SPA建立的三种识别模型。但从简化模型方面,SPA提取的特征波常数仅为全光谱的11.8%,大大降低了模型运算量。三种模型中,基于随机森林模型无损识别野生黑枸杞效果最好,均达到100%。研究表明,利用高光谱图像技术结合分类模型可快速识别野生黑枸杞。  相似文献   

7.
基于拉曼光谱检测技术结合化学判别方法,建立新陈大米拉曼光谱判别模型;建立适当的样品预处理方法,确保样品制备的均一性,使用拉曼光谱仪对新陈大米共计60组样品进行检测,在785 nm波长激光激发下,获取样品200~2 400 cm-1的拉曼光谱信息;对原始拉曼光谱进行基线校正、平滑、滤波等处理。利用主成分分析法(PCA)对拉曼光谱进行降维处理及粗分类鉴别;基于偏最小二乘分析法(PLS),建立新陈大米快速鉴别模型,该模型对建模训练集鉴别正确率为100%,模型验证集鉴别正确率为95%。结果表明:该模型判断新陈大米是可行的,为大米新陈度的快速判别提供了一种新的方法。  相似文献   

8.
高光谱成像的油菜和杂草分类方法   总被引:3,自引:0,他引:3  
利用高光谱成像技术结合化学计量学方法对油菜中的杂草进行分类识别。采用近红外高光谱技术,通过正态变量变换(SNV)、去趋势化(De-trending)、多元散射校正(MSC)、移动平均平滑法(MA)、多项式卷积平滑法(SG)、基线校正(baseline)及归一化(normalize)算法对光谱数据进行预处理,采用主成分载荷(PCA loadings)、载荷系数法(x-LW)、回归系数法(RC)、连续投影算法(SPA)分别进行特征波长提取,采用偏最小二乘判别分析(PLS-DA)、极限学习机(ELM)和支持向量机(SVM)建立分类模型。结果表明,基于De-trending 预处理,通过PCA loadings,x-loading weights及SPA特征波长提取方法,基于极限学习机ELM算法建立的模型取得了最优的分类效果,建模集和预测集的分类精度均达到100%,另引入平均分类精度的指标,发现不同试验时间下,模型分类精度变化不大,表明应用近红外高光谱成像技术对油菜和杂草进行分类是可行的。  相似文献   

9.
SiPLS-CARS与GA-ELM对哈密瓜冠层叶片含水率的反演估测   总被引:1,自引:0,他引:1  
传统的叶片含水率检测方法效率低、操作繁琐且是有损的检测,不利于大田哈密瓜叶片含水率的快速获取。为实现对大田哈密瓜生长期进行更精细的田间灌水管理,利用光谱技术分别获取了哈密瓜植株在成长期(M1)、开花期(M2)、结果期(M3)、成熟期(M4)四个时期内的冠层叶片样本,采用烘干法测得叶片样本的含水率。为提高预测模型的精度和稳定性,首先开展并讨论极限学习机(ELM)模型中的核函数与隐含层神经元个数的选择对ELM模型精度的影响。随后分别利用联合子区间偏最小二乘法(SiPLS)及其与竞争性自适应重加权采样法(CARS)、遗传算法(GA)、连续投影算法(SPA)的组合算法对全波段光谱数据中与叶片含水率相关性高的特征波长进行筛选提取。再分别使用GA与粒子群算法(PSO )对已经确定最佳核函数与隐含层神经元个数的ELM模型中的输入层与隐含层间的连接权值(W)和隐含层神经元阈值(B)进行优化选择,获取最优且稳定的W与B值,进一步提高模型的稳定性和预测精度。最后将四种特征波长提取算法优选出的特征波长分别进行ELM,GA-ELM,PSO-ELM建模分析,以校正集和预测集的相关系数RcRp为模型评价指标,经过对比分析优选出能准确预测哈密瓜冠层叶片含水率的反演估测模型。采用SiPLS及其与CARS,GA和SPA的组合算法提取特征波长,筛选出的变量数分别为273,20,32和6,占全光谱变量的15.6%,1.2%,1.9%和0.03%。进一步将筛选出的特征波长作为自变量,叶片的含水率作为因变量,建立了ELM的预测模型,最佳预测精度Rp值为0.845 0,预测精度不是很理想。故引入GA与PSO对ELM中随机产生的W与B值进行优化选择。最终,经过研究发现,利用GA优化后的ELM模型结合SiPLS-CARS筛选出的特征波长建立的哈密瓜冠层叶片含水率预测精度最优,故反演叶片含水率的最优建模方式为SiPLS-CARS-GA-ELM,Rc值为0.928 9,Rp值为0.903 2,所建模型精度较高,可为大田哈密瓜冠层叶片的含水率进行快速检测,为田间灌溉管理提供科学依据。  相似文献   

10.
研究盐碱地的性质、组成,对于生态环境具有重要意义。传统的含盐量测定方法大多基于化学分析,因其成本高、效率低的缺点使得应用于大面积土地的可行性很低。极限学习机(ELM)作为一种基于前馈神经网络构建的机器学习系统,在许多研究中作为一种光谱处理方法被成功运用。为了改进传统的盐碱地含盐量检测方法,采用光谱学结合改进的极限学习机(ELM)模型的方法对盐碱地进行研究。根据镇赉县采集得到的62个土壤表层样本得到对应的光谱反射率和含盐量数据,提出了基于随机值改进粒子群优化算法(RVIPSO-MELM)优化的多层极限学习机模型。首先使用主成分分析提取光谱数据特征,并使用ELM算法对光谱数据建立分类模型,引入改进的粒子群优化算法以提高精度和速度。该模型结合了具有随机值的多层ELM(RV-MELM)和改进PSO算法的多层ELM(IPSO-MELM)二者的优点,在运用启发式算法搜索最优值的同时还具有随机性,提高了模型优化速度,同时以提高模型性能为目的对隐含层之间参数进行优化和选择。并且该模型可以推广到多层,对隐含层之间的参数的两种选择方法,根据经验公式计算和使用改进的启发式算法搜索,进行了提高模型性能和优化时间的讨论,实践结果表明,选择第一层参数使用改进粒子群优化算法,确定随后的隐含层之间参数选择,使用经验公式进行计算得到一种更具现实意义的方法模型。模型在进行启发式搜索最优值之前,利用蒙特卡罗方法确定一个较好的初值,使得模型能保持较高准确率的条件下,优化速度进一步提高。相比于传统方法,这种光谱分析结合ELM的模型节省时间和经济成本,有一定推广意义。  相似文献   

11.
Vehicles generate dissimilar sound patterns under different working environments. These generated sound patterns signify the condition of the engines, which in turn is used for diagnosing various faults. In this paper, the sound signals produced by motorcycles are analyzed to locate various faults. The important attributes are extracted from the generated sound signals based on time, frequency and wavelet domains which clearly describe the statistical behavior of the signals. Further, various types of faults are classified using the Extreme Learning Machine (ELM) classifier from the extracted features. Moreover, the improved classification performance is obtained by the combination of feature sets in different domains. The simulation results clearly demonstrate that the proposed hybrid feature set together with the ELM classifier gives more promising results with higher classification accuracy when compared with the other conventional methods.  相似文献   

12.
近红外光谱检测和模式识别方法相结合,在药品的现场快速无损监督管理中有广阔的应用前景。传统的鉴别方法以最小化错误率为目标,往往忽略了样本数据的类别不平衡性,从而使得少数类样本被多数类样本淹没,降低少数类样本对分类器的影响,使分类结果更加倾向正确识别多数类样本,严重影响鉴别结果。针对药品光谱数据中真假药品类别不平衡问题进行研究,融合平衡级联和稀疏分类方法(SRC),提出一种级联的稀疏分类药品鉴别方法(BC-SRC)。文中在多数类样本中选取和少数类数目相同的样本作为训练样本,并在多数类样本中进行多次平行采样使得多数类样本被全部获得过(采样次数为多数类样本数与少数类样本数商的向上取整),最终得到测试样本的多组预测结果,根据得到的多组结果获得最终预测标签。将提出的方法在Matlab 2012a上进行仿真实验,通过三组样本集的实验证明该方法的有效性,实验结果表明该方法优于常用的偏最小二乘(PLS)、极限学习机(ELM)和BP神经网络分类法,特别是在解决类别不平衡问题时,当不平衡因子大于10时,BC-SRC算法分类相对于其他算法性能更好,且稳定性更高。  相似文献   

13.
基于ELM和可见/近红外光谱的鲜枣动态分类检测   总被引:1,自引:0,他引:1  
枣营养丰富且品种繁多,不同品种的内外部品质与市场价格均存在差异,为了实现鲜枣品种分类的快速无损检测,以产自同一地区的板枣、鸡心枣和相枣为研究对象,动态采集光谱数据。采用移动平滑(moving smoothing)与多元散射校正(multiplicative scatter correction, MSC)相结合的方法预处理光谱数据,对预处理后的光谱数据采用连续投影算法(successive projections algorithm, SPA)提取出11个特征波长分别为:980, 1 860, 1 341, 1 386, 2 096, 1 831, 1 910, 1 628, 441, 768, 601 nm,其重要程度依次递减。以所提取的特征波长作为输入变量,建立极限学习机(extreme learning machine,ELM)分类模型,进行预测判别,并与偏最小二乘判别分析(partial least squares discriminant analysis, PLS-DA)和最小二乘支持向量机(least squares support vector machines, LS-SVM)方法进行比较。结果表明:SPA-ELM方法所建校正模型的决定系数R2=0.972 38,校正均方根误差RMESC=0.018 724,SPA-ELM方法与SPA-PLS-DA和SPA-LS-SVM方法判别准确率均为100%,说明ELM是一种有效的分类判别方法。该研究为鲜枣品种分类检测提供了新的理论基础。  相似文献   

14.
为探讨利用可见/近红外光谱进行小麦黑胚病快速无损检测的可行性,以及基于主流机器学习算法,寻找面向生产的小麦黑胚病优化识别模型,利用自行研发的近红外光谱采集平台采集了579~1 099 nm波段23个品种共2760个小麦单籽粒的吸光度光谱数据,采用标准正态变量变换(SNV)进行预处理之后分别经过SPA(successive projections algorithm), PCA(principal component analysis)等两种数据降维方法,结合ELM(extreme learning machine), SVM(support vector machine), RF(random forest)和AdaBoost等四种分类方法,分别构建SPA-SVM, SPA-ELM, SPA-RF, SPA-AdaBoost, PCA-SVM, PCA-ELM, PCA-RF, PCA-AdaBoost八种小麦黑胚病识别模型; 结果表明小麦黑胚籽粒的识别准确率达到93.3%~98.6%,识别效果优于前人文献中利用近红外波段的识别效果;其中SPA-SVM模型具有最高的识别率,PCA-AdaBoost模型具有更好的普适性。将SPA-SVM模型和PCA-AdaBoost模型作为优选模型,从生产实际出发,分别对未感病+轻感病、中感病+重感病籽粒进行了二分类识别,对未感病,轻感病+中感病、重感病籽粒进行了三分类识别,以及对未感病、轻感病、中感病、重感病籽粒进行了四分类识别,并深入分析了识别效果和产生原因。总体来说,小麦黑胚粒的识别准确率随分类程度的细化而下降,二分类的识别模型可直接用于生产,尽管三分类和四分类的感病粒识别效果较差,但是对未感病粒的检出率则不受分类程度的影响,识别率在87.2%以上,符合生产需求。综合来看,SPA-SVM模型分类效果优于PCA-AdaBoost模型,可作为首选识别模型,该研究为小麦籽粒黑胚病的在线批量快速检测提供了技术依据。  相似文献   

15.
近红外光谱(NIR)分析具有分析高效、样品无损、环境无污染以及可现场检测等优点,特别适合药品的快速建模分析。但NIR存在吸收强度弱以及谱带重叠等缺点,需要建立稳健可靠的化学计量学模型对其进行分析。深度卷积神经网络是深度学习方法中一个重要分支,它通过逐层抽取数据特征并进行组合、转换,形成更高层的语义特征,具有极强的建模能力,广泛应用于计算机视觉、语音识别等领域,而在药品NIR分析方面尚未见报道。基于深度卷积网络模型,对药品NIR多分类建模进行研究。针对药品NIR数据的特点,设计若干个面向多品种、多厂商药品NIR分类的一维深度卷积网络模型。模型中卷积层和池化层交叠排列用于逐层抽取NIR数据特征,输出层连接softmax分类器,对药品NIR数据进行分类概率预测。在输出层之前采用全局最大池化层,将特征图进行整体池化,形成一个特征点,用于解决全连接层存在的限制输入维度大小,参数过多的问题。同时,在网络模型中引入批处理操作和dropout机制,以防止梯度消失和减小网络过拟合的风险。在网络模型的设计过程中,通过设计不同的卷积网络层数以及不同的卷积核尺寸大小,分析其对建模效果的影响,同时分析五种经典数据预处理方法对NIR分析的影响。以我国7个厂商生产的头孢克肟片和11个厂商生产的苯妥英钠片样本NIR为实验对象, 建立药品的多品种、多厂商分类模型,该模型在二分类、多分类实验中取得了良好的分类效果。在十八分类实验中,当训练集与测试集比例为7∶3时,分类准确率为99.37±0.45,比SVM, BP, AE和ELM算法取得更优的分类性能。同时,深度卷积神经网络模型推理速度较快,优于SVM和ELM算法,但训练速度慢于二者。大量实验结果表明,深度卷积神经网络可对多品种、多厂商药品NIR数据准确、可靠地判别分类,且模型具有良好的鲁棒性和可扩展性。该方法也可推广到烟草、石化等其他领域的NIR数据分类应用中。  相似文献   

16.
恒星光谱自动分类是研究恒星光谱的基础内容,快速、准确自动识别、分类恒星光谱可提高搜寻特殊天体速度,对天文学研究有重大意义。目前我国大型巡天项目LAMOST每年发布数百万条光谱数据,对海量恒星光谱进行快速、准确自动识别与分类研究已成为天文学大数据分析与处理领域的研究热点之一。针对恒星光谱自动分类问题,提出一种基于卷积神经网络(CNN)的K和F型恒星光谱分类方法,并与支持向量机(SVM)、误差反向传播算法(BP)对比,采用交叉验证方法验证分类器性能。与传统方法相比CNN具有权值共享,减少模型学习参数;可直接对训练数据自动进行特征提取等优点。实验采用Tensorflow深度学习框架,Python3.5编程环境。K和F恒星光谱数据集采用国家天文台提供的LAMOST DR3数据。截取每条光谱波长范围为3 500~7 500 部分,对光谱均匀采样生成数据集样本,采用min-max归一化方法对数据集样本进行归一化处理。CNN结构包括:输入层,卷积层C1,池化层S1,卷积层C2,池化层S2,卷积层C3,池化层S3,全连接层,输出层。输入层为一批K和F型恒星光谱相同的3 700个波长点处流量值。C1层设有10个大小为1×3步长为1的卷积核。S1层采用最大池化方法,采样窗口大小为1×2,无重叠采样,生成10张特征图,与C1层特征图数量相同,大小为C1层特征图的二分之一。C2层设有20个大小为1×2步长为1的卷积核,输出20张特征图。S2层对C2层20张特征图下采样输出20张特征图。C3层设有30个大小为1×3步长为1的卷积核,输出30张特征图。S3层对C3层30张特征图下采样输出30张特征图。全连接层神经元个数设置为50,每个神经元都与S3层的所有神经元连接。输出层神经元个数设置为2,输出分类结果。卷积层激活函数采用ReLU函数,输出层激活函数采用softmax函数。对比算法SVM类型为C-SVC,核函数采用径向基函数,BP算法设有3个隐藏层,每个隐藏层设有20,40和20个神经元。数据集分为训练数据和测试数据,将训练数据的40%,60%,80%和100%作为5个训练集,测试数据作为测试集。分别将5个训练集放入模型中训练,共迭代8 000次,每次训练好的模型用测试集进行验证。对比实验采用100%的训练数据作为训练集,测试数据作为测试集。采用精确率、召回率、F-score、准确率四个评价指标评价模型性能,对实验结果进行详细分析。分析结果表明CNN算法可对K和F型恒星光谱快速自动分类和筛选,训练集数据量越大,模型泛化能力越强,分类准确率越高。对比实验结果表明采用CNN算法对K和F型恒星光谱自动分类较传统机器学习SVM和BP算法自动分类准确率更高。  相似文献   

17.
极限学习机理论(extreme learning machine, ELM)作为一种新的化学计量学方法,在近红外光谱定量分析中的应用研究,已引起学术界的高度重视。然而,由于光谱数据维数较高,建立ELM模型时需要大量的隐节点,导致隐含层输出矩阵维数高且存在高度共线性,用现有的Moore-Penrose广义逆算法求取隐含层输出矩阵与待测性质间的回归模型往往会存在病态问题。基于ELM建立光谱波长变量与性质之间的回归模型,提出以ELM模型隐含层输出矩阵作为新的变量,采用作者最新提出的基于变量投影重要性的改进叠加PLS算法(stacked partial least squares regression algorithm based on variable importance in the projection,VIP-SPLS),建立新变量与待测性质间的回归模型。VIP-SPLS算法充分利用了每个隐节点的输出信息,能有效解决高维共线性问题,同时具有模型集成的优点,从而改进了ELM模型的性能。将提出的改进ELM算法(improved ELM,iELM)应用于标准近红外光谱数据集,结果表明iELM模型的精度相对于现有的PLS模型和ELM模型分别显著提升了29.06%和27.47%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号