首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   2篇
  免费   0篇
物理学   2篇
  2021年   1篇
  2019年   1篇
排序方式: 共有2条查询结果,搜索用时 15 毫秒
1
1.
特征提取是太赫兹光谱识别的关键处理步骤,通常利用降维方法作为特征提取手段。然而,当一些化合物的太赫兹光谱曲线整体差异度较小时,降维方法往往会缺失样本差异的重要特征信息,从而导致分类错误。如果不采用降维方法提取特征,传统机器学习分类算法对维数较高的原始太赫兹光谱数据又不能很好的分类。针对此问题,提出了一种基于双向长短期记忆网络(BLSTM-RNN)自动提取太赫兹光谱特征的识别方法。BLSTM-RNN作为一种特殊的循环神经网络,利用其LSTM单元可以有效解决原始太赫兹光谱数据维数较高使得模型难以训练问题。再结合模型的双向频谱信息利用架构模式,可以增强模型对复杂光谱数据自动提取有效特征信息的能力。采用三类、15种化合物太赫兹透射光谱作为测试对象,首先利用S-G滤波和三次样条插值对Anthraquinone,Benomyl和Carbazole等十五种化合物在0.9~6 THz内的太赫兹透射光谱数据进行归一化处理,然后通过构建一个具有双向长短期记忆的循环神经网络对太赫兹光谱的全频谱信息进行自动特征提取并利用Softmax分类器进行分类。通过试验优化网络结构和各项参数,最终获得了针对复杂太赫兹透射光谱数据的预测模型,并与传统机器学习算法SVM,KNN及神经网络算法MLP,CNN进行对比实验。结果表明,dataset-1和dataset-2分别作为差异度较大和无明显峰值特征的五种化合物太赫兹透射光谱数据集,其平均识别率分别为100%和98.51%,与其他方法相比识别率有所提高;最重要的是,dataset-3作为5种化合物谱线极为相似的太赫兹透射光谱数据集,其平均识别率为96.56%,与其他方法相比识别率提高显著;dataset-4作为dataset-1,dataset-2和dataset-3的透射光谱数据集集合,其平均识别率为98.87%。从而验证了BLSTM-RNN模型能自动提取有效的太赫兹光谱特征,同时又能保证复杂太赫兹光谱的预测精度。在选择模型训练优化算法方面,使用Adam优化算法要好于RMSProp,SGD和AdaGrad,其模型的目标函数损失值收敛速度最快。同时随着模型训练迭代次数增加,相似太赫兹透射光谱数据集的预测准确率也不断提升。可为复杂太赫兹光谱数据库的光谱识别检索提供一种新的识别方法。  相似文献   
2.
物质的太赫兹光谱具有唯一性。目前,结合先进的机器学习方法,研究基于规模光谱数据库的太赫兹光谱识别技术已成为太赫兹应用技术领域的重点。考虑到由于实验条件及实验设备的影响,很难收集到多物质均衡光谱数据,而这又是对太赫兹光谱数据进行分类的基础。针对这一问题,提出一种基于WGAN的不均衡太赫兹光谱识别方法。WGAN作为生成数据的一种新方法,将模型达到纳什均衡条件下的生成数据用来补充数据集,使其达到类别均衡。生成数据可以有效映射真实数据分布,通过将生成数据与真实数据混合训练可以提高识别不均衡光谱数据的准确率。采用三种特征谱较为相似的麦芽糖化合物的太赫兹透射光谱数据进行验证,首先利用S-G滤波和三次样条插值法对三种物质的光谱数据进行归一化处理,然后通过构建WGAN模型对三种物质的不均衡太赫兹光谱数据进行扩展,使其达到类别均衡。实验在同一测试集下进行验证,并利用三组对比实验证明WGAN在不均衡数据集处理中的效果。首先利用WGAN生成数据,随着迭代次数的增加,生成数据逐渐符合真实数据分布。实验结果证明,使用WGAN扩展后的数据集训练SVM模型,可以解决模型在测试集上小样本数据(Maltotriose,Malthexaose)偏向大样本数据(Maltoheptaose)的问题。在将WGAN与传统处理不均衡数据集方法FWSVM和COPY对比后发现,三种分类算法在dataset-1数据集上的训练集准确率都能达到90%以上。但是由于模型泛化能力的限制,传统方法在测试集上的效果并不是很理想,而使用WGAN后的测试集准确率却能达到91.54%。在不同不均衡度方面,采用不均衡度为16,81和256的数据集进行验证,其三个测试集上的准确率分别为92.08%,91.54%和90.27%,可满足实际工作中处理不同不均衡度的要求。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号