期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李鹏杨元维杜李慧高贤君周意蒋梦月张净波《应用声学》2020,39(3):464-471

当前基于深度神经网络模型中,虽然其隐含层可设置多层,对复杂问题适应能力强,但每层之间的节点连接是相互独立的,这种结构特性导致了在语音序列中无法利用上下文相关信息来提高识别效果,而传统的循环神经网络虽然做出了改进,但是只能对上文信息进行利用。针对以上问题,该文采用可以同时利用语音序列中上下文相关信息的双向循环神经网络模型与深度神经网络模型相结合,并应用于语音识别。构建具有5层隐含层的模型,其中第3层为双向循环神经网络结构,其他层采用深度神经网络结构。实验结果表明:加入了双向循环神经网络结构的模型与其他模型相比,较好地提高了识别正确率;噪声对双向循环神经网络汉语识别有重要影响,尤其是训练集和测试集附加噪声类型不同时,单一的含噪声语音的训练模型无法适应不同噪声类型的语音识别;调整神经网络模型中隐含层神经元数量后,识别正确率并不是一直随着隐含层中神经元数量的增加而增加,神经元数量数目增加到一定程度后正确率出现了降低的趋势。相似文献

2.

基于BP—LVQ神经网络的纸币新旧识别算法研究

王洪陈丽肖思宁《光学与光电技术》2010,8(4):64-67

针对纸币图像的特点,在一个系统同时提取两组表示纸币新旧的图像特征,采用级联的组合方式,设计了一种新的BP—LVQ神经网络组合分类器对纸币进行新旧识别。经过实验对比验证,该方法有效提高15％的系统识别率,可应用于清分系统的纸币新旧识别。相似文献

3.

基于LVQ神经网络的目标识别技术

黄勇刘燕《光学与光电技术》2006,4(1):58-61

通过对目标特征的分析比较,选取不变矩作为识别特征.为了达到很好的识别效果,对不变矩做了优化处理.采用LVQ神经网络技术建立了识别模型,提高了识别速度.运用有限的样本对目标识别技术进行了测试,结果表明采用此技术后的识别成功率较高,平均约为98%,识别速度快,每幅二值目标图像的识别时间约为16 ms. 相似文献

4.

基于注意力卷积神经网络的动态手势识别研究北大核心CSCD

施丽红《光学技术》2020,(6):750-756

针对复杂环境下动态手势识别准确率低的问题,提出了一种基于长短期记忆网络和卷积神经网络的动态手势识别算法。采用长短期记忆网络学习每个滤波器的权重,预测人体外形相关的滤波器组;采用卷积神经网络提取目标手势的轨迹图,创建彩色的轨迹图像;将轨迹图像送入注意力卷积神经网络训练,利用神经网络识别出复杂环境下的手势。实验结果表明,该算法能够准确地检测与跟踪手势的动态变化,并且实现了较好的手势识别准确性。相似文献

5.

复合深度神经网络在直升机声目标识别中的研究

下载免费PDF全文

郭洋周翊管鲁阳鲍明《应用声学》2019,38(1):8-15

针对直升机探测中目标运动过程连续识别的鲁棒性问题,提出了一种基于复合深度神经网络的直升机声学特征提取和识别框架。复合深度神经网络由卷积神经网络和长短时记忆神经网络以并行结构组合,进行直升机声学特征的优化,完成直升机类型识别。针对直升机声信号特性,对卷积神经网络进行了改进,使得该复合深度神经网络在信号短时谱基础上优化声信号特征表征并提取前后帧之间的相关信息,弥补通常声目标识别方法不能充分利用目标信号时间历程信息的缺陷。真实外场实验数据测试结果显示:相较于传统识别方法,该算法显著提升了直升机进入有效探测范围后连续识别的鲁棒性和目标识别正确率。相似文献

6.

基于荧光光谱法的钞票识别技术 总被引：1，自引：0，他引：1

黄鹰谢艳红易新建《应用光学》2008,29(4):629-632

以光栅光谱仪为基础,光电倍增管作为探测器,运用VC++语言设计了计算机采样界面,形成了荧光光谱分析的钞票识别光电系统。在紫光灯激发下,对钞票进行了荧光光谱特性分析,设计了基于荧光光谱分析的钞票识别光学系统、光电信号的检测和信号处理系统。测试结果表明：真假币的荧光光谱曲线有着明显的区别,它们的峰值分别为545nm和525nm。设计的荧光光电系统灵敏度高,可靠性好。相似文献

7.

基于神经网络模型的光学计算

羊国光《物理》1989,18(2):71-75

目前的电子计算机适于解决数字运算问题，但是在解决辨别、联想、推理等所谓随机问题方面的能力却远不如人的大脑．企图模仿人脑的解剖结构来设计计算机以解决随机问题，并利用光学的独特功能，这就是光学神经元计算机．据此，Ｈｏｐｆｉｅｌｄ提出了一种关联存贮模型（或称为内容存贮），即每个存贮状态不是按地址存贮，而是按内容存贮在整个神经网络系统上．光学由于具有内禀的并行性，特别适于实现这个模型．采用纯光学或光电混会方法，通过光学矩阵乘法，取阀值运算，反馈迭代过程，可以实现从有误差的输入信息中提取正确的关联存贮信息．利用全息技术，有可能实现二维数据的关联存贮．相似文献

8.

基于BP神经网络的血液荧光光谱识别分类研究 总被引：2，自引：0，他引：2

高斌赵鹏飞卢昱欣范雅周林华钱军刘林娜赵思言孔之丰《光谱学与光谱分析》2018,38(10):3136-3143

光谱技术在生物和医学检测方面具有积极的应用前景。由于血液成分的复杂性和类同性,有关不同动物血液光谱识别分类的技术研究尚未出现较为完善的结论。基于机器学习理论, 以BP神经网络为工具, 建立了对不同动物血液荧光光谱进行特征提取和识别分类的方法。实验采用Cary Eclipse光谱仪分别采集了鸽、鸡、鼠、羊四种动物不同浓度(1%和3%)的全血与红细胞荧光光谱数据(每个类型样本各50组数据);基于移动平滑算法对原始数据进行了平滑处理,以减少实验仪器噪声对特征提取和识别分类的影响;进一步根据血液光谱数据的特性, 该文出了“组合放大”的特征提取方法, 并建立了BP神经网络分类器进行训练和识别。相比于常用的光谱数据(单一)特征, 提出的“组合放大”特征和所设计的BP神经网络能对不同动物、不同类型(全血与红细胞)、不同浓度(1%和3%)的血液荧光光谱实现100%的准确分类, 同时神经网络测试误差均远小于设定的允许误差值。研究的动物血液光谱特征提取及识别技术具有较好的普适性和可靠性, 在农业、食品检查、以及生物医学检测等方面均可发挥重要作用。相似文献

9.

基于BP神经网络提高伪装目标识别概率的研究

Wang HQ 《光谱学与光谱分析》2010,30(12):3316-3319

采用静态迈克尔逊干涉仪对待测目标进行光谱识别,在空间干涉长度不变的条件下,应用BP神经网络算法对混合光谱分离过程进行优化,从而达到提高伪装目标识别概率的目的。由干涉仪及线阵CCD记录视场内所有位置上的光谱信息,构成混合光谱数据集合,以已知材料的标准吸收光谱作为隐含层的规则依据,将BP神经网络应用于混合光谱的分离。实验采用不同距离、不同背景组合的混合光谱作为初始数据,以1.5 m×1.5 m钢板做成四种待测目标,由静态迈克尔逊干涉仪得到混合光谱,BP神经网络算法与传统光谱吸收算法对无伪装目标的识别率都在90%以上,对具有伪装效果的待测目标识别概率分别为75.5%和31.7%,所以采用BP神经网络可有效地提高伪装目标的识别概率。相似文献

10.

基于级联神经网络的实用型三维复合不变性多目标识别 总被引：3，自引：1，他引：3

刘玥陈戍郭鹏毅张文伟申金媛张延炘《光学学报》2000,20(7):19-924

以三飞机模型作为待识别目标,模型真实场景,对用于多目标分类识别的级联神经网络重新进行了研究。实验发现畜产品上降的主要原因是实际采集的目标发生的复杂畸变与计算机模拟产生的效果并不一样。用采集得到的目标图像作为训练样本,对网络重新构造和训练,取得了好的实验结果。分析了其中涉及到目标定位、图像分割等图像预处理问题,提出了一种基于二值图像开矿学腐蚀运算的快速目标检测位法,可快速有效地对目标进行检测定。相似文献

11.

Invariant Pattern Recognition Using Neural Networks Combined with Optical Wavelet Preprocessor

Katsuhisa Hirokawa Kazuyoshi Itoh Yoshiki Ichioka 《Optical Review》2000,7(4):284-293

A novel pattern-recognition system that is invariant against scale-, position- and rotation-changes is proposed. The system is composed of an array of modular neural networks with local space-invariant interconnections (FELSI) [Appl. Opt. 29 (1990) 4790] and a multiwavelet transform preprocessor. The wavelet decomposition of two-dimensional patterns is optically realized by the VanderLugt correlator. To obtain the multiwavelet transforms simultaneously, we synthesize a correlation filter of multiwavelets using computer-generated holograms. The learning process of the FELSI with the techniques of additional noise and weight decay is shown to contribute to the invariant recognition of the system. 相似文献

12.

GIS Partial Discharge Pattern Recognition Based on a Novel Convolutional Neural Networks and Long Short-Term Memory

Tingliang Liu Jing Yan Yanxin Wang Yifan Xu Yiming Zhao 《Entropy (Basel, Switzerland)》2021,23(6)

Distinguishing the types of partial discharge (PD) caused by different insulation defects in gas-insulated switchgear (GIS) is a great challenge in the power industry, and improving the recognition accuracy of the relevant models is one of the key problems. In this paper, a convolutional neural network and long short-term memory (CNN-LSTM) model is proposed, which can effectively extract and utilize the spatiotemporal characteristics of PD input signals. First, the spatial characteristics of higher-level PD signals can be obtained through the CNN network, but because CNN is a deep feedforward neural network, it does not have the ability to process time-series data. The PD voltage signal is related to the time dimension, so LSTM saves and analyzes the previous voltage signal information, realizes the modeling of the time dependence of the data, and improves the accuracy of the PD signal pattern recognition. Finally, the pattern recognition results based on CNN-LSTM are given and compared with those based on other traditional analysis methods. The results show that the pattern recognition rate of this method is the highest, with an average of 97.9%, and its overall accuracy is better than that of other traditional analysis methods. The CNN-LSTM model provides a reliable reference for GIS PD diagnosis. 相似文献

13.

Multi-Stream Convolution-Recurrent Neural Networks Based on Attention Mechanism Fusion for Speech Emotion Recognition

Huawei Tao Lei Geng Shuai Shan Jingchao Mai Hongliang Fu 《Entropy (Basel, Switzerland)》2022,24(8)

The quality of feature extraction plays a significant role in the performance of speech emotion recognition. In order to extract discriminative, affect-salient features from speech signals and then improve the performance of speech emotion recognition, in this paper, a multi-stream convolution-recurrent neural network based on attention mechanism (MSCRNN-A) is proposed. Firstly, a multi-stream sub-branches full convolution network (MSFCN) based on AlexNet is presented to limit the loss of emotional information. In MSFCN, sub-branches are added behind each pooling layer to retain the features of different resolutions, different features from which are fused by adding. Secondly, the MSFCN and Bi-LSTM network are combined to form a hybrid network to extract speech emotion features for the purpose of supplying the temporal structure information of emotional features. Finally, a feature fusion model based on a multi-head attention mechanism is developed to achieve the best fusion features. The proposed method uses an attention mechanism to calculate the contribution degree of different network features, and thereafter realizes the adaptive fusion of different network features by weighting different network features. Aiming to restrain the gradient divergence of the network, different network features and fusion features are connected through shortcut connection to obtain fusion features for recognition. The experimental results on three conventional SER corpora, CASIA, EMODB, and SAVEE, show that our proposed method significantly improves the network recognition performance, with a recognition rate superior to most of the existing state-of-the-art methods. 相似文献

14.

基于卷积神经网络与光谱特征的夏威夷果品质鉴定研究 总被引：1，自引：0，他引：1

杜剑胡炳樑刘永征卫翠玉张耿唐兴佳《光谱学与光谱分析》2018,38(5):1514-1519

夏威夷果含油量高,在开缝之后容易发生变质,现有关于夏威夷果品质鉴定的方法多为传统的破坏性检验,很难满足无损检测的需求。卷积神经网络(CNN)作为应用最广泛的深度学习网络模型之一,具有比浅层学习方法更强的特征提取与模型表达能力,在光谱数据方面的应用拥有很大潜力。基于夏威夷果在可见-近红外的光谱特征分析,研究用于提取夏威夷果光谱特征的卷积神经网络模型,并提出一种高效无损鉴定夏威夷果品质的方法。首先以三种不同品质的夏威夷果(好籽、哈籽及霉籽)为研究对象,分析样本在500~2 100 nm的光谱信息;在光谱数据预处理中引入白化处理方法,用以增强数据的相关性差异;然后在模型训练过程中,将样本随机分为训练集和预测集,探讨不同CNN结构、卷积层数、卷积核大小及个数、池化层类型、全连接层神经元个数以及激活函数对分类结果的影响,并采用激活函数ReLU和Dropout方法,预防样本数据过少引起的过拟合现象;最后通过分析模型分类准确率和计算效率,确定了一个6层结构的CNN模型：输入层-卷积层-池化层-全连接层(200神经元)-全连接层(100神经元)-输出层。实验结果表明：上述网络模型对校正集和预测集的分类准确率均达到100％。因此,改进后的卷积神经网络模型可充分学习夏威夷果的光谱特征并有效分类,将深度学习理论与光谱分析相结合的方法能够实现对夏威夷果品质的准确鉴定,同时为夏威夷果等坚果类食品的高效、无损、实时在线检测提供了新思路。相似文献

15.

人工神经网络分类鉴别苦丁茶红外光谱 总被引：7，自引：2，他引：7

庞涛涛姚建斌杜黎明《光谱学与光谱分析》2007,27(7):1336-1339

为了分类鉴别苦丁茶,采用竞争神经网络(CNN)和反向传播人工神经网络(BP网络)两种模式的人工神经网络(ANN)分别分析了各种苦丁茶的红外谱图。作者采用25个样本作训练集,11个样本作检验集,用两种网络进行了训练。结果表明,CNN网络和BP网络均能够有效地实现苦丁茶产地的鉴别,但CNN网络能够进一步地区分苦丁茶的级别。实验表明,CNN速度快,预测结果准确,可望用竞争神经网络(CNN)和红外光谱法结合分类鉴别苦丁茶。相似文献

16.

基于多层神经网络的非线性图像分割 总被引：3，自引：1，他引：2

郭平刘大禾《光学学报》1997,17(1):4-78

提出了一种用多层神经网络对图像进行非线性分割的方法。讨论了所用多层神经网络的学习速度的改进与训练样本的选择方法。实验表明，该多层神经网络系统可用于实时图像分割，并能获得很好的结果。相似文献

17.

基于BP神经网络的LED可靠性模型研究

黄伟明文尚胜夏云云《发光学报》2015,36(8):962-968

根据LED可靠性与相关参数的映射关系,建立拓扑结构为6-12-1的BP神经网络。以实测白光LED芯片的理想因子、结温、色温漂移等参数为输入量,以寿命为输出量,计算模型精度。研究结果表明,该模型有良好的外推能力及鲁棒性,可在短时间内成功预测LED寿命,神经网络训练结果相关系数为99.8%,检验组误差小于3%。相似文献

18.

基于神经网络的托卡马克能量约束时间预测

郑书昱彭佳臻张先梅薛二兵虞立敏《计算物理》2021,38(4):423-430

使用机器学习理论中的神经网络方法,根据通用逼近原理对能量约束时间的复杂函数进行逼近,采用托卡马克装置的典型实验数据,设计一种组合结构的神经网络.通过大量的调参试验,给出一套性能最好的参数组合,并与传统幂指数形式的多元线性回归方法进行准确性和数据集迁移能力的比较.结果表明:神经网络模型对于能量约束时间的预测准确率更高,回... 相似文献

19.

Speaker Recognition Using Constrained Convolutional Neural Networks in Emotional Speech

Nikola Simi&#x; Sini&#x;a Suzi&#x; Tijana Nosek Mia Vujovi&#x; Zoran Peri&#x; Milan Savi&#x; Vlado Deli&#x; 《Entropy (Basel, Switzerland)》2022,24(3)

Speaker recognition is an important classification task, which can be solved using several approaches. Although building a speaker recognition model on a closed set of speakers under neutral speaking conditions is a well-researched task and there are solutions that provide excellent performance, the classification accuracy of developed models significantly decreases when applying them to emotional speech or in the presence of interference. Furthermore, deep models may require a large number of parameters, so constrained solutions are desirable in order to implement them on edge devices in the Internet of Things systems for real-time detection. The aim of this paper is to propose a simple and constrained convolutional neural network for speaker recognition tasks and to examine its robustness for recognition in emotional speech conditions. We examine three quantization methods for developing a constrained network: floating-point eight format, ternary scalar quantization, and binary scalar quantization. The results are demonstrated on the recently recorded SEAC dataset. 相似文献

20.

基于模型辨识的BP神经网络在光伏系统MPPT中的应用

胡桂廷仲程超张伟君张正江《应用声学》2017,25(10):213-216, 266

光伏电池作为光伏发电系统的重要组成部分,研究其模型的准确性并对其最大功率点进行预测与跟踪,对于光伏发电效率的提高具有重大意义。本文首先根据光伏电池的内部结构和伏安特性建立其数学模型,并对所建立的模型进行参数辨识,进而得到模型输出与测量信息偏差最小的参数值,验证模型的准确和有效性。根据模型所反映的规律,将温度和光照强度作为输入变量,最大功率点对应的电压作为输出变量,构建了用于MPPT的神经网络模型。神经网络经训练后对最大功率点电压进行预测与跟踪,结果表明构建的神经网络具有良好的适应性。相似文献