期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

一种改进的DNN-HMM的语音识别方法* 总被引：1，自引：1，他引：1

李云红梁思程贾凯莉张秋铭宋鹏何琛王刚毅李禹萱《应用声学》2019,38(3):371-377

针对深度神经网络与隐马尔可夫模型(DNN-HMM)结合的声学模型在语音识别过程中建模能力有限等问题,提出了一种改进的DNN-HMM模型语音识别算法。首先根据深度置信网络(DBN)结合深度玻尔兹曼机(DBM),建立深度神经网络声学模型,然后提取梅尔频率倒谱系数(MFCC)和对数域的Mel滤波器组系数(Fbank)作为声学特征参数,通过TIMIT语音数据集进行实验。实验结果表明:结合了DBM的DNN-HMM模型相比DNN-HMM模型更具优势,其中,使用MFCC声学特征在词错误率与句错误率方面分别下降了1.26%和0.20%。此外,使用默认滤波器组的Fbank特征在词错误率与句错误率方面分别下降了0.48%和0.82%,并且适量增加滤波器组可以降低错误率。总之,研究取得句错误率与词错误率分别降低到21.06%和3.12%的好成绩。相似文献

2.

深度学习在超声检测缺陷识别中的应用与发展* 总被引：1，自引：1，他引：0

李萍宋波毛捷廉国选《应用声学》2019,38(3):458-464

深度学习（Deep Learning）是目前最强大的机器学习算法之一,其中卷积神经网络（Convolutional Neural Network, CNN）模型具有自动学习特征的能力,在图像处理领域较其他深度学习模型有较大的性能优势。本文先简述了深度学习的发展史,然后综述了深度学习在超声检测缺陷识别中的应用与发展,从早期浅层神经网络到现在深度学习的应用现状,并借鉴医学影像识别和射线图像识别领域的方法,分析了卷积神经网络对超声图像缺陷识别的适用性。最后,探讨归纳了目前在超声检测图像识别中使用CNN存在的一些问题,及其主要应对策略的研究方向。相似文献

3.

水下目标多模态深度学习分类识别研究 总被引：2，自引：0，他引：2

曾赛杜选民《应用声学》2019,38(4):589-595

水下目标的分类识别对于水声探测具有重要意义。提出一种水下目标多模态深度学习分类识别方法。针对水声信号的一维时域模态和二维频域模态特征建立一种多模态特征融合的深度学习结构,结合长短时记忆网络和卷积神经网络的优点,对一维时域信号和二维频谱信号分别进行并行处理,对输出进行典型相关分析,形成特征融合表示,并利用相邻帧的相关性进行参数优化。利用实测水声信号对算法进行了验证。结果表明：提出的算法对于水下目标识别的精度有显著的提高。相似文献

4.

卷积神经网络的缺陷类型识别分析*

高子洋师芳芳张碧星苏业旺《应用声学》2022,41(2):301-309

该文提出一种基于卷积神经网络直接对阵列超声检测原始信号进行缺陷类型识别的方法,该方法无需对超声回波原始信号进行特征提取.文章研究对比了不同卷积神经网络及其优化的识别性能.首先采用超声相控阵系统对不同试块上的平底孔、球底孔、通孔三种缺陷进行超声检测,然后利用LeNet5、VGG16和ResNet三种卷积神经网络对一维和二... 相似文献

5.

卷积神经网络在气体泄漏超声识别中的应用

韩鹏程燕群彭涛宁方立《应用声学》2022,41(4):602-609

为了克服现有气体泄漏检测方法的不足,提出一种基于卷积神经网络的气体泄漏超声信号识别方法。在设计卷积神经网络网络结构时,通过多次预训练确定网络层数、卷积核数目和尺寸、全连接层神经元数目。同时,选择Inception模块平衡网络宽度和深度,防止过拟合的同时提高网络对尺度的适应性。通过输气管道泄漏实验平台模拟工况中常见的阀门泄漏和垫片泄漏,利用短时傅里叶变换进行时频图表征,在此基础上,建立二分类模型和不同泄漏类型的三分类模型。结果表明,相比二分类模型,不同泄漏类型的三分类模型识别准确率有所降低,添加Inception模块可以有效提高三分类模型的性能。相似文献

6.

基于改进卷积神经网络算法的语音识别 总被引：1，自引：1，他引：0

杨洋汪毓铎《应用声学》2018,37(6):940-946

为了解决传统卷积神经网络识别连续语音数据时识别性能较差的问题,提出一种改进的卷积神经网络算法。该方法引入Fisher准则以及L2正则化约束,在反向传播调整参数阶段,既保证参数误差的最小化,又确保分类以后的样本类间分布较分散,类内分布较集中,同时保证网络权值具有合适的数量级以有效缓解过拟合问题;采用一种更符合生物神经元激活特性的新型log激活函数进行卷积神经网络的优化,进一步提高语音识别的正确率。在语音识别库TIMIT以及THCHS30上的实验结果表明,相较于传统卷积神经网络算法,本文提出的改进算法能较好的提高语音识别率,且泛化能力更强。相似文献

7.

基于深度神经网络的水声信号恢复方法研究*

王全东郭良浩闫超《应用声学》2019,38(6):1004-1014

针对干扰或噪声环境下水声目标信号难以获取的问题,该文提出研究基于深度神经网络的自适应水声被动信号波形恢复方法。在单阵元情况下,该方法提取对数功率谱特征作为输入,采用深度神经网络回归模型自适应学习目标信号的自身特征,输出降噪后的对数功率谱特征并还原时域波形。在多阵元情况下,提出阵列深度神经网络降噪方法,将部分或全部阵元特征拼接为长向量作为输入,从而利用空域信息。为全面利用阵列丰富的时频域信息,该文提出一种两阶段特征融合深度神经网络,在第一阶段将阵列分为若干个子阵,将每个子阵分别用阵列深度神经网络进行处理,在第二阶段将第一阶段的各子阵处理结果与阵列接收信号同时输入一个深度神经网络进行融合学习。实验表明,所提出的单阵元和两阶段融合深度神经网络取得了显著优于常规波束形成的恢复结果,能够准确估计目标信号波形和功率并显著提高输出信噪比。相似文献

8.

基于深度学习的船舶辐射噪声识别研究 总被引：2，自引：1，他引：2

下载免费PDF全文

朱可卿田杰黄海宁张扬帆《应用声学》2018,37(2):238-245

为了改善船舶辐射噪声识别系统的性能,进一步提高船舶辐射噪声识别的正确率,该文提出采用一种基于深度学习的船舶辐射噪声识别方法。该方法首先提取了船舶辐射噪声的频谱、梅尔倒谱系数等特征,将提取特征后的图像样本分别用于训练卷积神经网络和深度置信网络,再对船舶辐射噪声进行识别。通过文中所给实例,将深度学习和支持向量机两种识别方法的性能进行比较,得出深度学习方法可以有效地提高船舶辐射噪声识别正确率的初步结论。相似文献

9.

基于核的k-最近邻在水下目标识别中的应用*

严良涛项晓丽《应用声学》2019,38(3):448-451

针对水中目标特征类型多、非线性强的特点,本文将K-KNN应用于水中目标识别。该方法采用PCA对特征矩阵进行降维,利用Kernel技巧将降维后的特征映射到高维空间进行KNN分类识别,并讨论了邻近点个数K对试验结果的影响。实际试验数据验证结果表明：与传统的KNN和BP神经网络分类器相比,K-KNN分类器的综合性能更优。相似文献

10.

水声被动目标识别技术挑战与展望

程玉胜邱家兴刘振李海涛《应用声学》2019,38(4):653-659

低频水声探测和船舶减振降噪技术发展,使得传统水声目标识别技术性能逐渐下降。该文分析了声呐工作带宽、探测频率、船舶减振降噪给识别技术带来的挑战。针对低频声呐广泛使用的低频线谱识别,研究了低频线谱的识别能力问题;针对智能识别技术发展,研究了深度学习技术在船舶辐射噪声识别中的应用问题,并给出了数据试验结果,文章最后指出了水声被动目标识别技术亟需开展的研究内容和方向。相似文献

11.

基于双向循环神经网络的汉语语音识别*

下载免费PDF全文

李鹏杨元维杜李慧高贤君周意蒋梦月张净波《应用声学》2020,39(3):464-471

当前基于深度神经网络模型中,虽然其隐含层可设置多层,对复杂问题适应能力强,但每层之间的节点连接是相互独立的,这种结构特性导致了在语音序列中无法利用上下文相关信息来提高识别效果,而传统的循环神经网络虽然做出了改进,但是只能对上文信息进行利用。针对以上问题,该文采用可以同时利用语音序列中上下文相关信息的双向循环神经网络模型与深度神经网络模型相结合,并应用于语音识别。构建具有5层隐含层的模型,其中第3层为双向循环神经网络结构,其他层采用深度神经网络结构。实验结果表明:加入了双向循环神经网络结构的模型与其他模型相比,较好地提高了识别正确率;噪声对双向循环神经网络汉语识别有重要影响,尤其是训练集和测试集附加噪声类型不同时,单一的含噪声语音的训练模型无法适应不同噪声类型的语音识别;调整神经网络模型中隐含层神经元数量后,识别正确率并不是一直随着隐含层中神经元数量的增加而增加,神经元数量数目增加到一定程度后正确率出现了降低的趋势。相似文献

12.

基于边缘区域不变矩的缺损扩展目标识别方法

下载免费PDF全文

张坤华张力纪震《强激光与粒子束》2008,20(01):0

该方法提出以基于边缘区域的局部不变矩作为识别特征,结合多神经网络实现对缺损扩展目标的有效识别。讨论了离散情况下基于边缘区域局部不变矩的平移、旋转和尺度不变性。在此基础上,建立目标多个处理区域的BP人工神经网络,利用各网络分类综合结果提高缺损目标的识别率。实验结果显示该方法能够对缺损扩展目标进行正确识别,特别对于有较大部分缺损的扩展目标识别有明显优势。相似文献

13.

基于LVQ神经网络的目标识别技术

黄勇刘燕《光学与光电技术》2006,4(1):58-61

通过对目标特征的分析比较,选取不变矩作为识别特征.为了达到很好的识别效果,对不变矩做了优化处理.采用LVQ神经网络技术建立了识别模型,提高了识别速度.运用有限的样本对目标识别技术进行了测试,结果表明采用此技术后的识别成功率较高,平均约为98%,识别速度快,每幅二值目标图像的识别时间约为16 ms. 相似文献

14.

基于边缘区域不变矩的缺损扩展目标识别方法

张坤华张力纪震《强激光与粒子束》2008,20(1):31-35

该方法提出以基于边缘区域的局部不变矩作为识别特征,结合多神经网络实现对缺损扩展目标的有效识别。讨论了离散情况下基于边缘区域局部不变矩的平移、旋转和尺度不变性。在此基础上,建立目标多个处理区域的BP人工神经网络,利用各网络分类综合结果提高缺损目标的识别率。实验结果显示该方法能够对缺损扩展目标进行正确识别,特别对于有较大部分缺损的扩展目标识别有明显优势。相似文献

15.

采用GAF-D3Net深度学习网络的水下目标有源识别方法

周天司吉坤杜伟东于晓阳《声学学报》2023,48(5):950-958

提出一种基于格拉姆角场(GAF)和卷积神经网络(CNN)的水下目标有源识别方法。该方法利用GAF将目标回波信号编码为二维图像, 使用空洞卷积构建轻量级的卷积神经网络GAF-D3Net实现对目标的特征提取与分类识别。实验表明, 与基于传统图像特征的分类方法相比, 所提方法的分类精度有显著提高, 达到99.65%。在泛化性测试中, 对比了经典CNN使用声呐图像的迁移学习方法, 本文方法的曲线下面积(AUC)达到89%, 具有更好的泛化性能以及抗干扰能力, 为实现水下目标有源识别提供了一种可靠方法。相似文献

16.

基于蚁群优化与神经网络的坦克目标识别算法

王永学王双进《物理实验》2010,30(5)

为了对成像引信探测得到的变形严重的图像进行识别,提出了基于蚁群优化与人工神经网络相结合的坦克目标识别算法.采用SUSAN特征检测原则提取目标图像的角点特征,作为神经网络模式分类器的输入.针对BP网络收敛速度慢,易于陷入局部极小点等问题,利用蚁群优化算法训练网络权值,可兼有ANN的广泛映射能力和蚁群算法的全局收敛以及启发式学习等特点.仿真实验表明,新算法能够有效缩短网络训练时间,提高目标识别精度. 相似文献

17.

神经网络在声发射信号模式识别中的应用

侯素霞罗积军徐军王汉功《应用声学》2003,22(1):44-47

介绍了人工神经网络中的BP网络、RBF网络、Hamming网络、BP－Hamming网络在声发射信号模式识别中的应用现状,并对这些方法的优缺点进行了比较。相似文献

18.

助听器端到端联合声反馈抑制和去噪去混响研究

下载免费PDF全文

王梅煌章辉勇徐晨阳李晓东郑成诗《声学学报》2024,49(6):1215-1225

现有助听器往往将声反馈、噪声和混响问题独立优化, 约束了其性能上限, 为此提出了一种两阶段端到端深度学习联合声反馈抑制和去噪去混响方法。该方法首先在助听器临界稳定工作状态通过闭环系统仿真构造大量的带噪带混响带声反馈的数据, 其次通过离线联合训练的方式完成两阶段网络模型预训练, 最后将预训练好的模型应用于闭环系统中实现低时延声反馈、噪声和混响的同步抑制。以实录声反馈路径进行助听器系统闭环仿真测试的客观实验结果表明, 相比于传统处理算法、只考虑混响和噪声的模型和只采用单阶段网络训练的模型, 所提方法在语音质量感知评估测度、扩展的短时客观可懂度和加权频带分段信噪比等客观指标上均具有显著优势。相似文献