首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
张少康  田德艳 《应用声学》2019,38(2):267-272
传统水下声目标识别分类方法具有较强的人机交互特性,无法满足未来水下无人平台智能识别分类水声目标的需求。针对这一问题,提出了一种基于梅尔倒谱系数(MFCC)的水下声目标智能识别分类方法,该方法通过提取水下声目标梅尔倒谱系数特征,采用长短时记忆网络(LSTM)构建了智能识别分类模型。使用实际水声信号对该方法进行了验证,结果表明,基于梅尔倒谱系数的水下声目标智能识别分类方法能够在不依赖人工提取特征的情况下,对目标噪声进行识别分类,具备智能化识别分类能力。  相似文献   

2.
张洪  刘彬彬 《应用声学》2021,40(3):350-357
针对常规诊断方法对螺栓的连接状态识别效果差、鲁棒性和抗噪性弱等问题,提出了基于深度学习理论的螺栓检测新方法。首先以4种预紧力状态下的法兰螺栓结构产生的声发射信号为研究对象,借助于自适应噪声的完整集成经验模态分解理论以及梅尔频率倒谱系数特征提取方式,实现了声发射信号的自适应消噪和最优模态函数分量组的选取,提取到了可以较好分辨螺栓连接状态的梅尔频率倒谱系数特征值。通过训练模型,较好地对4种连接状态下的螺栓进行了识别。结果表明,该模型在法兰螺栓的声发射信号的诊断中,准确率高,具有较好的抗噪性和鲁棒性。  相似文献   

3.
王栋  司纪锋 《应用声学》2018,37(2):252-259
针对小数据量的海洋动物声信号混合识别,将声信号同态分析过程中的线性频率转换为Mel频率,得到模拟人耳听觉特性的Mel频率倒谱系数作为声信号的特征。按照声信号所属的物种建立特征模板,使用动态时间规整算法对待识别特征进行分类识别,并对特征库和识别算法进行优化。分别提取了6种鱼类、3种虾类、12种鲸类的Mel频率倒谱系数,为每个物种建立特征模板。分3次对3种、5种、6种鱼类进行识别,分别获得了100%、96.25%、94.68%的识别率。对6种鱼类、3种虾类、12种鲸类共21个物种进行混合识别,总识别率由87.56%提升至优化后的88.96%。实验结果表明,基于Mel频率倒谱系数和动态时间规整算法的海洋动物声信号混合识别能够在小数据量时获得较高的识别率,优化后的特征库和识别算法能够提升识别率。  相似文献   

4.
曾宇  户文成 《应用声学》2020,39(3):409-416
针对公共场所异常声的感知和识别问题,提出一种基于贝叶斯优化卷积神经网络的识别方法。提取声信号的Gammatone倒谱系数、倍频程功率谱、短时能量和谱质心,组合成声信号的特征图。构建卷积神经网络作为分类器,利用递增的卷积核设置和池化操作处理不同尺度的特征。基于贝叶斯优化算法优化卷积神经网络的模型参数,对包括火苗噼啪声、婴儿啼哭声、烟花燃放声、玻璃破碎声和警报声的5种公共场所异常声进行识别。该方法的识别结果与基于不同的特征提取和分类器方案得到的识别结果进行比较,结果表明该方法的识别效果优于其他特征提取和分类器方案的识别效果。最后分析了该方法在不同信噪比噪声干扰下的识别结果,验证了该方法的有效性。  相似文献   

5.
为进一步提高光纤振动信号模式识别的实时性及准确性,提出一种基于补偿距离估计技术的信号特征提取算法.算法借鉴人类听觉感知机理,对光纤传感振动信号提取Mel频率倒谱系数特征向量,采用补偿距离估计技术制定特征筛选策略实现特征评估与优化.实验结果表明,基于补偿距离估计技术的振动信号特征提取算法可以有效减少光纤传感系统中影响分类...  相似文献   

6.
适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函数平滑方法,用于模拟人耳听觉感知特性和平滑耳机到鼓膜的传递函数,使均衡后的幅频响应保持相应的峰谷,避免了幅度峰谷过渡均衡。实验结果表明,进行耳机到鼓膜的传递函数平滑的幅度均衡对提高耳机的音色有显著作用,基于Mel频率倒谱系数平滑的幅度均衡对提高耳机的音色最为显著。  相似文献   

7.
采用L1/2稀疏约束的梅尔倒谱系数语音重建方法   总被引:1,自引:0,他引:1       下载免费PDF全文
周健  刘荣敏  窦云峰  路成  陶亮 《声学学报》2018,43(6):991-999
提出了一种利用L1/2稀疏约束从梅尔倒谱系数重建语音时域信号方法。从梅尔倒谱系数估计语音幅度谱是一个欠定问题,现有的方法均采用幅度谱最小均方误差估计或采用L1正则化进行幅度谱的稀疏约束。相比于L1正则化模型,L1/2的稀疏约束特性更强,为此,本文在从梅尔倒谱系数估计语音幅度谱时引入L1/2正则化约束,并利用求解的稀疏幅度谱估计相位谱,最后利用估计的频谱重建时域语音信号。实验结果表明,与幅度谱最小均方误差法相比,本文算法所估计出的语音信号具有更高的语音质量;在噪声环境下进行语音重建实验,与L1正则化幅度谱估计方法相比,本文算法重建的语音质量更好,表现出更好抗噪性。   相似文献   

8.
研究最小方差无失真响应感知倒谱系数在说话人识别中的应用。提取最小方差无失真响应感知倒谱系数,对其进行高斯混合模型建模并采用联合因子分析的方法来拟合高斯混合模型中的说话人和信道差异,在美国国家标准技术研究院2008年说话人识别评测核心测试集上分别对最小方差无失真响应感知倒谱系数和传统的Mel频率倒谱系数进行测试。结果显示,两种不同特征的系统性能相当,采用线性融合方法后,在不同测试集上的等错误率相对下降了7.6%~30.5%,最小检测错误代价相对下降了3.2%~21.2%。实验表明,最小方差无失真响应感知倒谱系数能有效应用于说话人识别中,且与传统的Mel频率倒谱系数存在一定程度的互补性。   相似文献   

9.
为了提高汉语语音的谎言检测准确率,提出了一种对信号倒谱参数进行稀疏分解的方法。首先,采用小波包滤波器组对语音信号进行多频带划分,求得子频带对数能量并进行离散余弦变换以提取小波包频带倒谱系数,结合梅尔频率谱系数得到倒谱参数;其次,依据K-奇异值分解方法分别利用说谎和非说谎两种状态下的语音倒谱参数集训练得到过完备混合字典,在此字典上根据正交匹配追踪算法对参数集进行稀疏编码提取稀疏特征;最终进行多种分类模型下的识别实验·实验结果表明,稀疏分解方法相比传统参数降维方法具有更好的优化性能,本文推荐的稀疏谱特征最佳识别率达到78.34%,优于其他特征参数,显著提高了谎言检测识别准确率。   相似文献   

10.
听觉计算模型在鲁棒性语音识别中的应用   总被引:3,自引:1,他引:2  
利用听觉感知机理,建立一个基于听觉感知机理的语音信号特征提取模型。本文由两部分组成,一部分是在传统听觉计算模型基础上提出听觉倒谱特征AFCC(AnditoryFrequencyCepstralCoefficient)的提取方法,这样既压缩了特征维数,减小计算量,又使各个特征维之间相互独立,满足HMM模型的要求。并且根据听觉神经中枢的长时整合特性,文中提出了用低通滤波模型来模拟这种功能。结合该低通模型,提取的语音信号的听觉倒谱特征在HMM框架下取得较好的鲁律性。另一部分在研究听觉侧抑制机理的基础上,提出一个简单有效的听觉侧抑制处理模型。美尔倒谱特征MFCC谱特征经过该侧抑制模型处理,得到侧抑制美倒谱特征MFCCI,实验表明,该新特征MFCCI鲁棒性能比MFCC有大大提高。听觉倒谱特征AFCC经过该侧抑制处理得到侧抑制听觉倒谱特征AFCCI,实验表明,该新特征AFCCI鲁律性能比AFCC有大大提高。  相似文献   

11.
赵乾坤  刘峰  梁秀兵  汪涛  宋永强 《应用声学》2023,42(5):1033-1041
水声目标被动识别是水声信号处理领域的研究热点之一。海洋环境中存在的不规则噪声干扰,使得基于传统方法的水声目标被动识别技术在实际的应用场景中效果不佳。本文采用一种基于时延网络(Time Delay Neural Network,TDNN)模型的舰船辐射噪声目标识别方法,该方法利用目标的短时平稳特性和长时关联特性对目标的声纹特征进行建模,使用梅尔谱图提取目标信号的初级特征,再通过融合注意力机制和时延神经网络的深度学习模型实现高级特性提取,最后再利用余弦相似度实现不同目标的类别划分。该方法在ShipsEar数据集和自行采集的数据进行测试验证,目标识别准确率分别达到79.2%和73.9%,可证明本文方法的有效性。  相似文献   

12.
一种改进的DNN-HMM的语音识别方法*   总被引:2,自引:1,他引:1       下载免费PDF全文
针对深度神经网络与隐马尔可夫模型(DNN-HMM)结合的声学模型在语音识别过程中建模能力有限等问题,提出了一种改进的DNN-HMM模型语音识别算法。首先根据深度置信网络(DBN)结合深度玻尔兹曼机(DBM),建立深度神经网络声学模型,然后提取梅尔频率倒谱系数(MFCC)和对数域的Mel滤波器组系数(Fbank)作为声学特征参数,通过TIMIT语音数据集进行实验。实验结果表明:结合了DBM的DNN-HMM模型相比DNN-HMM模型更具优势,其中,使用MFCC声学特征在词错误率与句错误率方面分别下降了1.26%和0.20%。此外,使用默认滤波器组的Fbank特征在词错误率与句错误率方面分别下降了0.48%和0.82%,并且适量增加滤波器组可以降低错误率。总之,研究取得句错误率与词错误率分别降低到21.06%和3.12%的好成绩。  相似文献   

13.
Mel frequency cepstral coefficients (MFCC) are the most widely used speech features in automatic speech recognition systems, primarily because the coefficients fit well with the assumptions used in hidden Markov models and because of the superior noise robustness of MFCC over alternative feature sets such as linear prediction-based coefficients. The authors have recently introduced human factor cepstral coefficients (HFCC), a modification of MFCC that uses the known relationship between center frequency and critical bandwidth from human psychoacoustics to decouple filter bandwidth from filter spacing. In this work, the authors introduce a variation of HFCC called HFCC-E in which filter bandwidth is linearly scaled in order to investigate the effects of wider filter bandwidth on noise robustness. Experimental results show an increase in signal-to-noise ratio of 7 dB over traditional MFCC algorithms when filter bandwidth increases in HFCC-E. An important attribute of both HFCC and HFCC-E is that the algorithms only differ from MFCC in the filter bank coefficients: increased noise robustness using wider filters is achieved with no additional computational cost.  相似文献   

14.
吕钊  吴小培  张超  李密 《声学学报》2010,35(4):465-470
提出了一种基于独立分量分析(ICA)的语音信号鲁棒特征提取算法,用以解决在卷积噪声环境下语音信号的训练与识别特征不匹配的问题。该算法通过短时傅里叶变换将带噪语音信号从时域转换到频域后,采用复值ICA方法从带噪语音的短时谱中分离出语音信号的短时谱,然后根据所得到的语音信号短时谱计算美尔倒谱系数(MFCC)及其一阶差分作为特征参数。在仿真与真实环境下汉语数字语音识别实验中,所提算法相比较传统的MFCC其识别正确率分别提升了34.8%和32.6%。实验结果表明基于ICA方法的语音特征在卷积噪声环境下具有良好的鲁棒性。   相似文献   

15.
水声目标识别一直是水声领域研究的重点问题之一,深度学习方法可以有效地解决目标识别问题,然而,水声样本的稀少限制了该方法的应用。该文 提出一种基于数据增强的水声信号深度学习目标识别方法,该方法以Mel功率谱作为网络的输入特征,通过对原始信号在时域和时频域的拉伸和掩蔽等变换,实现数据扩展和增加泛化性能的目的,最后,利用改进的VGG网络模型实现目标分类。实验结果表明,该文方法得到的水下目标识别准确率(95.2%) 要优于其他4种对比方法,证明了该文提出的网络模型和数据增强方法均有助于提高目标分类性能。  相似文献   

16.
绕组松动是变压器常见故障之一,对变压器的安全运行产生巨大威胁.故对其进行精准的监测,对提高电力系统的安全稳定性具有十分重要的意义.基于声信号的变压器绕组松动检测,由于其具有无损检测和不需停运变压器等优点,成为近年来研究的热点.但声信号检测存在故障特征提前复杂和易受噪声干扰等缺陷,限制了其工程应用.该文提出了一种基于声信...  相似文献   

17.
常用的梅尔倒谱系数结合高斯混合模型(MFCC+GMM)方法的鸟鸣声识别技术难适应噪声环境,模型难以收敛,且计算复杂度高。该文提出一种融合声纹信息的能量谱图的鸟类识别方法(VPS-BR),该方法利用鸟类鸣声在能量谱图上所表现的多维差异性,定量识别鸣声声纹特征。通过对分贝能量进行颜色映射得到能量谱图,提取其视觉特征所表达的声学特征,分析归纳得到鸟类特有鸣声模式。在特征提取步骤中,选用识别速度快的局部二值模式、识别鲁棒性高的方向梯度直方图两个参数表征鸟鸣声谱图的边缘声纹;在识别步骤中,用局部二值模式和方向梯度直方图两种特征分别与支持向量机、K最近邻和随机森林3种分类器算法进行两两组合构建识别模型测试。对15种原始带噪鸟类鸣声数据集进行交叉验证,VPS-BR模型的平均识别率比MFCC+GMM组合模型高出11.3%,方向梯度直方图特征与K最近邻分类器的组合模型识别率达90.5%,表现出较好的抗噪性能和识别性能。最后针对样本数据集缺乏问题,使用生成对抗网络进行图像增强,进一步将识别率提升1.48%。  相似文献   

18.
Air transportation is one of the most important services in the world, contributing greatly to the advancement of modern society. However, it has a local and a global impact on the environment making aircraft take-off noise an important environmental public health concern near airports, and this is a significant subject for monitoring and research. In this work an experimentally validated computational model for aircraft classification is presented. In addition, potentially harmful effects to human health and comfort associated with noise exposure are discussed. The feature extraction of aircraft take-off signals is conducted through a 1/24 octave analysis and Mel frequency cepstral coefficients (MFCC). The aircraft classification is made by using two parallel feed forward neural networks. The aircraft are clustered into classes depending on the installed engine type. This model has 13 aircraft classes and a classification level above 83% with measurements in real time environment.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号