期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《声学学报》2016,(6)

为解决听觉外周模型特征在具有工程背景的水中目标声信号分类研究中识别率下降问题,提出了一种外周模型Gammatone滤波器组修正方法,获得的窄带噪声特征可明显提高水中目标识别性能。首先,分析了识别率下降原因,发现声学工程应用中多通道数据采集,导致信号频率范围变窄,而引起声信号的时频特征发生变化。其次,根据听觉模型用Gammatone滤波器组模拟人耳基底膜频率分解特性、低频信息包含水中目标噪声信号的重要类别特征,对原有的听觉模型特征进行插值,对滤波器组的通道数与中心频率进行适应性修正,得到目标噪声在较窄频带的27维特征,修正后的模型能够更精细地反映出目标时频特性。最后,采用神经网络分类器进行实验。结果表明,修正后的听觉模型保留了原较宽频带特征的主要信息,而且进一步提高了对实际目标的分类能力,识别率由原来的82.59%提高到88.80%。本文提出根据工程应用平台的有效接收频带优化听觉外周模型Gammatone滤波器组的设计,采用阵元级的多通道数据进行分析,侧重于工程应用,解决了多通道数据采集中,由于频带变窄,导致信号的特征信息量下降,进而引起声特征识别性能下降的问题,修正后的听觉模型特征,有效地提高水中目标辐射噪声的识别效果。本文对从事无源声呐目标识别、有源声呐目标识别、带宽受限的多通道声数据采集的时频特性分析研究人员具有一定的参考价值。相似文献

2.

水下无源声呐目标听觉域张量特征提取方法

下载免费PDF全文

康春玉夏志军章新华张忆郭德鑫《声学学报》2020,45(6):824-829

特征提取是水下无源声呐目标分类识别的关键步骤,提出了一种基于听觉Patterson-Holdsworth耳蜗模型的听觉域张量特征提取方法。将耳蜗模型的滤波器冲激响应视为信号分解的基函数,根据听觉模型非线性尺度或常规线性尺度确定不同通道的中心频率,然后计算出相应通道的增益和带宽,并量化冲激响应的阶数和相位参数,得到信号分解基,再根据信号分解原理得到通道数×阶数×相位数的三阶张量特征,并通过计算测试样本张量特征与训练样本张量特征间的相似性实现了水下无源声呐目标的分类识别。海上实录无源声呐目标的分类识别实验表明,提取的张量特征具有比较好的分类识别性能,听觉模型等效矩形带宽尺度优于线性尺度划分中心频率,能够提高无源声呐的目标指示能力。相似文献

3.

听觉模型反演方法及其应用

赵鹤鸣王永琦陈雪勤《声学学报》2005,(6)

听觉模型已应用于语音信号处理的许多方面,并已取得了较好的结果。论文根据目前应用较为广泛的听觉模型,提出了模型中各部分的逆变换。首先通过对自相关图谱逆变换并经迭代运算重构相位信息恢复神经发放率,再经半波整流逆运算恢复负半部分信号,最后对描述内毛细胞、突触模型的相关方程进行逆运算和Gammatone逆滤波,构成整个听觉模型的反演方法。作为应用论文提出了一种基于听觉模型逆变换的含噪语音增强方法。实验结果表明,该方法对含噪语音有很好的降噪效果,特别是当信噪比较低时,该方法较常用的方法更为有效。论文提出的听觉模型逆变换方法可应用于语音增强等领域。相似文献

4.

基于听觉模型的耳语音的声韵切分 总被引：5，自引：0，他引：5

下载免费PDF全文

丁慧栗学丽徐柏龄《应用声学》2004,23(2):20-25,44

本文分析了耳语音的特点，并根据生理声学及心理声学的基本理论与实验资料，提出了一种利用听觉模型来进行耳语音声韵切分的方法。这种适用于耳语音声韵切分的听觉感知模型主要分为四个层次：耳蜗对声音频率的分解机理；听觉系统的时域和频域非线性变化；中枢神经系统的侧抑制机理。这种模型能反映在噪声环境下人对低能量语音的听觉感知特性，因而适于耳语音识别，在耳语音声韵母切分实验中得到了满意的结果。相似文献

5.

帧同步混合小波包变换模拟听觉模型的语音增强的研究

朱学文杨道淳王炜牟峰徐柏龄《声学学报》2003,(1)

首先介绍了帧同步混合小波包的分析方法。该方法结合了小波包时频窗口可变的特点和STFT的分帧处理形式。它既能够保证语音信号处理中帧长的要求,即可实时处理,义能获得对信号频域上的最佳分解,是一种类似FFT的小波包的快速算法。在此基础上,应用该方法模拟了听觉模型,并运用于语音增强。实验表明,即使在-5 dB低信噪比的条件下,也能获得良好的除噪效果和听觉效果。该方法还可运用于语音的编码、合成和识别等领域。相似文献

6.

混合双语语音识别的研究 总被引：1，自引：0，他引：1

张晴晴潘接林颜永红《声学学报》2010,35(2)

随着现代社会信息的全球化,双语以及多语混合的语言现象日趋普遍,随之而产生的双语或多语语音识别也成为语音识别研究领域的热门课题。在双语混合语音识别中,主要面临的问题有两个:一是在保证双语识别率的前提下控制系统的复杂度;二是有效处理插入语中原用语引起的非母语口音现象。为了解决双语混合现象以及减少统计建模所需的数据量,通过音素混合聚类方法建立起一个统一的双语识别系统。在聚类算法中,提出了一种新型基于混淆矩阵的两遍音素聚类算法,并将该方法与传统的基于声学似然度准则的聚类方法进行比较;针对双语语音中非母语语音识别性能较低的问题,提出一种新型的双语模型修正算法用于提高非母语语音的识别性能。实验结果表明,通过上述方法建立起来的中英双语语音识别系统在有效控制模型规模的同时,实现了同时对两种语言的识别,且在单语言语音和混合语言语音上的识别性能也能得到有效保证。相似文献

7.

用于无监督语音降噪的听觉感知鲁棒主成分分析法 总被引：1，自引：0，他引：1

下载免费PDF全文

闵刚邹霞韩伟张雄伟谭薇《声学学报》2017,42(2):246-256

针对现有稀疏低秩分解语音降噪方法对人耳听觉感知特性应用不充分、语音失真易被感知的问题,提出了一种用于语音降噪的听觉感知鲁棒主成分分析法。由于耳蜗基底膜对于频率感知具有非线性特性,该方法采用耳蜗谱图作为语噪分离的基础。此外,选用符合人耳听觉感知特性的板仓-斋田距离度量作为优化目标函数,在稀疏低秩建模过程中引入非负约束以使分解分量更符合实际物理含义,并在交替方向乘子法框架下推导了具有闭合解形式的迭代优化算法。文中方法在语音降噪时是完全无监督的,无需预先训练语音或噪声模型。多种类型噪声和不同信噪比条件下的仿真实验验证了该方法的有效性,噪声抑制效果较目前同类算法更为显著,且降噪后语音的可懂度和总体质量有所提高、至少相当。相似文献

8.

重庆方言语音识别系统的设计与实现

张策韦鹏程陆晓燕石熙《应用声学》2018,26(1)

语音识别赋予了计算机能够识别出语音内容的功能，是人机交互技术领域的重要研究内容。随着计算机技术的发展，语音识别已经得到了成熟的发展。但是关于方言的语音识别还有很大的发展空间。中国是一个幅员辽阔、人口众多的国家，因此方言种类繁多，其中有3000多万人交流使用的重庆方言就是其中之一。采集了重庆方言的部分词语的文本文件和对应的语音文件建立语料库，根据重庆方言的发音特点，选取重庆方言的声韵母作为声学建模基元，选取隐马尔可夫模型(Hidden Markov Model, HMM)为声学模型设计了一个基于HMM的重庆方言语音识别系统。在训练过程利用语料库中训练集语料对声学模型进行训练，形成HMM模型库；在识别过程利用语料库中的测试集语料进行识别测试。实验结果表明，该系统能够实现重庆方言的语音识别，并且识别的正确率为100%。相似文献

9.

基于帧特征、段特征联合建模的语音识别模型

韩疆尹宝林《声学学报》2000,(2)

提出了基于帧特征、段特征联合建模的语音识别模型。该模型采用描述谱参数轨迹的段特征,在段尺度上实现了对语音信号帧间相关性的显式建模;采用段特征依赖的非平稳时间序列产生模型,实现了段特征与帧特征间的相关性建模,并在帧尺度上通过参数化的均值轨迹函数,实现了对语音信号帧间相关性的隐式建模。本文给出了基于帧特征、段特征联合统计距离优化的分段算法以及内嵌ＥＭ迭代的模型参数估计算法。对非特定人汉语孤立韵母以及多话者汉语基本音节的识别实验表明,该模型的识别性能优于标准ＨＭＭ及趋势ＨＭＭ。相似文献

10.

预测特征误差映射及其在多基地水下目标识别中的应用

下载免费PDF全文

温涛许枫王梦宾杨娟闫路《声学学报》2019,44(1):57-67

针对水下多基地目标识别问题,提出了基于特征预测和误差映射的多基地融合识别算法。推导并简化了基于贝叶斯公式的多基地目标识别条件概率公式,利用BP神经网络对最后一个节点的特征向量进行预测,并计算得到预测值与实际值误差的概率密度,将其与前面每个节点的条件概率累乘,以得到目标识别的条件概率。将利用特征预测计算条件概率的方法从单个节点推广到多个节点上,同时针对误差概率分布模型不准确的问题,提出了利用混合高斯分布模型代替单高斯概率分布模型的改进方法。对每个目标重复此过程,取结果最大值对应的目标类别为最后的识别结果.在消声水池开展多基地模拟实验,对四类目标进行识别,在一定声呐节点数目及信噪比条件下,与单基地声呐相比,多基地目标融合识别得到的识别正确率最大可提高40%,采用改进方法以后,识别正确率得到进一步提高。相似文献