期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

程宁刘文举《声学学报》2009,34(6):554-565

针对信号子空间语音增强算法中的子空间选择和线性滤波器中噪声功率谱和拉格朗日乘子的估计问题,用高斯、拉普拉斯和伽玛模型描述了语音的分布,提出了利用目标语音概率最大化来确定信号子空间维度的方法。在噪声子空间上,利用条件概率估计出噪声功率谱。接着,为了合理地折中增强语音中的残余噪声和语音畸变,提出了一种基于人耳听觉掩蔽效应的拉格朗日乘子估计方法。实验证明,在多项语音质量评价指标上,所提算法都取得了更好的结果。所提的信号子空间算法比传统的信号子空间算法更有效地消除了噪声,使得恢复的语音具有更好的质量。相似文献

2.

基于双传声器的蓝牙耳机降噪算法

下载免费PDF全文

严馨叶邱小军卢晶《应用声学》2014,33(4):313-323

用于免提通信设备的语音增强算法一直是研究的热点问题,而算法处理结果的音质问题近年来也备受关注。针对基于双传声器降噪的蓝牙耳机系统,将常用多通道传声器降噪算法归纳为基于相干函数法和基于空间预分离法这两大类进行分析和比较。基于相干函数法利用两个通道间信号的相干函数对含噪信号滤波达到降噪目的,而基于空间预分离法利用空间特性从含噪信号中分离出噪声参考信号来消除噪声。分析基于降噪量、语音音质和综合性能三个指标,从约束语音损伤的角度分析最优解的形式,并对比两类算法的实际性能。结果表明选择合适的算法可权衡降噪量与语音损伤,达到较好的综合性能。相似文献

3.

波达方向初始化空间混合概率模型的语音增强

下载免费PDF全文

石倩陈航艇张鹏远《声学学报》2022,47(1):139-150

提出了波达方向初始化空间混合概率模型的语音增强算法.通过声源定位估计出声源波达方向,再根据此计算相对传递函数,进而构造空间协方差矩阵来初始化空间混合概率模型.论证了相对传递函数在作为模型参数中语音协方差矩阵的主特征向量时,空间混合概率模型对应的概率分布可达到最大值,进而使期望最大化算法在迭代时更易收敛,以得到期望的掩蔽... 相似文献

4.

基于F范数的信号子空间维度估计的多通道语音增强算法

李超刘文举《声学学报》2011,36(4)

尽管信号子空间方法在语音增强中的应用已经得到了广泛的研究,但是作为制约子空间方法性能的子空间维度估计却一直没有得到较好的解决.针对子空间维度估计问题,本文用多通道语音信号互功率谱矩阵的F范数的统计模型来描述语音信号的先验知识和变化规律,提出了一种基于最大化原则的子空间维度估计方法,在接受原假设的前提下最大化子空间维度.实验证明,在客观语音质量评估和主观测评中,所提算法都取得了更好的结果.与传统方法相比,采用本文方法的多通道语音增强算法可在房间回声、低信噪比等恶劣环境下获得更高的噪声消除和更低的语音畸变. 相似文献

5.

差分传声器阵列期望最大化多声源方位估计方法

丁少为陈华伟《声学学报》2016,41(5):674-685

针对小尺寸传声器阵列多声源方位估计易受混响噪声影响的问题,提出了一种适用于差分传声器阵列的期望最大化多声源方位估计方法。首先,该方法利用期望最大化算法求解出各个时频点瞬时方位估计所应满足的高斯混合模型参数;然后,通过时频点分离技术估计出各声源的方位值。针对现有的硬、软时频点分离技术应用于差分传声器阵列所存在的缺陷,还提出了一种改进的时频点分离方法,该方法融合了软、硬分离方法所具有的优点,有效降低了时频点分离结果对混响噪声的敏感性。仿真和实测实验结果表明:相较于现有的差分传声器阵列多声源估计方法,所提方法在混响噪声环境下具有更高的估计精度和稳健性能。相似文献

6.

稀疏正交联合约束多通道非负矩阵分解声信号分离算法

下载免费PDF全文

章雯张君王璐赵静鲍明许耀华《声学学报》2023,48(1):249-263

针对复杂环境下多通道声信号分离问题,提出稀疏正交联合约束多通道非负矩阵分解声信号分离方法。首先设计基于多通道扩展坂仓斋藤(Itakura-Saito,IS)散度的稀疏正交联合约束项构造代价函数,给出信号稀疏和信号正交约束辅助函数,实现代价函数最小化求解。然后通过迭代更新规则设计,得到稀疏正交优化的多通道非负矩阵分解基矩阵和系数矩阵,讨论了稀疏正交约束对基矩阵和系数矩阵稀疏性与连续性影响。最后基于多通道信号空间特性,进行了非负矩阵分解基聚类以获得多通道非负矩阵分解声信号的分离结果。双通道音频数据与四通道声学目标分离实验数据测试表明,对音频数据,所提算法在性能指标信号失真比(SDR)上提高了0.84 dB,对于直升机声源数据,所提算法在SDR上提高了4.53 dB。相似文献

7.

噪声情况下采用稀疏非负矩阵分解与深度吸引子网络的人声分离算法 总被引：1，自引：1，他引：0

下载免费PDF全文

葛宛营张天骐范聪聪张天《声学学报》2021,46(1):55-66

为实现噪声情况下的人声分离,提出了一种采用稀疏非负矩阵分解与深度吸引子网络的单通道人声分离算法。首先,通过训练得到人声与噪声的字典矩阵,将其作为先验信息从带噪混合语音中分离出人声与噪声的系数矩阵;然后,根据人声系数矩阵中不同的声源成分在嵌入空间中的相似性不同,使用深度吸引子网络将其分离为各声源语音的系数矩阵;最后,使用分离得到的各语音系数矩阵与人声的字典矩阵重构干净的分离语音。在不同噪声情况下的实验结果表明,本文算法能够在抑制背景噪声的同时提高分离语音的整体质量,优于结合声噪人声分离模型的对比算法。相似文献

8.

基于卡尔曼滤波的低复杂度去混响算法* 总被引：1，自引：1，他引：0

下载免费PDF全文

齐园蕾杨飞然杨军《应用声学》2018,37(4):559-566

在电话会议、智能音箱等应用场景下,传声器往往处在声源的远场。混响信号的存在会掩蔽后续到达的直达声信号,降低传声器接收信号的语音质量,以及语音识别系统的准确识别率。多通道线性预测算法是一种经典的盲去混响算法,但该算法往往具有较高的计算复杂度。本文提出了一种简化的卡尔曼滤波更新算法,通过对角化卡尔曼滤波器状态向量误差协方差矩阵,降低了自适应多通道线性预测去混响算法的复杂度。通过与现有分块对角简化算法对比发现,本文提出的简化算法在保证语音质量的同时,进一步降低了原卡尔曼滤波算法的复杂度。相似文献

9.

偏度最大化多通道逆滤波语音去混响研究* 总被引：1，自引：1，他引：0

下载免费PDF全文

郭颖彭任华郑成诗李晓东《应用声学》2019,38(1):58-67

房间混响会降低语音质量和语音可懂度。高阶统计量是衡量非高斯性的重要参量,基于语音非高斯特性可实现语音去混响。本文提出一种基于高阶统计量的多通道语音去混响方法,该方法首次用多通道语音信号线性预测残差的三阶统计量偏度（Skewness）构造代价函数,以去混响重建信号线性预测残差的偏度最大化为目标自适应地更新逆滤波器;同时结合语音信号的产生模型,提出基于偏度准则的线性预测与房间脉冲响应逆滤波联合估计方法,进一步提高去混响算法性能。实验结果表明,该方法相较于已有的基于线性预测残差四阶统计量峰度（Kurtosis）的方法具有更好的去混响效果,且对噪声具有更强的鲁棒性。相似文献

10.

用于无监督语音降噪的听觉感知鲁棒主成分分析法 总被引：2，自引：0，他引：2

下载免费PDF全文

闵刚邹霞韩伟张雄伟谭薇《声学学报》2017,42(2):246-256

针对现有稀疏低秩分解语音降噪方法对人耳听觉感知特性应用不充分、语音失真易被感知的问题,提出了一种用于语音降噪的听觉感知鲁棒主成分分析法。由于耳蜗基底膜对于频率感知具有非线性特性,该方法采用耳蜗谱图作为语噪分离的基础。此外,选用符合人耳听觉感知特性的板仓-斋田距离度量作为优化目标函数,在稀疏低秩建模过程中引入非负约束以使分解分量更符合实际物理含义,并在交替方向乘子法框架下推导了具有闭合解形式的迭代优化算法。文中方法在语音降噪时是完全无监督的,无需预先训练语音或噪声模型。多种类型噪声和不同信噪比条件下的仿真实验验证了该方法的有效性,噪声抑制效果较目前同类算法更为显著,且降噪后语音的可懂度和总体质量有所提高、至少相当。相似文献

11.

基于噪声追踪的二值时频掩蔽到浮值掩蔽的泛化算法

下载免费PDF全文

梁山刘文举江巍《声学学报》2013,38(5):632-637

虽然浮值掩蔽比二值掩蔽有更好的语音分离效果,但是由于理想浮值掩蔽难以直接估计,现有的语音分离系统通常以理想二值掩蔽估计作为计算目标。我们提出了一个二值掩蔽到浮值掩蔽的泛化算法。由于实现浮值掩蔽估计的关键在于噪声能量追踪,我们首先采用指数分布刻画以混合谱和噪声能量以混合能量及二值掩蔽为观测的条件分布。其次,采用高斯马尔柯夫条件随机场刻画噪声估计在连续几帧内的关联。最后,采用马尔柯夫链-蒙特卡洛计算噪声能量最小均方误差估计并进一步计算浮值掩蔽。实验表明,相比于基于二值掩蔽估计的常规算法,我们所提出的算法在信噪比增益和客观感知质量两方面都有显著提高。相似文献

12.

An objective quality assessment method for bit-reduction coding of wideband speech.

S Hayashi N Kitawaki 《The Journal of the Acoustical Society of America》1992,92(1):106-113

This paper proposes a new objective quality assessment method for bit-reduction coding of wideband speech taking into account the masking effect of quantizing noise. First, this paper analyzes the reliability and sensitivity of the speech quality assessment method, based on a paired-comparison test with a modulated noise reference signal, for the bit-reduction coding of high-quality wideband speech. Then, the perception of quantizing noise is studied using speech with noise synthesized similar to the quantizing noise. The detection of quantizing noise is found to be influenced by masking by the source signal. This leads to a new method of objectively estimating the quality of coding speech by multiple regression analysis. The factors for the estimation are segmental signal-to-noise ratio, spectrum envelope distance between source signal and quantizing noise, and the similarity of the noise power envelope to the source signal in the time domain. This estimation method is applied to the parameter optimization of wideband coding systems. 相似文献

13.

近似窄带假设下的最小方差无失真响应波束形成

下载免费PDF全文

王子腾孙兴伟李军锋颜永红《声学学报》2020,45(2):161-168

最小方差无失真响应波束形成算法在应用于语音等宽带信号时,依赖窄带假设可以在频域各个子带分别进行滤波。窄带假设下语音信号协方差矩阵是秩-1矩阵,而实际中窄带信号模型只是实际信号模型的一种近似,同时由于存在统计量估计误差,估计的语音信号协方差矩阵的秩一般大于1。提出利用语音协方差矩阵和噪声协方差矩阵的广义主特征向量来估计相对传递函数,用于重构语音信号协方差矩阵为秩-1矩阵。在REVERB数据集以及CHiME-4数据集上进行实验验证,最小方差无失真响应波束形成算法经过语音协方差矩阵低秩近似后,对估计误差的鲁棒性提高,输出信噪比分别提升平均0.8 dB和1.4 dB,同时提升了语音识别准确率。相似文献

14.

信噪比后滤波与特征空间融合的最小方差超声成像算法 总被引：2，自引：0，他引：2

下载免费PDF全文

王平江金洋李昉林楠岳影《声学学报》2019,44(1):136-144

为了提高超声成像空间分辨率和对比度,提出了一种信噪比后滤波与特征空间融合的最小方差波束形成算法。首先,利用信号子空间划分将最小方差算法得到的权矢量投影到信号子空间中提高成像对比度,然后基于信号相干性设计滤波系数,并引入基于信噪比的噪声加权系数,最终得到融合信噪比后滤波与特征空间的最小方差算法。为验证本算法的有效性,使用FieldⅡ对点目标和吸声斑目标进行了仿真实验验证,并采用密歇根大学geabr_0实验数据进行成像。实验结果表明:所提算法在对比度和分辨率上均有所提高,明显优于传统延时叠加算法,最小方差算法和ESBMV_wiener算法,且对噪声具有较强鲁棒性。相似文献

15.

A wavelet-based forward BSS algorithm for acoustic noise reduction and speech enhancement

Khadidja Ghribi Mohamed Djendi Daoued Berkani 《Applied Acoustics》2016

In this paper, we address the problem of noise reduction and speech enhancement by adaptive filtering algorithm. Recently, the well known forward blind source separation (FBSS) structure has been largely studied and intensively used to reduce acoustic noise components and to enhance speech signal. The FBSS structure is often combined with adaptive algorithms to accelerate the adaptation of the cross-filters, and to improve noise suppression at the output. In this paper, we propose to use a wavelet transform decomposition in the FBSS structure by using a two-channel forward wavelet symmetric adaptive decorrelating (WFSAD) algorithm. The proposed WFSAD algorithm provides a better compromise between time and frequency resolution and improves robustness of the noise reduction process when compared with the classical two-channel forward symmetric adaptive decorrelating (FSAD) algorithm. Simulation results prove the efficiency of the proposed WFBSS algorithm in comparison with conventional ones in terms of several objective and subjective criteria. 相似文献

16.

The effect of multimicrophone noise reduction systems on sound source localization by users of binaural hearing aids

Van den Bogaert T Doclo S Wouters J Moonen M 《The Journal of the Acoustical Society of America》2008,124(1):484-497

This paper evaluates the influence of three multimicrophone noise reduction algorithms on the ability to localize sound sources. Two recently developed noise reduction techniques for binaural hearing aids were evaluated, namely, the binaural multichannel Wiener filter (MWF) and the binaural multichannel Wiener filter with partial noise estimate (MWF-N), together with a dual-monaural adaptive directional microphone (ADM), which is a widely used noise reduction approach in commercial hearing aids. The influence of the different algorithms on perceived sound source localization and their noise reduction performance was evaluated. It is shown that noise reduction algorithms can have a large influence on localization and that (a) the ADM only preserves localization in the forward direction over azimuths where limited or no noise reduction is obtained; (b) the MWF preserves localization of the target speech component but may distort localization of the noise component. The latter is dependent on signal-to-noise ratio and masking effects; (c) the MWF-N enables correct localization of both the speech and the noise components; (d) the statistical Wiener filter approach introduces a better combination of sound source localization and noise reduction performance than the ADM approach. 相似文献

17.

Blind convolutive separation method for speech signals via joint block diagonalization

ZHANG Hua FENG Dazheng PANG Jiyong 《声学学报：英文版》2010,29(1):45-55

A blind speech source separation method for the overdetermined convolutive mixture model in time-domain is proposed via joint block-diagonalization based on the mutual- independence and short-time stationarity properties of the speech signals. Taking the sum of the F-norms of all off-diagonal sub-matrices as a criterion, a novel joint block-diagonalization method is proposed to estimate the whole mixture matrix through minimizing a sequence of quadratic sub-functions corresponding to mixture sub-matrices. Both theoretical analysis and simulations show that the proposed method has much lower complexity and faster convergence speed than the classical Jacobi-like method with no performance loss. In addition, there are almost no obvious impacts of the channel order and initialization values on the convergence speed. 相似文献