首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
多通路声重放系统能够增强听者的现实感与空间感,但在免提通信条件下,其不可避免会受到噪声和回声干扰,严重影响通信质量。针对上述问题,本文提出了一种基于门控卷积循环神经网络的多通路声学回声消除和噪声抑制方法。该方法以传声器接收信号和重放声道的压缩复数谱为网络输入,以近端语音的压缩复数谱为网络的输出目标,直接从传声器拾取信号中恢复近端纯净语音,无需对声重放信号进行去相关处理,解决了传统自适应滤波方法中存在的非唯一解问题,同时保证了多通路声重放质量。仿真和真实声学环境实验均表明本文所提出的方法可显著消除多通路声重放系统的噪声和回声,在语音质量和回声返回衰减增益方面均优于传统算法。  相似文献   

2.
尽管信号子空间方法在语音增强中的应用已经得到了广泛的研究,但是作为制约子空间方法性能的子空间维度估计却一直没有得到较好的解决.针对子空间维度估计问题,本文用多通道语音信号互功率谱矩阵的F范数的统计模型来描述语音信号的先验知识和变化规律,提出了一种基于最大化原则的子空间维度估计方法,在接受原假设的前提下最大化子空间维度.实验证明,在客观语音质量评估和主观测评中,所提算法都取得了更好的结果.与传统方法相比,采用本文方法的多通道语音增强算法可在房间回声、低信噪比等恶劣环境下获得更高的噪声消除和更低的语音畸变.  相似文献   

3.
严馨叶  邱小军  卢晶 《应用声学》2014,33(4):313-323
用于免提通信设备的语音增强算法一直是研究的热点问题,而算法处理结果的音质问题近年来也备受关注。针对基于双传声器降噪的蓝牙耳机系统,将常用多通道传声器降噪算法归纳为基于相干函数法和基于空间预分离法这两大类进行分析和比较。基于相干函数法利用两个通道间信号的相干函数对含噪信号滤波达到降噪目的,而基于空间预分离法利用空间特性从含噪信号中分离出噪声参考信号来消除噪声。分析基于降噪量、语音音质和综合性能三个指标,从约束语音损伤的角度分析最优解的形式,并对比两类算法的实际性能。结果表明选择合适的算法可权衡降噪量与语音损伤,达到较好的综合性能。  相似文献   

4.
王全东  郭良浩  闫超 《应用声学》2019,38(6):1004-1014
针对干扰或噪声环境下水声目标信号难以获取的问题,该文提出研究基于深度神经网络的自适应水声被动信号波形恢复方法。在单阵元情况下,该方法提取对数功率谱特征作为输入,采用深度神经网络回归模型自适应学习目标信号的自身特征,输出降噪后的对数功率谱特征并还原时域波形。在多阵元情况下,提出阵列深度神经网络降噪方法,将部分或全部阵元特征拼接为长向量作为输入,从而利用空域信息。为全面利用阵列丰富的时频域信息,该文提出一种两阶段特征融合深度神经网络,在第一阶段将阵列分为若干个子阵,将每个子阵分别用阵列深度神经网络进行处理,在第二阶段将第一阶段的各子阵处理结果与阵列接收信号同时输入一个深度神经网络进行融合学习。实验表明,所提出的单阵元和两阶段融合深度神经网络取得了显著优于常规波束形成的恢复结果,能够准确估计目标信号波形和功率并显著提高输出信噪比。  相似文献   

5.
程宁  刘文举 《声学学报》2009,34(6):554-565
针对信号子空间语音增强算法中的子空间选择和线性滤波器中噪声功率谱和拉格朗日乘子的估计问题,用高斯、拉普拉斯和伽玛模型描述了语音的分布,提出了利用目标语音概率最大化来确定信号子空间维度的方法。在噪声子空间上,利用条件概率估计出噪声功率谱。接着,为了合理地折中增强语音中的残余噪声和语音畸变,提出了一种基于人耳听觉掩蔽效应的拉格朗日乘子估计方法。实验证明,在多项语音质量评价指标上,所提算法都取得了更好的结果。所提的信号子空间算法比传统的信号子空间算法更有效地消除了噪声,使得恢复的语音具有更好的质量。   相似文献   

6.
基于卡尔曼滤波的低复杂度去混响算法*   总被引:1,自引:1,他引:0       下载免费PDF全文
齐园蕾  杨飞然  杨军 《应用声学》2018,37(4):559-566
在电话会议、智能音箱等应用场景下,传声器往往处在声源的远场。混响信号的存在会掩蔽后续到达的直达声信号,降低传声器接收信号的语音质量,以及语音识别系统的准确识别率。多通道线性预测算法是一种经典的盲去混响算法,但该算法往往具有较高的计算复杂度。本文提出了一种简化的卡尔曼滤波更新算法,通过对角化卡尔曼滤波器状态向量误差协方差矩阵,降低了自适应多通道线性预测去混响算法的复杂度。通过与现有分块对角简化算法对比发现,本文提出的简化算法在保证语音质量的同时,进一步降低了原卡尔曼滤波算法的复杂度。  相似文献   

7.
传统的船舶辐射噪声基频检测方法不仅依赖大量的先验知识,而且对背景噪声非常敏感。为了提高目标识别的稳定性和精确性,本文提出了一种基于深度神经网络的基频检测算法。首先从多通道水听器信号中提取DEMON谱,然后直接将二维谱特征矩阵输入由CNN和LSTM构成的级联网络,最后通过稠密层输出实现对基频的估计。从仿真和外场试验数据得到如下结论:(1)深度网络能够实现无先验知识和不同信噪比条件下的基频检测,具有良好的泛化性能。(2)LSTM网络能够高效地从时序DEMON谱中提取统计特征,提高基频估计精度。(3)输入信号的时间长短会影响网络的检测精度,更长时间的信号能够获得更好的检测结果。  相似文献   

8.
传感器网络基于特征值分解的信号被动定位技术   总被引:3,自引:0,他引:3       下载免费PDF全文
郝本建  李赞  万鹏武  司江勃 《物理学报》2014,63(5):54304-054304
基于传感器网络的信号被动定位技术在电磁学、声学、声呐系统以及传热学等领域具有广泛的应用前景,当传感器网络节点所接收噪声强度不同或传输信道存在阴影衰落效应时,给出了目标信号到达距离比定位关联度量的估计方法与基于信号到达距离比的被动定位算法.将特征值分解技术引入到信号到达距离比定位关联度量估计中,通过接收信号协方差矩阵特征值分解技术估计各节点所接收噪声强度,并通过网络参考节点轮换与特征值分解方法消除阴影衰落效应所引入的定位误差,最后给出该算法的最小二乘定位解.该方法可较好的消除由于节点接收噪声强度不同以及阴影衰落效应等因素所带来的定位性能恶化.  相似文献   

9.
将一种新颖的迭代算法用于消除语音信号中非目标话者的语音干扰。一个简单的双传声器系统被用来采集混合语音,形成迭代维纳滤波器的主通道信号和参考信号。算法的关键在于提出差分相位相关准则(DPCF)控制造代过程的收敛,并根据话者状态多类判决实时更新滤波器以自动适应声学环境.实验表明,迭代算法不断的消除主通道中的干扰话音直到准则函数判断收敛.客观语音评价和非正式的试听评价表明系统在达到收敛的同时,目标语音也达到最佳的语音质量,清晰度令人满意。  相似文献   

10.
浅海大孔径水平阵信号估计近端射的低频声源方位时, 常规波束形成会产生明显的波束偏移和分裂现象, 从而造成单声源方位估计偏差。针对这一问题, 提出一种基于块稀疏压缩感知的声源方位估计方法。根据简正模理论, 将水平阵接收声场表示为方位角空间的块稀疏信号模型, 并通过块正交匹配追踪算法进行方位估计。仿真和2011年北黄海实验数据结果表明所提块正交匹配追踪方法可实现浅海波导环境下低频近端射的单个声源方位的准确估计。  相似文献   

11.
周翊  郑成诗  李晓东 《声学学报》2010,35(2):223-229
立体声声学回波消除的梯度法格梯形算法对脉冲干扰不具鲁棒性。针对这个问题,引入了鲁棒M-估计方法,并从理论上予以了论证。由此产生的双通道M-估计梯度法格梯形算法具有显著提升的抗脉冲干扰鲁棒稳定性,从而也具有了更高的实际应用价值。   相似文献   

12.
The multisignal minimum-cross-entropy spectral analysis (multisignal MCESA) is applied to the problem of separating the speech signals of two talkers speaking simultaneously on a single channel, e.g., when two talkers use a single microphone. A new two-stage approach to the problem is proposed in which a spectral separator is followed by a spectral tailoring procedure. The spectral separator produces an initial estimate of the speech spectrum for each talker. Then the spectral tailoring procedure employs the multisignal MCESA technique to adjust the initial spectral estimates to account for the characteristics of the known cochannel composite speech signal. The research emphasis is placed on the implementation and evaluation of the spectral tailoring procedure, i.e., the use of the multisignal MCESA in the proposed scheme. Its usefulness is evaluated and validated by listening tests and by comparing the spectral distortions of the estimated voices before and after the multisignal MCESA processing.  相似文献   

13.
In this paper, an effective post-filter structure for subband-based acoustic echo cancellation (SAEC) is proposed. Compared with the current subband-based post-filters, the proposed one can more consistently suppress the background noise, as well as the residual echoes. To reduce the effects of the distortion of the near-end speech, two alternative modified versions of the post-filter are proposed, which guarantees the quality of speech communications. The proposed post-filters are seamlessly combined with the subband-based AEC system with quite small computational burden. The instrumental evaluation and listening test both demonstrate the superiority of the post-filters.  相似文献   

14.
为了克服低信噪比输入下,语音增强造成语音清音中的弱分量损失,造成重构信号包络失真的问题。论文提出了一种新的语音增强方法。该方法根据语音感知模型,采用不完全小波包分解拟合语音临界频带,并对语音按子带能量进行清浊音区分处理,在阈值计算上,提出了一种清浊音分离,基于子带信号能量的小波包自适应阈值算法。通过仿真实验,客观评测和听音测试表明,该算法在低信噪比输入时较传统算法,能够更加有效地减少重构信号包络失真,在不损伤语音清晰度和自然度的前提下,使输出信噪比明显提高。将该算法与能量谱减法结合,进行二次增强能进一步提高降噪输出的语音质量。  相似文献   

15.
结合幅度谱和功率谱字典的语音增强方法   总被引:1,自引:0,他引:1       下载免费PDF全文
从双路字典学习、噪声功率谱估计、语音幅度谱重构角度提出了一种改进的谱特征稀疏表示语音增强方法.在字典学习阶段,融合功率谱与幅度谱特征,采用区分性字典降低语音字典和噪声字典的相干性;在语音增强阶段,提出一种噪声功率谱估计方法对非平稳噪声进行跟踪估计;考虑到幅度谱和功率谱特征对不同噪声的适应程度不同,设计了语音重构权值表....  相似文献   

16.
A blind method for suppressing late reverberation from speech and audio signals is presented. The proposed technique operates both on the spectral and on the sub-band domains employing a single input channel. At first, a preliminary rough clean signal estimation is required and for this, any standard technique may be applied; however here the estimate is obtained through spectral subtraction. Then, an auditory masking model is employed in sub-bands to extract the reverberation masking index (RMI) which identifies signal regions with perceived alterations due to late reverberation. Utilizing a selective signal processing technique only these regions are suppressed through sub-band temporal envelope filtering based on analytical expressions. Objective and subjective measures indicate that the proposed method achieves significant late reverberation suppression for both speech and music signals over a wide range of reverberation time (RT) scenarios.  相似文献   

17.
如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规律来构造相应的字典,再对带噪语音信号进行投影以估计出干净语音信号。针对训练样本与测试数据不匹配的情况,有监督类的非负矩阵分解方法与基于统计模型的传统语音增强方法相结合,在增强阶段对语音字典和噪声字典进行更新,从而估计出干净语音信号。本文首先介绍了单通道情况下语音增强的信号模型,然后对4种典型的增强方法进行了阐述,最后对未来可能的研究热点进行了展望。  相似文献   

18.
An algorithm for blind estimation of reverberation time (RT) in speech signals is proposed. Analysis is restricted to the free-decaying regions of the signal, where the reverberation effect dominates, yielding a more accurate RT estimate at a reduced computational cost. A spectral decomposition is performed on the reverberant signal and partial RT estimates are determined in all signal subbands, providing more data to the statistical-analysis stage of the algorithm, which yields the final RT estimate. Algorithm performance is assessed using two distinct speech databases, achieving 91% and 97% correlation with the RTs measured by a standard nonblind method, indicating that the proposed method blindly estimates the RT in a reliable and consistent manner.  相似文献   

19.
语音质量的客观评价可以代替昂贵的人工评分,但是目前客观指标的计算通常需要纯净的参考语音,这在许多实际声学系统中很难获得。为此提出了一种融合辅助目标学习和卷积循环网络(CRN)的非侵入式语音质量评价算法。为降低算法的复杂度,算法采用基于仿人耳听觉特性滤波器的Bark频率倒谱系数(BFCCs)作为CRN的输入。算法首先构建一个卷积神经网络(CNN)从BFCCs中提取帧级特征。然后,构建双向的长短记忆网络,在帧级特征中建模长期的时间依赖性和序列特征。最后,利用自注意力机制自适应地从帧级特征中筛选出有用信息,将其整合至话语层面的特征中,并将这些话语级特征映射为客观得分。为改善质量评测的有效性,算法采用多任务训练策略,引入语音激活检测(VAD)作为辅助学习目标。基于开源数据库的实验显示,与其他非侵入式算法相比,提出的算法和平均主观意见分(MOS)具有更好的相关性。而且,算法参数规模较小且对ITU-T P.808发布的带有主观MOS的失真语音数据库具有良好的泛化能力,接近语音质量感知评估(PESQ)指标的精度。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号