共查询到9条相似文献,搜索用时 31 毫秒
1.
提出人耳掩蔽效应与■阶STSA-MMSE(Short Time Spectral Amplitude-Minimum Mean SquareError)算法动态结合的语音增强算法.该算法通过引入参量■提高了STSA-MMSE算法的实时性,同时结合人耳掩蔽效应,动态的确定增强滤波器的传递函数以适应语音信号的变化,来提高语音质量.实验结果表明,和STSA-MMSE算法相比,该算法在实时性方面有很大改善,并使降噪后的语音信号有较小的失真,同时很好地抑制了音乐噪音. 相似文献
2.
提出人耳掩蔽效应与ω阶STSA—MMSE(Short Time Spectral Amplitude—Minimum Mean Square Error)算法动态结合的语音增强算法.该算法通过引入参量面提高了STSA—MMSE算法的实时性,同时结合人耳掩蔽效应,动态的确定增强滤波器的传递函数以适应语音信号的变化,来提高语音质量.实验结果表明,和STSA—MMSE算法相比,该算法在实时性方面有很大改善,并使降噪后的语音信号有较小的失真,同时很好地抑制了音乐噪音. 相似文献
3.
提出人耳掩蔽效应与阶STSA- MMSE(Short Time Spectral Amplitude-Minimum Mean Square Error)算法动态结合的语音增强算法.该算法通过引入参量提高了STSA-MMSE 算法的实时性,同时结合人耳掩蔽效应,动态的确定增强滤波器的传递函数以适应语音信号的变化,来提高语音质量.实验结果表明,和STSA-MMSE 算法相比,该算法在实时性方面有很大改善,并使降噪后的语音信号有较小的失真,同时很好地抑制了音乐噪音. 相似文献
4.
为了在噪声抑制和语音失真中之间寻找最佳平衡,提出了一种听觉频域掩蔽效应的自适应β阶贝叶斯感知估计语音增强算法,以期提高语音增强的综合性能。算法利用了人耳的听觉掩蔽效应,根据计算得到的频域掩蔽阈自适应调整β阶贝叶斯感知估计语音增强算法中的β值,从而仅将噪声抑制在掩蔽阈之下,保留较多的语音信息,降低语音失真。并分别用客观和主观评价方式,对所提出的算法的性能进行了评估,并与原来基于信噪比的自适应β阶贝叶斯感知估计语音增强算法进行了比较。结果表明,频域掩蔽的β阶贝叶斯感知估计方法的综合客观评价结果在信噪比为-10 dB至5 dB之间时均高于基于信噪比的自适应β阶贝叶斯感知估计语音增强算法。主观评价结果也表明频域掩蔽的β阶贝叶斯感知估计方法能在尽量保留语音信息的同时,较好的抑制背景噪声。 相似文献
5.
噪声估计的准确性直接影响语音增强算法的好坏,为提升当前语音增强算法的噪声抑制效果,有效求解无约束优化问题,提出一种联合深度神经网络(DNN)和凸优化的时频掩蔽优化算法进行单通道语音增强。首先,提取带噪语音的能量谱作为DNN的输入特征;接着,将噪声与带噪语音的频带内互相关系数(ICC Factor)作为DNN的训练目标;然后,利用DNN模型得到的互相关系数构造凸优化的目标函数;最后,联合DNN和凸优化,利用新混合共轭梯度法迭代处理初始掩蔽,通过新的掩蔽合成增强语音。仿真实验表明,在不同背景噪声的低信噪比下,相比改进前,新的掩蔽使增强语音获得了更好的对数谱距离(LSD)、主观语音质量(PESQ)、短时客观可懂度(STOI)和分段信噪比(segSNR)指标,提升了语音的整体质量并且可以有效抑制噪声。 相似文献
6.
针对目前有监督语音增强忽略了纯净语音、噪声与带噪语音之间的幅度谱相似性对增强效果影响等问题,提出了一种联合精确比值掩蔽(ARM)与深度神经网络(DNN)的语音增强方法。该方法利用纯净语音与带噪语音、噪声与带噪语音的幅度谱归一化互相关系数,设计了一种基于时频域理想比值掩蔽的精确比值掩蔽作为目标掩蔽;然后以纯净语音和噪声幅度谱为训练目标的DNN为基线,通过该DNN的输出来估计目标掩蔽,并对基线DNN和目标掩蔽进行联合优化,增强语音由目标掩蔽从带噪语音中估计得到;此外,考虑到纯净语音与噪声的区分性信息,采用一种区分性训练函数代替均方误差(MSE)函数作为基线DNN的目标函数,以使网络输出更加准确。实验表明,区分性训练函数提升了基线DNN以及整个联合优化网络的增强效果;在匹配噪声和不匹配噪声下,相比于其它常见DNN方法,本文方法取得了更高的平均客观语音质量评估(PESQ)和短时客观可懂度(STOI),增强后的语音保留了更多语音成分,同时对噪声的抑制效果更加明显。 相似文献
7.
基于双向搜索方法的最小值控制递归平均语音增强算法 总被引:4,自引:0,他引:4
语音增强效果的提高,有赖于对噪声的准确估计和对噪声变化的及时跟踪与更新。为了提高对非平稳噪声的估计和更新能力,本文基于\ 相似文献
8.
如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规律来构造相应的字典,再对带噪语音信号进行投影以估计出干净语音信号。针对训练样本与测试数据不匹配的情况,有监督类的非负矩阵分解方法与基于统计模型的传统语音增强方法相结合,在增强阶段对语音字典和噪声字典进行更新,从而估计出干净语音信号。本文首先介绍了单通道情况下语音增强的信号模型,然后对4种典型的增强方法进行了阐述,最后对未来可能的研究热点进行了展望。 相似文献