首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
夏秀渝  何培宇 《声学学报》2013,38(2):224-230
针对欠定卷积混合的语音信号模型,提出一种基于声源方位信息和非线性时频掩蔽的语音盲提取算法。首先对低频段混合语音信号进行时频分析估计瞬时相对时延(ITD)并采用势函数聚类分析方法估计出声源个数及其ITD,接着锁定目标提取准确的目标语音方位信息,最后利用独立语音在时频域上的近似W一分离正交性,采用非线性时频掩蔽的方法提取目标语音。仿真实验表明,该方法能锁定任意感兴趣目标方位,能有效提取目标语音,文中实验条件下信噪比增益平均达9.5 dB。  相似文献   

2.
本文针对FIR非线性混合模型,基于最大熵算法,提出了一种以高斯混合模式概率密度函数估计替代传统对数化概率密度估计的盲分离算法,以偶函数为非线性激活函数,采用最大期望(EM)迭代算法推导了分离算法的权向量迭代公式,通过模拟仿真实验结果与传统的最大熵和高阶累积量方法比较,新算法提高了收敛速度,并有效地完成了非线性语音分离任务,抑制了干扰语音信号的影响,提高了输出信噪比。  相似文献   

3.
采用时反和时频差分OFDM的水声语音通信方法   总被引:1,自引:0,他引:1       下载免费PDF全文
周跃海  江伟华  陈磊  童峰 《应用声学》2015,34(4):283-290
针对水声信道多径、时变、多普勒等恶劣传输特点对水声语音通信的严重影响,本文采用多通道时间反转和时频差分OFDM进行水声语音通信技术方案设计,该方法首先通过多通道时间反转进行时间域和空间域多径聚焦,进而结合时频差分OFDM调制解调抑制残留多径的影响。由于无需采用信道估计和均衡算法,系统实现方便、复杂度低,同时对信道具有一定程度的稳健性。该方法语音压缩编码采用混合激励线性预测编码。仿真实验和海试实验表明了本文方案的有效性。  相似文献   

4.
周毅  徐柏龄 《声学学报》2002,27(3):241-248
就一种基于非线性累加和的信号盲分离方法作了探讨。首先,文中针对方法中非线性函数特性对信号分离的影响从理论上作了分析,给出了加快迭代收敛的约束条件。接着,将该方法从无卷积混合信号分离的情况推广到混合卷积情形。最后通过数值模拟,给出了信号分离结果。  相似文献   

5.
卷积混迭语音信号的联合块对角化盲分离方法   总被引:1,自引:0,他引:1  
张华  冯大政  庞继勇 《声学学报》2009,34(2):167-174
针对语音信号的卷积混迭模型,利用不同语音信号之间的近似独立和短时平稳特性,提出一种基于信号二阶统计量的联合块对角化方法,解决超定卷积盲分离问题。该方法采用非对角线上各子矩阵 F -范数的平方和作为联合块对角化性能的评判准则,将原四次代价函数转化为一组较为简单的二次子代价函数,每一子代价函数用于估计酉混迭矩阵的一个子矩阵。依次最小化各子函数,迭代搜索代价函数最小点,得到混迭矩阵的估计。理论分析及实验结果表明,所提方法不仅能够达到与类Jacobi经典方法同样好的分离效果,并且具有更低的计算复杂度、更快的收敛速度和对传输信道阶数、迭代初始值不敏感的特点。  相似文献   

6.
本文研究了开放型办公室中平稳噪声掩蔽语音环境下噪声可懂度的客观评价指标与工作效率之间的关系。文章通过对三种客观评价指标:Speech Transmission Index(STI),Perceptually Evaluation of Speech Quality(PESQ)和modified Normalized Covariance Method(mNCM)与专门设计的主观实验结果相对比,得到了该条件下客观评价指标与主观烦扰度和工作效率之间的关系。结果显示,客观评价指标与主观实验结果均具有较高的相关性,说明利用客观评价指标来预测、评估工作效率具有可行性。实验结果还初步揭示了噪声的语言可懂度和工作效率之间的变化规律:在噪声的语言可懂度的中间区域,工作效率变化显著;但噪声的语言可懂度高于一定值以后,工作效率趋于稳定。  相似文献   

7.
基于修正Mel域掩蔽模型和无语音概率的耳语音增强   总被引:1,自引:0,他引:1  
提出了一种基于修正Mel域听觉掩蔽模型和无语音概率的耳语音增强方法。该方法根据耳语音的发音特点对Mel频率进行修正,对每一帧耳语音信号进行Mel域频带滤波,同时通过无语音概率(SAP)动态地确定每个频带的听觉掩蔽阈值,对不同的听觉掩蔽阈值自适应地调整谱减系数来进行耳语音增强。对增强后的耳语音进行客观和主观测试,结果表明,该方法与其它谱减法相比,能将残留噪声和背景噪声控制在人耳掩蔽阈值下,取得更小的语音失真,主观听觉也得到了很大的改善。  相似文献   

8.
基于掩蔽特性的噪声环境下语音识别新特征   总被引:4,自引:1,他引:3  
语音识别系统的识别率在噪声环境中下降很大。本文根据人耳的听觉特性,提出一种基于人耳听觉掩蔽特性的抗噪声特征提取方法。该方法先求取噪声语音的掩蔽特性,在此基础上再计算Mel倒谱系数用于语音识别。通过对TIMIT数据包的 0~9十个英语数字在 NoiseX92的各种噪声下进行了识别试验。其中在信噪比 0dB条件下,在 3种噪声条件下识别率平均提高 152%,实验表明新方法对于各种噪声环境下的识别率有显著提高。  相似文献   

9.
10.
针对目前有监督语音增强忽略了纯净语音、噪声与带噪语音之间的幅度谱相似性对增强效果影响等问题,提出了一种联合精确比值掩蔽(ARM)与深度神经网络(DNN)的语音增强方法。该方法利用纯净语音与带噪语音、噪声与带噪语音的幅度谱归一化互相关系数,设计了一种基于时频域理想比值掩蔽的精确比值掩蔽作为目标掩蔽;然后以纯净语音和噪声幅度谱为训练目标的DNN为基线,通过该DNN的输出来估计目标掩蔽,并对基线DNN和目标掩蔽进行联合优化,增强语音由目标掩蔽从带噪语音中估计得到;此外,考虑到纯净语音与噪声的区分性信息,采用一种区分性训练函数代替均方误差(MSE)函数作为基线DNN的目标函数,以使网络输出更加准确。实验表明,区分性训练函数提升了基线DNN以及整个联合优化网络的增强效果;在匹配噪声和不匹配噪声下,相比于其它常见DNN方法,本文方法取得了更高的平均客观语音质量评估(PESQ)和短时客观可懂度(STOI),增强后的语音保留了更多语音成分,同时对噪声的抑制效果更加明显。  相似文献   

11.
Aim at the underdetermined convolutive mixture model, a blind speech source separation method based on nonlinear time-frequency masking was proposed, where the approximate W-disjoint orthogonality (W-DO) property among independent speech signals in time-frequency domain is utilized. In this method, the observation mixture signal from multimicrophones is normalized to be independent of frequency in the time-frequency domain at first, then the dynamic clustering algorithm is adopted to obtain the active source information in each time-frequency slot, a nonlinear function via deflection angle from the cluster center is selected for time-frequency masking, finally the blind separation of mixture speech signals can be achieved by inverse STFT (short-time Fourier transformation). This method can not only solve the problem of frequency permutation which may be met in most classic frequency-domain blind separation techniques, but also suppress the spatial direction diffusion of the separation matrix. The simulation results demonstrate that the proposed separation method is better than the typical BLUES method, the signal-noise-ratio gain (SNRG) increases 1.58 dB averagely.  相似文献   

12.
A blind speech source separation method for the overdetermined convolutive mixture model in time-domain is proposed via joint block-diagonalization based on the mutual- independence and short-time stationarity properties of the speech signals. Taking the sum of the F-norms of all off-diagonal sub-matrices as a criterion, a novel joint block-diagonalization method is proposed to estimate the whole mixture matrix through minimizing a sequence of quadratic sub-functions corresponding to mixture sub-matrices. Both theoretical analysis and simulations show that the proposed method has much lower complexity and faster convergence speed than the classical Jacobi-like method with no performance loss. In addition, there are almost no obvious impacts of the channel order and initialization values on the convergence speed.  相似文献   

13.
针对以往语音增强算法在非平稳噪声环境下性能急剧下降的问题,基于时频字典学习方法提出了一种新的单通道语音增强算法。首先,提出采用时频字典学习方法对噪声的频谱结构的先验信息进行建模,并将其融入到卷积非负矩阵分解的框架下;然后,在固定噪声时频字典情况下,推导了时变增益和语音时频字典的乘性迭代求解公式;最后,利用该迭代公式更新语音和噪声的时变增益系数以及语音的时频字典,通过语音时频字典和时变增益的卷积运算重构出语音的幅度谱并用二值时频掩蔽方法消除噪声干扰。实验结果表明,在多项语音质量评价指标上,本文算法都取得了更好的结果。在非平稳噪声和低信噪比环境下,相比于多带谱减法和非负稀疏编码去噪算法,本文算法更有效地消除了噪声,增强后的语音具有更好的质量。  相似文献   

14.
A time-frequency dictionary learning approach is proposed to enhance speech contaminated by additive nonstationary noise.In this framework,a time-frequency dictionary which is learned from noise data is incorporated into the convolutive nonnegative matrix factorization framework.The update rules for the time-varying gains and speech dictionary are derived by precomputing the noise dictionary.The magnitude spectra of speech are estimated using convolution operation between the learned speech dictionary and the time-varying gains. Finally,noise is removed via binary time-frequency masking.The experimental results indicate that the proposed scheme gives better enhancement results in terms of quality measures of speech.Moreover,the proposed algorithm outperforms the multiband spectra subtraction and the non-negative sparse coding based noise reduction algorithm in nonstationary noise conditions.  相似文献   

15.
主观空间分离下的汉语信息掩蔽效应   总被引:1,自引:0,他引:1  
基于听觉优先效应中的融合现象,探讨了主观空间分离下的汉语信息掩蔽效应。实验用左右两个扬声器来播放目标言语信号和掩蔽声音,并通过改变两个扬声器之间的延迟来操作掩蔽声音的主观空间位置。结果显示,尽管言语信号和掩蔽声音都由同样的扬声器播放而没有实际的空间分离,这种利用优先效应所产生的主观空间分离却可以提高言语识别的正确率。在信息掩蔽条件下由主观空间分离所造成的言语识别的改善显著地高于在能量掩蔽条件下的改善。这些结果为如何分离对言语信号的能量掩蔽与信息掩蔽,以及为相关的建筑声学和通讯技术的研究与应用提供了听觉心理学的参考。  相似文献   

16.
Blind source separation of two electromagnetic fields is investigated. The difficulty of this task lies in the fact that only the power, which is the square of the sum of the electromagnetic fields, can be directly measured; the cross term of the electromagnetic fields is inevitable, and a strong correlation occurs in blind deconvolution. However, the relative phase is physically different from the field intensities, and, hence, extracting the phase during separation seems inconceivable. Our results demonstrate that the intensities and the relative phase of two electromagnetic waves can be determined with eigenvalue problem formalism even when the mixing processes are completely unknown.  相似文献   

17.
陈健  陆佶人 《声学学报》2002,27(5):477-481
噪声背景下应用盲分离技术恢复源信号是盲信号处理的难点之一,本文主要研究了双输入时延有噪混合模型的盲分离方法,和传统的盲分离算法相比,该方法可以有效地利用多阵元的观测信号,对加性噪声具有相当的抑制作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号