首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
在波形网络中融合相位信息的骨导语音增强   总被引:3,自引:0,他引:3       下载免费PDF全文
已有骨导语音增强算法重点关注语音幅度谱增强,在波形合成时会因为相位不匹配导致语音质量下降.为解决该问题,提出了一种融合相位信息的波形网络(WaveNet)模型实现骨导语音增强波形生成.该方法以频带扩展WaveNet为基础,融合骨导语音相位谱信息与增强的语音幅度谱作为模型的条件特征,根据融合特征生成增强语音波形,实现了相...  相似文献   

2.
针对现有基于字典学习的增强算法需要先验信息、不易实时处理的问题,提出一种便于实时处理的无监督的单通道语音增强算法。首先,该算法将无监督条件下背景噪声的建模问题转化为带噪语音幅度谱的稀疏低秩噪声分解;然后,采用增量非负子空间方法对背景噪声进行在线字典学习,获得能够体现背景噪声时变特性的自适应噪声字典;最后,利用所得的噪声字典,采用易于实时处理的逐帧迭代方式,对带噪语音进行处理。实验结果表明:相较于多带谱减法和基于低秩稀疏矩阵分解的增强算法,所提算法在噪声抑制方面的性能尤为显著,在多项性能评价指标上,均表现出更好的结果。  相似文献   

3.
李轶南  张雄伟  贾冲  陈亮  曾理 《声学学报》2015,40(4):607-614
针对现有基于字典学习的增强算法需要先验信息、不易实时处理的问题,提出一种便于实时处理的无监督的单通道语音增强算法。首先,该算法将无监督条件下背景噪声的建模问题转化为带噪语音幅度谱的稀疏低秩噪声分解;然后,采用增量非负子空间方法对背景噪声进行在线字典学习,获得能够体现背景噪声时变特性的自适应噪声字典;最后,利用所得的噪声字典,采用易于实时处理的逐帧迭代方式,对带噪语音进行处理。实验结果表明:相较于多带谱减法和基于低秩稀疏矩阵分解的增强算法,所提算法在噪声抑制方面的性能尤为显著,在多项性能评价指标上,均表现出更好的结果。   相似文献   

4.
对双门限法、频带方差法、信息熵法三种端点检测方法进行了比较研究。仿真实验表明在信噪比较高的情况下,各算法都能较好检测语音端点,但随着信噪比的下降,各算法性能都明显下降。但三者相比较而言,信息熵法具有更好的鲁棒性。  相似文献   

5.
田玉静  左红伟  王超 《应用声学》2020,39(6):932-939
语音通信系统中,语音通过信道传输将不可避免地引入码间串扰和信号畸变,同时受到噪声污染。本文在分析自适应盲均衡算法CMA(constant modulus algorithm)和改进盲均衡算法的基础上,考虑到自适应盲均衡技术在语音噪声控制方面能力有限,将自适应盲均衡技术与小波包掩蔽阈值降噪算法联合使用,形成一种基带语音增强新方法。仿真试验结果显示自适应盲均衡技术可以使星座图变得清晰而紧凑,有效减小误码率。研究证实该方法在语音信号ISI和畸变严重情况下,在白噪及有色噪声不同的噪声环境中都具有稳定的降噪能力,消噪同时可获得汉语普通话良好的听觉效果。  相似文献   

6.
联合深度神经网络和凸优化的单通道语音增强算法   总被引:1,自引:1,他引:0       下载免费PDF全文
噪声估计的准确性直接影响语音增强算法的好坏,为提升当前语音增强算法的噪声抑制效果,有效求解无约束优化问题,提出一种联合深度神经网络(DNN)和凸优化的时频掩蔽优化算法进行单通道语音增强。首先,提取带噪语音的能量谱作为DNN的输入特征;接着,将噪声与带噪语音的频带内互相关系数(ICC Factor)作为DNN的训练目标;然后,利用DNN模型得到的互相关系数构造凸优化的目标函数;最后,联合DNN和凸优化,利用新混合共轭梯度法迭代处理初始掩蔽,通过新的掩蔽合成增强语音。仿真实验表明,在不同背景噪声的低信噪比下,相比改进前,新的掩蔽使增强语音获得了更好的对数谱距离(LSD)、主观语音质量(PESQ)、短时客观可懂度(STOI)和分段信噪比(segSNR)指标,提升了语音的整体质量并且可以有效抑制噪声。   相似文献   

7.
针对含噪语音难以实现有效的语音转换,本文提出了一种采用联合字典优化的噪声鲁棒性语音转换算法。在联合字典的构成中,语音字典采用后向剔除算法(Backward Elimination algorithm,BE)进行优化,同时引入噪声字典,使得含噪语音与联合字典相匹配。实验结果表明,在保证转换效果的前提下,后向剔除算法能够减少字典帧数,降低计算量。在低信噪比和多种噪声环境下,本文算法与传统NMF算法和基于谱减法消噪的NMF转换算法相比具有更好的转换效果,噪声字典的引入提升了语音转换系统的噪声鲁棒性。   相似文献   

8.
近年来大量全卷积网络、U-Net等编解码网络结构应用于语音增强,它们具有计算复杂度低、模型参数少等优势。然而,与长短时记忆模型等方法相比,这些编解码结构仍存在不能充分利用先后时间之间和高低频率之间的关联信息等缺点,尤其对于长序列数据的输入,编解码结构存在信息丢失的问题。为保持计算效率的同时考虑更充分的时频关联信息建模,本文提出一种融合注意力机制的U-Net网络的骨导语音增强方法(Att-U-Net),通过在跳跃连接中引入注意力机制,生成一个权重矩阵,将编码层中的全局信息根据权重融入对应的解码层中,使网络在编解码过程中能够关注输入数据中与增强目标相关程度高的重要信息,同时抑制不相关的信息。在骨导语音数据集上的实验表明,融合注意力机制的U-Net网络能在保持模型轻量化的同时有效提升骨导语音的增强效果,增强后的语音在各项客观评价指标上均优于基线模型。通过对编解码网络中间层的可视化分析发现,在解码过程中注意力机制有效地保留了有声段的信息,滤除了骨导语音由于骨导传声特性带来的中频共振,从而使得增强后的骨导语音具有较好的听觉效果。  相似文献   

9.
提出了一种滑动窗累积量的递推估计算法并应用于语音端点检测中,用以解决传统端点检测方法在噪声环境下检测性能变差的问题。在对含噪语音信号进行加窗之后,利用滑动窗累积量的递推估计算法估计含噪语音信号的高阶累积量值,并在此基础上结合能量特征进行语音端点检测。实验结果表明,所提滑动窗累积量递推估计算法相比较传统高阶累积量计算方法运算效率明显提高;所提端点检测算法在不同噪声和信噪比环境下相比较G.729b算法点正确率Pc-point值平均提升了6.07%。基于滑动窗高阶累积量的语音端点检测算法具有较高的运算效率及良好的鲁棒性。   相似文献   

10.
提出了一种滑动窗累积量的递推估计算法并应用于语音端点检测中,用以解决传统端点检测方法在噪声环境下检测性能变差的问题。在对含噪语音信号进行加窗之后,利用滑动窗累积量的递推估计算法估计含噪语音信号的高阶累积量值,并在此基础上结合能量特征进行语音端点检测。实验结果表明,所提滑动窗累积量递推估计算法相比较传统高阶累积量计算方法运算效率明显提高;所提端点检测算法在不同噪声和信噪比环境下相比较G.729b算法点正确率Pc-point值平均提升了6.07%。基于滑动窗高阶累积量的语音端点检测算法具有较高的运算效率及良好的鲁棒性。  相似文献   

11.
蒋海军  刘文  刘朝晖 《光子学报》2007,36(11):2168-2171
提出一种红外弱小多目标图像分割方法,用一个回形窗口和对比度阈值分割图像.对天空背景下低信噪比的红外弱小多目标图像序列能够有效的分割,抑制噪音干扰.将该方法与传统的图像分割方法做了比较,并对用不同阈值,不同窗口分割时的分割结果进行了分析.实验表明,该算法在执行效率和检测概率上能够取得满意的结果.  相似文献   

12.
In this paper, a new region growing method to achieve the accurate and complete segmentation of the moving objects is introduced. Firstly, the ideal seeds of every moving object are extracted based on “hole” effect of temporal difference. Secondly, on the basis of the consideration that human vision system is most sensitive to the local contrast between targets and surrounding, we proposed a metric for “good” infrared target segmentation based on human vision perception. And according to this metric, a search method based on fine and rough adjustment is applied to determine the best growing threshold for moving objects. The segmented mask of every moving object is grown from the relevant seeds with the best growing threshold. At last, the segmented masks of all moving objects are merged into a complete segmented mask. Experimental results show that the proposed method is superior and effective on segmentation of infrared moving object.  相似文献   

13.
李伟  张硕 《光子学报》2014,40(7):1046-1050
球栅阵列封装焊点的射线图像具有信噪比差、背景不均匀等特点,故传统的阈值分割方法无法将目标焊点与背景图像很好的分割.本文通过对球栅阵列封装焊点射线图像直方图的分析,利用了自适应维纳滤波对阈值分割前的图像进行了预处理.根据图像的差异来调整该滤波器的参量,对局部差异大的地方进行小的平滑操作,对局部差异小的地方进行大的平滑操作.在最大类间方差法的基础上,对分割后的图像进行了进一步的分析并提出了改进的二次分割方法.改进的方法为并不直接通过OTSU法进行二值化处理来去除背景,而是在阈值分割得到的两个灰度级内通过计算中值和统计最大灰度像素的方法得到了更优化的阈值,使得去除背景后的焊点图像整体更加清晰和均匀.在背景灰度级内寻找了一个合适的灰度级作为处理后的灰度图像新背景,实验证明该方法明显改进了传统最大类间方差法对球栅阵列封装焊点射线图像的阈值分割效果.  相似文献   

14.
Hong Fan 《中国物理 B》2021,30(7):78703-078703
To solve the problem that the magnetic resonance (MR) image has weak boundaries, large amount of information, and low signal-to-noise ratio, we propose an image segmentation method based on the multi-resolution Markov random field (MRMRF) model. The algorithm uses undecimated dual-tree complex wavelet transformation to transform the image into multiple scales. The transformed low-frequency scale histogram is used to improve the initial clustering center of the K-means algorithm, and then other cluster centers are selected according to the maximum distance rule to obtain the coarse-scale segmentation. The results are then segmented by the improved MRMRF model. In order to solve the problem of fuzzy edge segmentation caused by the gray level inhomogeneity of MR image segmentation under the MRMRF model, it is proposed to introduce variable weight parameters in the segmentation process of each scale. Furthermore, the final segmentation results are optimized. We name this algorithm the variable-weight multi-resolution Markov random field (VWMRMRF). The simulation and clinical MR image segmentation verification show that the VWMRMRF algorithm has high segmentation accuracy and robustness, and can accurately and stably achieve low signal-to-noise ratio, weak boundary MR image segmentation.  相似文献   

15.
贺福强  罗红  姚学练  平安 《应用光学》2020,41(3):508-515
针对光照不均、多种复杂背景并存的工况下,采用传统阈值分割方法难以有效将露筋与背景分开的问题,提出了基于局部图像分割与多特征滤波的自适应桥梁露筋检测算法。首先,将灰度图像的灰度值进行投影并寻找露筋在投影图上形成的波谷及其坐标;其次,以波谷坐标为中心设置分割范围对灰度图进行行和列的分块,然后对合并行和列分块的灰度图像进行局部阈值分割;最后,基于多特征滤波实现露筋特征的提取。采用该算法对7种常见的露筋进行验证。实验表明:该方法的平均误检率、漏检率和与人工测量的露筋长度相对误差分别为5.15%、3.89%和3.74%,误差符合公路病害评定标准,实现了复杂环境下露筋的自适应识别。  相似文献   

16.
为了克服低信噪比输入下,语音增强造成语音清音中的弱分量损失,造成重构信号包络失真的问题。论文提出了一种新的语音增强方法。该方法根据语音感知模型,采用不完全小波包分解拟合语音临界频带,并对语音按子带能量进行清浊音区分处理,在阈值计算上,提出了一种清浊音分离,基于子带信号能量的小波包自适应阈值算法。通过仿真实验,客观评测和听音测试表明,该算法在低信噪比输入时较传统算法,能够更加有效地减少重构信号包络失真,在不损伤语音清晰度和自然度的前提下,使输出信噪比明显提高。将该算法与能量谱减法结合,进行二次增强能进一步提高降噪输出的语音质量。  相似文献   

17.
传统的HOG算法针对整幅图像进行行人特征提取,大量的非人窗口计算必然降低检测的准确率和效率。为此,提出一种基于OTSU分割和HOG特征的行人检测与跟踪方法。利用OTSU算法以最佳阈值分割图像,在分割区域的基础上进行Canny边缘检测,通过边缘的对称性计算确定行人候选区,继而采用经PCA方法降维后的HOG特征和隐马尔可夫模型对行人候选区进行检测验证。最后,以确定的行人区域为跟踪窗口,利用CamShift算法跟踪行人。多组实验结果证明,本文方法的行人检测效率和精度均有所提高,跟踪性能稳定、可靠。  相似文献   

18.
Image segmentation is a fundamental and challenging problem in the field of computer vision. In this paper, an efficient two-stage image segmentation method is proposed which takes advantage of modified SLIC segmentation and Nyström based spectral clustering. With the modified SLIC approach utilized in the first stage, Nyström based spectral clustering method is used to cluster the segmented regions instead of the pixels in the image to bring the final result. Therefore, the memory requirement and the computational complexity are significantly reduced. To verify the proposed algorithm, it is applied to images of different characters and compared with six other famous image segmentation approaches. Experiment results show the effectiveness and the robustness of the proposed method.  相似文献   

19.
Automatic segmentation and classification of color images is a problem of great practical interest in different areas. This paper presents an algorithm for this purpose which is divided in three steps. Firstly, the regions of interest are isolated from the rest of the image based on threshold functions defined in theYUV andYIQ color spaces, producing a set of connected components. Then, a set of features is computed to enable a quantitative evaluation of the segmented objects. Finally, the image is classified by means of a decision rule based on the analysis of the differences between the computed measures and a set of ideally segmented images, according to experts’ assessment. The algorithm was applied to a decision support tool for estrus detection in cattle. This approach constitutes a valuable alternative to improve this process, as it may replace the visual observation by the automatic analysis of pictures taken to cows in controlled environments. Experimental results show that the segmentations obtained with this method are highly satisfactory and they allow a precise classification of the images with low computational complexity.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号