期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

郑昌艳杨吉斌张雄伟孙蒙《声学学报》2021,46(2):309-320

已有骨导语音增强算法重点关注语音幅度谱增强,在波形合成时会因为相位不匹配导致语音质量下降.为解决该问题,提出了一种融合相位信息的波形网络(WaveNet)模型实现骨导语音增强波形生成.该方法以频带扩展WaveNet为基础,融合骨导语音相位谱信息与增强的语音幅度谱作为模型的条件特征,根据融合特征生成增强语音波形,实现了相... 相似文献

2.

稀疏低秩噪声模型下无监督实时单通道语音增强算法

《声学学报：英文版》2015,(4)

针对现有基于字典学习的增强算法需要先验信息、不易实时处理的问题,提出一种便于实时处理的无监督的单通道语音增强算法。首先,该算法将无监督条件下背景噪声的建模问题转化为带噪语音幅度谱的稀疏低秩噪声分解;然后,采用增量非负子空间方法对背景噪声进行在线字典学习,获得能够体现背景噪声时变特性的自适应噪声字典;最后,利用所得的噪声字典,采用易于实时处理的逐帧迭代方式,对带噪语音进行处理。实验结果表明:相较于多带谱减法和基于低秩稀疏矩阵分解的增强算法,所提算法在噪声抑制方面的性能尤为显著,在多项性能评价指标上,均表现出更好的结果。相似文献

3.

稀疏低秩噪声模型下无监督实时单通道语音增强算法

下载免费PDF全文

李轶南张雄伟贾冲陈亮曾理《声学学报》2015,40(4):607-614

针对现有基于字典学习的增强算法需要先验信息、不易实时处理的问题,提出一种便于实时处理的无监督的单通道语音增强算法。首先,该算法将无监督条件下背景噪声的建模问题转化为带噪语音幅度谱的稀疏低秩噪声分解;然后,采用增量非负子空间方法对背景噪声进行在线字典学习,获得能够体现背景噪声时变特性的自适应噪声字典;最后,利用所得的噪声字典,采用易于实时处理的逐帧迭代方式,对带噪语音进行处理。实验结果表明:相较于多带谱减法和基于低秩稀疏矩阵分解的增强算法,所提算法在噪声抑制方面的性能尤为显著,在多项性能评价指标上,均表现出更好的结果。相似文献

4.

几种语音信号端点检测方法的比较研究

郑建华黄汉明钟明辉曹乃文陈芽玲《广西物理》2007,(4)

对双门限法、频带方差法、信息熵法三种端点检测方法进行了比较研究。仿真实验表明在信噪比较高的情况下,各算法都能较好检测语音端点,但随着信噪比的下降,各算法性能都明显下降。但三者相比较而言,信息熵法具有更好的鲁棒性。相似文献

5.

语音通信降噪研究

下载免费PDF全文

田玉静左红伟王超《应用声学》2020,39(6):932-939

语音通信系统中,语音通过信道传输将不可避免地引入码间串扰和信号畸变,同时受到噪声污染。本文在分析自适应盲均衡算法CMA(constant modulus algorithm）和改进盲均衡算法的基础上,考虑到自适应盲均衡技术在语音噪声控制方面能力有限,将自适应盲均衡技术与小波包掩蔽阈值降噪算法联合使用,形成一种基带语音增强新方法。仿真试验结果显示自适应盲均衡技术可以使星座图变得清晰而紧凑,有效减小误码率。研究证实该方法在语音信号ISI和畸变严重情况下,在白噪及有色噪声不同的噪声环境中都具有稳定的降噪能力,消噪同时可获得汉语普通话良好的听觉效果。相似文献

6.

联合深度神经网络和凸优化的单通道语音增强算法 总被引：1，自引：1，他引：0

下载免费PDF全文

张晓艳张天骐葛宛营白杨柳《声学学报》2021,46(3):471-480

噪声估计的准确性直接影响语音增强算法的好坏,为提升当前语音增强算法的噪声抑制效果,有效求解无约束优化问题,提出一种联合深度神经网络(DNN)和凸优化的时频掩蔽优化算法进行单通道语音增强。首先,提取带噪语音的能量谱作为DNN的输入特征;接着,将噪声与带噪语音的频带内互相关系数(ICC Factor)作为DNN的训练目标;然后,利用DNN模型得到的互相关系数构造凸优化的目标函数;最后,联合DNN和凸优化,利用新混合共轭梯度法迭代处理初始掩蔽,通过新的掩蔽合成增强语音。仿真实验表明,在不同背景噪声的低信噪比下,相比改进前,新的掩蔽使增强语音获得了更好的对数谱距离(LSD)、主观语音质量(PESQ)、短时客观可懂度(STOI)和分段信噪比(segSNR)指标,提升了语音的整体质量并且可以有效抑制噪声。相似文献

7.

采用联合字典优化的噪声鲁棒性语音转换算法

下载免费PDF全文

张石磊简志华孙闽红钟华刘二小《声学学报》2019,44(6):1074-1082

针对含噪语音难以实现有效的语音转换,本文提出了一种采用联合字典优化的噪声鲁棒性语音转换算法。在联合字典的构成中,语音字典采用后向剔除算法(Backward Elimination algorithm,BE)进行优化,同时引入噪声字典,使得含噪语音与联合字典相匹配。实验结果表明,在保证转换效果的前提下,后向剔除算法能够减少字典帧数,降低计算量。在低信噪比和多种噪声环境下,本文算法与传统NMF算法和基于谱减法消噪的NMF转换算法相比具有更好的转换效果,噪声字典的引入提升了语音转换系统的噪声鲁棒性。相似文献

8.

Att-U-Net：融合注意力机制的U-Net骨导语声增强*

下载免费PDF全文

邦锦阳张玥张雄伟孙蒙刘伟栾合禹《应用声学》2023,42(4):814-824

近年来大量全卷积网络、U-Net等编解码网络结构应用于语音增强,它们具有计算复杂度低、模型参数少等优势。然而,与长短时记忆模型等方法相比,这些编解码结构仍存在不能充分利用先后时间之间和高低频率之间的关联信息等缺点,尤其对于长序列数据的输入,编解码结构存在信息丢失的问题。为保持计算效率的同时考虑更充分的时频关联信息建模,本文提出一种融合注意力机制的U-Net网络的骨导语音增强方法（Att-U-Net）,通过在跳跃连接中引入注意力机制,生成一个权重矩阵,将编码层中的全局信息根据权重融入对应的解码层中,使网络在编解码过程中能够关注输入数据中与增强目标相关程度高的重要信息,同时抑制不相关的信息。在骨导语音数据集上的实验表明,融合注意力机制的U-Net网络能在保持模型轻量化的同时有效提升骨导语音的增强效果,增强后的语音在各项客观评价指标上均优于基线模型。通过对编解码网络中间层的可视化分析发现,在解码过程中注意力机制有效地保留了有声段的信息,滤除了骨导语音由于骨导传声特性带来的中频共振,从而使得增强后的骨导语音具有较好的听觉效果。相似文献

9.

滑动窗累积量的递推估计算法及其在语音端点检测中的应用

下载免费PDF全文

罗雅琴吴小培吕钊彭奎桂雅骏《声学学报》2015,40(5):730-738

提出了一种滑动窗累积量的递推估计算法并应用于语音端点检测中,用以解决传统端点检测方法在噪声环境下检测性能变差的问题。在对含噪语音信号进行加窗之后,利用滑动窗累积量的递推估计算法估计含噪语音信号的高阶累积量值,并在此基础上结合能量特征进行语音端点检测。实验结果表明,所提滑动窗累积量递推估计算法相比较传统高阶累积量计算方法运算效率明显提高;所提端点检测算法在不同噪声和信噪比环境下相比较G.729b算法点正确率Pc-point值平均提升了6.07%。基于滑动窗高阶累积量的语音端点检测算法具有较高的运算效率及良好的鲁棒性。相似文献

10.

滑动窗累积量的递推估计算法及其在语音端点检测中的应用

《声学学报：英文版》2015,(5)

提出了一种滑动窗累积量的递推估计算法并应用于语音端点检测中,用以解决传统端点检测方法在噪声环境下检测性能变差的问题。在对含噪语音信号进行加窗之后,利用滑动窗累积量的递推估计算法估计含噪语音信号的高阶累积量值,并在此基础上结合能量特征进行语音端点检测。实验结果表明,所提滑动窗累积量递推估计算法相比较传统高阶累积量计算方法运算效率明显提高;所提端点检测算法在不同噪声和信噪比环境下相比较G.729b算法点正确率Pc-point值平均提升了6.07%。基于滑动窗高阶累积量的语音端点检测算法具有较高的运算效率及良好的鲁棒性。相似文献

11.

基于回形窗的弱小多目标图像分割方法

蒋海军刘文刘朝晖《光子学报》2007,36(11):2168-2171

提出一种红外弱小多目标图像分割方法,用一个回形窗口和对比度阈值分割图像.对天空背景下低信噪比的红外弱小多目标图像序列能够有效的分割,抑制噪音干扰.将该方法与传统的图像分割方法做了比较,并对用不同阈值,不同窗口分割时的分割结果进行了分析.实验表明,该算法在执行效率和检测概率上能够取得满意的结果. 相似文献

12.

A method for moving objects segmentation based on human vision perception in infrared video

Bin Sun Chaobo Min Junju Zhang Bengkang Chang Yingjie Li Yiyong Han 《Optical Review》2014,21(1):27-34

In this paper, a new region growing method to achieve the accurate and complete segmentation of the moving objects is introduced. Firstly, the ideal seeds of every moving object are extracted based on “hole” effect of temporal difference. Secondly, on the basis of the consideration that human vision system is most sensitive to the local contrast between targets and surrounding, we proposed a metric for “good” infrared target segmentation based on human vision perception. And according to this metric, a search method based on fine and rough adjustment is applied to determine the best growing threshold for moving objects. The segmented mask of every moving object is grown from the relevant seeds with the best growing threshold. At last, the segmented masks of all moving objects are merged into a complete segmented mask. Experimental results show that the proposed method is superior and effective on segmentation of infrared moving object. 相似文献

13.

一种改进的球栅阵列封装焊点射线图像阈值分割算法

李伟张硕《光子学报》2014,40(7):1046-1050

球栅阵列封装焊点的射线图像具有信噪比差、背景不均匀等特点,故传统的阈值分割方法无法将目标焊点与背景图像很好的分割.本文通过对球栅阵列封装焊点射线图像直方图的分析,利用了自适应维纳滤波对阈值分割前的图像进行了预处理.根据图像的差异来调整该滤波器的参量,对局部差异大的地方进行小的平滑操作,对局部差异小的地方进行大的平滑操作.在最大类间方差法的基础上,对分割后的图像进行了进一步的分析并提出了改进的二次分割方法.改进的方法为并不直接通过OTSU法进行二值化处理来去除背景,而是在阈值分割得到的两个灰度级内通过计算中值和统计最大灰度像素的方法得到了更优化的阈值,使得去除背景后的焊点图像整体更加清晰和均匀.在背景灰度级内寻找了一个合适的灰度级作为处理后的灰度图像新背景,实验证明该方法明显改进了传统最大类间方差法对球栅阵列封装焊点射线图像的阈值分割效果. 相似文献

14.

Magnetic-resonance image segmentation based on improved variable weight multi-resolution Markov random field in undecimated complex wavelet domain

下载免费PDF全文

Hong Fan 《中国物理 B》2021,30(7):78703-078703

To solve the problem that the magnetic resonance (MR) image has weak boundaries, large amount of information, and low signal-to-noise ratio, we propose an image segmentation method based on the multi-resolution Markov random field (MRMRF) model. The algorithm uses undecimated dual-tree complex wavelet transformation to transform the image into multiple scales. The transformed low-frequency scale histogram is used to improve the initial clustering center of the K-means algorithm, and then other cluster centers are selected according to the maximum distance rule to obtain the coarse-scale segmentation. The results are then segmented by the improved MRMRF model. In order to solve the problem of fuzzy edge segmentation caused by the gray level inhomogeneity of MR image segmentation under the MRMRF model, it is proposed to introduce variable weight parameters in the segmentation process of each scale. Furthermore, the final segmentation results are optimized. We name this algorithm the variable-weight multi-resolution Markov random field (VWMRMRF). The simulation and clinical MR image segmentation verification show that the VWMRMRF algorithm has high segmentation accuracy and robustness, and can accurately and stably achieve low signal-to-noise ratio, weak boundary MR image segmentation. 相似文献

15.

基于局部图像分割与多特征滤波的自适应桥梁露筋检测算法

贺福强罗红姚学练平安《应用光学》2020,41(3):508-515

针对光照不均、多种复杂背景并存的工况下,采用传统阈值分割方法难以有效将露筋与背景分开的问题,提出了基于局部图像分割与多特征滤波的自适应桥梁露筋检测算法。首先,将灰度图像的灰度值进行投影并寻找露筋在投影图上形成的波谷及其坐标;其次,以波谷坐标为中心设置分割范围对灰度图进行行和列的分块,然后对合并行和列分块的灰度图像进行局部阈值分割;最后,基于多特征滤波实现露筋特征的提取。采用该算法对7种常见的露筋进行验证。实验表明:该方法的平均误检率、漏检率和与人工测量的露筋长度相对误差分别为5.15%、3.89%和3.74%,误差符合公路病害评定标准,实现了复杂环境下露筋的自适应识别。相似文献

16.

小波包自适应阈值语音降噪新算法

下载免费PDF全文

田玉静左红伟董玉民王超《应用声学》2011,30(1):72-80

为了克服低信噪比输入下,语音增强造成语音清音中的弱分量损失,造成重构信号包络失真的问题。论文提出了一种新的语音增强方法。该方法根据语音感知模型,采用不完全小波包分解拟合语音临界频带,并对语音按子带能量进行清浊音区分处理,在阈值计算上,提出了一种清浊音分离,基于子带信号能量的小波包自适应阈值算法。通过仿真实验,客观评测和听音测试表明,该算法在低信噪比输入时较传统算法,能够更加有效地减少重构信号包络失真,在不损伤语音清晰度和自然度的前提下,使输出信噪比明显提高。将该算法与能量谱减法结合,进行二次增强能进一步提高降噪输出的语音质量。相似文献

17.

基于OTSU分割和HOG特征的行人检测与跟踪方法

徐守坤王斌石林瞿诗齐《应用声学》2016,24(10)

传统的HOG算法针对整幅图像进行行人特征提取,大量的非人窗口计算必然降低检测的准确率和效率。为此,提出一种基于OTSU分割和HOG特征的行人检测与跟踪方法。利用OTSU算法以最佳阈值分割图像,在分割区域的基础上进行Canny边缘检测,通过边缘的对称性计算确定行人候选区,继而采用经PCA方法降维后的HOG特征和隐马尔可夫模型对行人候选区进行检测验证。最后,以确定的行人区域为跟踪窗口,利用CamShift算法跟踪行人。多组实验结果证明,本文方法的行人检测效率和精度均有所提高,跟踪性能稳定、可靠。相似文献

18.

Image segmentation using modified SLIC and Nyström based spectral clustering

X.D. Bai Z.G. Cao Y. Wang M.N. Ye L. Zhu 《Optik》2014

Image segmentation is a fundamental and challenging problem in the field of computer vision. In this paper, an efficient two-stage image segmentation method is proposed which takes advantage of modified SLIC segmentation and Nyström based spectral clustering. With the modified SLIC approach utilized in the first stage, Nyström based spectral clustering method is used to cluster the segmented regions instead of the pixels in the image to bring the final result. Therefore, the memory requirement and the computational complexity are significantly reduced. To verify the proposed algorithm, it is applied to images of different characters and compared with six other famous image segmentation approaches. Experiment results show the effectiveness and the robustness of the proposed method. 相似文献

19.

Application of color image segmentation to estrusc detection

M. del Fresno A. Macchi Z. Marti A. Dick A. Clausse 《显形杂志》2006,9(2):171-178

Automatic segmentation and classification of color images is a problem of great practical interest in different areas. This paper presents an algorithm for this purpose which is divided in three steps. Firstly, the regions of interest are isolated from the rest of the image based on threshold functions defined in theYUV andYIQ color spaces, producing a set of connected components. Then, a set of features is computed to enable a quantitative evaluation of the segmented objects. Finally, the image is classified by means of a decision rule based on the analysis of the differences between the computed measures and a set of ideally segmented images, according to experts’ assessment. The algorithm was applied to a decision support tool for estrus detection in cattle. This approach constitutes a valuable alternative to improve this process, as it may replace the visual observation by the automatic analysis of pictures taken to cows in controlled environments. Experimental results show that the segmentations obtained with this method are highly satisfactory and they allow a precise classification of the images with low computational complexity. 相似文献