首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 46 毫秒
1.
林慧镔  谢菠荪 《应用声学》2018,37(2):187-195
随着VR眼镜技术的发展,普通的智能手机已可以作为虚拟现实和动态声、视频重放的平台。该文提出了一种基于手机的多通路环绕声动态双耳重放技术及其信号处理的高效实现方法。利用手机内的加速度传感器、电子罗盘、陀螺仪组成头踪迹跟踪器,实时检测倾听者头部的方向,并利用手机的信号处理芯片实现动态双耳合成。采用头相关脉冲响应的最小相位近似和主成分分解的方法简化双耳合成处理,提高了信号处理的效率。文中给出了系统的结构和软、硬件设计方法,并给出了实现22.2通路空间环绕声动态双耳重放的例子。客观测量和心理声学实验验证了所提出的方法。  相似文献   

2.
陈智颖  陈锴  卢晶  方元 《应用声学》2009,28(3):166-173
本文研究了双通道回声抵消系统的三个核心模块:频域多延时自适应滤波器算法(MDF),双端说话检测算法(DTD),以及残留回声抑制算法(RES)。针对频域算法的特点提出了改进的双端说话检测算法和基于维纳滤波与谱减法的残留回声抑制算法,然后以上述三种算法为核心模块实现双通道回声抵消系统,并对系统定点化以便在定点DSP处理器上实时实现,分析并解决了定点化的精度问题所带来的影响。  相似文献   

3.
《应用声学》1999,18(4):44-48
本文叙述了多通路声的发展和它的音质。环绕声系统和家庭影院的进展,将使家庭内具有甚优于目前流行的双通路立体声系统的音质。  相似文献   

4.
《应用声学》1999,18(5):44-48
4 杜比环绕声系统声音具有强大的表现力,近年来在四通路立体声研究的基础上掀起了对环绕声感觉的追求,它是80年代以来放声系统质量继立体声普及后最大的改进。环绕声感觉是指在前置通路直达声方向感不变的情况下,使聆听者感受到声音的音量、音调、语气和情绪与画面、剧情、场景和一切有声艺术的特定内容在环境、人物、空间的广度、深度、比例诸方面相吻合,达到听觉和视觉的一致性,符合所描绘的特定环境。环绕声感觉与心理声学中优先效应和掩蔽效应有关,可以让前置通路直达声先到达以保证声象定位。同时又将与直达声不相干的混响声…  相似文献   

5.
刘杨  杨飞然  杨军 《声学学报》2023,35(5):1036-1044

提出了一种使用编码器−时序建模结构的时延估计方法来估计声学回声抵消中传声器信号相对远端信号的时延。该方法以短时傅里叶变换域的远端信号和传声器信号作为输入特征, 通过复数卷积神经网络构成的编码器提取带有相位信息的高维特征, 利用循环神经网络学习两输入信号之间的时延关系, 构建了从信号到时延的映射。仿真实验结果表明, 相比WebRTC-DE和GCC-PHAT, 所提方法的优势有: (1)模型的参数量和计算量不受时延长度影响; (2)有效缩短了时延估计的收敛时间和跟踪时间; (3)在长混响和双端对讲的情况下具有更小、更稳定的估计误差和标准差。将使用编码器−时序建模结构的时延估计方法与自适应回声抵消级联的实验验证了新方法的有效性。

  相似文献   

6.
提出了一种两阶段复数谱卷积循环网络(CRN)的立体声回声消除(SAEC)算法,该算法无需对立体声信号进行去相关,因而能够在保证立体声音质和空间感的同时,解决自适应滤波SAEC算法非唯一解问题。所提算法采用两个阶段进行回声消除,第一阶段根据传声器接收信号和参考信号估计回声信号,第二阶段将估计回声信号作为先验信息,联合传声器接收信号作为输入特征,估计近端语音。相对于单阶段CRN算法,该方法能够提高网络对回声和近端语音的区分度,有助于近端语音的提取。另外,网络的输入特征和训练目标均采用复数谱,降低了近端语音的相位估计误差,因而可以进一步提升算法性能。实验表明,基于两阶段复数谱CRN的SAEC算法在单端讲话时的回声抑制量和双端讲话时的语音质量都明显优于传统算法以及单阶段CRN算法。  相似文献   

7.
谢兴甫 《声学学报》1979,4(2):89-95
为了解决磁带录声系统中四通路全景声、三维空间环绕声信号与双通路立体声信号之间的兼容问题,文中提出一种应用矩阵编码信号的记录方法,使磁带上所记录的四通路信号与目前已通行的双通路立体声磁带记录系统之间能够完全兼容;而所用于新系统的附加电路也非常简单。  相似文献   

8.
针对在基于深度学习语音增强的方法中因采用因果式的网络输入导致语音增强性能下降的问题,提出了一种基于轻量级卷积门控循环神经网络(LCGRU)的语音增强方法。门控循环神经网络能够建模语音信号的时间相关性,但是其全连接结构破坏了语音信号的时频结构特征,并且参数数量庞大,不利于网络的训练。对此,本文采用卷积核替代门控循环神经网络中的全连接结构,在对语音信号时间相关性建模的同时保留了语音信号的时频结构特征,同时降低了网络的参数数量。为充分利用先前帧的特征信息,该网络单元当前时刻的输入融合了上一时刻的输入与输出。针对网络训练过程中容易产生过拟合的问题,本文采用了线性门控机制来控制信息的传输,这缓解了网络训练过程中的过拟合问题,提高了网络的语音增强性能。实验结果表明,本文所提出的网络结构在增强后的语音感知质量(PESQ),语音短时客观可懂度(STOI),分段信噪比(SSNR)等指标上均优于传统的网络结构。  相似文献   

9.
张驰  谢菠荪 《应用声学》2024,43(1):64-75
典型的多通路空间声扬声器布置一般包含水平面左前、右前,高仰角左前上、右前上四个方向的扬声器。 本文提出一种利用该四个扬声器产生前方水平与垂直方向虚拟源的一阶局域Ambisonics 信号馈给法。该信号馈给法是通过对目标和重放声场进行球谐函数展开并取一阶近似得到。采用简化的头部模型和精确的头相关传输函数模型分析表明,一阶局域Ambisonics 信号馈给法可以产生合适的低频听觉定位因素,包括双耳时间差及其随头部转动的动态变化。虚拟源定位实验结果表明,该方法可以在扬声器布置的范围内,甚至在略超出扬声器布置的范围内产生不同方位角和仰角的虚拟源。因而本文的方法可用在多通路空间声重放中产生与图像配合的虚拟源定位效果。  相似文献   

10.
对于声学多频分析问题,研究者提出了一种声学边界元级数多频算法节省了重复计算频率无关项的时间,但这种原始算法受到多项式拟合的Runge现象限制,计算频段较窄。进一步改进此原始方法,提出了级数截断项数的选取原则,加入波数因子调整自变量区间避免Runge现象,消除了原始算法的不稳定性,拓展了级数多频算法的适用范围。声辐射计算实例证明了改进的级数多频算法的正确性,所需级数截断项数更少,降低了计算量,能够应用于更高频段的声学分析。  相似文献   

11.
In this paper, an effective post-filter structure for subband-based acoustic echo cancellation (SAEC) is proposed. Compared with the current subband-based post-filters, the proposed one can more consistently suppress the background noise, as well as the residual echoes. To reduce the effects of the distortion of the near-end speech, two alternative modified versions of the post-filter are proposed, which guarantees the quality of speech communications. The proposed post-filters are seamlessly combined with the subband-based AEC system with quite small computational burden. The instrumental evaluation and listening test both demonstrate the superiority of the post-filters.  相似文献   

12.
Siren noises usually severely disturb the intelligibility of voice communication inside the cabs of police, paramedic and fire vehicles. It is often desired that such unwanted noise can be removed from the speech signal. In this paper, a new method is proposed to adaptively cancel siren noises and enhance speech signals. Based on the characteristics of siren noises, an anti-speech filter and a time delayer are employed in the single and dual channel noise cancellation systems to reduce the siren noises. Experiment results demonstrate that the effectiveness of the proposed method for canceling the siren noises and the performance of the enhanced speech signal is satisfying.  相似文献   

13.
空间声的目的是通过电声的手段重放声音空间信息,给聆听者再现特定的空间听觉感知。它在文化生活、通信、多媒体和虚拟现实等方面以及航空、航天等领域都有重要的应用。国内对空间声的研究起步于1958年,五十多年来进行了大量的基础研究工作,是和国际上的发展前沿相接轨的。本文在回顾空间声的基本原理与分类、国际上空间声发展历史的基础上,侧重评述了国内空间声研究和应用的历史、发展与现状,并展望了今后的发展前景。  相似文献   

14.
In this paper, a novel single microphone channel-based speech enhancement technique is presented. While most of the conventional nonnegative matrix factorization-based approaches focus on generating a basis matrix of speech and noise for enhancement, the proposed algorithm performs an additional process to reconstruct speech from noisy speech when these two elements are highly overlapped in selected spectral bands. This process involves a log-spectral amplitude based estimator, which provides the spectrotemporal speech presence probability to obtain a more accurate reconstruction. Moreover, the proposed algorithm applies an unsupervised learning method to the input noise, so it is adaptable to any type of environmental noise without a pre-trained dictionary. The experimental results demonstrate that the proposed algorithm obtains improved speech enhancement performance compared with conventional single channel-based approaches.  相似文献   

15.
谢菠荪 《应用声学》1999,18(3):39-46
本文利用环绕声重发的声像定位理论,探讨了对5.1通路(3/20环绕声系统的改进方法。理论和实验结果表明,通过改变系统现有的分立-对信号馈给方法,而采用文中所提出的新的信号馈给方法,就可以在一定的程度上克服现有方法的缺陷,使系统不但可重发稳定、明晰的前方声像,而且可重发稳定的侧向声像,并且听音区域有所扩大,因而改进后的系统既可用于伴随图像的声音重发,又可作为通用系统(兼容地)用于不伴随图像伯声音重发  相似文献   

16.
频率对环绕声声像定位的影响   总被引:2,自引:1,他引:2       下载免费PDF全文
本文考虑双耳相位差的高级近似,导出了中频情况下适用的具有更普遍意义的平面环绕声声像定位公式。在低频时该式将化为通常的环绕声声像定位公式,而随着声音频率的增加,声像位置将与频率有关。将新的公式用到方型排列和棱型排列的4-4-4环绕声系统,得到了同实验相一致的结果。文中着重指出,声像随频率而变化是导致环绕声重发中侧向声像不稳定的重要在而为今后改进环绕声系统提供了理论基础。  相似文献   

17.
In this paper, we address the problem of noise reduction and speech enhancement by adaptive filtering algorithm. Recently, the well known forward blind source separation (FBSS) structure has been largely studied and intensively used to reduce acoustic noise components and to enhance speech signal. The FBSS structure is often combined with adaptive algorithms to accelerate the adaptation of the cross-filters, and to improve noise suppression at the output. In this paper, we propose to use a wavelet transform decomposition in the FBSS structure by using a two-channel forward wavelet symmetric adaptive decorrelating (WFSAD) algorithm. The proposed WFSAD algorithm provides a better compromise between time and frequency resolution and improves robustness of the noise reduction process when compared with the classical two-channel forward symmetric adaptive decorrelating (FSAD) algorithm. Simulation results prove the efficiency of the proposed WFBSS algorithm in comparison with conventional ones in terms of several objective and subjective criteria.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号