共查询到16条相似文献,搜索用时 46 毫秒
1.
随着VR眼镜技术的发展,普通的智能手机已可以作为虚拟现实和动态声、视频重放的平台。该文提出了一种基于手机的多通路环绕声动态双耳重放技术及其信号处理的高效实现方法。利用手机内的加速度传感器、电子罗盘、陀螺仪组成头踪迹跟踪器,实时检测倾听者头部的方向,并利用手机的信号处理芯片实现动态双耳合成。采用头相关脉冲响应的最小相位近似和主成分分解的方法简化双耳合成处理,提高了信号处理的效率。文中给出了系统的结构和软、硬件设计方法,并给出了实现22.2通路空间环绕声动态双耳重放的例子。客观测量和心理声学实验验证了所提出的方法。 相似文献
2.
3.
本文叙述了多通路声的发展和它的音质。环绕声系统和家庭影院的进展,将使家庭内具有甚优于目前流行的双通路立体声系统的音质。 相似文献
4.
4 杜比环绕声系统声音具有强大的表现力,近年来在四通路立体声研究的基础上掀起了对环绕声感觉的追求,它是80年代以来放声系统质量继立体声普及后最大的改进。环绕声感觉是指在前置通路直达声方向感不变的情况下,使聆听者感受到声音的音量、音调、语气和情绪与画面、剧情、场景和一切有声艺术的特定内容在环境、人物、空间的广度、深度、比例诸方面相吻合,达到听觉和视觉的一致性,符合所描绘的特定环境。环绕声感觉与心理声学中优先效应和掩蔽效应有关,可以让前置通路直达声先到达以保证声象定位。同时又将与直达声不相干的混响声… 相似文献
5.
提出了一种使用编码器−时序建模结构的时延估计方法来估计声学回声抵消中传声器信号相对远端信号的时延。该方法以短时傅里叶变换域的远端信号和传声器信号作为输入特征, 通过复数卷积神经网络构成的编码器提取带有相位信息的高维特征, 利用循环神经网络学习两输入信号之间的时延关系, 构建了从信号到时延的映射。仿真实验结果表明, 相比WebRTC-DE和GCC-PHAT, 所提方法的优势有: (1)模型的参数量和计算量不受时延长度影响; (2)有效缩短了时延估计的收敛时间和跟踪时间; (3)在长混响和双端对讲的情况下具有更小、更稳定的估计误差和标准差。将使用编码器−时序建模结构的时延估计方法与自适应回声抵消级联的实验验证了新方法的有效性。
相似文献6.
提出了一种两阶段复数谱卷积循环网络(CRN)的立体声回声消除(SAEC)算法,该算法无需对立体声信号进行去相关,因而能够在保证立体声音质和空间感的同时,解决自适应滤波SAEC算法非唯一解问题。所提算法采用两个阶段进行回声消除,第一阶段根据传声器接收信号和参考信号估计回声信号,第二阶段将估计回声信号作为先验信息,联合传声器接收信号作为输入特征,估计近端语音。相对于单阶段CRN算法,该方法能够提高网络对回声和近端语音的区分度,有助于近端语音的提取。另外,网络的输入特征和训练目标均采用复数谱,降低了近端语音的相位估计误差,因而可以进一步提升算法性能。实验表明,基于两阶段复数谱CRN的SAEC算法在单端讲话时的回声抑制量和双端讲话时的语音质量都明显优于传统算法以及单阶段CRN算法。 相似文献
7.
针对在基于深度学习语音增强的方法中因采用因果式的网络输入导致语音增强性能下降的问题,提出了一种基于轻量级卷积门控循环神经网络(LCGRU)的语音增强方法。门控循环神经网络能够建模语音信号的时间相关性,但是其全连接结构破坏了语音信号的时频结构特征,并且参数数量庞大,不利于网络的训练。对此,本文采用卷积核替代门控循环神经网络中的全连接结构,在对语音信号时间相关性建模的同时保留了语音信号的时频结构特征,同时降低了网络的参数数量。为充分利用先前帧的特征信息,该网络单元当前时刻的输入融合了上一时刻的输入与输出。针对网络训练过程中容易产生过拟合的问题,本文采用了线性门控机制来控制信息的传输,这缓解了网络训练过程中的过拟合问题,提高了网络的语音增强性能。实验结果表明,本文所提出的网络结构在增强后的语音感知质量(PESQ),语音短时客观可懂度(STOI),分段信噪比(SSNR)等指标上均优于传统的网络结构。 相似文献
8.
典型的多通路空间声扬声器布置一般包含水平面左前、右前,高仰角左前上、右前上四个方向的扬声器。 本文提出一种利用该四个扬声器产生前方水平与垂直方向虚拟源的一阶局域Ambisonics 信号馈给法。该信号馈给法是通过对目标和重放声场进行球谐函数展开并取一阶近似得到。采用简化的头部模型和精确的头相关传输函数模型分析表明,一阶局域Ambisonics 信号馈给法可以产生合适的低频听觉定位因素,包括双耳时间差及其随头部转动的动态变化。虚拟源定位实验结果表明,该方法可以在扬声器布置的范围内,甚至在略超出扬声器布置的范围内产生不同方位角和仰角的虚拟源。因而本文的方法可用在多通路空间声重放中产生与图像配合的虚拟源定位效果。 相似文献
9.
10.
光子计数激光雷达技术具有极高的探测灵敏度与时间分辨率,是极端条件下高精度目标信息获取的重要手段.由于该技术通过探测单光子级的回波能量实现对目标信息的三维重建,因此极易受噪声干扰,导致成像质量严重降低.基于高速电子门控的距离选通技术虽然可以有效抑制噪声,但存在参数设计依靠经验、目标检测区间窄等问题.本文提出一种在宽目标检测区间条件下的目标信息提取及三维重建方法,首先通过对三维回波信息的获取机理及其概率模型进行分析,获取目标信息分布范围并通过算法门控提取有效信息;再采用高效的图像重建算法进一步提升三维重建的质量,从而具有比基于纯硬件的去噪方法更强的抑噪能力.实验结果显示,在平均像素光子数仅为3.020,且信号噪声比仅为0.106的极端条件下,本文提出的目标信息提取方法可将信号噪声比提升19.330倍;再配合高效的图像重建算法,距离图像的重建信噪比相比于传统的互相关算法提升了33.520 d B,大幅提升了强噪声环境下高精度目标信息获取的能力. 相似文献
11.
In this paper, an effective post-filter structure for subband-based acoustic echo cancellation (SAEC) is proposed. Compared with the current subband-based post-filters, the proposed one can more consistently suppress the background noise, as well as the residual echoes. To reduce the effects of the distortion of the near-end speech, two alternative modified versions of the post-filter are proposed, which guarantees the quality of speech communications. The proposed post-filters are seamlessly combined with the subband-based AEC system with quite small computational burden. The instrumental evaluation and listening test both demonstrate the superiority of the post-filters. 相似文献
12.
Siren noises usually severely disturb the intelligibility of voice communication inside the cabs of police, paramedic and fire vehicles. It is often desired that such unwanted noise can be removed from the speech signal. In this paper, a new method is proposed to adaptively cancel siren noises and enhance speech signals. Based on the characteristics of siren noises, an anti-speech filter and a time delayer are employed in the single and dual channel noise cancellation systems to reduce the siren noises. Experiment results demonstrate that the effectiveness of the proposed method for canceling the siren noises and the performance of the enhanced speech signal is satisfying. 相似文献
13.
In this paper, a novel method for Three dimensional active sound field cancellation is proposed. The optimum sound cancellations in different situations may be obtained. An array whose elements lie on a set of rings placed on the surface of a scattering object is considered as the device. It is quite possible to cancel the scattered sound field to any arbitrary level over either the whole space or a partial area of interest, as long as the number of the array elements is sufficient. 相似文献
14.
In this paper, we address the problem of noise reduction and speech enhancement by adaptive filtering algorithm. Recently, the well known forward blind source separation (FBSS) structure has been largely studied and intensively used to reduce acoustic noise components and to enhance speech signal. The FBSS structure is often combined with adaptive algorithms to accelerate the adaptation of the cross-filters, and to improve noise suppression at the output. In this paper, we propose to use a wavelet transform decomposition in the FBSS structure by using a two-channel forward wavelet symmetric adaptive decorrelating (WFSAD) algorithm. The proposed WFSAD algorithm provides a better compromise between time and frequency resolution and improves robustness of the noise reduction process when compared with the classical two-channel forward symmetric adaptive decorrelating (FSAD) algorithm. Simulation results prove the efficiency of the proposed WFBSS algorithm in comparison with conventional ones in terms of several objective and subjective criteria. 相似文献
15.
The construction and performance of an acoustic chamber suitable for sound intensity measurements is described. The walls
and the ceiling of the room are treated with glass wool sheets, air gap and pleated carpet in that order for sound absorption.
The final testing of the room shows that good sound absorption is obtained down to low frequencies. The sound absorption coefficient
for the room varies between 0.83 and 0.91 for different frequencies. 相似文献
16.
提出了一种基于球谐域的自适应混响抵消与声源定位算法,该方法通过去混响处理改善语音质量,并提高球谐域定位算法在混响环境下的定位性能。推导了基于多通道线性预测的自适应混响抵消算法在球谐域的表达式,针对刚球模型提出分阶处理的去混响方法,并对去混响后的信号进行波达方向估计。采用32元球阵的仿真结果表明,相比于球谐域不分阶去混响方法,该方法最大可减少约2/3的运算量,同时语音PESQ得分及SRMR均显著提高。利用实验数据对算法性能进行测试,实验结果验证了该方法在实际声学环境中去混响和声源定位的有效性。 相似文献