首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 58 毫秒
1.
林慧镔  谢菠荪 《应用声学》2018,37(2):187-195
随着VR眼镜技术的发展,普通的智能手机已可以作为虚拟现实和动态声、视频重放的平台。该文提出了一种基于手机的多通路环绕声动态双耳重放技术及其信号处理的高效实现方法。利用手机内的加速度传感器、电子罗盘、陀螺仪组成头踪迹跟踪器,实时检测倾听者头部的方向,并利用手机的信号处理芯片实现动态双耳合成。采用头相关脉冲响应的最小相位近似和主成分分解的方法简化双耳合成处理,提高了信号处理的效率。文中给出了系统的结构和软、硬件设计方法,并给出了实现22.2通路空间环绕声动态双耳重放的例子。客观测量和心理声学实验验证了所提出的方法。  相似文献   

2.
基于头相关传递函数数据库的传统双耳声源定位方法的定位角度往往被限定在头相关传递函数数据库的离散测量点上。当头相关传递函数数据库的测量方位角间隔较大时,这类算法的性能会显著下降,这就是典型的离格问题。该文提出了基于加权宽带稀疏贝叶斯学习的离格双耳声源定位算法。首先该算法建立离格双耳信号的稀疏表示模型,然后利用双耳相干与扩散能量比特征对各个频点进行加权以降低噪声和混响的影响,最后通过加权宽带稀疏贝叶斯学习方法估计离格声源的方位角。实验结果表明,该算法在各种复杂的声学环境下都有着较高的定位精度和鲁棒性,特别是提高了离格条件下的声源定位性能。  相似文献   

3.
张承云  谢菠荪 《应用声学》2016,35(4):283-287
为改善5.1通路环绕声的双耳重放性能,提出一种基于低价头踪迹跟踪模块的动态双耳重放方法。头踪迹跟踪模块通过单片机采集磁传感器、加速度传感器的输出数据,计算出倾听者头部水平方向信息,并将其经USB接口传给计算机进行动态双耳声信号合成。心理声学实验表明,本文提出的方法可以消除虚拟声源前后混乱和头中定位现象,提升5.1通路环绕声双耳重放的虚拟声源定位性能。  相似文献   

4.
燕子翔  谢菠荪  朱俊 《应用声学》2024,43(3):469-477
虚拟听觉重放是研究距离感知的一种重要工具,它可分为传统的稳态虚拟听觉重放和动态虚拟听觉重放。然而,稳态虚拟听觉重放经常会产生头中定位而影响距离感知的判断,从而影响最终的实验结果。过去的实验大多采用稳态虚拟听觉重放,因此其结论也存在较大的争议性结论。本文对比研究稳态和动态的虚拟听觉重放对绝对距离感知效果的影响。实验采用非个性化HRTF进行双耳合成,将分布在水平面0.20 m至1.00 m的七个距离、0°至180°的七个方位角下的信号通过耳机进行虚拟重放。心理声学实验结果表明,在稳态虚拟听觉重放条件下,受试者不同程度地报告了存在头中定位。而动态虚拟听觉重放系统能够利用动态因素,从而产生头外化的听觉感知。统计分析表明动态虚拟听觉重放下的距离感知效果与稳态重放存在明显的差异。由于动态虚拟重放更接近真实声源的感知效果,应选用这种方法作为实验工具。同时,在实际的空间声应用中,也应该采用动态虚拟听觉重放产生不同的距离感知。  相似文献   

5.
管鲁阳  鲍明  李晓东 《应用声学》2008,27(5):351-357
在声目标识别中,基于单路信号的特征提取算法难以保证特征在低信噪比条件下的鲁棒性。针对该问题,本文使用由两个传声器组成的小孔径阵列采集信号,采用Stereausis双耳听觉模型对两路信号进行综合处理,在此基础上设计了基于双耳模型的倒谱系数,并将其作为识别特征应用于多类地面目标识别。试验表明该特征可有效提高识别系统的识别性能和抗噪声能力。  相似文献   

6.
本文针对语音信号稀疏表示及压缩感知问题,将听觉感知引入稀疏系数筛选过程,用掩蔽阈值筛选重要系数,以得到更符合听觉感受的语音稀疏表示。通过对一帧浊音信号分别采用掩蔽阈值和能量阈值方法进行系数筛选对比实验,结果表明掩蔽阈值法具有更好的稀疏表示效果。为验证听觉感知对语音压缩感知性能的影响,与能量阈值法对照对测试语音进行压缩感知观测和重构,通过压缩比、信噪比、主观平均意见分等主客观指标评价其性能,结果表明,掩蔽阈值法可有效地提高压缩比且保证重构语音具有较高的主观听觉质量。  相似文献   

7.
信号压缩是数字电路中的一个基本概念,就其物理本质而言,这里的“压”指的是增加单位面积上的信号储存的密度;“缩”指的是在不影响感知效果的条件下减小信号中不必要的成分.人们对于“压”的理解通常比较深刻,下面以音频信号为例,主要从“缩”的角度出发谈谈音频信号压缩技术的物理基础.  相似文献   

8.
随着互联网(Internet)和电信网等信息网络的蓬勃发展,人们的信息交互变得越来越方便,除了文字信息,语音、音乐、图像等多媒体信息也越来越多地进入了人们的日常生活中。例如,在广播或电视媒体中每天都在增加的语音文档或视频文档,在日常生活中的音视频电子邮件等。目前针对文字信息的检索已经有许多成功的应用,如:Google、Yahoo、百度等搜索引擎,  相似文献   

9.
头相关传输函数(HRTF)是自由场情况下点声源到双耳的声学传输函数,它包含了有关声源的主要空间信息,因而在双耳空间听觉的研究方面有非常重要的意义.作为HRTF的一个重要的应用,虚拟听觉则是近二十年发展起来的新技术,它利用HRTF进行信号处理,模拟出声波从声源到双耳的传输,从而在耳机或扬声器重放中虚拟出相应的空间听觉.虚拟听觉技术在有关听觉的科学实验、通信、多媒体与虚拟现实、家用声重放、室内声学设计等科学研究、工程技术、消费电子领域都有重要的应用价值.近十多年来,国际上有关HRTF和虚拟听觉技术的研究发展很快,已成为声学、信号处理、听觉等研究领域的热门与前沿课题,并已在众多的领域得到应用.  相似文献   

10.
胡瑞敏  王恒  涂卫平  张聪  王松 《声学学报》2014,39(6):752-756
为探索双耳时间差(Interaural Time Difference,ITD)的感知机理,研究ITD恰可感知差异(Just Notice Difference,JND)与时间差和频率的关系。依据人耳对ITD的敏感程度的定性分析,非均匀地选取7个离散的ITD测试值,按照临界频带的划分方法将低频段划分为12个频带进行测试;采用1 up/2 down和2AFC心理学测试方法,同时采用窄带的高斯白噪声作为测试序列以避免相位混淆。测试结果表明:随频率的变化ITD的JND变化较为显著,在500 Hz左右出现极小值,两端较大;随ITD的增大,ITD的JND也相应增大。实验所得数据及结论可为多声道音频的高效压缩提供基础数据和理论支撑。   相似文献   

11.
In this paper, a fuzzy self-adaptive digital audio watermarking method based on a time-spread echo hiding algorithm is proposed. Echo spreading is performed in the impulse response domain using PN sequences to achieve good robustness of echo hiding and high secrecy of spread spectrum. Fuzzy theory is employed in the embedding process to control the power of the watermark. Since fuzzy set theory is capable of performing complex nonlinear mappings between input and output spaces, it can effectively estimate the strength of a frame for each subband and ensure that the embedded watermark in the original audio is self-adaptive. A listening test and simulation results show that the algorithm is robust for common digital audio processing methods as attacks and that the quality of the audio is retained.  相似文献   

12.
MPEG音频编码的高效算法研究及单片DSP实现   总被引:2,自引:0,他引:2       下载免费PDF全文
ISO标准推荐MPEG-1音频编码算法要实现起来运算复杂,为便于单片DSP实现,算法可以优化。本文简要分析了该算法的各个模块并估计了它们的运算复杂性,然后对子带滤波和心理声学模型作了进一步的探讨,提出了基于逆余弦变换(IDCT)的子带滤波的高效实现算法和不用FFT或只用部分FFT的快速心理声学掩蔽计算模型。最后用单片TMS320C31@40MHz实现了MPEG-1层2编码算法。  相似文献   

13.
针对提高室内三维空间的定位精度和速度的问题,从减少节点数量、建立特定坐标系的角度提出了一种基于四节点和特定坐标系的三维空间定位算法。该算法引入位置相对固定的四个节点,提高解算速度;充分考虑有效反射区对衰减指数影响,根据伯鲁斯特角将天线辐射场区分为叠加加强区和叠加减弱区,建立三维坐标系进行定位,结合信号强度指示(Received Signal Strength Indicator, RSSI)衰减模型,在叠加减弱区定位,把三维空间问题转化到二维空间,降低定位算法的复杂度。文中分别阐述方法的原理与验证,结果表明,四节点定位算法的解算速度比降低复杂度(Complexity-Reduced Trilateration Approach , COLA)定位算法有较大提高,该算法平均定位误差小于2米。  相似文献   

14.
针对工程应用中对舰船辐射噪声信号仿真结果在听觉感受上模拟度欠佳的问题,建立了一种基于音色参量谱质心的辐射噪声仿真方法。采用基于实测谱的连续谱仿真模拟,并且通过整体对比实测信号的听觉特性来搜索符合特征样本音色的线谱族幅值参量,在一定程度上改善了仿真信号的听觉特征。通过仿真最优匹配度趋势来寻求最优搜索次数,用以缩短仿真时间,得到了符合工程应用的结果。  相似文献   

15.
The recent needs of analysis and visualization of variable in time real 3D objects in many applications require development of new approach towards combining rapid 3D shape acquisition and the methodology of data processing in order to perform visualization and analysis of real 3D dynamic objects. In this paper, the general concept of visualization system of data gathered by means of optical 4D (x,y,z,t) shape measurement system is presented. The concept of a virtual camera, as the mean for interactive object visualization is introduced. The experimental results for processing of simulated and real variable in time 3D object are presented and discussed. The directions of future works focused on full implementation of the concept are introduced.  相似文献   

16.
李波  郑成诗  赵剑  李晓东 《应用声学》2007,26(5):292-299
摘要当系统输入信号是有色信号时,传统的自适应反馈抵消算法会由于系统的输出和输入信号存在相关性而造成辨识反馈路径存在偏差,从而导致反馈抵消性能的降低。为了减小反馈路径的辨识偏差,本文提出在系统输出信号中加入被掩蔽噪声来降低系统的输入信号和输出信号的相关性的方法,噪声的能量由频域掩蔽阈值控制。这种基于听觉频域掩蔽效应的自适应反馈抵消算法改善了自适应反馈抵消的性能,同时加入的噪声是被掩蔽不可听的,输出语音的质量没有受到损害。  相似文献   

17.
均方误差函数是深度学习单通道语声增强算法最常用的一种代价函数。然而,均方误差值的大小与语声质量好坏并非完全相关。为了提高算法性能,该文在深度神经网络训练中引入了两类与人耳听觉相关的代价函数。第一类是加权欧氏距离代价函数,考虑了人耳听觉掩蔽效应;第二类是Itakura-Satio代价函数、COSH代价函数和加权似然比代价函数,强调语声谱峰的重要性,侧重于恢复干净语声谱峰信息。基于长短期记忆网络结构分析比较了两类代价函数在深度学习单通道语声增强算法中的性能,并与均方误差代价函数进行对比。实验结果表明,基于加权欧式距离代价函数的深度神经网络单通道语声增强算法能够获得更好的语声质量和更低的噪声残留。  相似文献   

18.
19.
Air transportation is one of the most important services in the world, contributing greatly to the advancement of modern society. However, it has a local and a global impact on the environment making aircraft take-off noise an important environmental public health concern near airports, and this is a significant subject for monitoring and research. In this work an experimentally validated computational model for aircraft classification is presented. In addition, potentially harmful effects to human health and comfort associated with noise exposure are discussed. The feature extraction of aircraft take-off signals is conducted through a 1/24 octave analysis and Mel frequency cepstral coefficients (MFCC). The aircraft classification is made by using two parallel feed forward neural networks. The aircraft are clustered into classes depending on the installed engine type. This model has 13 aircraft classes and a classification level above 83% with measurements in real time environment.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号