共查询到19条相似文献,搜索用时 58 毫秒
1.
随着VR眼镜技术的发展,普通的智能手机已可以作为虚拟现实和动态声、视频重放的平台。该文提出了一种基于手机的多通路环绕声动态双耳重放技术及其信号处理的高效实现方法。利用手机内的加速度传感器、电子罗盘、陀螺仪组成头踪迹跟踪器,实时检测倾听者头部的方向,并利用手机的信号处理芯片实现动态双耳合成。采用头相关脉冲响应的最小相位近似和主成分分解的方法简化双耳合成处理,提高了信号处理的效率。文中给出了系统的结构和软、硬件设计方法,并给出了实现22.2通路空间环绕声动态双耳重放的例子。客观测量和心理声学实验验证了所提出的方法。 相似文献
2.
基于头相关传递函数数据库的传统双耳声源定位方法的定位角度往往被限定在头相关传递函数数据库的离散测量点上。当头相关传递函数数据库的测量方位角间隔较大时,这类算法的性能会显著下降,这就是典型的离格问题。该文提出了基于加权宽带稀疏贝叶斯学习的离格双耳声源定位算法。首先该算法建立离格双耳信号的稀疏表示模型,然后利用双耳相干与扩散能量比特征对各个频点进行加权以降低噪声和混响的影响,最后通过加权宽带稀疏贝叶斯学习方法估计离格声源的方位角。实验结果表明,该算法在各种复杂的声学环境下都有着较高的定位精度和鲁棒性,特别是提高了离格条件下的声源定位性能。 相似文献
3.
为改善5.1通路环绕声的双耳重放性能,提出一种基于低价头踪迹跟踪模块的动态双耳重放方法。头踪迹跟踪模块通过单片机采集磁传感器、加速度传感器的输出数据,计算出倾听者头部水平方向信息,并将其经USB接口传给计算机进行动态双耳声信号合成。心理声学实验表明,本文提出的方法可以消除虚拟声源前后混乱和头中定位现象,提升5.1通路环绕声双耳重放的虚拟声源定位性能。 相似文献
4.
虚拟听觉重放是研究距离感知的一种重要工具,它可分为传统的稳态虚拟听觉重放和动态虚拟听觉重放。然而,稳态虚拟听觉重放经常会产生头中定位而影响距离感知的判断,从而影响最终的实验结果。过去的实验大多采用稳态虚拟听觉重放,因此其结论也存在较大的争议性结论。本文对比研究稳态和动态的虚拟听觉重放对绝对距离感知效果的影响。实验采用非个性化HRTF进行双耳合成,将分布在水平面0.20 m至1.00 m的七个距离、0°至180°的七个方位角下的信号通过耳机进行虚拟重放。心理声学实验结果表明,在稳态虚拟听觉重放条件下,受试者不同程度地报告了存在头中定位。而动态虚拟听觉重放系统能够利用动态因素,从而产生头外化的听觉感知。统计分析表明动态虚拟听觉重放下的距离感知效果与稳态重放存在明显的差异。由于动态虚拟重放更接近真实声源的感知效果,应选用这种方法作为实验工具。同时,在实际的空间声应用中,也应该采用动态虚拟听觉重放产生不同的距离感知。 相似文献
5.
6.
本文针对语音信号稀疏表示及压缩感知问题,将听觉感知引入稀疏系数筛选过程,用掩蔽阈值筛选重要系数,以得到更符合听觉感受的语音稀疏表示。通过对一帧浊音信号分别采用掩蔽阈值和能量阈值方法进行系数筛选对比实验,结果表明掩蔽阈值法具有更好的稀疏表示效果。为验证听觉感知对语音压缩感知性能的影响,与能量阈值法对照对测试语音进行压缩感知观测和重构,通过压缩比、信噪比、主观平均意见分等主客观指标评价其性能,结果表明,掩蔽阈值法可有效地提高压缩比且保证重构语音具有较高的主观听觉质量。 相似文献
7.
8.
随着互联网(Internet)和电信网等信息网络的蓬勃发展,人们的信息交互变得越来越方便,除了文字信息,语音、音乐、图像等多媒体信息也越来越多地进入了人们的日常生活中。例如,在广播或电视媒体中每天都在增加的语音文档或视频文档,在日常生活中的音视频电子邮件等。目前针对文字信息的检索已经有许多成功的应用,如:Google、Yahoo、百度等搜索引擎, 相似文献
9.
头相关传输函数(HRTF)是自由场情况下点声源到双耳的声学传输函数,它包含了有关声源的主要空间信息,因而在双耳空间听觉的研究方面有非常重要的意义.作为HRTF的一个重要的应用,虚拟听觉则是近二十年发展起来的新技术,它利用HRTF进行信号处理,模拟出声波从声源到双耳的传输,从而在耳机或扬声器重放中虚拟出相应的空间听觉.虚拟听觉技术在有关听觉的科学实验、通信、多媒体与虚拟现实、家用声重放、室内声学设计等科学研究、工程技术、消费电子领域都有重要的应用价值.近十多年来,国际上有关HRTF和虚拟听觉技术的研究发展很快,已成为声学、信号处理、听觉等研究领域的热门与前沿课题,并已在众多的领域得到应用. 相似文献
10.
为探索双耳时间差(Interaural Time Difference,ITD)的感知机理,研究ITD恰可感知差异(Just Notice Difference,JND)与时间差和频率的关系。依据人耳对ITD的敏感程度的定性分析,非均匀地选取7个离散的ITD测试值,按照临界频带的划分方法将低频段划分为12个频带进行测试;采用1 up/2 down和2AFC心理学测试方法,同时采用窄带的高斯白噪声作为测试序列以避免相位混淆。测试结果表明:随频率的变化ITD的JND变化较为显著,在500 Hz左右出现极小值,两端较大;随ITD的增大,ITD的JND也相应增大。实验所得数据及结论可为多声道音频的高效压缩提供基础数据和理论支撑。 相似文献
11.
In this paper, a fuzzy self-adaptive digital audio watermarking method based on a time-spread echo hiding algorithm is proposed. Echo spreading is performed in the impulse response domain using PN sequences to achieve good robustness of echo hiding and high secrecy of spread spectrum. Fuzzy theory is employed in the embedding process to control the power of the watermark. Since fuzzy set theory is capable of performing complex nonlinear mappings between input and output spaces, it can effectively estimate the strength of a frame for each subband and ensure that the embedded watermark in the original audio is self-adaptive. A listening test and simulation results show that the algorithm is robust for common digital audio processing methods as attacks and that the quality of the audio is retained. 相似文献
12.
13.
针对提高室内三维空间的定位精度和速度的问题,从减少节点数量、建立特定坐标系的角度提出了一种基于四节点和特定坐标系的三维空间定位算法。该算法引入位置相对固定的四个节点,提高解算速度;充分考虑有效反射区对衰减指数影响,根据伯鲁斯特角将天线辐射场区分为叠加加强区和叠加减弱区,建立三维坐标系进行定位,结合信号强度指示(Received Signal Strength Indicator, RSSI)衰减模型,在叠加减弱区定位,把三维空间问题转化到二维空间,降低定位算法的复杂度。文中分别阐述方法的原理与验证,结果表明,四节点定位算法的解算速度比降低复杂度(Complexity-Reduced Trilateration Approach , COLA)定位算法有较大提高,该算法平均定位误差小于2米。 相似文献
14.
15.
The recent needs of analysis and visualization of variable in time real 3D objects in many applications require development
of new approach towards combining rapid 3D shape acquisition and the methodology of data processing in order to perform visualization
and analysis of real 3D dynamic objects. In this paper, the general concept of visualization system of data gathered by means
of optical 4D (x,y,z,t) shape measurement system is presented. The concept of a virtual camera, as the mean for interactive
object visualization is introduced. The experimental results for processing of simulated and real variable in time 3D object
are presented and discussed. The directions of future works focused on full implementation of the concept are introduced. 相似文献
16.
17.
均方误差函数是深度学习单通道语声增强算法最常用的一种代价函数。然而,均方误差值的大小与语声质量好坏并非完全相关。为了提高算法性能,该文在深度神经网络训练中引入了两类与人耳听觉相关的代价函数。第一类是加权欧氏距离代价函数,考虑了人耳听觉掩蔽效应;第二类是Itakura-Satio代价函数、COSH代价函数和加权似然比代价函数,强调语声谱峰的重要性,侧重于恢复干净语声谱峰信息。基于长短期记忆网络结构分析比较了两类代价函数在深度学习单通道语声增强算法中的性能,并与均方误差代价函数进行对比。实验结果表明,基于加权欧式距离代价函数的深度神经网络单通道语声增强算法能够获得更好的语声质量和更低的噪声残留。 相似文献
18.
19.
Air transportation is one of the most important services in the world, contributing greatly to the advancement of modern society. However, it has a local and a global impact on the environment making aircraft take-off noise an important environmental public health concern near airports, and this is a significant subject for monitoring and research. In this work an experimentally validated computational model for aircraft classification is presented. In addition, potentially harmful effects to human health and comfort associated with noise exposure are discussed. The feature extraction of aircraft take-off signals is conducted through a 1/24 octave analysis and Mel frequency cepstral coefficients (MFCC). The aircraft classification is made by using two parallel feed forward neural networks. The aircraft are clustered into classes depending on the installed engine type. This model has 13 aircraft classes and a classification level above 83% with measurements in real time environment. 相似文献