首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
基于听觉事件检测的汉语语音声韵切分   总被引:2,自引:0,他引:2  
张宝奇  张连海  屈丹 《声学学报》2010,35(6):701-707
提出了一种基于听觉事件检测的汉语声韵母切分方法。该方法首先使用耳蜗滤波器组对语音进行滤波,然后在每个频带上检测对应于能量突变的听觉事件,最后在不同频率范围对听觉事件进行融合以确定声韵母边界。实验结果表明,对8 kHz采样的干净语音切分准确率可达到88.9%;信噪比10 dB的语音切分准确率可达到82.9%以上。  相似文献   

2.
采用拖曳线列阵的海洋声学参数联合反演方法研究   总被引:1,自引:0,他引:1  
邱海宾  杨坤德  段睿 《声学学报》2011,36(4):396-404
匹配场反演方法是快速获取海底声学参数的一种有效途径,但是其反映的是水体和海底空间变化环境的平均效果,对海底密度和衰减系数的敏感性较小,且在复杂海底环境下,不确定性明显增加。匹配场反演方法通常采用垂直阵来实现,其机动性较差,只能获得局部海区的环境参数。利用拖曳线列阵可以实现环境参数的走航式获取。提出了基于匹配场与反射损失联合反演的方法,利用其中之一的反演结果作为下一步反演的先验信息,敏感参数与不敏感参数多步反演,并逐步缩小了参数的优化空间。同时引入贝叶斯理论与蒙特卡罗方法对反演参数的后验概率密度进行分析,并利用反演结果的后验分布计算了传播损失随距离的概率分布。研究结果表明,联合反演方法对地声参数进行了更准确的反演,尤其是对海底声速反演效果提高明显。通过传播损失的概率分布发现,估计得到的海底参数用于声场预报时,误差较小。  相似文献   

3.
杨青  马蕙  籍仙荣 《声学学报》2014,39(5):624-632
对实地双通道测量获得的道路交通噪声和铁路噪声信号样本进行了自相关函数和双耳自相关函数(Interaural CrossCorrelation Function)的分析。进而通过对噪声样本时间因子和空间因子的相关性分析、主成分分析和主观评价实验,得到了3个铁路噪声源特征参量物理因子和4个道路交通噪声源特征参量物理因子。发现与传统的声压级测量相比,表征声音信号时间特性和空间特性的这7个物理量可以更全面、准确地表征交通噪声的特性。在对道路噪声进行测量或分析时,掌握与声源视觉宽度和音调感相对应的物理因子以及双耳时延和初始能量,就可获悉与人的主观评价相一致的道路交通噪声特征信息;对铁路噪声而言,掌握与声源视觉宽度相对应的物理因子以及双耳时延和声音的重复性特征,就可以得到与入主观评价相一致的铁路噪声特征信息。综合道路噪声特征参量和铁路噪声特征参量可以发现,双耳时延和与声源视觉宽度相对应的物理因子是与人的主观反应最为一致的主成分指标,说明噪声中决定人的评价的最主要的因素是代表空间特征的信号因子。  相似文献   

4.
陈斌  张连海  王波  屈丹 《声学学报》2012,37(1):104-112
提出了一种基于声韵母能量分布和共振峰结构特性的汉语连续语音声韵母边界检测方法。该方法首先将语音经过Seneff听觉感知模型得到听觉谱,然后基于听觉谱,选取全频带能量、低频带能量、谱重心、高低频能量比、中高频能量等特征参数对各声韵母类别能量分布和共振峰结构特性进行描述,最后根据特征参数变化剧烈的点确定出声韵母边界,并采用包络的一阶差分和基于样点的Kullback-Leibler距离对得到的边界进行修正。实验结果表明,对8 kHz采样的语音边界检测准确率可达到93.7%;信噪比10dB的语音边界检测准确率可达到85.3%以上;经过参数编码后语音边界检测准确率可达86 7%以上。  相似文献   

5.
尹辉  谢湘  匡镜明 《声学学报》2012,37(1):97-103
分数阶Fourier变换在处理非平稳信号尤其是chirp信号方面有着独特的优势,而人耳听觉系统具有自动语音识别系统难以比拟的优良性能。本文采用Gammatone听觉滤波器组对语音信号进行前端时域滤波,然后对输出的各个子带信号用分数阶Fourer变换方法提取声学特征。分数阶Fourier变换的阶数对其性能有着重要影响,本文针对子带时域信号提出了采用瞬时频率曲线拟合求取阶数的方法,并将其与采用模糊函数的方法作了比较。在干净与含噪汉语孤立数字库上的语音识别结果表明,采用新提出的声学特征得到的识别正确率相对MFCC基线系统有了显著提高;根据瞬时频率曲线搜索阶数的算法与模糊函数方法相比,计算量大大减少,并且根据该方法提取的声学特征得到了最高的平均识别正确率。  相似文献   

6.
大熊猫的吠叫声特征与家狗的吠声比较   总被引:1,自引:0,他引:1  
将大熊猫和家狗的吠叫声“旺”分别进行了频谱分析,大熊猫语图在4kHz内由8条共振带重叠构成,共振带宽、长,边界清晰。大熊猫叫声“旺”的基颇为200~300Hz,次频带为400Hz左右,叫声的幅度直方图似伽玛分布。家狗吠声“旺”的语图共振带短,埋于湍流乱纹中,家狗吠叫声中含很强的噪声,家狗叫声“旺”的基频为 400~ 500 Hz,次频带为900Hz左右,叫声的幅度直方图似高斯分布。  相似文献   

7.
倪崇嘉  刘文举  徐波 《声学学报》2012,37(5):553-560
虽然汉语和英语的重音自动标注被广泛的研究,但是关于汉语和英语的重音自动标注之间对比的研究还鲜有报道。基于汉语韵律标注库ASCCD和英语韵律标注库Boston University Radio News Corpus,对汉语和英语的重音自动标注的异同进行对比,考察不同的特征在不同语言的语料库上的泛化性能。通过基于集成分类回归树的重音自动标注实验、特征分析及基于互信息的重音自动标注的声学对比,得到如下结论:在相同的条件下,汉语重音自动标注的正确率比英语重音自动标注的正确率要低;在重音自动标注中,词典语法相关特征比声学相关的特征更重要;不同的声学信息源在重音自动标注中所起的作用不同,时长相关的特征对汉语和英语重音自动标注都很重要;英语中大部分特征提供的互信息要比汉语相应的特征提供的互信息要高。  相似文献   

8.
针对浅海声波导中远距离脉冲声源被动测距问题,提出了一种利用单水听器接收信号自相关函数进行warping变换的声源被动测距方法。理想水下声波导中,接收信号warping变换输出的傅里叶变换频谱中具有不变性频率特征,即与声源距离无关的各简正波截止频率;信号自相关函数中不同简正波相干成分也存在不变性频率特征;推导了未知声源距离时特征频率提取值与不变性频率特征之间的近似关系式。这些规律可推广到实际浅海声波导,并用于声源被动测距。利用声场计算模型来提供具有不变性频率特征的频谱,对2011年12月北黄海海域水声实验中单水听器接收的脉冲声数据进行了处理,验证了方法的有效性,测距结果和实际距离符合良好,平均测距误差在10%以内。  相似文献   

9.
一种对加性噪声和信道函数联合补偿的模型估计方法   总被引:1,自引:0,他引:1  
语音识别系统在面对实际环境中多变的加性噪声和信道差异的影响时性能急剧下降,抑制这些噪声和差异所造成的性能下降具有重要意义。作者提出了一种模型补偿算法,使用句子中的非语音段估计加性噪声,然后利用EM算法估计信道函数,从而在倒谱域上对失配的声学模型进行联合补偿。实验表明,相比基线系统,采用该算法的系统的平均性能相对提升幅度超过50%。算法可以动态跟踪环境的变化,性能表现优于一些传统的语音识别稳健性处理算法。  相似文献   

10.
基于图象处理和傅里叶变换的三维多孔介质重构方法   总被引:1,自引:0,他引:1  
本文基于傅里叶变换的截断高斯场方法的理论,通过从实际多孔介质二维切片的二元化图像中提取孔隙率和自相关函数来构造整个三维多孔结构.模拟结果显示通过傅里叶变换技术得到的随机过程确实满足高斯分布,且构造出的三维多孔结构的统计特性基本与二维切片类似,说明了该技术能够构造出符合要求的三维多孔介质,从而为进一步从孔隙尺度研究其内部传热传质过程奠定了基础.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号