期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

吴镇扬陈家澍理查德Ａ．雷阿尔《声学学报》1996,(1)

自由声场至耳膜的传递函数（ＦＥＴＦ）被认为是影响辨别声源方向的主要因素之一。ＦＥＴＦ已被用于真实听觉空间的计算机仿真。对于ＦＥＴＦ的估计和测量方法，本文提出了具体的改进意见。对于单脉冲激励的测量方法，我们建议采用ＬＭＳ估计方法，计算机模拟结果表明ＬＭＳ方法优于经典的ＦＦＴ方法。文章中还对各种用于测量ＦＥＴＦ冲激响应的激励方法作了分析和比较。相似文献

2.

基于谐波和噪声能量改进的语音截止频率轮廓估计

汤一彬张索非吴镇扬《声学学报》2010,35(3):375-384

为了对语音谐波/噪声模型中的语音截止频率轮廓进行更好的描述,本文提出了一种基于谐波和噪声能量改进的语音截止频率轮廓估计算法。改进算法对累积谐波和噪声能量函数进行对应谐波处的功率谱加权,并且在语音截止频率轨迹的平滑部分采用形态滤波的手段。实验表明,与原算法相比,通过改进算法得到的截止频率轮廓在语谱图上标注得更为准确,在主观评分测试中改进算法也获得了优于原算法的测试评分。改进算法比原算法能够更加准确的对语音截止频率轮廓进行估计,从而使得语音谐波/噪声模型在语音编码、语音合成及识别方面具有更为有效的应用。相似文献

3.

基于Laplace-Gauss模型和简化相位判别的离散余弦变换域语音增强

吴红卫俞一彪吴镇扬《声学学报》2008,33(3):244-251

分析了理想情况下离散余弦变换域中语音信号增益,先验信噪比及后验信噪比之间的关系,用实际数据获得了各种信噪比下增益范围的统计特性。基于语音呈Laplace分布、噪声呈Gauss分布的模型,推导了具有相位特性的增益及先验信噪比的估计公式,通过合理性分析得到了简化的相位判别准则。实验结果表明,在高斯白噪声和F16飞机噪声情况下,简化的相位判别可使低信噪比下的语音增强系统的性能得到较大的改善。相似文献

4.

基于空间特征抽取与神经网络的人耳空间听觉模型 总被引：4，自引：0，他引：4

吴镇扬王卫斌《声学学报》1999,24(6):645-652

空间听觉中复数值的与头相关联的传递函数(HRTF)可用实数值的与头相关联的冲激响应(HRIR表示。对测量空间上归一化的HRIR进行Karhunen-Loeve展开可以提取其空间特征.用Von—Mises函数为基函数的神经网络逼近离散的HRIR空间特征函数得到连续听觉空间上的双耳时域模型.模型与实际测量得到的HRIR有较好的一致性。相似文献

5.

基于动态单边自相关序列和频率规整线性预测的抗噪声语音识别

刘海滨吴镇扬赵力曾毓敏《声学学报》2004,29(2):182-186

提出了一种既符合人耳听觉特性又具有良好抗噪性的语音特征分析方法。首先将单边自相关函数序列进行时间方向的平滑处理,提高单边自相关函数的抗噪性,然后用平滑后的单边自相关函数序列代替原信号进行频率规整的LPC分析,最后经倒谱变换得到该特征参数。数字语音识别实验证明:利用该特征参数的语音识别系统的识别性能优于MEL倒谱系数、LPC倒谱系数等传统的语音特征参数。相似文献

6.

基于3维空间Viterbi算法的音素模型和声调模型识别概率统合方法的研究 总被引：2，自引：1，他引：1

赵力邹采荣吴镇扬《声学学报》2001,(3)

提出了一种在汉语连续语音识别中基于３维空间Ｖｉｔｅｒｂｉ算法的音素模型和声调模型识别概率的统合方法。该方法采用６０个音素单位的ＨＭＭ和８个声调单位的ＨＭＭ作为识别用基元模型。音素和声调基元模型识别结果的统合,采用音素的ＨＭＭ状态、声调的ＨＭＭ状态和时间的３维空间帧同步Ｖｉｔｅｒｂｉ算法来实现。本文还探讨了在该方法的基础上,给予不同路径限制时的匹配统合效果,并且通过和传统的匹配统合方式的比较,证明了提出的方法的有效性。相似文献

7.

基于最大似然多项式回归的鲁棒语音识别 总被引：2，自引：0，他引：2

吕勇吴镇扬《声学学报》2010,35(1):88-96

本文针对最大似然线性回归算法线性假设的缺点,将多项式回归方法用于模型自适应,构建了基于最大似然多项式回归的非线性模型自适应算法。该算法在对数谱域用多项式回归方法,逼近每个Mel子带上识别环境模型均值与训练环境模型均值之间的非线性关系。多项式系数通过EM算法和最大似然准则从识别环境下的少量自适应数据中估计。实验结果表明,二阶多项式就可以较好地逼近模型均值的非线性环境变换关系。在噪声补偿和说话人自适应实验中,最大似然多项式回归算法的误识率都明显低于最大似然线性回归算法。本文算法较好地克服了线性模型自适应算法线性假设的缺陷,可同时减小噪声,和说话人的改变或其它因素对语音识别系统的影响,尤其适合说话人和噪声的联合自适应。相似文献

8.

噪声环境下基于最大后验非线性变换的隐马尔可夫模型自适应算法

刘海滨吴镇扬赵力曾毓敏《声学学报》2004,29(5):467-471

由于训练环境和识别环境的失配,识别系统的性能会严重下降。为此,提出了基于最大后验概率非线性变换的环境自适应算法,可以减小由于环境的失配所引起的系统性能的下降。在本算法中,利用分段线性回归近似非线性变换将训练环境下隐马尔可夫模型(HMM)的均值向量变换到识别环境,减小环境的失配,变换参数的估计采用了最大后验概率估计(MAP)。数字语音识别实验证明:该环境自适应算法的识别性能优于MLST,MAPLR和MLLR等算法。相似文献

9.

基于多窗谱的心理声学语音增强 总被引：7，自引：2，他引：5

吴红卫吴镇扬赵力《声学学报》2007,32(3):275-281

与传统的周期谱图相比,多窗谱具有更小的估计方差。从含噪语音的多窗谱对噪声及噪声与含噪语音之比(NNSR)进行估计,用基于NNSR的幅度谱减实现用于计算人耳掩蔽阈值的预增强语音,用集成了人耳掩蔽阈值的心理声学加权规则实现最终的增强语音。考虑到多窗谱的特点对掩蔽偏移量进行了修正,修正后的重建语音,其客观测量指标修正巴克谱测度比修正前有一定的改进。再对心理声学加权规则作最大值小于1的限制,则输入信噪比越大(0 dB以上),分段信噪比和总体信噪比提高得越多。非正式试听表明重建语音失真较小,背景噪声大大降低,且没有音乐噪声。相似文献

10.

汉语连续语音识别中语音处理和语言处理统合方法的研究 总被引：4，自引：1，他引：4

赵力邹采荣吴镇扬《声学学报》2001,26(1):73-78

提出了一种语音处理和语言处理按帧同步统合的汉语连续语音识别方法。该方法把基于 CFG语言模型和 Top Down型句法分析器的语言处理过程结合进基于有限状态自动机控制的 One Pass Viterbi语音识别算法中,实现了帧同步的语音语言处理的统合。为完成帧同步句法分析的单词预测和语音识别过程的结合,本文提出了一种类似于Earley法的 TopDown型句法分析方法以及 One Pass Viterbi算法中的有限状态自动机动态展开建立法. 60个音素单位和 8个声调单位的 HMM作为识别用基元模型被用于识别实验,识别结果表明,对于一个识别困难度(Perplexity)为27.3的任务(Task)的识别系统,利用本文提出的方法,10名话者发音的 1070句子的平均识别率达到 94.4%,比利用传统的基于单词确认(Word Spotting)以及从单词串(列)(lattice)进行句法分析的阶层性语音·语言统合方式的识别率提高约8%. 相似文献