期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

吴红卫俞一彪吴镇扬《声学学报》2008,33(3):244-251

分析了理想情况下离散余弦变换域中语音信号增益,先验信噪比及后验信噪比之间的关系,用实际数据获得了各种信噪比下增益范围的统计特性.基于语音呈Laplace分布、噪声呈Gauss分布的模型,推导了具有相位特性的增益及先验信噪比的估计公式,通过合理性分析得到了简化的相位判别准则.实验结果表明,在高斯白噪声和F16飞机噪声情况下,简化的相位判别可使低信噪比下的语音增强系统的性能得到较大的改善. 相似文献

2.

倒谱本征空间结构化高斯混合模型语音转换方法

李阳春俞一彪《声学学报》2015,40(1):12-19

针对非平行语料非联合训练条件下的语音转换,提出一种基于倒谱本征空间结构化高斯混合模型的方法。提取说话人语音倒谱特征参数之后,根据其散布矩阵计算本征向量构造倒谱本征空间并训练结构化高斯混合模型SGMM-ES(Structured Gaussian Mixture Model in Eigen Space)。源和目标说话人各自独立训练的SGMM-ES根据全局声学结构AUS(Acoustical Universal Structure)原理进行匹配对准,最终得到基于倒谱本征空间的短时谱转换函数。实验结果表明,转换语音的目标说话人平均识别率达到95.25%,平均谱失真度为1.25,相对基于原始倒谱特征空间的SGMM方法分别提高了0.8%和7.3%,而ABX和MOS测评表明转换性能非常接近于传统平行语料方法。这一结果说明采用倒谱本征空间结构化高斯混合模型进行非平行语料条件下的语音转换是有效的。相似文献

3.

一种适于说话人识别的非线性频率尺度变换 总被引：3，自引：0，他引：3

俞一彪袁冬梅薛峰《声学学报》2008,33(5)

传统的非线性频率尺度变换虽然能够反映人类听觉系统(HAS:Human Auditory System)的感知特性,但不能区别对待语音中包含的语义和个性特征,在表达说话人个性特征方面并不充分.通过分析语旨信号不同频带短时谱对说话人识别性能的影响,采用最小二乘法多项式曲线拟合技术,提出了一种非线性频率尺度变换.实验表明,与传统的Mel、Bark和ERB频率尺度变换相比,在同样的训练与测试条件下,平均误识率分别降低70.5%,60.8%和70.5%.这一结果说明,本文提出的非线性频率尺度变换有效地增强了短时谱的说话人个性特征,能够提高说话人识别系统的性能. 相似文献

4.

文本无关说话人识别的全特征矢量集模型及互信息评估方法 总被引：1，自引：0，他引：1

俞一彪王朔中《声学学报》2005,(6)

提出了一种文本无关说话人识别的全特征矢量集模型及互信息评估方法,该模型通过对一组说话人语音数据在特征空间进行聚类而形成,全面地反映了说话人语音的个性特征。对于说话人语音的似然度计算与判决,则提出了一种互信息评估方法,该算法综合分析距离空间和信息空间的似然度,并运用最大互信息判决准则进行识别判决。实验分析了线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC)两种情况下应用全特征矢量集模型和互信息评估算法的说话人识别性能,并与高斯混合模型进行了比较。结果表明:全特征矢量集模型和互信息评估算法能够充分反映说话人语音特征,并能够有效评估说话人语音特征相似程度,具有很好的识别性能,是有效的。相似文献

5.

噪声自适应拟合补偿的鲁棒性声纹识别算法

下载免费PDF全文

陈壮俞一彪《声学学报》2022,47(1):151-160

目前的声纹识别系统在安静环境下性能已经很高,但处在复杂噪声背景时,由于训练和应用环境的不同会导致系统性能急剧下降.为解决这一问题,从i-vector空间降噪思想出发,通过偏最小二乘算法直接推导含噪i-vector与纯净i-vector之间的关系,并采用自编码器衡量未知噪声类型的含噪i-vector与已知噪声类型的含噪i... 相似文献

6.

短时频谱通用背景模型群联合韵律的年龄语音转换

下载免费PDF全文

惠琳俞一彪《声学学报》2017,42(6):762-768

提出一种短时频谱通用背景模型群与韵律参数相结合进行年龄语音转换的方法。谱参数转换方面,同一年龄段各说话者提取语音短时谱系数并建立高斯混合模型,然后依据语音特征相似性对说话者进行聚类,每一类训练一个通用背景模型,最终得到通用背景模型群和一组短时频谱转换函数。谱参数转换之后再对共振峰进一步微调。韵律参数转换方面,基频和语速分别建立单高斯和平均时长率模型来推导转换函数。实验结果显示,提出的方法在ABX和MOS等评价指标上比传统的双线性法有明显的优势,相对单一通用背景模型法的对数似然度变化率提高了4%。这一结果表明提出的方法能够使转换语音具有良好目标倾向性的同时有较好的语音质量,性能较传统方法有明显提升。相似文献

7.

基于互信息匹配模型的说话人识别 总被引：4，自引：0，他引：4

俞一彪王朔中《声学学报》2004,(5)

依据互信息理论提出的互信息匹配识别模型MIM(Mutual Information Matching),能够有效地综合处理语音信号的统计分布特征与时变分布特征,并具有较强的鲁棒性。介绍了运用互信息进行说话人模式匹配的原理,探讨了基于文本的说话人识别中MIM模型的应用,通过说话人辨别实验对MIM模型的性能进行了实验分析,并与其它识别模型DTW和GMM进行了比较。对18名男性和12名女性组成的30名说话人进行的识别实验表明, MIM模型的说话人识别性能较好,在采用LPCC特征参数的情况下,平均错误识别率为1.33％。相似文献

8.

临界频带子波变换用于混叠语音分离的研究 总被引：4，自引：1，他引：3

赵鹤鸣朱祺陈雪勤俞一彪《声学学报》2004,(2)

以反映听觉特性的临界频带子波变换为工具,对混叠语音进行了分析,提出了一种基于临界频带子波变换的混叠语音源信号基音分离和检测方法,在此基础上利用数字多谐振荡器的选频特性,有效地获取构成混叠语音的每个语音信号的各谐波分量,以此实现从混叠语音中分离出各源信号。实验结果表明混叠语音分离方法是可行有效的。相似文献

9.

采用独立说话人模型的语音转换

下载免费PDF全文

俞一彪曾道建姜莹《声学学报》2012,37(3):346-352

提出一种基于完全独立的说话人语音模型进行语音转换的方法。首先每个说话人采用各自的语料训练结构化高斯混合模型(Structured Gaussian Mixture Model,SGMM),然后根据源和目标说话人各自的模型采用全局声学结构(AcousticalUniversal Structure,AUS)进行匹配和高斯分布对准,最终得到相应的转换函数进行语音转换。ABX和MOS实验表明可以得到与传统的平行语料联合训练方法接近的转换性能,并且转换语音的目标说话人识别正确率达到94.5%。实验结果充分说明了本文提出的方法不仅具有较好的转换性能,而且具有较小的训练量和很好的系统扩展性。相似文献