期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

吕钊吴小培张超李密《声学学报》2010,35(4):465-470

提出了一种基于独立分量分析(ICA)的语音信号鲁棒特征提取算法,用以解决在卷积噪声环境下语音信号的训练与识别特征不匹配的问题。该算法通过短时傅里叶变换将带噪语音信号从时域转换到频域后,采用复值ICA方法从带噪语音的短时谱中分离出语音信号的短时谱,然后根据所得到的语音信号短时谱计算美尔倒谱系数(MFCC)及其一阶差分作为特征参数。在仿真与真实环境下汉语数字语音识别实验中,所提算法相比较传统的MFCC其识别正确率分别提升了34.8%和32.6%。实验结果表明基于ICA方法的语音特征在卷积噪声环境下具有良好的鲁棒性。相似文献

2.

汉语语音识别中基于区分性权重训练的声调集成方法

黄浩朱杰《声学学报》2008,33(1):1-8

提出一种区分性方法,将声调信息加入大词汇量连续语音识别系统中.该方法根据最小音子错误准则,区分性地训练模型相关的概率权重.利用这些权重对传统基于传统谱特征的隐马尔可夫模型概率以及声调模型概率进行加权,通过调整模型之间的作用程度提高系统识别率.推导了利用扩展Baum-Welch算法的权重更新公式.对不同模型权重组合策略进行了评估,并利用权重之间的平滑方法来克服权重训练过拟合的问题.分别通过大词汇连续语音的带调音节输出和汉字输出两种识别任务来验证区分性模型权重训练的性能.实验结果表明在两种识别任务上,区分性的模型权重较使用全局模型权重分别获得9.5%以及4.7%的相对误识率降低.这表明了区分性模型权重对提高声调集成性能的有效性. 相似文献

3.

采用归一化补偿变换的与文本无关的说话人识别 总被引：10，自引：0，他引：10

包永强赵力邹采荣《声学学报》2006,31(1):55-60

在噪声环境下,特别是当说话人识别最常用的模型——高斯混合模型(GMM)失配的情况下,需要对其输出帧似然概率的统计特性进行补偿。文章根据说话人识别的声学特性,提出了一种非线性变换方法——归一化补偿变换。理论分析和实验结果表明:与常用的最大似然(ML)变换相比,该变换能够提高系统识别率,最大可达3．7％,同时可降低误识率,最大可达45．1％。结果说明归一化补偿变换方法基本克服了在与文本无关说话人识别系统中,当说话人的个性特征不断变化、语音与噪声不能很好地分离或者降噪算法对语音有损伤、模型不能很好地匹配时,需要对模型输出的似然概率(得分)进行补偿的局限。这也说明对模型输出的似然概率进行处理是降低噪声和干扰的影响、提高说话人识别率的有效方法。相似文献

4.

面向鲁棒自动语音识别的一致性自监督学习方法

高长丰程高峰张鹏远《声学学报》2023,(3):578-587

提出了一种基于一致性自监督学习的鲁棒自动语音识别方法。该方法通过使用语音信号仿真技术,模拟一条语音在不同声学场景下的副本;在通过自监督学习方式学习语音表征的同时,极大化一条语音在不同声学环境下对应语音表征的相似性,从而获取到与环境干扰无关的语音表征方式,提高下游语音识别模型的性能。在远讲数据集CHiME-4和会议数据集AMI上的实验表明,所提的一致性自监督学习算法能够取得相比已有的wav2vec2.0自监督学习基线算法30%以上的识别词错误率下降。这表明,所提方法是一种获取噪声无关语音表征、提升鲁棒语音识别性能的有效方法。相似文献

5.

层叠式“产生/判别”混合模型的语音情感识别

下载免费PDF全文

黄永明章国宝董飞李悦《声学学报》2013,38(2):231-240

提出了层叠式“产生/判别”混合模型的语音情感识别方法。首先,提取63维语句级特征,运用Fisher从中选择12个最佳的语句级特征,建立小波神经网络(WNN)的层叠式产生式模型进行语音情感识别;然后提取69维帧级特征,采用SFS选择出待使用的8维特征,将高斯混合模型(GMM)进行多维概率输出,建立层叠式“产生/判别”混合模型进行语音情感识别。实验结果显示:(1)层叠式“产生/判别”混合模型较单独WNN、GMM、HMM (隐马尔可夫模型)、SVM (支持向量机)的识别率要高;(2)层叠式“产生/判决式”混合模型识别率较基于WNN的层叠产生式模型高;(3) M=13,D维GMM-MAP/SVM (MAP,最大后验概率)串联融合模型为最优的层叠式“产生/判别”混合模型,能获得最高85.1%的识别率。相似文献

6.

基于高斯-拉普拉斯-伽玛模型和人耳听觉掩蔽效应的信号子空间语音增强算法

程宁刘文举《声学学报》2009,34(6):554-565

针对信号子空间语音增强算法中的子空间选择和线性滤波器中噪声功率谱和拉格朗日乘子的估计问题,用高斯、拉普拉斯和伽玛模型描述了语音的分布,提出了利用目标语音概率最大化来确定信号子空间维度的方法。在噪声子空间上,利用条件概率估计出噪声功率谱。接着,为了合理地折中增强语音中的残余噪声和语音畸变,提出了一种基于人耳听觉掩蔽效应的拉格朗日乘子估计方法。实验证明,在多项语音质量评价指标上,所提算法都取得了更好的结果。所提的信号子空间算法比传统的信号子空间算法更有效地消除了噪声,使得恢复的语音具有更好的质量。相似文献

7.

联合宽带到达方向估计和语音特征增强的传声器阵处理方法

李晓雪徐文金丽玲李建龙《声学学报》2011,36(4)

以提高室内混响环境下自动语音识别(ASR)性能为目标,讨论了一种小尺寸传声器阵处理方法.该方法采用基于旋转不变技术的信号参数估计算法(ESPRIT)计算宽带语音信号到达方向角,进行时延补偿;同时联合考虑阵列滤波与隐马尔可夫模型(HMM)识别过程,将识别输出结果反馈到前端的传声器阵处理,优化阵列滤波系数.与常规阵处理方法改善信号波形质量不同,本文通过调节阵列滤波系数降低待识别特征与训练模型之间的失配,直接提高识别过程中正确假设的概率.实验结果表明,上述方案能够有效降低会议室环境下孤立词有限词库ASR的错误概率,表现优于常规波束形成方法;采用全局优化进行阵列滤波设计,与局部优化算法相比,进一步改善了处理性能. 相似文献

8.

基于声调建模的带噪汉语数字串语音识别 总被引：2，自引：1，他引：1

王欢良钱瑶 F.K.SOONG 韩纪庆《声学学报》2007,32(5):454-460

尝试利用声调信息来改善噪声下汉语数字串语音识别性能。为解决声调特征不连续问题,提出采用基于多空间概率分布的隐马尔可夫模型进行声调建模。简要分析噪声对声调特征提取的影响,论证了在带噪数字串语音识别中利用声调信息的可行性。实验结果显示,与不采用声调信息的方法相比,在5 dB到20 dB的测试数据上,所提方法可使错误率平均相对下降17.2%。这说明声调信息及所提建模方法对于改善带噪汉语数字串语音识别性能是有效的。相似文献

9.

低信噪比下的语音识别技术

侯昭武侯波《广西物理》2009,(1)

传统的语音识别方法,信噪比较低时识别率也较低。为了使语音识别更具有环境适应性、抗噪性,从非齐次隐马尔可夫模型(nonhomogeneous Hidden Markov Model,HMM)出发,结合自适应函数链神经元网络,训练出适应环境变化的混合语音模型,并采用该混合模型进行语音识别。实验结果表明,该模型适用于含噪语音的识别,特别是在低信噪情况下,可以相对提高识别率。相似文献

10.

基于复高斯模型的雷达高分辨距离像目标识别新方法

王鹏辉杜兰刘宏伟《光学学报》2014,34(2):228004-284

为了利用雷达高分辨距离像(HRRP)中的相位信息改善识别系统性能,提出了一类针对复距离像的目标识别新方法。分析了复距离像的统计特性,将识别领域常用的三种高斯模型———自适应高斯分类器(AGC)模型、联合高斯(JG)模型和概率主分量分析(PPCA)模型推广至复数域对复距离像统计建模。研究表明,这三种模型及其参数估计结果均不受距离像初相的影响。此外,为了解决噪声环境中的稳健识别问题,进一步提出了噪声稳健的模型修正方法。实验结果显示:在识别过程中加入距离像相位信息能够获得更高的正确识别率;且经过噪声稳健修正后的模型大幅改善了低信噪比下的识别性能。相似文献