期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

姜涛韩纪庆郑铁然《声学学报》2011,36(6)

提出一种模型补偿方法,以克服基于高斯混合模型的文本无关说话人识别系统性能随目标话者训练语料长度减小而下降的问题.该方法首先构造了一个低维的移动空间,每个训练语料较充分说话人模型的自适应过程均可用该空间中的移动因子表示,然后在目标话者训练语料较不充分的条件下,从受训练语料长度影响较小的话者模型分量中学习移动因子,并依据它对受语料长度影响较大的分量进行参数补偿.和基线系统相比,该方法在相同的训练和评测集上,等错误率指标下,获得相对约7％的性能提升. 相似文献

2.

基于Teager能量算子(TEO)基频的应力影响下的变异语音分类 总被引：4，自引：1，他引：3

马永林韩纪庆张磊吕成国王承发《声学学报》2002,(6)

变异语音识别是一项极具挑战意义的研究课题,一种解决方法是在前端对语音进行变异分类,然后根据不同变异情况采用相关的处理算法。在各种语音变异中,说话人在战斗机、航天飞机座舱等环境中,身体受到应力（重力）影响时的情况更具有特殊性。其所引起的发音变异有别于因心理的、感知的或生理的因素所引起的变异,目前国内外还鲜见有关应力影响不变异语音分类问题的专门研究。木文从对应力影响下的几种基于基频的语音特征的分析出发,提出了对应力影响下的变异语音和正常语音进行分类的方法。对航空模拟飞行器中采集的小词表实验样本,特定人平均分类正确率达到了93.3％,多说话人分类上确率达到了85.8％。相似文献

3.

基于音节Lattice的汉语语音检索技术及其索引去冗余方法 总被引：4，自引：0，他引：4

郑铁然韩纪庆《声学学报》2008,33(6)

针对网络中越来越多的语音数据,人们迫切地需要基于语义内容的快速、准确的语音检索技术.本文在基于音节Lattice的汉语语音检索研究中,针对传统的向量空间模型检索方法的不足,提出了一种基于词检出实现的语音榆索方法.并针对Lattice索引存在的信息冗余问题,提出了一种基于音节后验概率直方图的索引去冗余方法.实验结果表明,本文的检索方法在性能上明显优于向量空间模型方法;而提出的索引去冗余方法达到了大规模缩减索引尺寸加快检索速度的目的. 相似文献

4.

基于分段的实时声频检索方法 总被引：1，自引：0，他引：1

郑贵滨韩纪庆李海峰郑铁然《声学学报》2006,31(2):101-108

提出了基于分段的实时声频检索方法,并讨论了在实时检索中的控制策略。该方法将检索目标划分为片段序列,并使用检索窗控制参与检索的片段。在多目标检索中,利用声频的类别信息加快检索速度。实验证明检索方法的速度快、可控性好、实时性强,具有良好的缺失鲁棒性(Robustness),查全率和查准率分别达到100％和99．7％;将声频分类可有效提高多目标检索的速度,声频分类方法的平均正确率为95．7％。解决了声频检索中检索反应滞后时间长、检索速度随检索目标长度增加呈线性下降等问题。相似文献

5.

基于听觉特性的音频水印能量估计及自适应嵌入算法研究 总被引：9，自引：0，他引：9

冯涛韩纪庆《声学学报》2006,31(1):48-54

基于水印能量对提高水印鲁棒性的重要作用,提出了音频水印载体可以嵌入最大水印能量的估计方法。该方法利用了听觉掩蔽特性及MPEG-2听觉模型,计算音频载体在变换域下每帧数据可以嵌入的水印能量,进而估计整体水印能量,并将能量估计方法应用在自适应水印嵌入算法的模型构造上。实验结果验证了水印鲁棒性随嵌入能量的增加而提高;所提出的自适应水印嵌入模型,能根据音频载体自身的特点动态调整水印嵌入强度,在保证听觉质量的同时,提高了水印嵌入量。克服了通过重复实验判断水印嵌入能量方法的复杂性,以及在嵌入相同能量情况下,采用固定水印嵌入强度系数导致的噪声过大等缺点。相似文献

6.

动态时间规正与差别子空间相结合的变异语音识别方法

吕成国韩纪庆王承发《声学学报》2005,(3)

分析了由于说话人受到重力加速度变化而产生的变异语音(应力影响下的变异语音)的特点,把变异语音分成主体部分和变异部分两方面进行研究,提出一种动态时间规正与差别子空间相结合的孤立词语音识别方法。该方法构造差别子空间去除变异部分的影响,利用语音的主体部分进行识别,采用动态时间规正技术对语音特征矢量进行长度对齐,并提出了相应的判别标准。实验结果表明,本方法对应力影响下的变异语音具有良好识别效果,对15个词的小词表,系统平均识别率达到98.3%,与正常语音的识别率基本相当。克服了话者在应力影响下由于心理紧张和生理情况的变化,语音发生严重变异,导致常规语音识别系统性能急剧下降的缺点。相似文献

7.

一种对应力变异语音的特征补偿方法

张磊韩纪庆王承发《声学学报》2004,(1)

提出一种描述正常语音和变异语音之间关系的补偿因子。该补偿因子兼顾考虑了由于变异引起的特征分布中均值和方差的变化,并在k-均值初始化的参数基础上,采用期望最大化(EM)算法迭代估计变异补偿因子的值。通过估计出的补偿因子对变异语音特征进行补偿。对航空模拟飞行器中采集的应力变异下特定话者小词表孤立词的实验结果表明,利用所提出的方法可以将识别率提高32.3％。相似文献

8.

基于声调建模的带噪汉语数字串语音识别 总被引：1，自引：1，他引：1

王欢良钱瑶 F.K.SOONG 韩纪庆《声学学报》2007,32(5):454-460

尝试利用声调信息来改善噪声下汉语数字串语音识别性能。为解决声调特征不连续问题,提出采用基于多空间概率分布的隐马尔可夫模型进行声调建模。简要分析噪声对声调特征提取的影响,论证了在带噪数字串语音识别中利用声调信息的可行性。实验结果显示,与不采用声调信息的方法相比,在5 dB到20 dB的测试数据上,所提方法可使错误率平均相对下降17.2%。这说明声调信息及所提建模方法对于改善带噪汉语数字串语音识别性能是有效的。相似文献

9.

自然风格言语的汉语句重音自动判别研究 总被引：6，自引：2，他引：6

邵艳秋韩纪庆刘挺赵永贞《声学学报》2006,31(3):203-210

重音是语音合成中韵律处理的一个重要参数。本文分析了轻声和重读音节同正常重音在各声学参数上的差异,包括基频、音节时长、强度、停顿长度等,还特别考察了时长同基频参数之间的关系,以及上声音调同基频的关系。建立了基于人工神经网络的三种重音预测模型,即声学预测模型、语言学预测模型和混合预测模型,对汉语句重音(包括轻声、正常重音、重读)进行了自动判别,结果显示混合模型要优于另外两种模型。此外,本文还根据重音标注的多样性现象设计了支持率的评价方法。相似文献

10.

高噪声背景下的孤立词语音识别方法研究及系统实现 总被引：2，自引：0，他引：2

王承发徐近需扬子云韩纪庆任为民吕成国《声学学报》1998,(3)

对高噪声背景下的语音特点进行了分析，提出了适应于高噪声背景下孤立词语音识别的全套方法，进行了系统实现。对本方法和系统进行了详细的实验比较和测试，证明系统在80dB左右接近同类无噪声识别系统的精度，最高可以抵抗100dB的噪声。相似文献