期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陈景东徐波黄泰翼《电路与系统学报》1996,1(4):29-32

端点检测在语音识别中占有十分重要的地位，端点检测的准确性将直接影响整十语音识别系统的性能。已往的自动端点检测方绝大多数都是利用帧平均能量EN，帧平均跨零数ZN，帧平均跨零积A和帧平均零比B等参敦来确定语音段的始点和终点。这些方法的缺点是难以设置对各次实验都合适的固定阈值，这给实际应用带来了很多不便。本文提出了一种基于迟滞编码的自动端点检测方法——在对语音信号进行迟滞编码的基础上，利用各杖的码字和来判斯语音段的起点和终点。该方法充分利用了噪声和信号的统计特性，克服了已往端点检测方法的不足。实验结果表明．该方法具有良好的性能。相似文献

2.

听觉模型用于语音识别以及与一般方法的比较

黄泰翼高雨青《电子学报》1993,21(10):1-6

本文在文献（１）建立的外周听觉系统以及部分中枢听觉神经系统的基础上，建立了一个主意识别器。它由听觉模型作为语音声学前端处理器（即特征提取），由具有ｔｏｎｏｔｏｐｉｃ组织结构的神经网络作为识别分类器。大量实验表明，由该听觉模型提取的特征参数不仅能很好地表示主意区别意义，而且对于噪声环境下的语音特征表示有较好ｔｏｂｕｓｔｎｅｓｓ。语音识别实验表明：在有噪声的情况下，采用听觉模型参数的识别器，其识别率明相似文献

3.

一种频域基频提取新方法 总被引：3，自引：0，他引：3

张红张红黄泰翼宋俊寿《声学学报》1999,(4)

提出了一种基于二值侧抑制网络的频域基频提取方法。即利用二值侧抑制网络对语音的短时谱进行峰值提取,得到包括语音基频及其谐波的线谱,根据谐波间的距离平均值估算出基频．该算法在ＣＯＳＤＩＣ数据库上进行了测试,并与自相关基频提取法和倒谱基频提取法进行了比较．实验数据表明,本算法具有更高的精度和更强的抗噪声性能．相似文献

4.

基于决策树的汉语三音子模型 总被引：8，自引：2，他引：6

高升徐波黄泰翼《声学学报》2000,25(6):504-509

基于决策树理论的上下文相关声学模型在英语语音识别中已经得到了比较深入的研究和应用,但在汉语语音识别中的应用则研究的比较少。本文基于决策树理论建立了汉语语境相关模型-三音于模型,讨论了决策构建模所要解决的几个重要问题:(1)基本建模单元集的选择,(2)音子类别集的设计,(3)评估函数的选择,(4)停止准则的选择,(5)决策树的建立和三音子模型的生成,本文着重分析了两种不同建模单元的性能:对音子类别集的设计提出了一些一般性的准则,并对我们设计的类别集进行了统计分析;分析了三音子模型在语音库的覆盖程度。实验结果表明,基于决策树的三音子声学模型建立的识别系统与双音子声学模型系统比较,误识率下降了24.7%。相似文献

5.

基于半波差分谱的语音信号音节切分 总被引：1，自引：1，他引：0

张红黄泰翼李治《声学学报》2000,25(4):323-328

根据听觉感知系统对于动态语音特征的响应特点,提出了半波差分港的概念,在此基础上提出了一种简便的音节切分算法,可以将存在大量协同发音现象的连续语音切分成一个个音节。在连续语音上的切分实验结果说明这种切分算法是准确而可靠的. 相似文献

6.

几种高鲁棒性通道及说话人自适应语音识别算法研究 总被引：1，自引：1，他引：0

陈景东姚磊黄泰翼《声学学报》1998,23(6):537-544

鲁棒性问题是决定语音识别技术能否在实际中得以应用和推广的关键问题之一。概括起来说,导致语音识别系统性能变坏的原因大体上来自三个方面,即噪声(加性噪声、卷积噪声)、信道变化和不同的讲话者(不同的声道形状、不同的发育方式等)。本文对三种高鲁律性自适应语音识别方法进行了研究和改进,并对它们的性能进行了比较,这三种方法分别是VQ码本自适应法、HMM参数自适应法和基于正则相关分析的谱变换补偿方法。实验结果表明,这三种方法都能提高非特定人语音识别系统对信道以及说话人的鲁棒性,而且基于正则相关分析的稻变换补偿方法具有最好的性能,它能够补偿由三种失真源同时引起的训练条件与测试条件之间的不匹配,因此适合作为一种通用的自适应方法。相似文献

7.

第二届全国人机语言通讯学术会议在桂林召开

下载免费PDF全文

黄泰翼《应用声学》1993,12(1):46-46

由中国自动化学会、中国声学学会等五个学术团体联合主持的第二届全国人机语音通讯学术会议,于1992年9月18日—20日在桂林举行。近一百名学者、专家及青年科技人员参加了这次会议。在会上宣读了95篇论文,这批论文涉及听觉模型与特征提取、语音识别方法与系统、非特定人语音识别、连续语音识别与语言模型、说话人识别、神经网络相似文献

8.

音节混淆字典及在汉语口音自适应中的应用研究

刘明宽徐波黄泰翼胡伟湘《声学学报》2002,27(1):53-58

提出了一种基于对识别器识别错误的统计分析建立音节混淆字典,并应用该音节混淆字典作为识别器的先验知识来校正结果的识别方法。这种近似的音节混淆字典可以分与语境无关和相关两种情况讨论,作为一种先验知识,它综合地刻画了说话人的发音特征、识别器的识别特征以及二者之间的相对关系。实验中,我们应用语境无关/相关的音节混淆字典于识别带上海口音的普通话识别器,使其音节误识率分别下降15%及20%。在此基础上,本论文结合常规的声学模型参数重估自适应MAP (最大后验概率)算法进一步研究了这种方法应用于语音识别系统的实际效果。结果证明,二者互为补充,更大地提高了识别器的精度。相似文献