期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于HMM／MLFNN混合结构的说话人辨认研究 总被引：3，自引：0，他引：3

包威权陈琦《北京大学学报(自然科学版)》1997,33(3):359-367

将隐马尔可夫模型与人工神经网络相结合既利用ＨＭＭ能够较好地描述动态时间序列又ＡＮＮ静态分类能力强的特点，应用于说话人辨认。本文将一个多层前馈神经网络与ＨＭＭ相结合构成混合模模型，与以往的方法不同。具有所需训练数据量小，推广性能良好的特点。相似文献

2.

基于掌上电脑录音的说话人辨认

殷启新韩春光杨鉴《云南民族大学学报(自然科学版)》2003,12(4):251-254

说话人辨认是语音信号研究中的一个重要组成部分。本文根据掌上电脑录音的语音数据库进行说话人辨认的实验。当高斯混合模型(GMM)用于说话人辨认，而特征矢量的协方差矩阵取不同形式时，比较用EM算法对模型参数进行估计的收敛性以及对说话人辨认的影响。实验表明，当特征矢量参数协方差矩阵为满矩阵时，EM算法能更有效估计GMM参数，有效提高识别率。相似文献

3.

基于参考说话人模型和双层结构的说话人辨认

王刚邬晓钧郑方王琳琳张陈昊《清华大学学报(自然科学版)》2011,(9):1261-1266

为了提高基于Gauss混合模型通用背景模型(GMM-UBM)的说话人辨认系统的运算效率,提出一种基于参考说话人模型的双层结构用于目标说话人剪枝,采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,利用语音与参考说人模型的偏差来描述说话人的发音特性,将辨认语音偏差向量和目标说话人偏差向量的相似性作为距离度量来进行目标说话人剪枝。实验结果表明:在基于GMM-UBM的说话人辨认系统中,对包含5 200个目标说话人和1 000个集外说话人的测试集进行开集辨认的条件下,在提高辨认的运算效率12.5倍的同时识别率仅下降0.3%。相似文献

4.

基于KFD特征提取的说话人辨认

党圣鸣姚宏高敬媛《西北大学学报(自然科学版)》2009,39(4)

目的获得具有更好的说话人鉴别特征,改善说话人识别系统.方法首先用KFD对语音信号的MFCC特征进行再提取,然后用SVM对提取的特征分类辨认.结果比较了LPC和KDA提取MFCC后的3种特征的识别结果.其中LPC的识别结果在89%左右,MFCC识别结果在96%左右,提取后的识别结果在97%左右.其识别率比提取前有明显的提高.结论该方法对说话人有更好的识别能力.KFD比传统的LDA能提取出可分性更强的特征,提高了系统的识别率,同时由于该方法的复杂性,也增加了系统的运算时间.今后,应该针对如何进一步提高系统的识别率和缩短系统的运算时间等问题进行研究. 相似文献

5.

多特征组合多分类器的方法用于“文本无关”的说话人辨认

王岚陈珂《北京大学学报(自然科学版)》1998,34(2):275-282

组合多分类器可以看作是一种用于获得较高识别效果的混合系统，重点探索了以不同特征作为输入的组合多分类器方法。实验结果表明：利用多特征组合多分类器的方法可以提高“文本无关”说话人辨认系统的识别率和可靠性。相似文献

6.

说话人辨认中基于进化策略的最大互信息训练方法

茅晓泉胡光锐唐斌《上海交通大学学报》2003,37(3):335-337

针对最大似然训练分辨能力的不足，把最大互信息训练方法引入到高斯混合模型（GMM）的训练中，并直接采用进化策略实现模型参数的全局训练，以模型与训练数据之间的互信息作为进化过程中个体的适应度。该系统不仅分辨能力强，而且摆脱了局部搜索的缺陷。实验结果表明，这种方法生成的说话人辨认系统的识别性能要优于传统的期望最大化算法（EM）生成的系统。相似文献

7.

基于神经网络的与文本相关说话人辨认系统

荣蓉《山东科学》2008,21(4):62-65

说话人识别是语音识别的一种特殊方式,对于各种领域的身份认证具有得天独厚的优势。以线性预测系数（Linear Predielion Coefficients,LPC）作为特征参数,采用多层感知器神经网络和BP算法建立了一个与文本相关的说话人辨认系统。实验结果表明,这种神经网络系统在说话人辨认中是有效的。相似文献

8.

神经网络预测模型的说话人识别算法

江太辉《五邑大学学报(自然科学版)》2003,17(1):23-26

将神经网络预测模型（NPM）应用于说话人识别中，经过实验，获得了较满意的结果。这说明神经网络对于说话人识别是一种很有潜力的方法。相似文献

9.

基于树形通用背景模型的高效说话人辨认

熊振宇郑方宋战江吴文虎《清华大学学报(自然科学版)》2006,46(7):1305-1308

为了提高基于G auss混合模型通用背景模型(GMM-U BM)的说话人辨认系统的运算效率,提出一种基于树的核心挑选算法(TBK S),通过将U BM中的各个G auss分布按组织成树形结构,来减少从中挑选核心分布的运算量。实验结果表明:对1 000个说话人进行辨认,TBK S与现有的基于特征矢量重排序的剪枝算法(ORBP)相结合,将基于GMM-U BM的辨认系统的运算速度提高21.9倍,误识率却只上升不到4%;TBK S和ORBP相结合,可大幅度提高GMM-U BM系统的运算效率,而基本不降低识别率。相似文献

10.

基于GMM统计参数和SVM的说话人辨认研究

贺志阳张玲华《南京邮电大学学报(自然科学版)》2006,26(3):78-82

支持向量机(SVM)是以统计学习理论为基础,解决模式识别问题的有力工具,但是它训练算法复杂,难以处理大量样本,限制了其在说话人识别方面的使用。针对这个问题,提出了一种基于GMM(高斯混合模型)统计参数和SVM的说话人辨认系统,以GMM模型的统计参数来训练SVM说话人辨认模型,有效解决了大样本数据下SVM模型的训练问题。实验表明,该方法有良好的效果,并且与倒谱加权方法结合后,可以增强系统的健壮性,进一步提高系统的识别率。相似文献

11.

基于分级遗传算法的结构损伤识别方法 总被引：6，自引：1，他引：6

程远胜区达光谭国焕白植洲《华中科技大学学报(自然科学版)》2002,30(8):73-75

提出了一种基于遗传算法的利用不完整振动数据识别结构损伤的新方法，该方法首先扩展不完整的振型并利用单元能量熵差比确定结构损伤的大致位置，然后采用二级搜索策略，借助遗传算法确定结构损伤的程度，数值计算结果表明，当可能的损伤区域较大时，本方法较直接搜索策略更能有效地确定结构损伤的程度。相似文献

12.

A two-level hierarchical Markov decision model with considering interaction between levels

LIU Dan ZENG Wei ZHOU Hongtao 《武汉大学学报:自然科学英文版》2013,18(1):37-41

Decision in reality often have the characteristic of hierarchy because of the hierarchy of an organization’s structure. In this paper, we propose a two-level hierarchic Markov decision model that considers the interactions of agents in different levels and different time scales of levels. A backward induction algo-rithm is given for the model to solve the optimal policy of finite stage hierarchic decision problem. The proposed model and its algorithm are illustrated with an example about two-level hierar-chical decision problem of infrastructure maintenance. The optimal policy of the example is solved and the impacts of interactions between levels on decision making are analyzed. 相似文献

13.

GMM-UBM和SVM说话人辨认系统及融合的分析 总被引：3，自引：0，他引：3

鲍焕军郑方《清华大学学报(自然科学版)》2008,48(Z1):693-698

在说话人辨认任务中,Gauss混合模型-通用背景模型(Gaussian mixture model-universal backgroundmodel,GMM-UBM)采用帧向量进行建模和识别,突出了说话人个性特征,但受信道影响较大;支持向量机(support vector machine,sVM)利用帧向量在空间中分布的Gauss混合的均值进行建模和识别,对信道的鲁棒性较好,但对说话人的个性体现不够.该文分析了这2种说话人识别系统的优缺点,并采用融合方法来提高系统的性能.在美国国家标准与技术研究所(NIST)评测数据集的实验中,融合系统的等错误率从GMM-UBM系统的9.30％和SVM系统的8.26％降低到7.34％,分别相对降低了21.08％和11.14％. 相似文献

14.

智能环境中音视频双模态的身份辨识

陈雁翔刘鸣《中国科学技术大学学报》2010,40(5)

首先描述了智能环境下一种基于语音和人脸图像的双模态的身份辨识系统;然后在基于语音的说话人辨识中采用改进的基于语音段的高斯混合模型,在基于人脸的身份辨识中利用K近邻法对整个视频序列而非单个静止图做判决;最后在评分层通过对双模态输出的评分进行规整和加权组合实现融合.实验表明,音视频双模态融合能有效提高身份辨识系统的正确率. 相似文献

15.

与文本无关的复合策略说话人辨识系统 总被引：4，自引：1，他引：4

牟晓隆胡起秀吴文虎《清华大学学报(自然科学版)》1997,(3)

为获得较高的说话人辨识正确率，同时减小辨识系统的时空开销，提出了一种复合策略的辨识系统。采用长时平均频谱作为粗识的特征，定义了相应的辨识判别准则。建立ｍｅｌ－倒谱特征的高斯混合模型（ＧＭＭ）进行第二步辨识。给出了ＧＭＭ求解算法的一种简便推导，着重研究了判别阈值，预加重系数，ＧＭＭ阶次，训练语音长度及辨识语音长度对系统辨识性能的影响。相似文献

16.

一种新的数字语音通信中说话人身份认证方法

唐升侯榆青李岩克兢《西北大学学报(自然科学版)》2006,36(1):46-49

目的为保证网络信息交互的安全,在数字语音通信中对说话人进行身份认证。方法利用回声隐藏技术,在语音信号中嵌入表征说话人身份的数字签名。结果实验证明,引入的回声信号听觉上不能感知。通过倒谱分析,能够完整地从隐写语音信号中提取出数字签名。结论是一种有效的说话人认证方法,具有广泛的应用前景。相似文献

17.

基于GA/VQ的说话人辨认的研究与实现 总被引：3，自引：0，他引：3

王金明李恩波《解放军理工大学学报(自然科学版)》2005,6(3):214-218

为了改善在矢量量化说话人识别中,采用模板(码书)表征说话人,模板的质量对识别系统的性能。采用遗传算法改进模板的生成方式,构建了一种GA／VQ说话人辨认系统,给出了一种GA／VQ识别算法,通过遗传操作获得全局优化的说话人模板。实验证明,GA／VQ方法提高了码书的质量,比经典矢量量化识别系统识别率高。相似文献

18.

基于二电平矢量拓展的通用多电平控制策略

程善美蔡凯李自成《华中科技大学学报(自然科学版)》2008,36(12):35-38

选择电平作为参考对象,研究了对电平数和相数都具有通用性的多电平控制策略,提出了二电平矢量拓展法,并进一步分析解决了新控制策略中的电平离散意义、整余分量分解、二电平分析、桥臂开关分组等关键问题.该控制策略物理意义明晰、实现简易,控制策略的复杂度不随电平数或相数的增加而增大,对于系统电平数及相数的变化都具有很好的通用性.最后,在Matlab环境中搭建了三相五电平逆变系统模型,仿真结果证明了该控制策略简单可行. 相似文献