首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 234 毫秒
1.
本文分析了语音信号的对称限幅引起的短时FFT谱变异,计算了相同音段在不同程度限幅下的谱相关系数。以及不同音素在同样限幅下的谱相关系数、本文为开发实用语音识别系统提供了依据。  相似文献   

2.
基于MMSE先验信噪比估计的语音增强   总被引:3,自引:0,他引:3  
针对传统最小均方误差(MMSE)沿爵增强方法无法准确处理快速语音的变化问题,提出了一种堆于MMSE估计先验信噪比的语音增强方法,利用该笔法估计每帧语音俯号的每一个频率分量上的平滑系数αn,k。进行平均反馈估计,从而得到更加接近于真实情况的先验信噪比,进而使用MMSE方法进行语音的增强,提高了对于快速变化语肯的增强效果,实验结果农明,本方法比传统MMSE语青增强方法在增强性能上提高了近2dB。  相似文献   

3.
本文根据现有的维吾尔文语音识别语音库的不足,以自然口语为对象研究维吾尔语的语音特征,提出了适合该语言的电话语音语料库设计方案,其中包括了维吾尔语电话语音库的文本设计、发音人的选择、语音录制、语音库的标注和后期处理方法等.本文从构建的350个说话人的维吾尔语电话语音语料库中挑选50个目标人提供给基于GMM-UBM/SVM的维吾尔语电话信道说话人识别的研究.  相似文献   

4.
本文应用语音信号的傅里叶谱的谱矩距离判决准则选择特征谱实现了语音的自动识别.实验表明,用这种方法实现的语音识别系统对三字一组的汉语数字语音串,识别精度约为99.8%。拒识率约为1%。  相似文献   

5.
本文研讨缺乏语言资源的民族语言(如维吾尔语)中如何引用语音技术、开发应用系统问题.提出基于GMM-UBM混合SVM技术方法实现实用性说话人识别系统,通过小语料人工标注语音语料预选高精度声学根(seed)模型、再引导大语料训练生成鲁棒性声模提高连续语音识别精度实现汉民会话语音翻译系统.对维吾尔语70人发话电话语音识别实验结果显示,基于GMM-UBM -SVM方法的不特定说话人识别实验其正确识别率为94.3%,比先行GMM-UBM方法精度提升3%;基于seed声模HTK-Julius技术的维吾尔语连续语音识别实验,其识别率为72.5%,比直接使用语音文本对齐语料单靠HTK实现识别方法(63.2%)精度提高9.3%;同时本研究讨论基于Moses技术的汉维医院门诊会话语音翻译系统预测Blue值达到了57.7%.  相似文献   

6.
声调集成是汉语语音识别的一个重要任务.在语音识别的二次解码过程中,使用区分性训练的权重因子进行声调模型集成已被证明是一个有效的方法,而且使用上下文相关的得分加权进行模型组合也得到了应用.上下文相关模型组合方法的一个不足是将会带来大量的训练参数,从而导致权重训练受到过拟合的影响.针对该问题,提出利用声学决策树对上下文相关...  相似文献   

7.
语音语料库是语音识别和语音合成技术研究的基础.由于维吾尔语文字与语音特征、维吾尔语语音语料库的建立、管理、使用之工作不仅工作量巨大,且具有一定的复杂性,这就不得不开发维吾尔语语音数据库管理软件.本文首先研究维吾尔语语音语料库的设计过程,包括语音文本的设计、语音录制、语音库的标注、并在此基础上论述维吾尔语语音语料管理软件的总体功能设计以及部分关键技术的实现方法.  相似文献   

8.
语音识别是通过对说话人语音信号的分析和提取.自动确定说话人是否在所登记的说话人集合中,以及说话的人是谁的过程.本文提出了一种基于特征提取技术的模板匹配语音识别算法.该算法中,采用与文本有关(主要用于时域分析)和与文本无关(主要用于频域分析)相结合的三种识别方法:快速傅立叶变换(FFT)、平均过零率分析(RBZ)和高斯混合模型(GMM),最后通过三种方法的加权平均来生成判决门限值.通过比较门限值误差的大小,根据“最大似然准则”给出待识别语音的身份.  相似文献   

9.
在维吾尔语语音识别研究工作中,由于语音标注工作量大、精度要求高,人工标注之后不可避免的存在各种错误,因此通过专门的复查软件来检查已标注过的文件并修改错误是必不可少的。对已标注的语音文件进行复查操作在语音识别研究中具有十分重要的作用,本文介绍了维吾尔语语音标注复查软件的必要性及基本原理,复查软件的功能及其实现过程的一些技术。  相似文献   

10.
采用一种新颖的结合信息隐藏技术的语音检索算法,该算法将保密语音和伪语音分割成多段,利用经典的LSB算法分别隐藏到不同的音频,并存储在磁盘空间中.提取语音码流时,利用小波变换第一级细节分量系数能量的大小找到相应的载体音频,提取其中的语音码流,并建立语音库.利用特定人语音检索技术,检出相应的语音码流,合并语音码流得到真正的保密语音.研究表明:新算法的查准率和查全率可以达到很高的水平,为信息隐藏技术的发展开辟了一条新的研究道路,同样扩大了语音检索技术的应用范围。  相似文献   

11.
本文提出了一种对嘶哑语声功率谱进行实时伪彩色编码显示的新方法,并应用这种方法观测了16种典型的嘶哑语声功率谱的实时伪彩色语谱图.结果表明,这种方法便于直观判读,能实时地提供较多的特征信息.  相似文献   

12.
一种基于感兴趣区域提取的医学图像检索技术   总被引:1,自引:0,他引:1  
针对胸部CT扫描图像库,提出了一种基于感兴趣区域提取的图像检索方法.首先为了提取感兴趣区域,提出一种基于灰度层共现矩阵的区域增长算法,分割出病灶区域,再通过闽值算法进行边界的磨合,然后针对感兴趣区域提取形状和分布特性作为图像匹配准则的客观依据.最后,将该算法与其他底层特征算法进行比较和分析.实验结果表明,该算法能够比较有效地应用于基于内容的医学图像检索系统中.  相似文献   

13.
利用图像分割技术 ,采用矩不变自动门限方法 ,对低对比度的精子显微图像进行了自动分割 ,实验表明 ,该方法能够在较短的时间内分割出目标和背景 ,同时能克服二值化过程中出现的断线和粘连等问题 ,且方法简单 ,容易实现 ,具有较好的实用价值 .  相似文献   

14.
在土地利用/覆盖变化监测中,通常要对多时相遥感影像进行辐射归化处理,使得影像间的成像差异减小,相同地物的光谱特征相似.本研究利用两时相ETM+影像,精确选取不变像元,采用分段线性回归,探讨一种自动辐射归化处理方法.研究方法充分考虑了影像间成像条件的差异,通过影像对应波段差值直方图剔除变化像元来有效选取不变像元,将不变像元划分为暗、灰和亮3类并分级确定校正系数进行辐射归化处理.结果分析表明该方法具有一定优势.  相似文献   

15.
提出了一种当视频中的运动物体有较大范围的运动时,对其进行分割的方法.首先利用帧差法来快速定位运动物体的位置,并以此作为初始分割结果.然后利用均值偏移法准确估计运动物体的边缘并利用图切割方法建立两者之间联系.考虑到视频的运动连续性,同时引入前一帧分割结果来约束当前帧的分割.该算法同时利用了帧差法和均值偏移法的优点,能够快速准确地分割在视频场景中出现的运动物体.  相似文献   

16.
对民族服饰图案进行自动分割以提取图案纹样元素,是民族服饰图案素材库构建急需解决的难题。通过融合形态学连通域标记和CV模型(MCC-CV),提出了一种民族服饰图案自动分割方法,首先对民族服饰图案进行预处理,然后采用形态学连通域标记算法获得待分割目标的位置和大致轮廓信息,对CV模型进行初始化,最后通过CV模型对不同分割目标进行边缘追踪,以实现民族服饰图案纹样元素的自动分割。实验表明,融合形态学连通域和CV模型的民族服饰图案纹样元素自动分割方法在边界召回率(BR)为0.5时,分割准确率为60%,与其他自动分割算法相比,该算法更为有效,满足了民族服饰图案素材库建设对图案纹样元素分割的基本要求。  相似文献   

17.
对民族服饰图案进行自动分割以提取图案纹样元素,是民族服饰图案素材库构建急需解决的难题。通过融合形态学连通域标记和CV模型(MCC-CV),提出了一种民族服饰图案自动分割方法,首先对民族服饰图案进行预处理,然后采用形态学连通域标记算法获得待分割目标的位置和大致轮廓信息,对CV模型进行初始化,最后通过CV模型对不同分割目标进行边缘追踪,以实现民族服饰图案纹样元素的自动分割。实验表明,融合形态学连通域和CV模型的民族服饰图案纹样元素自动分割方法在边界召回率(BR)为0.5时,分割准确率为60%,与其他自动分割算法相比,该算法更为有效,满足了民族服饰图案素材库建设对图案纹样元素分割的基本要求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号