排序方式: 共有36条查询结果,搜索用时 531 毫秒
21.
22.
23.
应用于语音识别片上系统的语音检测算法 总被引:2,自引:0,他引:2
语音识别技术的研究已经进入实用化阶段,而实用化语音识别系统中的一个关键技术就是可靠的语音检测。本文提出了一种基于有限状态机模型的实时语音检测算法(FSM-SD)。采用对数最大似然判决帧能量检测器和过零率检测器控制各状态之间的跳转关系。针对语音识别中的MFCC(Mel频标倒谱系数)和LPCC(线性预测倒谱参数)特征提取过程,分别得到两种不同的帧能量计算方法。将FSM-SD应用到在OAK DSP上实现的小词表汉语语音识别系统,通过实验验证了其对系统识别性能和噪声稳健性的有效保证。 相似文献
24.
基于对计算听觉场景分析(Computational Auditory Scene Analysis,CASA)算法思想的研究,提出了一种单通道语音增强方法。通过分析白噪声、风噪声、周期性噪声三类典型噪声和一般语音信号的频谱特点,构造适合的信号提取特征作为线索,判别出信号时频单元中的主要信号成分,然后对各时频单元乘以相应的衰减系数以掩蔽噪声成分。对仿真实验结果的客观测试和非正式听音测试表明,相对于常用的多子带谱减法和维纳滤波法,所提出的算法能够更有效地抑制白噪声、风噪声、周期性噪声等背景噪声。 相似文献
25.
开关电源控制苍片宏模型是开关电源CAD中一个重要组成部分。本文讨论了开关电源控制芯片宏模型的自动生成方法,分两类构造了控制芯片的整体拓扑和各功能单元宏模型,并详细介绍了宏模型的生成步骤,实现了自动生成软件,最后给出了测试结果。 相似文献
26.
本文提出了一种新的用于片上的语音识别多级搜索算法.该算法以连续隐含马尔可夫模型(Continuous Density HMM,CDHMM)为基本识别框架.在保证识别率基本不变的前提下,大大降低了片内存储空间的占用量,减少了识别搜索时间.在第二级识别候选词条的选取准则上,提出一种基于置信度的选择方法,更进一步改善了识别速度,增强了识别的稳健性.在200个语音命令的识别任务下,系统的识别率为98.83%.而当识别词条增加到600条时,该算法也具有良好的识别性能. 相似文献
27.
28.
基于Actel CoreMP7低成本SoC开发验证平台,完成了以ARM7为核心控制器、马氏距离计算专用电路(MSAC)为协处理器的语音识别SoC的设计与验证。实验结果表明,该SoC系统在Actel ProASIC系列FPGA M7A3P1000上综合实现后,约占用M7A3P1000总资源的39.18%及1KB片内SRAM,完成整个语音识别算法性能比S3C44BOx(ARM7)平台上定点C程序提高了49.78%,充分证明了CoreMP7平台用于SoC设计的可行性和便捷性,以及主处理器配合硬件加速协处理器架构在信号处理领域的优势。 相似文献
29.
该文提出了一种基于先验知识的三音子模型聚类结构自适应策略,可以在规模很小的自适应语音库条件下改善三音子声学模型的聚类结构使之更适合应用对象的协同发音特点。以基本声学模型训练过程中的三音子模型聚类结果作为先验知识的聚类中心,依据基本声学模型对自适应语音库的分割,按照最大似然准则迭代地重估新的聚类中心和模型聚类结构。实验表明:基于先验知识的三音子模型聚类结构自适应策略可以在不足两小时的自适应语音库上实现三音子模型聚类结构重估,在针对汉语母语说话人的英语声学模型实验中,该文的模型聚类结构自适应策略可以将系统识别率从74.59%提高到83.63%。 相似文献
30.
该文通过将计算机辅助语言学习(Computer Assisted Language Learning, CALL)系统的标准发音网络加入插入和删除路径的方法提出了一种发音错误检测新算法:检错音网络(Error-Detecting Network of Pronunciation, EDNP)错误检测算法。该算法首先对待测语音进行EDNP错误检测,然后通过对检错音网络的二级识别结果使用一级多候选词图进行错误召回的策略,进行错误检测,该算法易于实现并具有平台无关性。实验结果表明:该文提出的EDNP错误检测方法在中国四级考生语音测试库上使删除错误虚警率和漏报率分别达到7.38%和12.25%,插入错误虚警率和漏报率分别达到4.94%和26.17%,且客观评分与专家评分相关度比强制对齐方法的相关度提高了4.29%。 相似文献