排序方式: 共有15条查询结果,搜索用时 15 毫秒
1.
音频工作站MPEG-Ⅰ Layer-Ⅱ码流快速解码混音 总被引:1,自引:0,他引:1
为了能实时完成数字音频工作站中多路MPEG-Ⅰ Layer-Ⅱ音频压缩码流的快速解码混音,在分析MPEG-Ⅰ解码器中的多相滤波器组这个核心算法的基础上,提出了多路MPEG-Ⅰ Layer-Ⅱ码流的快速解码混音算法.此算法在进行混音计算时,只需做一次在解码中较为费时的子带综合滤波计算,大大提高了多路混音的速度.实验表明,用该算法进行8路MPEG-Ⅰ Layer-Ⅱ解码混音时,在PI-Ⅱ 600MHz的PC机达到了0.25倍实时的解码速度,完全满足了专业数字音频工作站的要求. 相似文献
2.
为了能实时完成数字音频工作站中多路MPEG-ILayer-II音频压缩码流的快速解码混音,在分析MPEG-I解码器中的多相滤波器组这个核心算法的基础上,提出了多路MPEG-ILayer-II码流的快速解码混音算法。此算法在进行混音计算时,只需做一次在解码中较为费时的子带综合滤波计算,大大提高了多路混音的速度。实验表明,用该算法进行8路MPEG-ILayer-II解码混音时,在PI-II600MHz的PC机达到了0.25倍实时的解码速度,完全满足了专业数字音频工作站的要求。 相似文献
3.
4.
段长信息在连续语音识别中的应用研究 总被引:4,自引:1,他引:3
基于段长分布的隐含马尔可夫模型(DDBHMM)有效地解决了经典HMM的缺陷.本文以DDBHMM模型为基础,详细研究了如何在连续语音识别中有效地利用段长信息。文中首先介绍了段长分布的统计方法,然后按照不同的说话速度对数据文件进行了分类,据此进行的识别实验表明,段长信息对于速度慢的文件效果最好,速度中等的次之,速度快的效果较小.作者认为,段长信息最大的作用在于能够得到更加精确的音节和状态分割点,并因而提高识别效果.同时,通过段长信息的有效利用,还能够提高识别系统对于说话速度的稳健性、作者又进行了细化研究,提出了利用分类段长和规整化的段长的研究方法,发现两者均可使识别效果有进一步的提高.为了研究如何利用段长之间的相关性,文中还提出了段长的Bigram的方法,并对之作了分析.最后,本文研究了采用后处理方法利用段长信息的效果,进一步说明了只有基于DDBHMM,在识别过程中同步利用段长信息,才能得到卓有成效的性能提高。 相似文献
5.
为了克服传统端点检测算法在有噪环境下的不足,提出了一种新的语音多子带端点检测算法,它能根据子带背景噪声大小动态设置门限.实验结果表明,所提出的算法较传统的检测方法有更好的检测性能. 相似文献
6.
设计并实现了一种以ADI公司ADSP-21369高性能浮点处理器为核心,CS5368芯片为数据采集接口的8路传声器阵列信号处理系统.由于采用了高速浮点处理器,使得该系统具有高速的浮点信号处理能力,适合于完成各种复杂的信号处理.该系统应用于实时语音增强中,取得了满意的效果. 相似文献
7.
介绍了一种传声器阵列语音数据果集系统的软硬件设计方案,该系统采用USB2.0接口实时传输采集到的多通道语音数据,系统具有使用方便、容易扩展等特点. 相似文献
8.
针对目前近场环境下利用TDE(Time Delay Estimation)估计声源位置时无闭式表达式的情况,在分析声源不同方向上的坐标值对TDE误差的敏感度不同的基础上,利用声源在线阵列方向上的坐标值对TDE误差相对不敏感这一结论,提出了MOLA(Mutual Ortho-Linear Array)结构,给出了该阵列结构下融合一组TDE值的求解声源位置的闭式表达式。实验结果表明,在相同的TDE下,MOLA以及其对应的声源位置估计算法的估计误差小于全局搜索算法。MOLA估计位置时不需要计算出所有传声器对的TDE,且有闭式表达式,计算量小,适用于实时系统。 相似文献
9.
10.
数字语音识别具有很高的识别率,具有较高的实用价值。为实现在真实噪声环境下能达到高识别率的数字语音识别系统,采用基于段长分布的隐马尔可夫模型(DDBHMM)进行了安静环境和带噪环境下,特定人和非特定人的数字语音识别试验。试验结果表明,基于DDBHMM模型的数字语音识别技术对真实非平稳噪声环境下录制的特定人和非特定人语音都具有较高识别率。 相似文献