首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   4篇
  免费   0篇
物理学   4篇
  2000年   2篇
  1996年   2篇
排序方式: 共有4条查询结果,搜索用时 15 毫秒
1
1.
汉语塞音选择性特征自动萃取的小波变换方法   总被引:1,自引:0,他引:1  
本文提出了汉语语音导引特征的概念,讨论了语音导引特征在自动语音识别中用于导引匹配搜索的运用方式和重要作用;提出并设计了汉语塞音选择性特征自动萃取的小波变换方法和数字信号处理算法。本文方法和算法从声学信号处理和检测的角度,将汉语清辅音声波输入信号自动分为塞音子集BDG:{b,d,g}、塞音子集ZZHJGPTcCHQK:{z,zh,j,g,p,t,c,ch,q,k}和擦音集FsSHhX:{f,s,sh,x,h};对输入的合清辅音的音节,计算检测并输出汉语自动语音识别系统可以利用的清辅音类属标记b.d.g、STOP/BD和f.s.sh.x.h以及它们的音段起始时标;从声学信息计算检测的角度为汉语自动语音识别系统提供一种新的“从粗到细”的辅助匹配结构。算法可用性模拟实验采用实际语音的数据库数据,以手工标注信息作为自动检测分类正确与否的对比标准。对1267个汉语全音节中,总数913个待分类清辅音的初步分类结果表明:正确分类率分别为b.d.g:96.1%,STOP/BD:95.1%和f.s.sh.x.h:89.0%,总体平均正确分类率为93.6%。  相似文献   
2.
汉语听觉视觉双模态数据库CAVSR1.0   总被引:8,自引:0,他引:8  
听觉视觉双模态语音识别在国际上已经逐渐成为当前语音识别的热点之一,汉语的双模态识别研究也已开始启动。然而,由于视觉信息获取及处理难度极大,目前的双模态语音数据库的建设尚显薄弱,汉语方面更是空白。鉴于此,我们在进行听觉视觉双模态语音识别关键技术研究的同时,在分析国外同类数据库的结构的基础上,结合汉语语音的特点,建立了汉语语音的第一个双模态数据库CAVSR1.0。它具有如下特点:采用的语料涵盖所有声韵母,其规模(总数据量、音节量)超出目前国际上同类数据库;语料分布符合汉语声韵母的实际分布概率,因此其反映的规律具有代表性;捆绑了自动音节分割程序及脸部主要特征标定程序,使数据库具有很强的可扩展性。  相似文献   
3.
自动语音识别研究的人工神经网络方法   总被引:1,自引:0,他引:1  
  相似文献   
4.
基音同步特征波形内插语音编码算法   总被引:3,自引:1,他引:2  
研究了在特征波形语音编码算法中的特征波形分解算法,提出了一种基于基音同步的特征波形内插语音编码算法。特征波形的量化采用变维矢量量化(VDVQ)。通过实现的2.4kb/s的语音质量表明,这种语音压缩算法在低码率时能得到高通信质量的重建语音。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号