首页 | 本学科首页   官方微博 | 高级检索  
     

IBM GALE中文识别系统
引用本文:张世磊,施勤,秦勇,刘文,CHU StephenM,KUO Hong-Kwang,MANGU Lidia. IBM GALE中文识别系统[J]. 清华大学学报(自然科学版), 2009, 0(Z1)
作者姓名:张世磊  施勤  秦勇  刘文  CHU StephenM  KUO Hong-Kwang  MANGU Lidia
作者单位:IBM中国研究院;IBM华生研究中心;
摘    要:为解决中文音频自动转成文字问题,IBM开发了GALE中文识别系统。该系统采用区分性声学模型训练方法和新颖的基于主题的语言模型自适应技术;为获得最优的识别性能,系统采用多遍解码的识别策略。该文还给出该系统在3个测试集上的识别结果:包括广播新闻和广播访谈节目,结果显示,IBM GALE中文识别系统取得了很好的识别性能;此外,该文还分析了特殊声学现象对识别结果的影响,结果显示,对识别率影响最大的3种声学现象为说话人语速过快、语音交叠和口音问题,这指示了系统下一步的改进方向。

关 键 词:语音识别  区分型模型训练  语言模型自适应  多遍解码  

IBM GALE Mandarin transcription system
ZHANG Shilei,SHI Qin,QIN Yong,LIU Wen,CHU Stephen M,KUO Hong-Kwang,MANGU Lidia. IBM GALE Mandarin transcription system[J]. Journal of Tsinghua University(Science and Technology), 2009, 0(Z1)
Authors:ZHANG Shilei  SHI Qin  QIN Yong  LIU Wen  CHU Stephen M  KUO Hong-Kwang  MANGU Lidia
Affiliation:1.IBM China Research Lab;Beijing 100193;China;2.IBM T.J.Watson Research Center;New York 10598;USA
Abstract:
Keywords:speech recognition  discriminative training  topic-adaptive language model  multiple passes decoding  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号