首页 | 本学科首页   官方微博 | 高级检索  
     检索      

语义类的提取及其在语音搜索系统中的应用
引用本文:李亚丽,徐为群,颜永红.语义类的提取及其在语音搜索系统中的应用[J].声学学报,2011,36(5).
作者姓名:李亚丽  徐为群  颜永红
作者单位:中国科学院语言声学与内容理解重点实验室 北京100190
摘    要:本研究的目的是解决语音搜索系统中新领域语料稀缺的问题.对于手中的少量语料,采取的方法是:首先从中进行语义类的提取,语义类的提取采用的是一种基于同现概率的语义类提取方法,这种基于相似度计算方法的提取结果在正确率、召回率、F1值的评价中均优于常用的基于Kullback-Leibler散度的距离度量.利用从少量文本中提取出的语义类别和文本结构,生成句子模板;再把领域信息加入到模板中,并由此生成大量领域相关语料.最后,利用生成的大量语料,进行语言模型自适应,这时的语音识别结果(字识别正确率)从85.2%提高到91%.实验结果说明语音搜索领域的语料不足问题可以通过语义类提取后得到的模板,生成领域相关语料的方法来有效解决.


Semantic class induction and its application for voice search system
LI Yali,XU Weiqun,YAN Yonghong.Semantic class induction and its application for voice search system[J].Acta Acustica,2011,36(5).
Authors:LI Yali  XU Weiqun  YAN Yonghong
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号