基于信息单元融合的新闻原子事件抽取 |
| |
引用本文: | 张贺,刘茂福,胡慧君,顾进广.基于信息单元融合的新闻原子事件抽取[J].武汉大学学报(理学版),2015(2):139-144. |
| |
作者姓名: | 张贺 刘茂福 胡慧君 顾进广 |
| |
作者单位: | 武汉科技大学计算机科学与技术学院;智能信息处理与实时工业系统湖北省重点实验室 |
| |
基金项目: | 国家自然科学基金(61100133,61173062);国家社会科学基金重大项目(11&ZD189) |
| |
摘 要: | 原子事件抽取是将非结构化文本进行结构化表示的重要方法.针对新闻语料,本文提出了一种基于信息单元融合的原子事件抽取方法.在中文分词、词性标注、命名实体识别等自然语言处理技术的基础上,利用语言规则将信息单元标识出来并进行融合,达到浅层句法分析的效果,通过原子事件抽取算法将原子事件从经信息单元融合后的语料中抽取出来.基于信息单元融合的原子事件抽取方法不仅对文本长度没有严格限制,并且不受事件类型的约束;实验结果表明,基于信息单元融合的原子事件抽取方法是有效的.
|
关 键 词: | 信息单元融合 原子事件 事件抽取 |
本文献已被 CNKI 等数据库收录! |
|