首页 | 本学科首页   官方微博 | 高级检索  
     

基于主题约束的篇章级文本生成方法
引用本文:黄炎,孙海丽,徐科,余晓阳,王同洋,张新访,路松峰. 基于主题约束的篇章级文本生成方法[J]. 北京大学学报(自然科学版), 2020, 56(1): 9-15. DOI: 10.13209/j.0479-8023.2019.103
作者姓名:黄炎  孙海丽  徐科  余晓阳  王同洋  张新访  路松峰
作者单位:1. 华中科技大学计算机科学与技术学院, 武汉 4300742. 深圳华中科技大学研究院, 深圳 5180633. 中南民族大学计算机科学学院, 武汉 430074
基金项目:深圳市科技计划基础研究项目(JCYJ20180306124612893, JCYJ20170818160208570, JCYJ20170307160458368)资助
摘    要:针对计算机自动生成的文本缺乏主题思想这一问题, 提出一种基于主题约束的篇章级文本自动生成方法。该方法围绕用户输入的主题描述语句提取若干主题词; 然后对主题词进行扩展和主题聚类, 形成文章主题规划; 最后利用每个聚类中的关键词信息约束每个段落的文本生成。该模型从文本主题分布、注意力评分方法和主题覆盖生成3个方面对现有基于注意力机制的循环神经网络文本生成模型进行了改进。在3个真实数据集上分别与Char-RNN, SC-LSTM和MTA-LSTM基准模型进行对比, 并对3个方面的改进进行独立验证。实验结果表明, 所提方法在人工评判和BLEU自动评测上均优于基准模型, 生成的文本能更好地贴合主题。

关 键 词:文本自动生成  主题约束  循环神经网络(RNN)  长短时记忆网络(LSTM)  注意力机制  
收稿时间:2019-05-22

Discourse-Level Text Generation Method Based on Topical Constraint
HUANG Yan,SUN Haili,XU Ke,YU Xiaoyang,WANG Tongyang,ZHANG Xinfang,LU Songfeng. Discourse-Level Text Generation Method Based on Topical Constraint[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(1): 9-15. DOI: 10.13209/j.0479-8023.2019.103
Authors:HUANG Yan  SUN Haili  XU Ke  YU Xiaoyang  WANG Tongyang  ZHANG Xinfang  LU Songfeng
Affiliation:1. School of Computer Science and Technology, Huazhong University of Science and Technology, Wuhan 4300742. Shenzhen Huazhong University of Science and Technology Research Institute, Shenzhen 5180633. School of Computer Science, South-Central University for Nationalities, Wuhan 430074
Abstract:
Keywords:automatic text generation  topical constraint  RNN  LSTM  attention mechanism  
本文献已被 CNKI 等数据库收录!
点击此处可从《北京大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《北京大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号