项目或开源代码URL:http://arxiv.org/abs/1905.13164 https://github.com/nlpyang/hiersumm

注释

ACL 2019 多文档摘要

数据集

WikiSum: 维基百科及其参考文献组成的数据集,用于从参考文献生成维基百科。

算法与模型

这篇文章主要是对ICLR2018的Generating Wikipedia by summarizing long sequences的改进和提升。 本文模型输入标题和参考文献,输出wiki百科的第一段。 image 对于输入的多篇参考文献,首先对其大体分段,然后排序选出重要的段落。这里作者采用LSTM来改进tfidf计算相似度,但没有消融实验证明效果。 本文的主要工作就是采用Transformer来对段落及其关系编码。这里作者引入了位置编码、多头池化和全局层。其中全局层是对各个段落的编码结果进一步构建层级结构。 image 细节上还有一些归一化的操作。

实验与对比

作者和一系列方法做了对比实验包括: Lead: 直接拼接重要段落的标题; LexRank(2004): 基于图的重要性排序,选取前几段; Flat Transformer: 用Transformer直接摘要展开的参考文献; T-DMCA: 本文的基线来自ICLR2018那篇文章,也是Transformer结构。 用ROUGE-1/2/L评测,本文方法均为最优。

消融实验主要应用在Transformer结构,显示位置编码、多头池化和全局层中全局层最重要。 当然还有人工评估,采取对所有候选和真实结果排序的方式计算效果。

思考

可以考虑用全局层来作参考文献分类、整理、摘要,生成结果看起来不够可用。