URL: https://github.com/EagleW/PaperRobot

TL;DR

ACL 2019 本科生论文,生成生物医学论文的一部分

Dataset

PMC Open Access Subset: 一个生物化学领域的开放论文集,作者从中抽取文本并构建引用关系。

Algorithm

首先从论文集中抽取实体及其描述构建知识图谱。 然后用图网络算法预测新的节点和连接,通过Mem2seq模型构成标题 最后用标题分别生成摘要、结论和未来工作,主要通过语言模型完成并移除重复词。

Model

image

Experiment Detail

作者写的是图灵测试,主要是人工评估,测试集表现是否比真实原文更好。 用了BLEU等自动指标来度量原始生成和人工编辑后的效果。

Thoughts

这为研究者迅速切入一个新的领域提供了方便。