Multi-Document Summarization

Multi-Document Summarization is a process of representing a set of documents with a short piece of text by capturing the relevant information and filtering out the redundant information. Two prominent approaches to Multi-Document Summarization are extractive and abstractive summarization. Extractive summarization systems aim to extract salient snippets, sentences or passages from documents, while abstractive summarization systems aim to concisely paraphrase the content of the documents. Source: Multi-Document Summarization using Distributed Bag-of-Words Model

Benchmarks

Libraries

Datasets

Subtasks

Most implemented papers

Bottom-Up Abstractive Summarization

Content

Generating Wikipedia by Summarizing Long Sequences

Scoring Sentence Singletons and Pairs for Abstractive Summarization

Centroid-based Text Summarization through Compositionality of Word Embeddings

Multi-News: A Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model

Generating (Factual?) Narrative Summaries of RCTs: Experiments with Neural Multi-Document Summarization

Global-aware Beam Search for Neural Abstractive Summarization

Quantitative Argument Summarization and beyond: Cross-Domain Key Point Analysis

Proposition-Level Clustering for Multi-Document Summarization