Question 1

What is the Microsoft Research Paraphrase Corpus (MRPC) dataset?

Accepted Answer

Dataset contains pairs of sentences which have been extracted from news sources on the web, along with human annotations indicating whether each pair captures a paraphrase/semantic equivalence relationship.

Question 2

Is Microsoft Research Paraphrase Corpus (MRPC) a benchmark?

Accepted Answer

Yes — Microsoft Research Paraphrase Corpus (MRPC) is used as an LLM benchmark. See model leaderboards in the Benchmarks section.

Question 3

Where can I download Microsoft Research Paraphrase Corpus (MRPC)?

Accepted Answer

Microsoft Research Paraphrase Corpus (MRPC) is available at its source: https://www.microsoft.com/en-us/download/details.aspx?id=52398.

Microsoft Research Paraphrase Corpus (MRPC)

About Microsoft Research Paraphrase Corpus (MRPC)

Details

Related Paraphrasing Identification datasets

FAQ