Question 1

What is the AlgorithmicResearchGroup/s2orc_arxiv dataset?

Accepted Answer

S2ORC ArXiv

A subset of the Semantic Scholar Open Research Corpus (S2ORC) filtered to ArXiv papers. Contains 2.58 million parsed scientific papers with full text, abstracts, structured sections, figures, and citation metadata.

D...

Question 2

Is AlgorithmicResearchGroup/s2orc_arxiv a benchmark?

Accepted Answer

Yes — AlgorithmicResearchGroup/s2orc_arxiv is used as an LLM benchmark. See model leaderboards in the Benchmarks section.

Question 3

Where can I download AlgorithmicResearchGroup/s2orc_arxiv?

Accepted Answer

AlgorithmicResearchGroup/s2orc_arxiv is available at its source: https://huggingface.co/datasets/AlgorithmicResearchGroup/s2orc_arxiv.

AlgorithmicResearchGroup/s2orc_arxiv

About AlgorithmicResearchGroup/s2orc_arxiv

Details

FAQ