Q: Is allenai/reward-bench-results a benchmark?

allenai/reward-bench-results is a dataset for training or evaluation; it isn't tracked as a standard LLM benchmark in our catalog.

Q: Where can I download allenai/reward-bench-results?

allenai/reward-bench-results is available at its source: https://huggingface.co/datasets/allenai/reward-bench-results.

Question 1

What is the allenai/reward-bench-results dataset?

Accepted Answer

Results for Holisitic Evaluation of Reward Models (HERM) Benchmark

Here, you'll find the raw scores for the HERM project.
The repository is structured as follows. 
├── best-of-n/ <- Nested directory for different compl...

Question 2

Is allenai/reward-bench-results a benchmark?

Accepted Answer

allenai/reward-bench-results is a dataset for training or evaluation; it isn't tracked as a standard LLM benchmark in our catalog.

Question 3

Where can I download allenai/reward-bench-results?

Accepted Answer

allenai/reward-bench-results is available at its source: https://huggingface.co/datasets/allenai/reward-bench-results.

allenai/reward-bench-results

About allenai/reward-bench-results

Details

Related General NLP datasets

FAQ