Skip to content

wenge-research/yayi_uie_sft_data

General NLPZH, ENBenchmark

Wenge-research/yayi_uie_sft_data is a General NLP benchmark dataset in ZH, EN from wenge-research in Parquet format.

📊 This dataset is used as an LLM benchmark. See model leaderboards →

About wenge-research/yayi_uie_sft_data

训练数据/Training Data 百万级语料中文54%,英文46%;其中其中数据集包括12个领域包括金融,社会,生物,商业,工业制造,化学,车辆,科学,疾病医疗,个人生活,安全和通用。覆盖数百个使用场景 NER:中文覆盖28个实体类型包括人物,地缘政治,组织,身体部位,药物等,英文覆盖130个实体类型包括Animal, Weapon, Conference, Book等。 RE:中文覆盖232种关系包括买资,增持,重组,国籍,别名,亲属,入股,转让,导致,发生地点,制造商等,英...

Details

Task
General NLP
Language
ZH, EN
Format
Parquet
Rows / instances
N/A
Creator
wenge-research
Year
2023
Download

Related General NLP datasets

FAQ