Skip to content

izumi-lab/llm-japanese-dataset

General NLPJAcc-by-sa-4.0

Created by izumi-lab at 2023, the izumi-lab/llm-japanese-dataset is a General NLP dataset in JA in Parquet format. With 483 downloads and 142 likes, it is actively used by the community. It is released under the cc-by-sa-4.0 license and is a 1M<n<10M-scale dataset.

About izumi-lab/llm-japanese-dataset

llm-japanese-dataset LLM構築用の日本語インストラクション(チャット)データセット 主に,英語で構築されたLLMモデルなどに対して,チャット(Instruction)応答タスクに関してLoRAなどでチューニングするために使用できます. ※様々な公開言語資源を利用させていただきました.関係各位にはこの場を借りて御礼申し上げます. updates 2023/5/15にAlpaca datasetがNCにライセンス変更されたことに対応し,安心して...

Details

Task
General NLP
Language
JA
Format
Parquet
Rows / instances
N/A
Size
1M<n<10M
Creator
izumi-lab
Year
2023
License
cc-by-sa-4.0
Downloads
483
Likes
142
Download Homepage

Related General NLP datasets

FAQ