allenai/c4
Viewer • Updated • 10.4B • 836k • 599
日本語GPT系言語モデル(GPT-NeoXアーキテクチャ)を 事前学習(CPT)の検証目的で構築したものです。
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("aooao/gpt-neox-ja-500M")
model = AutoModelForCausalLM.from_pretrained("aooao/gpt-neox-ja-500M")