--- library_name: transformers license: other --- # 日本語向けLlama3 8B # はじめに このリポジトリはLlama3を日本語化しようとしたモデルのリポジトリです。 # ライセンス Llama 3 ライセンスなので商用利用可能です。ただし、Llama 3ライセンスをよく読んで使ってください。 # 学習データ - llm-jp/databricks-dolly-15k-ja - cl-nagoya/auto-wiki-qa # 学習方法 cl-nagoya/auto-wiki-qaにある約240万件の学習データでLoRAによるインストラクションチューニングを1epoch行い、LoRAをマージしました。 その後、返答が味気なさすぎたので、llm-jp/databricks-dolly-15k-jaでLoRAによるインストラクションチューニングを1epoch行い、LoRAをマージしました。 # ハードウェア - NVIDIA A6000x2 # ソフトウェア - transformers - trl # 学習時間 - 50 GPU hours