alfredplpl's picture
Update README.md
4b45e82 verified
|
raw
history blame
No virus
927 Bytes
---
library_name: transformers
license: other
---
# 日本語向けLlama3 8B
# はじめに
このリポジトリはLlama3を日本語化しようとしたモデルのリポジトリです。
# ライセンス
Llama 3 ライセンスなので商用利用可能です。ただし、Llama 3ライセンスをよく読んで使ってください。
# 学習データ
- llm-jp/databricks-dolly-15k-ja
- cl-nagoya/auto-wiki-qa
# 学習方法
cl-nagoya/auto-wiki-qaにある約240万件の学習データでLoRAによるインストラクションチューニングを1epoch行い、LoRAをマージしました。
その後、返答が味気なさすぎたので、llm-jp/databricks-dolly-15k-jaでLoRAによるインストラクションチューニングを1epoch行い、LoRAをマージしました。
# ハードウェア
- NVIDIA A6000x2
# ソフトウェア
- transformers
- trl
# 学習時間
- 50 GPU hours