ryota39
/

bilingual-gpt-neox-4b-instruction-sft-en-ja-84k

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

ryota39 commited on Mar 19

Commit

8931f27

•

1 Parent(s): 1256197

Update README.md

Files changed (1) hide show

README.md +17 -2

README.md CHANGED Viewed

@@ -6,8 +6,23 @@ library_name: transformers
 ---
 # モデル
-- rinna/bilingual-gpt-neox-4b-instruction-sftに、84,300件の和訳データセットをフルパラメータファインチューニングしたモデルです。
-- ファインチューニングに使用したデータセットは`izumi-lab/llm-japanese-dataset`から和訳タスクのデータセットのみ抽出し、学習に使用しました。
 # コード
 ```python

 ---
 # モデル
+- **rinna/bilingual-gpt-neox-4b-instruction-sft**に、84,300件の和訳データセットをフルパラメータファインチューニングしたモデルです。
+- ファインチューニングに使用したデータセットは**izumi-lab/llm-japanese-dataset**から和訳タスクのデータセットのみ抽出し、学習に使用しました。
+- 学習に使用したデータは、instructionに「以下の英語を日本語に翻訳してください。」と記載されたデータのみ機械的に抽出しました。
+# 学習
+- ハードウェア: 1 x NVIDIA RTX A6000(VRAM48GB)
+- 使用VRAM: 32~34GB
+- 学習時間: 5h 39m 37s
+- train/epoch: 2.61
+- train/loss: 0.9958
+- eval/loss: 0.9223530292510986
+- optimizer: Adam
+- learning_rate: 1.5e-5
+- lr_scheduler_type: "cosine"
+- warmup_steps: 500
 # コード
 ```python