shakebenn
/

llm-jp-3-13b-SFT-LoRA

@@ -16,7 +16,7 @@ base_model:
 # llm-jp-3-13b-SFT-LoRA モデルカード
-llm-jp-3-13bをベースに、QLoRAとUnslothを用いて効率的なファインチューニングを行った日本語言語モデルです。
 ## モデルの詳細
@@ -33,12 +33,14 @@ llm-jp-3-13bをベースに、QLoRAとUnslothを用いて効率的なファイ
 - **リポジトリ:** https://huggingface.co/llm-jp/llm-jp-3-13b
-## 使用方法
-READMEの内容は、推論コードの実行手順です。上記の使用方法セクション内にREADMEの手順をもとに使用方法を記述してください。
-1. 必要なライブラリのインストール
     ```bash
     apt-get install git-lfs
     git lfs install
@@ -50,13 +52,14 @@ READMEの内容は、推論コードの実行手順です。上記の使用方
     pip install -r ./llama.cpp/requirements.txt
     ```
-2. モデルのダウンロード
     ```bash
     git clone https://huggingface.co/llm-jp/llm-jp-3-13b
     ```
-    [llm-jp/llm-jp-tokenizer](https://github.com/llm-jp/llm-jp-tokenizer)から「llm-jp-tokenizer-100k.ver3.0b1.model」をダウンロードして、「llm-jp-3-13b」フォルダに「tokenizer.model」という名前で配置します
-3. モデルの変換
     ```bash
     python ./llama.cpp/convert_hf_to_gguf.py --outfile llm-jp-3-13b.gguf llm-jp-3-13b
     ```
@@ -78,8 +81,8 @@ READMEの内容は、推論コードの実行手順です。上記の使用方
     ```
 4. 推論の実行
-    elyza-tasks-100-TV_0.jsonlをディレクトリにコピーする
-    推論コード(Model_Inference_v5.ipynb)のすべてのセルを実行する
 ### 直接利用
@@ -140,17 +143,3 @@ READMEの内容は、推論コードの実行手順です。上記の使用方
   - エポック数: 1
   - 学習率: 2e-4
   - シーケンス長: 512
-## 技術仕様
-### 計算インフラ
-#### ハードウェア要件
-- CUDA対応GPU
-- 最小8GB VRAM推奨
-#### ソフトウェア要件
-- Python 3.10以上
-- PyTorch 2.0以上
-- Transformers最新版
-- Unsloth（推奨）

 # llm-jp-3-13b-SFT-LoRA モデルカード
+llm-jp-3-13bをベースに、QLoRAとUnslothを用いてファインチューニングを行った日本語言語モデルです。
 ## モデルの詳細
 - **リポジトリ:** https://huggingface.co/llm-jp/llm-jp-3-13b
+## 推論コードの使用方法
+1. ファイルのダウンロード、準備
+  - [https://github.com/Kota-Ohno/LLM_saisyukadai](推論コード等のリポジトリ)から「Model_Inference_v5.ipynb」と「tokenizer.model」、「elyza-tasks-100-TV_0.jsonl」をダウンロードします。
+  - 「tokenizer.model」に関しては、[llm-jp/llm-jp-tokenizer](https://github.com/llm-jp/llm-jp-tokenizer)から「llm-jp-tokenizer-100k.ver3.0b1.model」をダウンロードして、「tokenizer.model」という名前でリネームしても構いません。
+  - google colabで「Model_Inference_v5.ipynb」を開き、ランタイムをL4に設定します。
+2. 必要なライブラリのインストール
+  - terminalを開き、以下のコードを順番に実行します。
     ```bash
     apt-get install git-lfs
     git lfs install
     pip install -r ./llama.cpp/requirements.txt
     ```
+3. モデルのダウンロード
     ```bash
     git clone https://huggingface.co/llm-jp/llm-jp-3-13b
     ```
+  - 「tokenizer.model」ファイルを「llm-jp-3-13b」フォルダに配置します
+4. モデルの変換
+  - 以下のコードを順番に実行します。
     ```bash
     python ./llama.cpp/convert_hf_to_gguf.py --outfile llm-jp-3-13b.gguf llm-jp-3-13b
     ```
     ```
 4. 推論の実行
+  - 「elyza-tasks-100-TV_0.jsonl」を推論コードと同階層にコピーする
+  - 推論コード(Model_Inference_v5.ipynb)のすべてのセルを実行する
 ### 直接利用
   - エポック数: 1
   - 学習率: 2e-4
   - シーケンス長: 512