pokutuna
/

llm2024-competition

GGUF

Japanese

English

Inference Endpoints

conversational

Model card Files Files and versions Community

pokutuna commited on 13 days ago

Commit

466a19b

•

1 Parent(s): b69f3fe

Update README.md

Browse files

Files changed (1) hide show

README.md +26 -13

README.md CHANGED Viewed

@@ -3,38 +3,43 @@ license: gemma
 language:
 - ja
 - en
 ---
 ## Datasets
-TBD
 ## 実行方法(コンペ採点者の方向け)
 ### 事前準備
 ```
-# lshw のインストール
-# (ollama インストール時に GPU を検出するのに必要)
 $ apt update && apt install -y lshw
-# ollama (https://ollama.com/) のインストール & 起動
 $ curl -fsSL https://ollama.com/install.sh | sh
 $ ollama serve
-# -- 以降別ターミナルプロセスから --
 # モデルのダウンロード
-$ MODEL_NAME="hf.co/pokutuna/llm2024-gemma2:gemma2-9b-sft005-Q6_K.gguf"
-$ ollama pull $MODEL_NAME
-# success と出力されるのを確認
 #
 # Note.
 #   演習環境で動作を確認済みですがネットワーク状況等により、
-#   時々 timeout (context deadline exceeded) が発生することがあります。
 #   何度か実行すれば走り切ります。
-# 実行コードの pull
 $ git clone https://github.com/pokutuna/llm2024-competition-runner.git
 # 依存ライブラリのインストール
@@ -43,7 +48,15 @@ $ pip install -r llm2024-competition-runner/requirements.txt
 ### 出力の生成
-`$ python ./llm2024-competition-runner/generate.py --tasks=./tasks.jsonl --outfile=./output.jsonl`
-- `--tasks=<入力タスク>` 各行に input フィールドを持つ JSONL ファイル (`elyza-tasks-100-TV_0.jsonl` と同じ構造を想定)
-- `--outfile=<出力先>` 入力タスクに `output` キーを追加したもの

 language:
 - ja
 - en
+datasets:
+- llm-jp/magpie-sft-v1.0
+base_model:
+- google/gemma-2-9b
 ---
 ## Datasets
+### Training Dataset
+- [llm-jp/magpie-sft-v1.0](https://huggingface.co/datasets/llm-jp/magpie-sft-v1.0) (apache-2.0)
+  - 加工 & サンプリングして使用
 ## 実行方法(コンペ採点者の方向け)
 ### 事前準備
 ```
+# lshw のインストール (ollama インストール時に GPU を検出するのに必要)
 $ apt update && apt install -y lshw
+# ollama のインストール & 起動
 $ curl -fsSL https://ollama.com/install.sh | sh
 $ ollama serve
+# -- 以降は別ターミナルプロセスから実行(ollama サーバーに対して実行) --
 # モデルのダウンロード
+$ ollama pull hf.co/pokutuna/llm2024-gemma2:gemma2-9b-sft009-Q6_K.gguf
 #
 # Note.
+#   ダウンロード後、success と出力されるのを確認して下さい。
 #   演習環境で動作を確認済みですがネットワーク状況等により、
+#   timeout (context deadline exceeded) が発生することがあります。
 #   何度か実行すれば走り切ります。
+# 回答生成コードの pull
 $ git clone https://github.com/pokutuna/llm2024-competition-runner.git
 # 依存ライブラリのインストール
 ### 出力の生成
+```sh
+$ python ./llm2024-competition-runner/generate.py \
+  --model="hf.co/pokutuna/llm2024-gemma2:gemma2-9b-sft009-Q6_K.gguf" \
+  --tasks=./tasks.jsonl \
+  --outfile=./output.jsonl
+```
+- `--tasks=<path>`
+  - タスクデータ、各行に `input` フィールドを持つ JSONL ファイルへのパス
+    (`elyza-tasks-100-TV_0.jsonl` と同じ構造を想定)
+- `--outfile=<path>`
+  - 結果の出力先、タスクデータの各行に対し `output` キーを出力結果として追加したもの