rinna-v1-tune-ep3 / README.md
Jumtra's picture
Update README.md
ea65466
metadata
license: mit
tags:
  - ja
  - gpt_neox
  - text-generation
  - lm
  - nlp
datasets:
  - kunishou/databricks-dolly-15k-ja
  - kunishou/hh-rlhf-49k-ja
  - Jumtra/oasst1_ja
  - Jumtra/jglue_jnli
  - Jumtra/jglue_jsquad
  - Jumtra/jglue_jsquads_with_input
inference: false
language:
  - ja

rinna-3.6b

このモデルは、MosaicMLのllm-foundryリポジトリを使用してJumtra/rinna-3.6b-tune-ep5をファインチューニングしたモデルです。

Model Date

June 28, 2023

Model License

MIT

評価

Jumtra/test_data_100QAを用いてモデルの正答率を評価した また、学習時のvalidateデータに対してのPerplexityを記載した。

model name 正答率 Perplexity
Jumtra/rinna-3.6b-tune-ep5 40/100 8.105
Jumtra/rinna-v1-tune-ep1 42/100 7.458
Jumtra/rinna-v1-tune-ep3 41/100 7.034
Jumtra/calm-7b-tune-ep4 40/100 9.766
Jumtra/calm-v3-ep1 35/100 9.305
Jumtra/calm-v3-ep3 37/100 13.276

以下のプロンプトを用いた

INSTRUCTION_KEY = "### 入力:"
RESPONSE_KEY = "### 回答:"
INTRO_BLURB = "以下はタスクを説明する指示と文脈のある文章が含まれた入力です。要求を適切に満たす回答を生成しなさい。"
JP_PROMPT_FOR_GENERATION_FORMAT = """{intro}
{instruction_key}
{instruction}
{response_key}
""".format(
    intro=INTRO_BLURB,
    instruction_key=INSTRUCTION_KEY,
    instruction="{instruction}",
    response_key=RESPONSE_KEY,
)