--- license: mit tags: - ja - gpt_neox - text-generation - lm - nlp datasets: - kunishou/databricks-dolly-15k-ja - kunishou/hh-rlhf-49k-ja - kunishou/cnn-dailymail-27k-ja - Jumtra/oasst1_ja - Jumtra/jglue_jnli - Jumtra/jglue_jsquad - Jumtra/jglue_jsquads_with_input inference: false language: - ja --- # rinna-3.6b このモデルは、MosaicMLのllm-foundryリポジトリを使用して[rinna/japanese-gpt-neox-3.6b](https://huggingface.co/rinna/japanese-gpt-neox-3.6b)をファインチューニングしたモデルです。 ## Model Date June 28, 2023 ## Model License MIT ## 評価 [Jumtra/test_data_100QA](https://huggingface.co/datasets/Jumtra/test_data_100QA)を用いてモデルの正答率を評価した また、学習時のvalidateデータに対してのPerplexityを記載した。 | model name | 正答率 | Perplexity | | ---- | ---- | ---- | | [Jumtra/rinna-3.6b-tune-ep5](https://huggingface.co/Jumtra/rinna-3.6b-tune-ep5)| 40/100 | 8.105 | | [Jumtra/rinna-v1-tune-ep1](https://huggingface.co/Jumtra/rinna-v1-tune-ep1) | 42/100 | 7.458 | | [Jumtra/rinna-v1-tune-ep3](https://huggingface.co/Jumtra/rinna-v1-tune-ep3) | 41/100 | 7.034 | | [Jumtra/calm-7b-tune-ep4](https://huggingface.co/Jumtra/calm-7b-tune-ep4) | 40/100 | 9.766 | | [Jumtra/calm-v3-ep1](https://huggingface.co/Jumtra/calm-v3-ep1) | 35/100 | 9.305 | | [Jumtra/calm-v3-ep3](https://huggingface.co/Jumtra/calm-v3-ep3) | 37/100 | 13.276 | 以下のプロンプトを用いた ```python INSTRUCTION_KEY = "### 入力:" RESPONSE_KEY = "### 回答:" INTRO_BLURB = "以下はタスクを説明する指示と文脈のある文章が含まれた入力です。要求を適切に満たす回答を生成しなさい。" JP_PROMPT_FOR_GENERATION_FORMAT = """{intro} {instruction_key} {instruction} {response_key} """.format( intro=INTRO_BLURB, instruction_key=INSTRUCTION_KEY, instruction="{instruction}", response_key=RESPONSE_KEY, ) ```