|
---
|
|
library_name: transformers
|
|
tags:
|
|
- dpo
|
|
license: cc
|
|
datasets:
|
|
- ryota39/dpo-ja-194k
|
|
language:
|
|
- ja
|
|
---
|
|
|
|
## モデル |
|
|
|
- ベースモデル:[ryota39/llm-jp-1b-sft-100k-LoRA](https://huggingface.co/ryota39/llm-jp-1b-sft-100k-LoRA) |
|
- 学習データセット:[ryota39/dpo-ja-194k](https://huggingface.co/datasets/ryota39/dpo-ja-194k) |
|
- 学習方式:フルパラメータチューニング |
|
|
|
## サンプル |
|
|
|
```python |
|
import torch |
|
from transformers import AutoTokenizer, AutoModelForCausalLM |
|
|
|
|
|
tokenizer = AutoTokenizer.from_pretrained( |
|
"ryota39/llm-jp-1b-sft-100k-LoRA-kto-194k" |
|
) |
|
pad_token_id = tokenizer.pad_token_id |
|
|
|
model = AutoModelForCausalLM.from_pretrained( |
|
"ryota39/llm-jp-1b-sft-100k-LoRA-kto-194k", |
|
device_map="auto", |
|
) |
|
|
|
text = "###Input: 東京の観光名所を教えてください。\n###Output: " |
|
tokenized_input = tokenizer.encode( |
|
text, |
|
add_special_tokens=False, |
|
return_tensors="pt" |
|
).to(model.device) |
|
|
|
attention_mask = torch.ones_like(tokenized_input) |
|
attention_mask[tokenized_input == pad_token_id] = 0 |
|
|
|
with torch.no_grad(): |
|
output = model.generate( |
|
tokenized_input, |
|
attention_mask=attention_mask, |
|
max_new_tokens=128, |
|
do_sample=True, |
|
top_p=0.95, |
|
temperature=0.8, |
|
repetition_penalty=1.10 |
|
)[0] |
|
|
|
print(tokenizer.decode(output)) |
|
|
|
``` |
|
|
|
## 出力例 |
|
|
|
``` |
|
###Input: 東京の観光名所を教えてください。 |
|
###Output: 東京タワー。日本で一番高い塔だと思いますよ。 |
|
東京の街は非常にきれいなので、夜には美しい光景を見ることができます。 |
|
また、隅田川やレインボーブリッジから眺める景色もいいですし、皇居や靖国神社など東京の象徴的な場所を訪れるのもいいかもしれません。 |
|
スカイツリーから見る景色は最高だと思います。スカイツリーの展望台の中では東京シティビューという場所がおすすめです。 |
|
また、浅草寺や雷門、勝鬨橋といった浅草近辺の人気スポットにも行くことができます。他 |
|
``` |