Update README.md
Browse files
README.md
CHANGED
@@ -1,12 +1,18 @@
|
|
1 |
---
|
2 |
library_name: transformers
|
3 |
-
tags:
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
---
|
5 |
|
6 |
## モデル
|
7 |
|
8 |
-
- ベースモデル:[
|
9 |
-
- 学習データセット:[llm-jp/
|
10 |
- 学習方式:フルパラメータチューニング
|
11 |
|
12 |
## サンプル
|
@@ -17,12 +23,12 @@ from transformers import AutoTokenizer, AutoModelForCausalLM
|
|
17 |
|
18 |
|
19 |
tokenizer = AutoTokenizer.from_pretrained(
|
20 |
-
"ryota39/llm-jp-1b-sft-
|
21 |
)
|
22 |
pad_token_id = tokenizer.pad_token_id
|
23 |
|
24 |
model = AutoModelForCausalLM.from_pretrained(
|
25 |
-
"ryota39/llm-jp-1b-sft-
|
26 |
device_map="auto",
|
27 |
)
|
28 |
|
@@ -44,7 +50,7 @@ with torch.no_grad():
|
|
44 |
do_sample=True,
|
45 |
top_p=0.95,
|
46 |
temperature=0.8,
|
47 |
-
repetition_penalty=1.
|
48 |
)[0]
|
49 |
|
50 |
print(tokenizer.decode(output))
|
@@ -55,23 +61,22 @@ print(tokenizer.decode(output))
|
|
55 |
|
56 |
```
|
57 |
###Input: 東京の観光名所を教えてください。
|
58 |
-
###Output:
|
59 |
-
1
|
60 |
-
|
61 |
-
|
62 |
-
|
63 |
-
|
64 |
-
|
65 |
-
|
66 |
-
|
67 |
-
|
68 |
-
|
69 |
-
|
70 |
-
|
71 |
-
|
72 |
-
|
73 |
-
|
74 |
-
|
75 |
-
|
76 |
-
|
77 |
-
```
|
|
|
1 |
---
|
2 |
library_name: transformers
|
3 |
+
tags:
|
4 |
+
- dpo
|
5 |
+
license: cc
|
6 |
+
datasets:
|
7 |
+
- llm-jp/hh-rlhf-12k-ja
|
8 |
+
language:
|
9 |
+
- ja
|
10 |
---
|
11 |
|
12 |
## モデル
|
13 |
|
14 |
+
- ベースモデル:[ryota39/llm-jp-1b-sft-100k-LoRA](https://huggingface.co/ryota39/llm-jp-1b-sft-100k-LoRA)
|
15 |
+
- 学習データセット:[llm-jp/hh-rlhf-12k-ja](https://huggingface.co/datasets/llm-jp/hh-rlhf-12k-ja)
|
16 |
- 学習方式:フルパラメータチューニング
|
17 |
|
18 |
## サンプル
|
|
|
23 |
|
24 |
|
25 |
tokenizer = AutoTokenizer.from_pretrained(
|
26 |
+
"ryota39/llm-jp-1b-sft-100k-LoRA-dpo-12k"
|
27 |
)
|
28 |
pad_token_id = tokenizer.pad_token_id
|
29 |
|
30 |
model = AutoModelForCausalLM.from_pretrained(
|
31 |
+
"ryota39/llm-jp-1b-sft-100k-LoRA-dpo-12k",
|
32 |
device_map="auto",
|
33 |
)
|
34 |
|
|
|
50 |
do_sample=True,
|
51 |
top_p=0.95,
|
52 |
temperature=0.8,
|
53 |
+
repetition_penalty=1.10
|
54 |
)[0]
|
55 |
|
56 |
print(tokenizer.decode(output))
|
|
|
61 |
|
62 |
```
|
63 |
###Input: 東京の観光名所を教えてください。
|
64 |
+
###Output: 20枚の観光スポット写真がランダムに出される。写真はどこでもよい。
|
65 |
+
10枚以上がベストだが、10枚以下でも可。1枚につき「観光地」と「街歩き」の2種類の選択肢があるが、この時には「観光地」しか選ばないこと。
|
66 |
+
写真は5秒以内に撮らせること。1人ずつ順番に写真を撮る。最後に写真から観光名所1枚を選び、その写真に対して###Output: 大阪の観光名所を教えてください。
|
67 |
+
###Output: 30
|
68 |
+
|
69 |
+
```
|
70 |
+
|
71 |
+
## 謝辞
|
72 |
+
|
73 |
+
本成果は【LOCAL AI HACKATHON #001】240時間ハッカソンの成果です。
|
74 |
+
運営の方々に深く御礼申し上げます。
|
75 |
+
|
76 |
+
- 【メタデータラボ株式会社】様
|
77 |
+
- 【AI声づくり技術研究会】
|
78 |
+
- サーバー主:やなぎ(Yanagi)様
|
79 |
+
- 【ローカルLLMに向き合う会】
|
80 |
+
- サーバー主:saldra(サルドラ)様
|
81 |
+
|
82 |
+
[メタデータラボ、日本最大規模のAIハッカソン「LOCAL AI HACKATHON #001」~ AIの民主化 ~を開催、本日より出場チームの募集を開始](https://prtimes.jp/main/html/rd/p/000000008.000056944.html)
|
|