ryota39 commited on
Commit
ad48bea
1 Parent(s): e0e3ba7

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +31 -26
README.md CHANGED
@@ -1,12 +1,18 @@
1
  ---
2
  library_name: transformers
3
- tags: []
 
 
 
 
 
 
4
  ---
5
 
6
  ## モデル
7
 
8
- - ベースモデル:[llm-jp/llm-jp-1.3b-v1.0](https://huggingface.co/llm-jp/llm-jp-1.3b-v1.0)
9
- - 学習データセット:[llm-jp/databricks-dolly-15k-ja](https://huggingface.co/datasets/llm-jp/databricks-dolly-15k-ja)
10
  - 学習方式:フルパラメータチューニング
11
 
12
  ## サンプル
@@ -17,12 +23,12 @@ from transformers import AutoTokenizer, AutoModelForCausalLM
17
 
18
 
19
  tokenizer = AutoTokenizer.from_pretrained(
20
- "ryota39/llm-jp-1b-sft-15k"
21
  )
22
  pad_token_id = tokenizer.pad_token_id
23
 
24
  model = AutoModelForCausalLM.from_pretrained(
25
- "ryota39/llm-jp-1b-sft-15k",
26
  device_map="auto",
27
  )
28
 
@@ -44,7 +50,7 @@ with torch.no_grad():
44
  do_sample=True,
45
  top_p=0.95,
46
  temperature=0.8,
47
- repetition_penalty=1.0
48
  )[0]
49
 
50
  print(tokenizer.decode(output))
@@ -55,23 +61,22 @@ print(tokenizer.decode(output))
55
 
56
  ```
57
  ###Input: 東京の観光名所を教えてください。
58
- ###Output: 東京には多くの観光名所がある:
59
- 1.皇居
60
- 2.江戸東京博物館
61
- 3.東京タワー
62
- 4.東京スカイツリー
63
- 5.芝公園
64
- 6.東京タワー、増上寺、増上寺宝物館
65
- 7.浜離宮恩賜庭園
66
- 8.東京都庁
67
- 9.増上寺
68
- 10.新宿御苑
69
- 11.浅草寺
70
- 12.上野公園
71
- 13.お台場
72
- 14.明治神宮
73
- 15.上野動物園
74
- 16.東京国立博物館
75
- 17.浅草寺、浅草寺仲見
76
-
77
- ```
 
1
  ---
2
  library_name: transformers
3
+ tags:
4
+ - dpo
5
+ license: cc
6
+ datasets:
7
+ - llm-jp/hh-rlhf-12k-ja
8
+ language:
9
+ - ja
10
  ---
11
 
12
  ## モデル
13
 
14
+ - ベースモデル:[ryota39/llm-jp-1b-sft-100k-LoRA](https://huggingface.co/ryota39/llm-jp-1b-sft-100k-LoRA)
15
+ - 学習データセット:[llm-jp/hh-rlhf-12k-ja](https://huggingface.co/datasets/llm-jp/hh-rlhf-12k-ja)
16
  - 学習方式:フルパラメータチューニング
17
 
18
  ## サンプル
 
23
 
24
 
25
  tokenizer = AutoTokenizer.from_pretrained(
26
+ "ryota39/llm-jp-1b-sft-100k-LoRA-dpo-12k"
27
  )
28
  pad_token_id = tokenizer.pad_token_id
29
 
30
  model = AutoModelForCausalLM.from_pretrained(
31
+ "ryota39/llm-jp-1b-sft-100k-LoRA-dpo-12k",
32
  device_map="auto",
33
  )
34
 
 
50
  do_sample=True,
51
  top_p=0.95,
52
  temperature=0.8,
53
+ repetition_penalty=1.10
54
  )[0]
55
 
56
  print(tokenizer.decode(output))
 
61
 
62
  ```
63
  ###Input: 東京の観光名所を教えてください。
64
+ ###Output: 20枚の観光スポット写真がランダムに出される。写真はどこでもよい。
65
+ 10枚以上がベストだが、10枚以下でも可。1枚につき「観光地」と「街歩き」の2種類の選択肢があるが、この時には「観光地」しか選ばないこと。
66
+ 写真は5秒以内に撮らせること。1人ずつ順番に写真を撮る。最後に写真から観光名所1枚を選び、その写真に対して###Output: 大阪の観光名所を教えてください。
67
+ ###Output: 30
68
+
69
+ ```
70
+
71
+ ## 謝辞
72
+
73
+ 本成果は【LOCAL AI HACKATHON #001】240時間ハッカソンの成果です。
74
+ 運営の方々に深く御礼申し上げます。
75
+
76
+ - 【メタデータラボ株式会社】様
77
+ - 【AI声づくり技術研究会】
78
+ - サーバー主:やなぎ(Yanagi)様
79
+ - 【ローカルLLMに向き合う会】
80
+ - サーバー主:saldra(サルドラ)様
81
+
82
+ [メタデータラボ、日本最大規模のAIハッカソン「LOCAL AI HACKATHON #001」~ AIの民主化 ~を開催、本日より出場チームの募集を開始](https://prtimes.jp/main/html/rd/p/000000008.000056944.html)