DataPilot commited on
Commit
b4c2a74
1 Parent(s): cd5906d
Files changed (1) hide show
  1. README.md +6 -6
README.md CHANGED
@@ -4,11 +4,11 @@ inference: false
4
  language: ja
5
  ---
6
 
7
- ##概要
8
 
9
- 「LOCAL AI HACKATHON」における、チームDataPilot(リーダーX: https://twitter.com/Holy_fox_LLM )初めての成果品です。Line社が開発した「japanese-large-lm-1.7b-instruction-sft」をウィキブックの内容をもとに地理、化学の分野でファインチューニングを行いました。
10
 
11
- ##how to use
12
 
13
  ```python
14
  import torch
@@ -40,16 +40,16 @@ print(text)
40
 
41
  ```
42
 
43
- ##トークン化:
44
 
45
  ユニグラム言語モデルとバイトフォールバックを備えたセンテンスピーストークナイザー(sentencepiece tokenizer)を使用します。日本語トークナイザーによる事前トークン化は適用されません。したがって、ユーザーは生の文をトークナイザーに直接フィードできます。
46
 
47
- ##ライセンス:
48
 
49
  当LLMはオープンソースソフトウェアです。詳しくは下記のリンクをご覧ください。
50
  https://www.apache.org/licenses/LICENSE-2.0
51
 
52
- ##謝辞:
53
 
54
  機材を貸していただいた Witnessさん 、このような機会を与えてくださった さるどらさん 、その他助言を与えてくださった「ローカルLLMに向き合う会」のみなさま、そしてすべてのステークホルダーの皆様に感謝を申し上げます。
55
 
 
4
  language: ja
5
  ---
6
 
7
+ ## 概要
8
 
9
+ 「LOCAL AI HACKATHON」における、チームDataPilot初めての成果品です。Line社が開発した「japanese-large-lm-1.7b-instruction-sft」をウィキブックの内容をもとに地理、化学の分野でファインチューニングを行いました。
10
 
11
+ ## how to use
12
 
13
  ```python
14
  import torch
 
40
 
41
  ```
42
 
43
+ ## トークン化:
44
 
45
  ユニグラム言語モデルとバイトフォールバックを備えたセンテンスピーストークナイザー(sentencepiece tokenizer)を使用します。日本語トークナイザーによる事前トークン化は適用されません。したがって、ユーザーは生の文をトークナイザーに直接フィードできます。
46
 
47
+ ## ライセンス:
48
 
49
  当LLMはオープンソースソフトウェアです。詳しくは下記のリンクをご覧ください。
50
  https://www.apache.org/licenses/LICENSE-2.0
51
 
52
+ ## 謝辞:
53
 
54
  機材を貸していただいた Witnessさん 、このような機会を与えてくださった さるどらさん 、その他助言を与えてくださった「ローカルLLMに向き合う会」のみなさま、そしてすべてのステークホルダーの皆様に感謝を申し上げます。
55