Saxo commited on
Commit
9d65c9f
โ€ข
1 Parent(s): 42c54df

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +1 -1
README.md CHANGED
@@ -16,7 +16,7 @@ AI ์™€ ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ ์ „๋ฌธ ๊ธฐ์—…์ธ Linkbricks(www.linkbricks.com)์˜
16
  ํ•œ๊ตญ์–ด ํ† ํฐ 17๋งŒ๊ฐœ๋ฅผ ์ถ”๊ฐ€ํ•œ ํ† ํฌ๋‚˜์ด์ €๋กœ llama3 ๊ณ„์—ด ํŒŒ์ธํŠœ๋‹์‹œ ๊ธฐ์กด llama3 ํ† ํฌ๋‚˜์ด์ € ๋Œ€์‹  ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก tokenzier_config.json๊ณผ special_tokens_map.json ์€ ์ˆ˜์ • ์—†์ด
17
  tokenzier.json์— vocab๊ณผ merges ๋งŒ appendํ•œ ํ† ํฌ๋‚˜์ด์ €์ด๋‹ค.
18
  ํ•œ๊ธ€ ์ฝ”ํผ์Šค ์•ฝ 6์–ต๊ฑด์—์„œ frequency>2 ์ด์ƒ๋งŒ ์ถ”์ถœํ•œ ํ† ํฐ๋“ค๋กœ์„œ ๊ณผํ•™, ์˜ˆ์ˆ , ์‚ฌํšŒ, ๋ฌธํ™”, ๋‰ด์Šค, ๋ฆฌ๋ทฐ, ์†Œ์…œ, ์ฑ„ํŒ… ๋“ฑ์„ ๋Œ€๋ถ€๋ถ„ ์ปค๋ฒ„ํ•œ๋‹ค.
19
- ์ฐธ๊ณ ๋กœ llama2๊ฐ€ ์›Œ๋“œํ”ผ์Šค์„ผํ…์Šค๊ณ„์—ด ํ† ํฌ๋‚˜์ด์ €๋ผ๋ฉด ์ด๋ฒˆ llama3์—์„œ๋Š” ๋ฐ”์ดํŠธ๋ ˆ๋ฒจ bpe๋กœ ๋ณ€๊ฒฝ๋˜์–ด ๊ธฐ๋ณธ ํ† ํฌ๋‚˜์ด์ €๋ฅผ ๋ฐ”์ดํŠธ๋ ˆ๋ฒจbpe๋กœ ํ•˜๊ณ  ํ”„๋ฆฌํ† ํฌ๋‚˜์ด์ €์™€ ๋…ธ๋ฉ€๋ผ์ด์ €๋“ค์€ ๊ธฐ์กด llama3 ํ† ํฌ๋‚˜์ด์ €์™€ ๋™์ผํ•˜๊ฒŒ
20
  ์„ค์ •ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
21
  <br>
22
  <br>
 
16
  ํ•œ๊ตญ์–ด ํ† ํฐ 17๋งŒ๊ฐœ๋ฅผ ์ถ”๊ฐ€ํ•œ ํ† ํฌ๋‚˜์ด์ €๋กœ llama3 ๊ณ„์—ด ํŒŒ์ธํŠœ๋‹์‹œ ๊ธฐ์กด llama3 ํ† ํฌ๋‚˜์ด์ € ๋Œ€์‹  ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก tokenzier_config.json๊ณผ special_tokens_map.json ์€ ์ˆ˜์ • ์—†์ด
17
  tokenzier.json์— vocab๊ณผ merges ๋งŒ appendํ•œ ํ† ํฌ๋‚˜์ด์ €์ด๋‹ค.
18
  ํ•œ๊ธ€ ์ฝ”ํผ์Šค ์•ฝ 6์–ต๊ฑด์—์„œ frequency>2 ์ด์ƒ๋งŒ ์ถ”์ถœํ•œ ํ† ํฐ๋“ค๋กœ์„œ ๊ณผํ•™, ์˜ˆ์ˆ , ์‚ฌํšŒ, ๋ฌธํ™”, ๋‰ด์Šค, ๋ฆฌ๋ทฐ, ์†Œ์…œ, ์ฑ„ํŒ… ๋“ฑ์„ ๋Œ€๋ถ€๋ถ„ ์ปค๋ฒ„ํ•œ๋‹ค.
19
+ ์ฐธ๊ณ ๋กœ llama2๊ฐ€ ์›Œ๋“œํ”ผ์Šค์„ผํ…์Šค๊ณ„์—ด ํ† ํฌ๋‚˜์ด์ €๋ผ๋ฉด ์ด๋ฒˆ llama3์—์„œ๋Š” ๋ฐ”์ดํŠธ๋ ˆ๋ฒจ bpe๋กœ ๋ณ€๊ฒฝ๋˜์–ด ๊ธฐ๋ณธ ํ† ํฌ๋‚˜์ด์ €๋ฅผ ๋ฐ”์ดํŠธ๋ ˆ๋ฒจbpe๋กœ ํ•˜๊ณ  ํ”„๋ฆฌํ† ํฌ๋‚˜์ด์ €์™€ ๋…ธ๋ฉ€๋ผ์ด์ € ํŒŒ์ดํ”„๋ผ์ธ๋“ค์€ ๊ธฐ์กด llama3 ํ† ํฌ๋‚˜์ด์ €์™€ ๋™์ผํ•˜๊ฒŒ
20
  ์„ค์ •ํ•˜์˜€์Šต๋‹ˆ๋‹ค.
21
  <br>
22
  <br>