Model Card
์์ค์ง
Model Details
Model Description
beomi/Llama-3-Open-Ko-8B (์ต์ ๋ฒ์ )์ Instruction tuning ๋ฒ์ ๋ชจ๋ธ์ ๋๋ค.
Dataset:
Instruction format:
- alpaca
Dataset
์์ ์ ์ผ๋ก ์ด์ฉ ๊ฐ๋ฅํ ๋ฐ์ดํฐ ์ ์ ์ฌ์ฉํ์์ต๋๋ค.
ํฅํ ๋น๊ต๋ฅผ ์ํ์ฌ, ์ํ/์ฝ๋ฉ ๊ด๋ จ ์ง๋ฌธ์ด ๋ง์ ๋ฐ์ดํฐ ์ (ex: kyujinpy/KOpen-platypus)์ ์ ์ธํ์์ต๋๋ค.
๋ฉํฐ ํด ๋ํ ๋ฐ์ดํฐ(nlpai-lab/openassistant-guanaco-ko)๋ฅผ ์ถ๊ฐํด๋ณด์์ต๋๋ค.
beomi/KoAlpaca-v1.1a
- 80% ํ๋ฅ ๋ก instruction ์ถ๊ฐ("๋น์ ์ ์ธ๊ณต์ง๋ฅ ๋น์์ ๋๋ค. ์ฌ์ฉ์๊ฐ ๋ต์ ์ดํดํ๊ธฐ ์ํด ์ธ๋ถ์์ ๊ฒ์ํ ํ์๊ฐ ์๋๋ก ์์ธํ ๋ต๋ณ์ ์ ๊ณตํ์ธ์.")
kyujinpy/OpenOrca-KO
- ๋ณ๊ฒฝ์ฌํญ ์์
nlpai-lab/openassistant-guanaco-ko
- ๋ฉํฐ ํด ๋ํ์ ๊ฒฝ์ฐ, ๋ง์ง๋ง Assistant์ ๋ต๋ณ์ ๋ชฉํ๋ก ํจ
- Alpaca format์ ๋ง์ถฐ ์ด์ ๋ํ ๋ด์ฉ์ ๋ํ ์ ์ฒ๋ฆฌ ์ํ
- 80% ํ๋ฅ ๋ก instruction ์ถ๊ฐ ("๋น์ ์ ์ธ๊ณต์ง๋ฅ ๋น์์ ๋๋ค. ์ฌ์ฉ์๊ฐ ๋ต์ ์ดํดํ๊ธฐ ์ํด ์ธ๋ถ์์ ๊ฒ์ํ ํ์๊ฐ ์๋๋ก ์์ธํ ๋ต๋ณ์ ์ ๊ณตํ์ธ์.")
Training details
Training: Axolotl์ ์ด์ฉํด LoRA๋ก 3epoch ํ์ต ์์ผฐ์ต๋๋ค.
- lora_r: 32
- lora_alpha: 32
- lora_dropout: 0.05
- gradient_accumulation_steps: 8
- micro_batch_size: 4
- num_epochs: 3
- learning_rate: 0.0002 (2e-4)
- lr_scheduler: cosine
- warmup_steps: 50
- sequence_len: 4096
- bf16
ํ์ต ์๊ฐ: 1xA100, ์ฝ 8์๊ฐ
Evaluation
- boolq๋ฅผ ์ ์ธํ๋ฉด ํฐ ์ ํ๋ ํฅ์์ ์์์ต๋๋ค.
- 5shot kobest (Accuracy)
Tasks | werty1248/Llama-3-Ko-8B-OpenOrca | beomi/Llama-3-Open-Ko-8B | werty1248/Llama-3-Ko-8B-Instruct-AOG |
---|---|---|---|
kobest_boolq | 0.7158ยฑ0.0120 | 0.7963ยฑ0.0108 | 0.8312ยฑ0.0100 |
kobest_copa | 0.7620ยฑ0.0135 | 0.8110ยฑ0.0124 | 0.8120ยฑ0.0124 |
kobest_hellaswag | 0.4740ยฑ0.0224 | 0.4780ยฑ0.0224 | 0.4700ยฑ0.0223 |
kobest_sentineg | 0.9471ยฑ0.0112 | 0.9622ยฑ0.0096 | 0.9647ยฑ0.0093 |
kobest_wic | 0.6079ยฑ0.0138 | 0.5778ยฑ0.0139 | 0.5937ยฑ0.0138 |
Format & Examples
Instruction - Input - Response ํํ๊ฐ ๊ถ์ฅ๋์ง๋ง, ๊ฒฝํ์ ์ผ๋ก Question - Instruction - Response๋ก ์ฌ์ฉํ๋ ๊ฒ์ด ๋ ๋์ ๊ฒ ๊ฐ์ต๋๋ค.
์ ๋ ๋ต๋ณ ์์
input = """### Question:
ํผ๋ณด๋์น ์์ด์ด ๋ญ์ผ? ๊ทธ๋ฆฌ๊ณ ํผ๋ณด๋์น ์์ด์ ๋ํด ํ์ด์ฌ ์ฝ๋๋ฅผ ์ง์ค๋ณผ๋?
### Instruction:
์น์ ํ ์ฑ๋ด์ผ๋ก์ ์๋๋ฐฉ์ ์์ฒญ์ ์ต๋ํ ์์ธํ๊ณ ์น์ ํ๊ฒ ๋ตํ์.
### Response:
"""
ํผ๋ณด๋์น ์์ด์ 1์ฐจ์ 2์ฐจ ์๋ฅผ ์ฌ์ฉํด ๋ค์ ์๋ฅผ ๊ตฌํ๋ ๋ฐฉ์์ผ๋ก ๋ง๋ค์ด์ง๋ ์์ด์
๋๋ค. ์๋ฅผ๋ค๋ฉด ํผ๋ณด๋์น ์์ด์ ์ฒ์ 7๊ฐ ์์๋ 1, 1, 2, 3, 5, 8, 13์
๋๋ค. ํผ๋ณด๋์น ์์ด์ ๊ฐ ์์น์์ 2๊ฐ ์ด์ ์์น์ ์๋ฅผ ๋ํ์ฌ ์๋ก์ด ์์๊ฐ ๊ณ์ฐ๋ฉ๋๋ค.
Python ์ฝ๋๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
def fibo(n):
if n<2:
return n
else:
return fibo(n-1)+fibo(n-2)
์ด๋ ๊ฒ ์์ฑํจ์ผ๋ก์จ ํผ๋ณด๋์น ์์ด์ ์์น 0๋ถํฐ n๊น์ง ๊ฐ ์์๊ฐ ๊ณ์ฐ๋ฉ๋๋ค. 6์ด๋ผ๋ ์์น๋ก ๊ณ์ฐํ๋ ๊ฒฝ์ฐ ๋ค์๊ณผ ๊ฐ์ ์ถ๋ ฅ์ด ๋ํ๋ฉ๋๋ค:
print(fibo(6))
fibonacci(6)==> 8<|end_of_text|>
- ์๋ชป๋ ๋ต๋ณ(ํ ๋ฃจ์๋ค์ด์ ) ์์
input = """### Question:
์ธ์ข
๋์์ ์งํ์ ๋งฅ๋ถ ๋์ง ์ฌ๊ฑด์ ๋ํด์ ์๊ณ ์์ด?
### Instruction:
์น์ ํ ์ฑ๋ด์ผ๋ก์ ์๋๋ฐฉ์ ์์ฒญ์ ์ต๋ํ ์์ธํ๊ณ ์น์ ํ๊ฒ ๋ตํ์.
### Response:
"""
๋ค, 2007๋
์ ์ธ์ข
๋์์ ์งํ์ ๋งฅ๋ถ ๋์ง ์ฌ๊ฑด์ด ์ผ์ด๋ฌ์ต๋๋ค. ๋ํ ์๊ฐ์ธ ์ด์ฃผ์์จ๊ฐ ๊น์ํฌ ์๊ฐ์ ์ฑ
์ ์งํํ๋ฉด์, ์ฑ
๋ด์ฉ์ ์๋ ์์๋ ์ธ์ข
๋์์ด ๋งฅ๋ถ์ ๋์ก๋ค๋ ๋ด์ฉ์ ์ ์ฌ๋ก ํด์ ์ถํํ์๊ณ , ์ด์ ๊น์ํฌ ์๊ฐ๋ ์งํ์ ์ด๋ ์ด๋ฆ์ผ๋ก ์ด์ฃผ์ ์๊ฐ์๊ฒ ๋ฒ์ ์์ก์ ๊ฑธ๊ฒ ๋์์ต๋๋ค. ๊ทธ๋ฌ๋ ๊ฒฐ๋ก ์ ์ผ๋ก, ๊น์ํฌ ์๊ฐ์ ์งํ์ ์ด๋ ๋จ์ด๋ ํน์ ๋จ์ฒด๋ ์ฅ์๋ง์ ๋ช
๋ฐฑํ๊ฒ ์ฌ์ฉํ๋ 'ํธ์นญ'์ ์ฑ๊ฒฉ๊ณผ ํจ๊ป ๋ค์์ ์งํ์ ์ฌ๋๋ค์ด ๊ณต๋ ์ฌ์ฉํ๋ 'ํ์ค'์ ์ฑ๊ฒฉ์ ๊ฐ์ก์ผ๋ฏ๋ก, ์ด์ฃผ์ ์๊ฐ์ ์ถํ ํ์๊ฐ ๋ช
์ํผ์์ ํด๋น๋๋์ง ์ฌ๋ถ๋ฅผ ํ๋จํ ๋์๋ ์ถํ ๋น์ ์งํ์ ์ด ์ผ๋ฐ์ ์ผ๋ก ์ด๋ค ์๋ฏธ๋ฅผ ๊ฐ์ง๊ณ ์์๋์ง๊ฐ ์ค์ํ ์์๋ก ๊ณ ๋ ค๋์์ต๋๋ค. ๋ฐ๋ผ์ ๋จ์ํ ์งํ์ ์ด ๊ฐ๊ณ์ ํน์ ๋จ์ฒด ๋ฐ ์ฅ์์ ๊ด๋ จ๋ ํธ์นญ์ผ๋ก๋ง ์ฌ์ฉ๋์ด์๋ค๋ฉด, ์ถํ ํ์๋ก ์ธํด ๋ช
์ํผ์์ ๋ฐ์๋ค๋ ๊น์ํฌ ์๊ฐ์ ์ฃผ์ฅ์ ๋ฐ์๋ค์ฌ์ง์ง ์์์ ์๋ ์์ต๋๋ค.<|end_of_text|>
- ๋ฉํฐํด ๋ํ ์์ (์ ๋ขฐ๋ ๋ฎ์)
"""### Question:
ํผ๋ณด๋์น ์์ด์ด ๋ญ์ผ? ๊ทธ๋ฆฌ๊ณ ํผ๋ณด๋์น ์์ด์ ๋ํด ํ์ด์ฌ ์ฝ๋๋ฅผ ์ง์ค๋ณผ๋?
### Response:
ํผ๋ณด๋์น ์์ด์ 1์ฐจ์ 2์ฐจ ์๋ฅผ ์ฌ์ฉํด ๋ค์ ์๋ฅผ ๊ตฌํ๋ ๋ฐฉ์์ผ๋ก ๋ง๋ค์ด์ง๋ ์์ด์
๋๋ค. ์๋ฅผ๋ค๋ฉด ํผ๋ณด๋์น ์์ด์ ์ฒ์ 7๊ฐ ์์๋ 1, 1, 2, 3, 5, 8, 13์
๋๋ค. ํผ๋ณด๋์น ์์ด์ ๊ฐ ์์น์์ 2๊ฐ ์ด์ ์์น์ ์๋ฅผ ๋ํ์ฌ ์๋ก์ด ์์๊ฐ ๊ณ์ฐ๋ฉ๋๋ค.
Python ์ฝ๋๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
def fibo(n):
if n<2:
return n
else:
return fibo(n-1)+fibo(n-2)
์ด๋ ๊ฒ ์์ฑํจ์ผ๋ก์จ ํผ๋ณด๋์น ์์ด์ ์์น 0๋ถํฐ n๊น์ง ๊ฐ ์์๊ฐ ๊ณ์ฐ๋ฉ๋๋ค. 6์ด๋ผ๋ ์์น๋ก ๊ณ์ฐํ๋ ๊ฒฝ์ฐ ๋ค์๊ณผ ๊ฐ์ ์ถ๋ ฅ์ด ๋ํ๋ฉ๋๋ค:
print(fibo(6))
fibonacci(6)==> 8
### Question:
๋ ๋น ๋ฅธ ์๊ณ ๋ฆฌ์ฆ์ ์์๊น?
### Instruction:
์น์ ํ ์ฑ๋ด์ผ๋ก์ ์๋๋ฐฉ์ ์์ฒญ์ ์ต๋ํ ์์ธํ๊ณ ์น์ ํ๊ฒ ๋ตํ์.
### Response:
"""
๋ค๋ฅธ Python ์ฝ๋๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
def fibo(n):
a, b = 0, 1
for _ in range(n):
a, b = b, a+b
return a
์ด ์ฝ๋๋ ๋ ๊ฐ์ ๋ก์ปฌ ๋ณ์ a ๋ฐ b๋ฅผ ์ฌ์ฉํ๋ ์ดํฐ๋ ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ๊ณ์ฐ์ ์ํํฉ๋๋ค. ์ด๊ธฐํ ์ a๋ ํผ๋ณด๋์น ์์ด์ ์์น 0์ ๊ฐ์ผ๋ก ์ค์ ๋๊ณ , b๋ ์ด์ ๊ณ์ฐ์์ ํผ๋ด ๊ณ์ด์ ์์น 0์ ๊ฐ(์์น 0์ ํฌํจํ๋ฉด 1๋จ๊ณ์์ 1์ด๋ฉฐ, ์์น 1์ ํฌํจํ๋ฉด 2๋จ๊ณ์์ 1)์ผ๋ก ์ค์ ๋ฉ๋๋ค. ๋ค์ ๊ฐ ๋ฐ๋ณต์์ a๋ ์ด์ ๋ก์ปฌ ๋ณ์ b์ ๊ฐ๊ณผ ์๋ก์ด ๊ฐ์ผ๋ก ๊ฐ์ด ๋ฐ๋๋๋ค. ๋ ๋ฒ์งธ ํ๋ผ๋ฏธํฐ __๋ ๊ฐ ๋ฐ๋ณต์์ ๊ฐ์ด ์ถ๋ ฅ๋์ง ์๋๋ค๋(๊ทธ๋ฌ๋ ์ฌ์ ํ ์ฌ์ฉ๋ฉ๋๋ค) ๊ฒ์ ๋ฐ์ํ๊ธฐ ์ํด ์ ํ๋์์ต๋๋ค.<|end_of_text|>
License:
- Downloads last month
- 1,484
Model tree for werty1248/Llama-3-Ko-8B-Instruct-AOG
Base model
beomi/Llama-3-Open-Ko-8B