metadata
license: apache-2.0
datasets:
- iljoo/chatbot_dataset1
base_model:
- MLP-KTLim/llama-3-Korean-Bllossom-8B
Base model
MLP-KTLim/llama-3-Korean-Bllossom-8B
Dataset
- AIHub : ํ๊ตญ์ด ์ฑ๋ฅ์ด ๊ฐ์ ๋ ์ด๊ฑฐ๋ AI ์ธ์ด๋ชจ๋ธ ๊ฐ๋ฐ ๋ฐ ๋ฐ์ดํฐ
- ๋ฐ์ดํฐ ์๊ฐ : ํ๊ตญ์ด ๋ง๋ญ์น ๋ฐ์ดํฐ 20์ต ์ด์ /310๋ง ๊ฑด๊ณผ RLHF ๋ฐ์ดํฐ 7๋ง 7์ฒ๊ฑด์ผ๋ก ๊ตฌ์ฑ ๋จ
- RLHF ๋ฐ์ดํฐ > SFT ๋ฐ์ดํฐ 10,579๊ฐ ๋ฐ์ดํฐ ํ์ฉ
- ์ฌ์ ์ ๋ณด AI ๊ฒ์ ์๊ณ ๋ฆฌ์ฆ ๊ฒฝ์ง๋ํ ๋ฐ์ดํฐ
- ๋ฐ์ดํฐ ์๊ฐ : ์ค์์ ๋ถ ์ฌ์ ์ ๋ณด ๊ด๋ จ ์ง์ ์๋ต ๋ฐ์ดํฐ
- train dataset : 498๊ฐ ๋ฐ์ดํฐ ํ์ฉ
Data structure
- Data format
- {instruction:, response:}
Parameter
[2024.10.24]
- QLoRA : Rank 4
- max_length : 512
- Epoch : 10