DEFT: Korean Alpaca Model (Kogpt-Version)
์นด์นด์ค๋ธ๋ ์ธ์์ ๊ณต๊ฐํ ํ๊ตญ์ด GPT์ธ Kogpt ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก Stanford Alpaca์ ํ์ต ๋ฐฉ๋ฒ + LoRA ๊ธฐ๋ฒ๊ณผ KoAlpaca์ ๋ฐ์ดํฐ์ ์ผ๋ก ํ์ตํ ํ๊ตญ์ด Alpaca๋ชจ๋ธ DEFT์ ๋๋ค.
hugginface์ peft๋ฅผ ์ฌ์ฉํด ํ์ตํ๊ณ ์ ํ์ผ๋, ์์ง Embedding Layer๋จ์ LoRA ๊ธฐ๋ฒ ์ ์ฉ์ด ๋ถ๊ฐ๋ฅํ์ฌ ๋ถ๋์ดํ๊ฒ ๋ฐ๋ก ๊ตฌํํ ๋ฐฉ์์ ์ฌ์ฉํ์์ต๋๋ค.
๋ฐ๋ผ์ ๋ชจ๋ธ์ Huggingface์์ ๋ค์ด ๋ฐ์ผ์ ํ ๋ณธ ๋ชจ๋ธ github(https://github.com/Data-Intelligence-Lab/DEFT-korean-alpaca)์ test-deft-chat.ipynb๋ฅผ ์ฐธ๊ณ ํ์ฌ ์ฌ์ฉํ์๊ธฐ ๋ฐ๋๋๋ค.
ํ์ฌ ๋ชจ๋ธ์ ํ๊ตญ์ด ์ ์ฉ์ด๋ฉฐ Multi-Turn์ด ๋ถ๊ฐ๋ฅํ๊ณ , ๊ณต๊ฒฉ์ , ์ฐจ๋ณ์ ์ธ ์ธ์ด์ ๊ฐ์ ์ฌํ์ ์ผ๋ก ํต๋ ๋์ง ์์ ํํ์ ๋ํ ์ฒ๋ฆฌ๊ฐ ๋์ด์์ง ์์ต๋๋ค.
- Downloads last month
- 2