Edit model card

AIFT-instruct-42dot_LLM-SFT-1.3B-dpo

<ํ•™์Šต ๋ฐ์ดํ„ฐ ๊ตฌ์ถ•>
kyujinpy ๋‹˜์ด ๊ณต๊ฐœํ•˜์‹  KOR-OpenOrca-Platypus ๋ฐ์ดํ„ฐ๋ฅผ ์ผ๋ถ€ ์‚ญ์ œ(์ƒ˜ํ”Œ๋ง) ๋ฐ ์ •์ œ ์ž‘์—… ์ง„ํ–‰ํ•˜์—ฌ ํ™œ์šฉ. ๊ทธ ์ดํ›„ ํ•ด๋‹น ๋ฐ์ดํ„ฐ๋“ค์„ ๋ณด๋ฉฐ ๊ด€๋ จ ํƒœ์Šคํฌ๋ฅผ ์ถ”์ถœํ•˜์˜€๊ณ  ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•ด๋‹น ํƒœ์Šคํฌ์— ๋งž์ถฐ์„œ NLP ๊ด€๋ จ ์˜คํ”ˆ์†Œ์Šค ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ํ•™์Šต๋ฐ์ดํ„ฐ๋ฅผ ์ž์ฒด์ ์œผ๋กœ ์—ญ์‚ฌ, ๊ณผํ•™, ์ˆ˜ํ•™, ๊ธฐ๊ณ„๋…ํ•ด, ๋ฆฌ๋ทฐ ๋ถ„์„ ๋ฌธ์ œ๋ฅผ gpt๋ฅผ ํ†ตํ•ด์„œ ๊ตฌ์ถ•ํ•˜์˜€๊ณ , aihub ์ผ๋ฐ˜์ƒ์‹ ๋ฐ ๊ธฐ๊ณ„๋…ํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์ถ”๊ฐ€๋กœ ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ๊ตฌ์ถ•(ํ˜•ํƒœ์†Œ ๊ด€๋ จ, ๊ธฐ๊ณ„๋…ํ•ด ๊ด€๋ จ ๋ฐ ์š”์•ฝ) ๊ฐ์ข… ๋ธ”๋กœ๊ทธ์—์„œ ์—ญ์‚ฌ ๋ฐ ์ƒ์‹ ํ€ด์ฆˆ๋ฅผ ์‚ฌ๋žŒ์ด ์ง์ ‘ ํ•™์Šต๋ฐ์ดํ„ฐ ํ˜•ํƒœ๋กœ ๋ณ€๊ฒฝ AI2AI Challenge ๋ฐ์ดํ„ฐ ํ˜•ํƒœ๋ฅผ ๋ณด๊ณ  gpt๋ฅผ ํ†ตํ•ด ์ดˆ๋“ฑ ์ˆ˜์ค€์˜ ๊ณผํ•™ ์ˆ˜ํ•™ ๋ฌธ์ œ ์œ ํ˜•์„ ์ œ์ž‘ 500๋ฌธ์ œ ์˜์–ด ๋ฒˆ์—ญ ๋ฐ์ดํ„ฐ ์˜ํ•œ/ํ•œ์˜ ๋ฐ์ดํ„ฐ ํ•™์Šต ๋ฐ์ดํ„ฐ๋กœ ํ™œ์šฉ ์ง„ํ–‰ ์ด ๋ฐ์ดํ„ฐ 4๋งŒ๊ฐœ ์ •๋„ ์‚ฌ์šฉํ•˜์˜€์Šต๋‹ˆ๋‹ค.

dpo๋ฐ์ดํ„ฐ์˜ ๊ฒฝ์šฐ๋Š” hh-rlhf๋ฐ์ดํ„ฐ๋ฅผ gpt-3.5-turbo๋ฅผ ํ™œ์šฉํ•ด ๋‹ต๋ณ€์„ ์žฌ์ƒ์„ฑํ•˜์˜€์Šต๋‹ˆ๋‹ค

  • TruthfulQA ๊ด€๋ จ ๋ฌธ์ œ ์ถ”๊ฐ€๋ฅผ ์ง„ํ–‰ํ•˜์˜€์Šต๋‹ˆ๋‹ค.(์†์„ค ๊ด€๋ จ ์ฐธ๊ฑฐ์ง“ ๋ฌธ์ œ)
  • ๊ธฐ๊ณ„๋…ํ•ด ๊ด€๋ จ ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ChatGPT๋ฅผ ํ†ตํ•ด์„œ ๋‹ต๋ณ€์„ ์–ป์–ด ํ•™์Šต
  • ๋ฌธ๋ฒ•๊ด€๋ จ ํ•™์Šต ๋ฐ์ดํ„ฐ
    ###ํ•™์Šต ๋ฐ์ดํ„ฐ ํŒŒ์ผ์€ ๋น„๊ณต๊ฐœ์ž…๋‹ˆ๋‹ค.

<๋ชจ๋ธ>
42dot์—์„œ ๊ณต๊ฐœํ•œ 42dot_LLM-SFT-1.3B์„ ๋ฒ ์ด์Šค ๋ชจ๋ธ๋กœ ํ•˜์—ฌ ํ•™์Šต ์ง„ํ–‰ํ•˜์˜€์Šต๋‹ˆ๋‹ค.


<ํ•™์Šต>
ํ•™์Šต์€ LoRA๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ A100 40G *2์—์„œ ํ•™์Šต์„ ์ง„ํ–‰ํ•˜์˜€์Šต๋‹ˆ๋‹ค.

Downloads last month
8,138
Safetensors
Model size
1.44B params
Tensor type
FP16
ยท