Text Generation
Transformers
PyTorch
Korean
gpt_neox
Inference Endpoints
text-generation-inference
Edit model card

iknow-lab/AULM-12.8b-v0

  • EleutherAI/polyglot-ko-12.8bλ₯Ό μ—¬λŸ¬ ν•œκ΅­μ–΄ instruction λ°μ΄ν„°μ…‹μœΌλ‘œ ν•™μŠ΅ν•œ λͺ¨λΈ

μƒμ„±μ˜ˆμ‹œ

ν”„λ‘¬ν”„νŠΈ

당신은 μ•„μ£ΌλŒ€ν•™κ΅μ˜ ν•œκ΅­μ–΄ 챗봇 μ•„μš°λ¦„μž…λ‹ˆλ‹€. μ‚¬μš©μžμ—κ²Œ 도움이 되고 μœ μ΅ν•œ λ‚΄μš©μ„ μ œκ³΅ν•΄μ•Όν•©λ‹ˆλ‹€. 닡변은 κΈΈκ³  μžμ„Έν•΄μ•Ό ν•˜λ©°, λ°˜λ“œμ‹œ μΉœμ ˆν•œ μ„€λͺ…을 ν¬ν•¨ν•΄μ•Όν•©λ‹ˆλ‹€.

### μ‚¬μš©μž:
μ•„μ£ΌλŒ€ν•™κ΅μ— λŒ€ν•΄ μ•Œμ•„?

### 챗봇:

μƒμ„±λœ λ‹΅λ³€:

μ•„μ£ΌλŒ€ν•™κ΅λŠ” λŒ€ν•œλ―Όκ΅­μ˜ λŒ€ν•™κ΅λ‘œ, 1973λ…„λΆ€ν„° μœ„μΉ˜ν•˜κ³  있으며, 경기도 μˆ˜μ›μ‹œ μ˜ν†΅κ΅¬μ— μ†Œμž¬ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€. λŒ€ν•™κ΅μ˜ 규λͺ¨λŠ” 맀우 크고, λ‹€μ–‘ν•œ 전곡과 ν•™λ¬Έ λΆ„μ•Όλ₯Ό μ œκ³΅ν•˜λ©°, 높은 μˆ˜μ€€μ˜ ꡐ윑과 연ꡬ ν™œλ™μ„ μˆ˜ν–‰ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€. ꡐ윑 κΈ°κ΄€μœΌλ‘œμ„œ μ•„μ£ΌλŒ€μ˜ λͺ©ν‘œλŠ” λ‹€μ–‘ν•œ ꡭ제적 기쀀을 κ°–μΆ˜ 전문적이고 μš°μˆ˜ν•œ 인재λ₯Ό λ°°μΆœν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€.

μ•„μ£ΌλŒ€ν•™κ΅λŠ” ν•™μƒλ“€μ˜ μ—­λŸ‰μ„ ν‚€μš°κΈ° μœ„ν•΄ λ‹€μ–‘ν•œ ν”„λ‘œκ·Έλž¨μ„ μ œκ³΅ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, 인문학과 이곡계 ν•™κ³Όμ˜ 학생듀은 인문학과 μžμ—°μ˜ 과학적 이해 κΈ°λ°˜μ„ λ†’μ΄λŠ” 과정을 톡해 지식을 ν™•μž₯ν•  수 있으며, 곡학·IT λΆ„μ•Ό 학생듀은 기초 κ³Όν•™ λΆ„μ•Όμ˜ μ—­λŸ‰μ„ 함양할 수 μžˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ, μ•„μ£ΌλŒ€μ˜ 학점 μ²΄μ œλŠ” λ‹€μ–‘ν•œ κ³Όλͺ©κ³Ό 평가 μŠ€νƒ€μΌμ„ 가지고 μžˆμ–΄, 학생듀은 μžμ‹ λ§Œμ˜ 곡뢀 λ°©ν–₯을 μ„€μ •ν•˜κ³  학점 μ‹œμŠ€ν…œμ— 적응할 수 μžˆλ„λ‘ μ§€μ›ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€.

μ•„μ£ΌλŒ€ν•™κ΅μ—λŠ” κ΅­λ‚΄ 졜고의 λŒ€ν•™κ΅λ‘œμ„œμ˜ μžκ²©μ„ μž…μ¦ν•˜κΈ° μœ„ν•΄ λ‹€μ–‘ν•œ ν•™μˆ  연ꡬ 센터듀이 μ‘΄μž¬ν•©λ‹ˆλ‹€. κ·Έ μ€‘μ—μ„œλ„ ν•™μˆ μ  연ꡬ 센터듀은 μ•„μ£ΌλŒ€ν•™κ΅μ˜ 핡심 κΈ°κ΄€μœΌλ‘œ, 학생듀이 높은 μˆ˜μ€€μ˜ ν•™μˆ  ν™œλ™μ„ κ²½ν—˜ν•  수 μžˆλ„λ‘ λ„μ™€μ€λ‹ˆλ‹€. λ˜ν•œ, μ•„μ£ΌλŒ€ν•™κ΅μ—λŠ” μ™Έκ΅­μ–΄ μ„Όν„° 및 μ™Έκ΅­μ–΄ ꡐ윑 연ꡬλ₯Ό μ§„ν–‰ν•˜λŠ” μ™Έκ΅­μ–΄ κ΅μœ‘μ„Όν„°κ°€ μžˆμ–΄μ„œ, 학생듀이 μ™Έκ΅­μ–΄ λŠ₯λ ₯을 κ°•ν™”ν•˜κ³  ν•΄μ™Έμ·¨μ—… κ°€λŠ₯성을 높일 수 μžˆλ„λ‘ μ§€μ›ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€.

μ•„μ£ΌλŒ€ν•™κ΅λŠ” λ‹€μ–‘ν•œ μ‚¬νšŒμ  곡읡사업을 μ§„ν–‰ν•˜λ©°, 학생듀과 μ‚¬νšŒμ™€μ˜ μƒν˜Έμž‘μš©μ΄ 맀우 μ€‘μš”ν•˜λ‹€κ³  μΈμ‹ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ λ…Έλ ₯λ“€ 쀑 ν•˜λ‚˜λŠ” μ•„μ£ΌλŒ€ν•™κ΅ 학생듀을 λŒ€μƒμœΌλ‘œ ν•œ μž₯ν•™κΈˆ μ œλ„λ₯Ό μš΄μ˜ν•˜κ³  μžˆλŠ” κ²ƒμž…λ‹ˆλ‹€. μž₯ν•™κΈˆμ€ 경제적인 이유둜 학업에 어렀움을 κ²ͺλŠ” 학생듀을 μ§€μ›ν•˜κΈ° μœ„ν•΄ 제곡 되고 있으며, μ΄λŸ¬ν•œ λ…Έλ ₯은 μ•„μ£ΌλŒ€ν•™κ΅μ—μ„œλ„ μ§€μ†λ˜κ³  μžˆμŠ΅λ‹ˆλ‹€.

λ˜ν•œ, μ•„μ£ΌλŒ€ν•™κ΅λŠ” 지역 μ‚¬νšŒμ™€μ˜ μƒν˜Έμž‘μš©μ—λ„ λ§Žμ€ 관심을 두고 μžˆμŠ΅λ‹ˆλ‹€. 이λ₯Ό μœ„ν•΄ μ•„μ£ΌλŒ€ν•™κ΅μ˜ 캠퍼슀 λ‚΄μ—μ„œ 지역 λ‚΄ μ—¬λŸ¬ κΈ°κ΄€λ“€κ³Ό ν•¨κ»˜ν•˜λŠ” ꡐ윑 ν˜‘λ ₯ ν”„λ‘œκ·Έλž¨μ„ μš΄μ˜ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ ν˜‘λ ₯ ν”„λ‘œκ·Έλž¨μ€ 지역 λ‚΄μ˜ 학생듀이 λ‹€μ–‘ν•œ ꡐ윑과 λ¬Έν™” μ²΄ν—˜μ„ 톡해 κΈ€λ‘œλ²Œν•œ 인재둜 μ„±μž₯ν•  수 μžˆλ„λ‘ μ§€μ›ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€.

μ•„μ£ΌλŒ€ν•™κ΅λŠ” 학생 쀑심 κ΅μœ‘μ„ μΆ”κ΅¬ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€. 이λ₯Ό μœ„ν•΄ μ•„μ£ΌλŒ€ν•™κ΅λŠ” ν•™μƒλ“€μ˜ μ˜κ²¬μ„ μ΅œλŒ€ν•œ μˆ˜μš©ν•˜λ €κ³  λ…Έλ ₯ν•˜λ©°, κ΅μˆ˜λ“€μ€ 학생듀이 μ°½μ˜μ„±κ³Ό λ¬Έμ œν•΄κ²° λŠ₯λ ₯을 λ°œμ „μ‹œν‚¬ 수 μžˆλ„λ‘ λ‹€μ–‘ν•œ κ°•μ˜μ™€ μ‹€μŠ΅ ν™œλ™μ„ μ œκ³΅ν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€. μ΄λ ‡κ²Œ 학생듀을 μ€‘μ‹¬μœΌλ‘œ ν•˜λŠ” λ…Έλ ₯κ³Ό 지원은 μ•„μ£ΌλŒ€ν•™κ΅μ˜ λ°œμ „μ— 큰 영ν–₯을 미치고 μžˆμŠ΅λ‹ˆλ‹€.

μ‚¬μš©ν•œ 데이터셋

Dataset # instance νƒ€μž…
KoAlpaca v1.1 50K μ‹±κΈ€ν„΄
dbdu/ShareGPT-74k-ko 의 part2_ko_uncleaned 36K λ©€ν‹°ν„΄
heegyu/korquad-chat-v1 9.6K λ©€ν‹°ν„΄, μ§€μ‹κΈ°λ°˜
lcw99/evolve-instruct 37K μ‹±κΈ€ν„΄
HAERAE-HUB/KoInstruct-QA 50.3k μ‹±κΈ€ν„΄
changpt/ko-lima-vicuna 1K μ‹±κΈ€ν„΄, λ©€ν‹°ν„΄(극히 일뢀)
nlpai-lab/kullm-v2 15K μ‹±κΈ€ν„΄
  • KULLM v2 λ°μ΄ν„°μ…‹μ—μ„œλŠ” GPT4ALL, Dolly λ°μ΄ν„°λ§Œ μΆ”μΆœν•΄μ„œ μ‚¬μš©ν–ˆμŠ΅λ‹ˆλ‹€.
  • λ‹€μ–‘ν•œ ν•™μŠ΅ 데이터셋은 HeegyuKim/open-korean-instructions GitHub repositoryλ₯Ό μ°Έκ³ ν•˜μ„Έμš”.
Downloads last month
1,216

Datasets used to train iknow-lab/AULM-12.8b-v0