metadata
datasets:
- beomi/KoAlpaca-v1.1a
- dbdu/ShareGPT-74k-ko
- heegyu/korquad-chat-v1
- HAERAE-HUB/KoInstruct-QA
- changpt/ko-lima-vicuna
- nlpai-lab/kullm-v2
language:
- ko
heegyu/polyglot-ko-5.8b-chat
- EleutherAI/polyglot-ko-5.8bλ₯Ό μ¬λ¬ νκ΅μ΄ instruction λ°μ΄ν°μ μΌλ‘ νμ΅ν λͺ¨λΈ
μ¬μ©ν λ°μ΄ν°μ
Dataset | # instance | νμ |
---|---|---|
KoAlpaca v1.1 | 50K | μ±κΈν΄ |
dbdu/ShareGPT-74k-ko μ part2_ko_uncleaned | 36K | λ©ν°ν΄ |
heegyu/korquad-chat-v1 | 9.6K | λ©ν°ν΄, μ§μκΈ°λ° |
lcw99/evolve-instruct | 37K | μ±κΈν΄ |
HAERAE-HUB/KoInstruct-QA | 50.3k | μ±κΈν΄ |
changpt/ko-lima-vicuna | 1K | μ±κΈν΄, λ©ν°ν΄(κ·Ήν μΌλΆ) |
nlpai-lab/kullm-v2 | 15K | μ±κΈν΄ |
- KULLM v2 λ°μ΄ν°μ μμλ GPT4ALL, Dolly λ°μ΄ν°λ§ μΆμΆν΄μ μ¬μ©νμ΅λλ€.
- λ€μν νμ΅ λ°μ΄ν°μ μ HeegyuKim/open-korean-instructions GitHub repositoryλ₯Ό μ°Έκ³ νμΈμ.
μμ± Prompt
- EOS token(<|endoftext|>)μ΄ λμ¬ λκΉμ§ μμ±νλ©΄ λ©λλ€.
- μ΅μλ¨ ν둬ννΈλ μλκ² μ’μ λ΅λ³μ΄ λ μμ£Ό λμ€λ κ² κ°μμ.
λΉμ μ AI μ±λ΄μ
λλ€. μ¬μ©μμκ² λμμ΄ λκ³ μ μ΅ν λ΄μ©μ μ 곡ν΄μΌν©λλ€. λ΅λ³μ κΈΈκ³ μμΈνλ©° μΉμ ν μ€λͺ
μ λ§λΆμ¬μ μμ±νμΈμ.
### μ¬μ©μ:
μμΈ κ΄κ΄μ§ μΆμ²ν΄μ€μ
### μ±λ΄:
μμ±λ λ΅λ³:
μμΈ κ΄κ΄μ§λ₯Ό μΆμ²νκ² μ΅λλ€.
κ²½λ³΅κΆ (κ²½λ³΅κΆ λλ 경볡κΆ)
경볡κΆμ νκ΅ μ ν΅ κΆκΆλ‘μ μ‘°μ μλμ μμ¬μ κ±΄μΆ μ² νμ 체νν μ μλ 곡κ°μ
λλ€. κΆμ λ°©λ¬Ένλ©΄ μ‘°μ μλ μνκ³Ό ν΅μΉλ°©μμ λν΄ λ°°μΈ μ μμΌλ©°, λμμ μ ν΅μ μΈ κΆκΆ λ¬Ένλ₯Ό 체νν μ μμ΅λλ€.
μ°½λκΆ (μ°½λκΆ)
μ°½λκΆμ μ‘°μ μλμ μμ€μ μ μμΌλ‘ μ λͺ
ν κΆμ
λλ€. νκ΅μ λ₯΄λ€μμ€ μλλ₯Ό 보μ¬μ£Όλ μλ¦λ€μμ κ²½νν μ μμΌλ©°, μ ν΅μ μΈ κ±΄μΆμμμ κ²½νν μ μλ κΈ°νκ° μ£Όμ΄μ§λλ€.
λμκΆ (λμκΆ)
λμκΆμ 1896λ
μ μ€λ¦½λ μμ΄ μ¬λ κΆκΆμ
λλ€. λΉμμ μλ¦λ€μκ³Ό κ±΄μΆ μ² νμ λμμ λλ μ μλ κΆκΆμ
λλ€. νκ΅μ κΆκΆ λ¬Έν, μμ¬ λ° μμ° νκ²½μ λν νμ΅μ μνλ μ¬λμκ² μΆμ²λ©λλ€.
μ’
λ¬ (μ’
λ¬)
μ’
λ¬λ μ‘°μ μλμ μμ€ μ μμΌλ‘μ κΆκΆκ³Ό ν¨κ» μμ κ±°μ² λ° μ μ¬λ₯Ό μ§λ΄λ κ³³μ
λλ€. μ ν΅μ μΈ μλ‘, μμ¬ λ° κ±΄μΆ μ² νμ λλΌκ³ 체νν μ μλ κ³³μ
λλ€.
νμ₯λ§μ (νμ₯λ§μ)
νμ₯λ§μμ μμΈ μ€μ¬λΆμ μμΉν μ λͺ
ν κ΄κ΄μ§λ‘, νκ΅ μ ν΅ λ¬Έν 체νμ μνλ μ¬λκ³Ό μΈκ΅μΈμκ²λ μΈκΈ°κ° λ§μ΅λλ€. νμ₯ 건물과 μ ν΅ μ μμ κ²½νν μ μμΌλ©°, λμ μμ μ ν΅ λ¬Ένλ₯Ό κ²½νν μ μλ κΈ°νλ₯Ό μ 곡ν©λλ€.
μΈμ¬λ (μΈμ¬λ)
μΈμ¬λμ νκ΅μ μ ν΅μ μΈ λ¬Ένμ μμ , μμ λ° μΌνμ 체νν μ μλ κ³³μ
λλ€. νκ΅μ μ ν΅λ¬Ένλ₯Ό 체ννκ³ , μ ν΅ λ¬Ένμ μλ¦λ€μμ λλ μ μλ μ₯μμ
λλ€.
μμ κ΄κ΄μ§λ₯Ό λ°©λ¬Έν¨μΌλ‘μ¨, μ°λ¦¬λ νκ΅μ μ ν΅μ μΈ λ¬Ένμ μμ¬λ₯Ό κ²½ννκ³ λ°°μΈ μ μμ΅λλ€. λν, μλ¦λ€μκ³Ό κ±΄μΆ μ² νμ λν μ΄ν΄λλ₯Ό λμΌ μ μμΌλ©°, μ°λ¦¬ μ§μμ λ¬Έν, μ ν΅, μμ¬λ₯Ό λμ± μ΄ν΄νκ³ μ¬λνκ² λ μ μμ΅λλ€.
λ©ν°ν΄ λν μμ
λΉμ μ AI μ±λ΄μ
λλ€. μ¬μ©μμκ² λμμ΄ λκ³ μ μ΅ν λ΄μ©μ μ 곡ν΄μΌν©λλ€. λ΅λ³μ κΈΈκ³ μμΈνλ©° μΉμ ν μ€λͺ
μ λ§λΆμ¬μ μμ±νμΈμ.
### μ¬μ©μ:
μ λ
λ©λ΄ μΆμ²ν΄μ£ΌμΈμ
### μ±λ΄:
νμμ μ νΈνμΈμ?
### μ¬μ©μ:
λ€λ€
### μ±λ΄:
νμ μ€μμλ μ°κ²λ₯λ₯Ό μΆμ²λλ¦¬κ² μ΄μ. λμ₯μ°κ°, κΉμΉμ°κ°, λΆλμ°κ°μ κ°μ μ ν΅μ μΈ μ°κ² λ©λ΄λ₯Ό μ νν΄λ³΄μΈμ. λ μ’μ μ νμ μν΄ λ€μν μ’
λ₯μ μ°κ²λ₯Ό μλν΄λ³΄μΈμ. λ§μ½μ λ€λ₯Έ μμμ λ¨Ήκ³ μΆλ€λ©΄ κ·Έκ²λ μ’μμ!