Text Generation
Transformers
PyTorch
Safetensors
Korean
gpt_neox
Inference Endpoints
text-generation-inference
Edit model card

heegyu/polyglot-ko-3.8b-chat

  • EleutherAI/polyglot-ko-3.8bλ₯Ό μ—¬λŸ¬ ν•œκ΅­μ–΄ instruction λ°μ΄ν„°μ…‹μœΌλ‘œ ν•™μŠ΅ν•œ λͺ¨λΈ

μ‚¬μš©ν•œ 데이터셋

Dataset # instance νƒ€μž…
KoAlpaca v1.1 50K μ‹±κΈ€ν„΄
dbdu/ShareGPT-74k-ko 의 part2_ko_uncleaned 36K λ©€ν‹°ν„΄
heegyu/korquad-chat-v1 9.6K λ©€ν‹°ν„΄, μ§€μ‹κΈ°λ°˜
lcw99/evolve-instruct 37K μ‹±κΈ€ν„΄
HAERAE-HUB/KoInstruct-QA 50.3k μ‹±κΈ€ν„΄
changpt/ko-lima-vicuna 1K μ‹±κΈ€ν„΄, λ©€ν‹°ν„΄(극히 일뢀)
nlpai-lab/kullm-v2 15K μ‹±κΈ€ν„΄
  • KULLM v2 λ°μ΄ν„°μ…‹μ—μ„œλŠ” GPT4ALL, Dolly λ°μ΄ν„°λ§Œ μΆ”μΆœν•΄μ„œ μ‚¬μš©ν–ˆμŠ΅λ‹ˆλ‹€.
  • λ‹€μ–‘ν•œ ν•™μŠ΅ 데이터셋은 HeegyuKim/open-korean-instructions GitHub repositoryλ₯Ό μ°Έκ³ ν•˜μ„Έμš”.

생성 Prompt

  • EOS token(<|endoftext|>)이 λ‚˜μ˜¬ λ•ŒκΉŒμ§€ μƒμ„±ν•˜λ©΄ λ©λ‹ˆλ‹€.
  • μ΅œμƒλ‹¨ ν”„λ‘¬ν”„νŠΈλŠ” μžˆλŠ”κ²Œ 쒋은 닡변이 더 자주 λ‚˜μ˜€λŠ” 것 κ°™μ•„μš”.
당신은 AI μ±—λ΄‡μž…λ‹ˆλ‹€. μ‚¬μš©μžμ—κ²Œ 도움이 되고 μœ μ΅ν•œ λ‚΄μš©μ„ μ œκ³΅ν•΄μ•Όν•©λ‹ˆλ‹€. 닡변은 κΈΈκ³  μžμ„Έν•˜λ©° μΉœμ ˆν•œ μ„€λͺ…을 λ§λΆ™μ—¬μ„œ μž‘μ„±ν•˜μ„Έμš”.

### μ‚¬μš©μž:
μ„œμšΈμ—μ„œ 강릉 κ°€λ €λ©΄ μ–΄λ–»κ²Œ κ°€μ•Όν•΄?

### 챗봇:

μƒμ„±λœ λ‹΅λ³€:

μ„œμšΈμ—μ„œ 강릉 κ°€λŠ” 방법은 λ‹€μ–‘ν•©λ‹ˆλ‹€. λΉ„ν–‰κΈ°λ₯Ό 타고 κ°€κ±°λ‚˜ KTXλ₯Ό μ΄μš©ν•˜κ±°λ‚˜ μžκ°€μš©μœΌλ‘œ μ΄λ™ν•˜λŠ” 방법이 μžˆμŠ΅λ‹ˆλ‹€.

1. λΉ„ν–‰κΈ°: λΉ„ν–‰κΈ°λŠ” μ„œμšΈμ—μ„œ μ–‘μ–‘ λ˜λŠ” 원주 κ³΅ν•­κΉŒμ§€ μš΄ν•­ν•©λ‹ˆλ‹€. μ†Œμš” μ‹œκ°„μ€ μ•½ 2μ‹œκ°„μ΄λ©°, μš΄μž„μ€ μ•½ 20,000μ›μž…λ‹ˆλ‹€.
2. KTX: KTXλŠ” μ„œμšΈμ—μ„œ κ°•λ¦‰κΉŒμ§€ μš΄ν–‰ν•˜λ©°, μš”κΈˆμ€ 일반 및 νŠΉμ‹€ λͺ¨λ‘ 6,550μ›μœΌλ‘œ ν†΅μΌλ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€. μ—΄μ°¨ μ‹œκ°„μ€ μ„œμšΈμ—μ„œ κ°•λ¦‰κΉŒμ§€ 1μ‹œκ°„ 30λΆ„ 정도 μ†Œμš”λ©λ‹ˆλ‹€.
3. μžκ°€μš©: μžκ°€μš©μ„ μ΄μš©ν•΄ κ°•λ¦‰μœΌλ‘œ κ°€λŠ” 방법도 많이 μžˆμŠ΅λ‹ˆλ‹€. μ„œμšΈμ—μ„œ 경포에 이λ₯΄λŠ” 길은 λ‹€μ–‘ν•˜λ©°, λ„λ‘œ 상황에 따라 μ£Όν–‰ μ‹œκ°„ 및 이동 κ±°λ¦¬λŠ” λ‹¬λΌμ§ˆ 수 μžˆμŠ΅λ‹ˆλ‹€. μ°Έκ³ ν•  수 μžˆλŠ” μ •λ³΄λŠ” 강릉 κ΄€κ΄‘μ•ˆλ‚΄μ†Œμ—μ„œ λ°›μœΌμ‹€ 수 μžˆμŠ΅λ‹ˆλ‹€.

μœ„ 방법을 μ΄μš©ν•˜μ—¬ μ„œμšΈμ—μ„œ κ°•λ¦‰κΉŒμ§€μ˜ 이동 μ‹œκ°„κ³Ό λΉ„μš©μ„ κ³ λ €ν–ˆμŠ΅λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ ꡐ톡 μƒν™©μ΄λ‚˜ λ„λ‘œ 상황 등에 따라 μΆ”κ°€ 정보가 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

λŒ€ν™” μ˜ˆμ‹œ (with prompt)

당신은 AI μ±—λ΄‡μž…λ‹ˆλ‹€. μ‚¬μš©μžμ—κ²Œ 도움이 되고 μœ μ΅ν•œ λ‚΄μš©μ„ μ œκ³΅ν•΄μ•Όν•©λ‹ˆλ‹€. 닡변은 κΈΈκ³  μžμ„Έν•˜λ©° μΉœμ ˆν•œ μ„€λͺ…을 λ§λΆ™μ—¬μ„œ μž‘μ„±ν•˜μ„Έμš”.

### μ‚¬μš©μž:
μ€‘κ΅­μ˜ 여행지 μΆ”μ²œν•΄μ€˜

### 챗봇:
μ•„λž˜λŠ” μ€‘κ΅­μ˜ λ‹€μ–‘ν•œ 여행지 쀑 λͺ‡ 가지λ₯Ό μΆ”μ²œν•΄λ“œλ¦¬κ² μŠ΅λ‹ˆλ‹€.

- μƒν•˜μ΄: μ€‘κ΅­μ˜ μƒν•˜μ΄λŠ” ν˜„λŒ€μ μΈ 건물과 높은 λΉŒλ”©μ΄ λ§Žμ€ λ„μ‹œμž…λ‹ˆλ‹€. 강을 따라 μ΄λ™ν•˜λŠ” 선박은 μƒν•˜μ΄μ˜ 풍경과 λ¬Έν™”λ₯Ό 감상할 수 μžˆλŠ” μž₯μ†Œμž…λ‹ˆλ‹€. (사진: 쀑ꡭ 사진 제곡 μ‚¬μ΄νŠΈ)
- μΉ˜λ°”μ˜€: μΉ˜λ°”μ˜€λŠ” μƒν•˜μ΄μ˜ ν•œ λ„μ‹œλ‘œ, λ…νŠΉν•œ 건좕물과 역사적인 μœ λ¬Όλ“€μ΄ 많이 μžˆλŠ” κ³³μž…λ‹ˆλ‹€. μ•„λ¦„λ‹€μš΄ 해변도 μžˆμœΌλ‹ˆ 일정을 ν™•μΈν•΄λ³΄μ‹œλ©΄ 쒋을 것 κ°™μŠ΅λ‹ˆλ‹€. (사진: 쀑ꡭ 사진 제곡 μ‚¬μ΄νŠΈ)
- ν•­μ €μš°: ν•­μ €μš°λŠ” μ€‘κ΅­μ˜ 4λŒ€ 정원 쀑 ν•˜λ‚˜λ‘œ 유λͺ…ν•œ κ³³μž…λ‹ˆλ‹€. μ•„λ¦„λ‹€μš΄ 정원, 였래된 건물, 그리고 ν’λΆ€ν•œ 역사 λ¬Έν™” μ²΄ν—˜μ„ 즐길 수 μžˆλŠ” λ„μ‹œμž…λ‹ˆλ‹€. (사진: 쀑ꡭ 사진 제곡 μ‚¬μ΄νŠΈ)
- λ‚œμ§•: λ‚œμ§•μ€ μ€‘κ΅­μ˜ μˆ˜λ„μΈ λ‚œμ§•μ— μœ„μΉ˜ν•œ λ„μ‹œλ‘œ, 역사와 λ¬Έν™”λ₯Ό 기반으둜 λ‹€μ–‘ν•œ λͺ…μ†Œλ“€μ„ 찾을 수 μžˆμŠ΅λ‹ˆλ‹€. (사진: 쀑ꡭ 사진 제곡 μ‚¬μ΄νŠΈ)
- 베이징: μ€‘κ΅­μ˜ μˆ˜λ„μΈ 베이징은 μ€‘κ΅­μ˜ 문화와 역사λ₯Ό μ²΄ν—˜ν•  수 μžˆλŠ” λ„μ‹œμž…λ‹ˆλ‹€. λ‹€μ–‘ν•œ κ΄€κ΄‘ λͺ…μ†Œμ™€ 역사 μœ λ¬Όλ“€μ΄ μ—¬λŸ¬λΆ„μ„ 기닀리고 μžˆμ„ κ²ƒμž…λ‹ˆλ‹€. (사진: 쀑ꡭ 사진 제곡 μ‚¬μ΄νŠΈ)
- λ² μ΄μ§•μ˜ 창좘: μ°½μΆ˜μ€ μ€‘κ΅­μ˜ 동뢁 지방에 μœ„μΉ˜ν•œ λ„μ‹œλ‘œ, 전톡 문화와 역사λ₯Ό μ²΄ν—˜ν•  수 μžˆλŠ” 쒋은 μž₯μ†Œμž…λ‹ˆλ‹€.

이 외에도 쀑ꡭ 문화와 역사에 λŒ€ν•œ μžμ„Έν•œ μ •λ³΄λŠ” μœ„μ˜ λͺ©λ‘μ„ μ°Έκ³ ν•˜μ—¬ λ‹€μ–‘ν•œ λ§€μ²΄μ—μ„œ 찾아보싀 수 μžˆμŠ΅λ‹ˆλ‹€.

λ©€ν‹°ν„΄ λŒ€ν™” μ˜ˆμ‹œ (with prompt)

당신은 AI μ±—λ΄‡μž…λ‹ˆλ‹€. μ‚¬μš©μžμ—κ²Œ 도움이 되고 μœ μ΅ν•œ λ‚΄μš©μ„ μ œκ³΅ν•΄μ•Όν•©λ‹ˆλ‹€. 닡변은 κΈΈκ³  μžμ„Έν•˜λ©° μΉœμ ˆν•œ μ„€λͺ…을 λ§λΆ™μ—¬μ„œ μž‘μ„±ν•˜μ„Έμš”.

### μ‚¬μš©μž:
μš”μ¦˜ μ¦κ²¨ν•˜λŠ” 컴퓨터 κ²Œμž„μ΄ μžˆμ–΄?

### 챗봇:
μ£„μ†‘ν•˜μ§€λ§Œ μ§ˆλ¬Έμ— λŒ€ν•œ μ •ν™•ν•œ 닡변을 μœ„ν•΄μ„œλŠ” κ²Œμž„μ˜ μœ ν˜•κ³Ό μž₯λ₯΄λ₯Ό 더 μžμ„Ένžˆ μ•Œλ €μ£Όμ‹œλŠ” 것이 μ’‹μŠ΅λ‹ˆλ‹€.

### μ‚¬μš©μž:
음 RPG μž₯λ₯΄ μͺ½μœΌλ‘œ μΆ”μ²œλ°›κ³  싢은데

### 챗봇:
RPG μž₯λ₯΄ μ€‘μ—μ„œλ„ κ°„λ‹¨ν•œ 캐주얼 κ²Œμž„μ„ μ„ ν˜Έν•˜μ‹ λ‹€λ©΄, μ œκ°€ μΆ”μ²œν•΄λ“œλ¦΄ 수 μžˆμŠ΅λ‹ˆλ‹€. λ°”λ‘œ 'Rogue Dragon(κ°€μΉ­)'μ΄λΌλŠ” κ²Œμž„μž…λ‹ˆλ‹€. 이 κ²Œμž„μ€ νŒνƒ€μ§€, μ•‘μ…˜ λ“± λ‹€μ–‘ν•œ μž₯λ₯΄λ₯Ό μ ‘λͺ©ν•˜μ—¬ 즐길 수 있으며, ν™”λ €ν•œ κ·Έλž˜ν”½, νƒ„νƒ„ν•œ μŠ€ν† λ¦¬μ— 쀑독성 κ°•ν•œ νƒ€κ²©μ‹œμŠ€ν…œλ„ νŠΉμ§•μž…λ‹ˆλ‹€.

### μ‚¬μš©μž:
μ–΄λ””μ„œ ν•  수 μžˆμ–΄?

### 챗봇:
'Rogue Dragon'은 μŠ€νŒ€μ—μ„œ 무료둜 ν”Œλ ˆμ΄ν•˜μ‹€ 수 μžˆμŠ΅λ‹ˆλ‹€. λ‹€λ₯Έ λ°©λ²•μœΌλ‘œλŠ”, 곡식 μ›Ήμ‚¬μ΄νŠΈμ—μ„œ λ‹€μš΄λ‘œλ“œν•˜μ…”μ„œ ν”Œλ ˆμ΄ν•˜μ‹€ 수 μžˆμŠ΅λ‹ˆλ‹€.
Downloads last month
1,325
Safetensors
Model size
3.81B params
Tensor type
F32
Β·
FP16
Β·

Datasets used to train heegyu/polyglot-ko-3.8b-chat