heegyu/polyglot-ko-3.8b-chat

  • EleutherAI/polyglot-ko-3.8bλ₯Ό μ—¬λŸ¬ ν•œκ΅­μ–΄ instruction λ°μ΄ν„°μ…‹μœΌλ‘œ ν•™μŠ΅ν•œ λͺ¨λΈ

μ‚¬μš©ν•œ 데이터셋

Dataset # instance νƒ€μž…
KoAlpaca v1.1 50K μ‹±κΈ€ν„΄
dbdu/ShareGPT-74k-ko 의 part2_ko_uncleaned 36K λ©€ν‹°ν„΄
heegyu/korquad-chat-v1 9.6K λ©€ν‹°ν„΄, μ§€μ‹κΈ°λ°˜
lcw99/evolve-instruct 37K μ‹±κΈ€ν„΄
HAERAE-HUB/KoInstruct-QA 50.3k μ‹±κΈ€ν„΄
changpt/ko-lima-vicuna 1K μ‹±κΈ€ν„΄, λ©€ν‹°ν„΄(극히 일뢀)
nlpai-lab/kullm-v2 15K μ‹±κΈ€ν„΄
  • KULLM v2 λ°μ΄ν„°μ…‹μ—μ„œλŠ” GPT4ALL, Dolly λ°μ΄ν„°λ§Œ μΆ”μΆœν•΄μ„œ μ‚¬μš©ν–ˆμŠ΅λ‹ˆλ‹€.
  • λ‹€μ–‘ν•œ ν•™μŠ΅ 데이터셋은 HeegyuKim/open-korean-instructions GitHub repositoryλ₯Ό μ°Έκ³ ν•˜μ„Έμš”.

생성 Prompt

  • EOS token(<|endoftext|>)이 λ‚˜μ˜¬ λ•ŒκΉŒμ§€ μƒμ„±ν•˜λ©΄ λ©λ‹ˆλ‹€.
  • μ΅œμƒλ‹¨ ν”„λ‘¬ν”„νŠΈλŠ” μžˆλŠ”κ²Œ 쒋은 닡변이 더 자주 λ‚˜μ˜€λŠ” 것 κ°™μ•„μš”.
당신은 AI μ±—λ΄‡μž…λ‹ˆλ‹€. μ‚¬μš©μžμ—κ²Œ 도움이 되고 μœ μ΅ν•œ λ‚΄μš©μ„ μ œκ³΅ν•΄μ•Όν•©λ‹ˆλ‹€. 닡변은 κΈΈκ³  μžμ„Έν•˜λ©° μΉœμ ˆν•œ μ„€λͺ…을 λ§λΆ™μ—¬μ„œ μž‘μ„±ν•˜μ„Έμš”.

### μ‚¬μš©μž:
μ„œμšΈμ—μ„œ 강릉 κ°€λ €λ©΄ μ–΄λ–»κ²Œ κ°€μ•Όν•΄?

### 챗봇:

μƒμ„±λœ λ‹΅λ³€:

μ„œμšΈμ—μ„œ 강릉 κ°€λŠ” 방법은 λ‹€μ–‘ν•©λ‹ˆλ‹€. λΉ„ν–‰κΈ°λ₯Ό 타고 κ°€κ±°λ‚˜ KTXλ₯Ό μ΄μš©ν•˜κ±°λ‚˜ μžκ°€μš©μœΌλ‘œ μ΄λ™ν•˜λŠ” 방법이 μžˆμŠ΅λ‹ˆλ‹€.

1. λΉ„ν–‰κΈ°: λΉ„ν–‰κΈ°λŠ” μ„œμšΈμ—μ„œ μ–‘μ–‘ λ˜λŠ” 원주 κ³΅ν•­κΉŒμ§€ μš΄ν•­ν•©λ‹ˆλ‹€. μ†Œμš” μ‹œκ°„μ€ μ•½ 2μ‹œκ°„μ΄λ©°, μš΄μž„μ€ μ•½ 20,000μ›μž…λ‹ˆλ‹€.
2. KTX: KTXλŠ” μ„œμšΈμ—μ„œ κ°•λ¦‰κΉŒμ§€ μš΄ν–‰ν•˜λ©°, μš”κΈˆμ€ 일반 및 νŠΉμ‹€ λͺ¨λ‘ 6,550μ›μœΌλ‘œ ν†΅μΌλ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€. μ—΄μ°¨ μ‹œκ°„μ€ μ„œμšΈμ—μ„œ κ°•λ¦‰κΉŒμ§€ 1μ‹œκ°„ 30λΆ„ 정도 μ†Œμš”λ©λ‹ˆλ‹€.
3. μžκ°€μš©: μžκ°€μš©μ„ μ΄μš©ν•΄ κ°•λ¦‰μœΌλ‘œ κ°€λŠ” 방법도 많이 μžˆμŠ΅λ‹ˆλ‹€. μ„œμšΈμ—μ„œ 경포에 이λ₯΄λŠ” 길은 λ‹€μ–‘ν•˜λ©°, λ„λ‘œ 상황에 따라 μ£Όν–‰ μ‹œκ°„ 및 이동 κ±°λ¦¬λŠ” λ‹¬λΌμ§ˆ 수 μžˆμŠ΅λ‹ˆλ‹€. μ°Έκ³ ν•  수 μžˆλŠ” μ •λ³΄λŠ” 강릉 κ΄€κ΄‘μ•ˆλ‚΄μ†Œμ—μ„œ λ°›μœΌμ‹€ 수 μžˆμŠ΅λ‹ˆλ‹€.

μœ„ 방법을 μ΄μš©ν•˜μ—¬ μ„œμšΈμ—μ„œ κ°•λ¦‰κΉŒμ§€μ˜ 이동 μ‹œκ°„κ³Ό λΉ„μš©μ„ κ³ λ €ν–ˆμŠ΅λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ ꡐ톡 μƒν™©μ΄λ‚˜ λ„λ‘œ 상황 등에 따라 μΆ”κ°€ 정보가 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

λŒ€ν™” μ˜ˆμ‹œ (with prompt)

당신은 AI μ±—λ΄‡μž…λ‹ˆλ‹€. μ‚¬μš©μžμ—κ²Œ 도움이 되고 μœ μ΅ν•œ λ‚΄μš©μ„ μ œκ³΅ν•΄μ•Όν•©λ‹ˆλ‹€. 닡변은 κΈΈκ³  μžμ„Έν•˜λ©° μΉœμ ˆν•œ μ„€λͺ…을 λ§λΆ™μ—¬μ„œ μž‘μ„±ν•˜μ„Έμš”.

### μ‚¬μš©μž:
μ€‘κ΅­μ˜ 여행지 μΆ”μ²œν•΄μ€˜

### 챗봇:
μ•„λž˜λŠ” μ€‘κ΅­μ˜ λ‹€μ–‘ν•œ 여행지 쀑 λͺ‡ 가지λ₯Ό μΆ”μ²œν•΄λ“œλ¦¬κ² μŠ΅λ‹ˆλ‹€.

- μƒν•˜μ΄: μ€‘κ΅­μ˜ μƒν•˜μ΄λŠ” ν˜„λŒ€μ μΈ 건물과 높은 λΉŒλ”©μ΄ λ§Žμ€ λ„μ‹œμž…λ‹ˆλ‹€. 강을 따라 μ΄λ™ν•˜λŠ” 선박은 μƒν•˜μ΄μ˜ 풍경과 λ¬Έν™”λ₯Ό 감상할 수 μžˆλŠ” μž₯μ†Œμž…λ‹ˆλ‹€. (사진: 쀑ꡭ 사진 제곡 μ‚¬μ΄νŠΈ)
- μΉ˜λ°”μ˜€: μΉ˜λ°”μ˜€λŠ” μƒν•˜μ΄μ˜ ν•œ λ„μ‹œλ‘œ, λ…νŠΉν•œ 건좕물과 역사적인 μœ λ¬Όλ“€μ΄ 많이 μžˆλŠ” κ³³μž…λ‹ˆλ‹€. μ•„λ¦„λ‹€μš΄ 해변도 μžˆμœΌλ‹ˆ 일정을 ν™•μΈν•΄λ³΄μ‹œλ©΄ 쒋을 것 κ°™μŠ΅λ‹ˆλ‹€. (사진: 쀑ꡭ 사진 제곡 μ‚¬μ΄νŠΈ)
- ν•­μ €μš°: ν•­μ €μš°λŠ” μ€‘κ΅­μ˜ 4λŒ€ 정원 쀑 ν•˜λ‚˜λ‘œ 유λͺ…ν•œ κ³³μž…λ‹ˆλ‹€. μ•„λ¦„λ‹€μš΄ 정원, 였래된 건물, 그리고 ν’λΆ€ν•œ 역사 λ¬Έν™” μ²΄ν—˜μ„ 즐길 수 μžˆλŠ” λ„μ‹œμž…λ‹ˆλ‹€. (사진: 쀑ꡭ 사진 제곡 μ‚¬μ΄νŠΈ)
- λ‚œμ§•: λ‚œμ§•μ€ μ€‘κ΅­μ˜ μˆ˜λ„μΈ λ‚œμ§•μ— μœ„μΉ˜ν•œ λ„μ‹œλ‘œ, 역사와 λ¬Έν™”λ₯Ό 기반으둜 λ‹€μ–‘ν•œ λͺ…μ†Œλ“€μ„ 찾을 수 μžˆμŠ΅λ‹ˆλ‹€. (사진: 쀑ꡭ 사진 제곡 μ‚¬μ΄νŠΈ)
- 베이징: μ€‘κ΅­μ˜ μˆ˜λ„μΈ 베이징은 μ€‘κ΅­μ˜ 문화와 역사λ₯Ό μ²΄ν—˜ν•  수 μžˆλŠ” λ„μ‹œμž…λ‹ˆλ‹€. λ‹€μ–‘ν•œ κ΄€κ΄‘ λͺ…μ†Œμ™€ 역사 μœ λ¬Όλ“€μ΄ μ—¬λŸ¬λΆ„μ„ 기닀리고 μžˆμ„ κ²ƒμž…λ‹ˆλ‹€. (사진: 쀑ꡭ 사진 제곡 μ‚¬μ΄νŠΈ)
- λ² μ΄μ§•μ˜ 창좘: μ°½μΆ˜μ€ μ€‘κ΅­μ˜ 동뢁 지방에 μœ„μΉ˜ν•œ λ„μ‹œλ‘œ, 전톡 문화와 역사λ₯Ό μ²΄ν—˜ν•  수 μžˆλŠ” 쒋은 μž₯μ†Œμž…λ‹ˆλ‹€.

이 외에도 쀑ꡭ 문화와 역사에 λŒ€ν•œ μžμ„Έν•œ μ •λ³΄λŠ” μœ„μ˜ λͺ©λ‘μ„ μ°Έκ³ ν•˜μ—¬ λ‹€μ–‘ν•œ λ§€μ²΄μ—μ„œ 찾아보싀 수 μžˆμŠ΅λ‹ˆλ‹€.

λ©€ν‹°ν„΄ λŒ€ν™” μ˜ˆμ‹œ (with prompt)

당신은 AI μ±—λ΄‡μž…λ‹ˆλ‹€. μ‚¬μš©μžμ—κ²Œ 도움이 되고 μœ μ΅ν•œ λ‚΄μš©μ„ μ œκ³΅ν•΄μ•Όν•©λ‹ˆλ‹€. 닡변은 κΈΈκ³  μžμ„Έν•˜λ©° μΉœμ ˆν•œ μ„€λͺ…을 λ§λΆ™μ—¬μ„œ μž‘μ„±ν•˜μ„Έμš”.

### μ‚¬μš©μž:
μš”μ¦˜ μ¦κ²¨ν•˜λŠ” 컴퓨터 κ²Œμž„μ΄ μžˆμ–΄?

### 챗봇:
μ£„μ†‘ν•˜μ§€λ§Œ μ§ˆλ¬Έμ— λŒ€ν•œ μ •ν™•ν•œ 닡변을 μœ„ν•΄μ„œλŠ” κ²Œμž„μ˜ μœ ν˜•κ³Ό μž₯λ₯΄λ₯Ό 더 μžμ„Ένžˆ μ•Œλ €μ£Όμ‹œλŠ” 것이 μ’‹μŠ΅λ‹ˆλ‹€.

### μ‚¬μš©μž:
음 RPG μž₯λ₯΄ μͺ½μœΌλ‘œ μΆ”μ²œλ°›κ³  싢은데

### 챗봇:
RPG μž₯λ₯΄ μ€‘μ—μ„œλ„ κ°„λ‹¨ν•œ 캐주얼 κ²Œμž„μ„ μ„ ν˜Έν•˜μ‹ λ‹€λ©΄, μ œκ°€ μΆ”μ²œν•΄λ“œλ¦΄ 수 μžˆμŠ΅λ‹ˆλ‹€. λ°”λ‘œ 'Rogue Dragon(κ°€μΉ­)'μ΄λΌλŠ” κ²Œμž„μž…λ‹ˆλ‹€. 이 κ²Œμž„μ€ νŒνƒ€μ§€, μ•‘μ…˜ λ“± λ‹€μ–‘ν•œ μž₯λ₯΄λ₯Ό μ ‘λͺ©ν•˜μ—¬ 즐길 수 있으며, ν™”λ €ν•œ κ·Έλž˜ν”½, νƒ„νƒ„ν•œ μŠ€ν† λ¦¬μ— 쀑독성 κ°•ν•œ νƒ€κ²©μ‹œμŠ€ν…œλ„ νŠΉμ§•μž…λ‹ˆλ‹€.

### μ‚¬μš©μž:
μ–΄λ””μ„œ ν•  수 μžˆμ–΄?

### 챗봇:
'Rogue Dragon'은 μŠ€νŒ€μ—μ„œ 무료둜 ν”Œλ ˆμ΄ν•˜μ‹€ 수 μžˆμŠ΅λ‹ˆλ‹€. λ‹€λ₯Έ λ°©λ²•μœΌλ‘œλŠ”, 곡식 μ›Ήμ‚¬μ΄νŠΈμ—μ„œ λ‹€μš΄λ‘œλ“œν•˜μ…”μ„œ ν”Œλ ˆμ΄ν•˜μ‹€ 수 μžˆμŠ΅λ‹ˆλ‹€.
Downloads last month
4,968
Safetensors
Model size
3.81B params
Tensor type
F32
Β·
FP16
Β·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Datasets used to train heegyu/polyglot-ko-3.8b-chat