KoMultiGen-General / README.md
maywell's picture
Update README.md
f207896 verified
metadata
license: apache-2.0

KoMultiGen-General

λ³Έ λͺ¨λΈμ€ λŒ€κ·œλͺ¨ ν•œκ΅­μ–΄ λ©€ν‹°ν„΄ 데이터셋 koVast ν”„λ‘œμ νŠΈμ˜ μΌλΆ€λ‘œμ¨ μ œμž‘λ˜μ—ˆμŠ΅λ‹ˆλ‹€.

KoMultiGen-General은 μ‹œλ‚˜νŠΈλΌ-λ―ΉμŠ€νŠΈλž„ λͺ¨λΈμ„ 기반으둜 μ œμž‘λ˜μ—ˆμŠ΅λ‹ˆλ‹€. λ³Έ λͺ¨λΈμ€ 주어진 λΉ„μ •ν˜• 데이터λ₯Ό 기반으둜 3~5ν„΄μ˜ ν•œκ΅­μ–΄ λ©€ν‹°ν„΄ 데이터λ₯Ό 생성 ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

Methodology

GPT-4 Turboλ₯Ό μ΄μš©ν•˜μ—¬ μƒμ„±ν•œ 데이터셋을 기반으둜 λͺ¨λΈμ„ ν›ˆλ ¨μ„ μ§„ν–‰ν•˜μ˜€μŠ΅λ‹ˆλ‹€.

일반적으둜, ν•œκ΅­μ–΄ λͺ¨λΈκ³Όμ˜ 질의 μ‘λ‹΅μ˜ κ²½μš°μ— '해체'λ₯Ό μ‚¬μš©ν•˜λŠ” κ²½ν–₯이 맀우 μ§™κ²Œ λ‚˜νƒ€λ‚¨μ— 따라 Question을 '해체'둜 κ΅¬μ„±ν•˜μ˜€μŠ΅λ‹ˆλ‹€.

λ˜ν•œ, 데이터λ₯Ό μƒμ„±ν•˜κΈ° νž˜λ“  μž…λ ₯에 λŒ€ν•΄μ„œλŠ” μƒμ„±ν•˜μ§€ μ•ŠλŠ” νŒλ‹¨μ„ μœ λ„ν•¨μœΌλ‘œμ¨ 데이터 μ •μ œκ³Όμ •μ—μ„œμ˜ 어렀움을 μ΅œμ†Œν™”ν•˜κ³ μž ν–ˆμŠ΅λ‹ˆλ‹€.

Example

일반적으둜 μ•„λž˜ ν”„λ‘¬ν”„νŠΈλ₯Ό λ”°λ¦…λ‹ˆλ‹€.

As an AI Bot, you excel in crafting multi-turn QA samples with a focus on Korean content. You start with an initial question that paves the way for deeper, more detailed follow-up inquiries. These questions are carefully designed to be relevant and interconnected, often referring back to subjects or details from previous answers. They can include techniques like using pronouns to maintain continuity, starting questions with phrases like 'if so,' or requesting examples for clarity. Your answers are expected to be rooted in thorough logical analysis. The dialogue can unfold over 3 to 5 exchanges. If the data provided falls short, you may limit your response to a single turn, or if even that proves challenging, you're to acknowledge the limitation by stating, 'ν•΄λ‹Ήν•˜λŠ” λ¬Έμž₯을 생성할 수 μ—†μŠ΅λ‹ˆλ‹€.'

### Instruction:
### Start of provided data
{prompt}
### End of provided data

주어진 λ°μ΄ν„°λ‘œ 3~5 turn의 QAλ₯Ό 생성해라.
μΈμš©ν‘œν˜„μ„ μ‚¬μš©ν•˜μ§€ λ§μ•„μ•Όν•œλ‹€.
Question의 λ§νˆ¬λŠ” '~λŠ” ~μ•Ό?' 같은 반말 μ–΄νœ˜λ₯Ό μ‚¬μš©ν•˜λ©°, AnswerλŠ” '~μž…λ‹ˆλ‹€.' μ–΄νœ˜λ₯Ό μ‚¬μš©ν•œλ‹€.

### Response:

μ•„λž˜λŠ” λ³Έ λͺ¨λΈμ„ μ‚¬μš©ν•œ μž…μΆœλ ₯ μ˜ˆμ‹œμž…λ‹ˆλ‹€.

#1

μž…λ ₯

μ•ˆλ…•ν•˜μ„Έμš”, μ—¬λŸ¬λΆ„. 였늘의 κ°•μ˜μ—μ„œλŠ” λ…ΈλΈ”λ ˆμŠ€ μ˜€λΈ”λ¦¬μ£Όμ™€ κ°μ‚¬μ˜ νž˜μ— λŒ€ν•΄ 이야기해 λ³΄κ² μŠ΅λ‹ˆλ‹€.
λ…ΈλΈ”λ ˆμŠ€ μ˜€λΈ”λ¦¬μ£ΌλŠ” 높은 μ§€μœ„λ‚˜ μž¬μ‚°μ„ 가진 μ‚¬λžŒλ“€μ΄ μ‚¬νšŒμ— 봉사해야 ν•˜λŠ” 의무λ₯Ό μ˜λ―Έν•˜λŠ” λΌν‹΄μ–΄λ‘œ, 'κ·€μ‘±μ˜ 의무'λΌλŠ” λœ»μž…λ‹ˆλ‹€. 귀쑱계측이 μ‚¬νšŒμ— λ΄‰μ‚¬ν•˜λŠ” 것이 기본적 μ˜λ¬΄λΌλŠ” μƒκ°μ΄μ—ˆμ£ . 이 μš©μ–΄λŠ” μ’…μ’… λΆ€μœ ν•˜κ³  영ν–₯λ ₯ μžˆλŠ” μ‚¬λžŒλ“€μ—κ²Œ 봉사λ₯Ό μš”κ΅¬ν•˜λŠ” 데에 μ‚¬μš©λ˜μ§€λ§Œ, λͺ¨λ“  μ‚¬λžŒμ—κ²Œ μ μš©λ˜λŠ” κ°œλ…μž…λ‹ˆλ‹€. 
μš°λ¦¬λŠ” λͺ¨λ‘ μ‚¬νšŒμ˜ μΌμ›μœΌλ‘œ, λ‹€λ₯Έ μ‚¬λžŒλ“€κ³Ό μ—°κ²°λ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€. 그리고 μš°λ¦¬κ°€ 받은 것을 μ‚¬νšŒμ— λŒλ €μ£ΌλŠ” 것은 우리의 μ˜λ¬΄μž…λ‹ˆλ‹€. 이λ₯Όν…Œλ©΄, μš°λ¦¬κ°€ 받은 ꡐ윑의 이읡은 μ‚¬νšŒ 전체에 λŒμ•„κ°‘λ‹ˆλ‹€. μš°λ¦¬κ°€ 받은 κ΅μœ‘μ„ λ°”νƒ•μœΌλ‘œ 더 λ‚˜μ€ 일자리λ₯Ό μ–»κ³  더 λ§Žμ€ λˆμ„ 벌 수 있고, κ·Έ 돈으둜 μ„ΈκΈˆμ„ λ‚΄μ„œ μ‚¬νšŒλ₯Ό λ•μŠ΅λ‹ˆλ‹€. λ˜ν•œ, μš°λ¦¬κ°€ 받은 κ΅μœ‘μ„ 톡해 더 λ§Žμ€ 것을 배우고 더 λ‚˜μ€ μ‚¬λžŒμ΄ 되고, 그것은 λ‹€μ‹œ μ‚¬νšŒμ— λŒμ•„κ°€κ²Œ λ©λ‹ˆλ‹€.
κ°μ‚¬λŠ” μš°λ¦¬κ°€ 받은 것에 λŒ€ν•œ 감사λ₯Ό ν‘œν˜„ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€. 그것은 λ‹¨μˆœνžˆ "κ³ λ§™μŠ΅λ‹ˆλ‹€"라고 λ§ν•˜λŠ” 것을 μ˜λ―Έν•˜λŠ” 것이 μ•„λ‹ˆλΌ, κ·Έ 선물을 μ§„μ •μœΌλ‘œ μ†Œμ€‘νžˆ μ—¬κΈ°κ³  그것을 μ£Όμ‹  μ‚¬λžŒμ—κ²Œ κ°μ‚¬ν•˜λŠ” λ§ˆμŒμ„ κ°€μ§€λŠ” 것을 μ˜λ―Έν•©λ‹ˆλ‹€.
감사λ₯Ό ν‘œν˜„ν•˜λŠ” 것은 쒋은 인간 관계λ₯Ό μœ μ§€ν•˜κΈ° μœ„ν•΄ μ€‘μš”ν•©λ‹ˆλ‹€. μš°λ¦¬κ°€ 선물을 받을 λ•Œ 감사λ₯Ό ν‘œν˜„ν•˜λ©΄, 선물을 μ€€ μ‚¬λžŒμ€ κΈ°λ»ν•˜κ³  μš°λ¦¬μ— λŒ€ν•œ ν˜Έκ°μ„ 느끼게 λ©λ‹ˆλ‹€. λ˜ν•œ, 감사λ₯Ό ν‘œν˜„ν•˜λ©΄ μš°λ¦¬λŠ” μ„ λ¬Όμ˜ 의미λ₯Ό 더 잘 이해할 수 있고, κ·Έ 선물을 더 μ†Œμ€‘νžˆ μ—¬κΈ°κ²Œ λ©λ‹ˆλ‹€.
κ°μ‚¬λŠ” 우리의 λ‡Œμ—λ„ 쒋은 영ν–₯을 λ―ΈμΉ©λ‹ˆλ‹€. 감사λ₯Ό ν‘œν˜„ν•˜λ©΄ λ‡Œμ—μ„œ 기뢄을 μ’‹κ²Œ ν•˜λŠ” 호λ₯΄λͺ¬μΈ λ„νŒŒλ―Όκ³Ό μ„Έλ‘œν† λ‹Œμ΄ λΆ„λΉ„λ©λ‹ˆλ‹€. μ΄λŸ¬ν•œ 호λ₯΄λͺ¬μ€ 슀트레슀λ₯Ό ν•΄μ†Œν•˜κ³  기뢄을 κ°œμ„ ν•˜λ©° 행볡감을 μ£ΌλŠ” νš¨κ³Όκ°€ μžˆμŠ΅λ‹ˆλ‹€.
λ˜ν•œ, κ°μ‚¬λŠ” 우리의 삢을 λ³€ν™”μ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€. μš°λ¦¬κ°€ λͺ¨λ“  것에 λŒ€ν•΄ κ°μ‚¬ν•˜λŠ” 법을 배우면, μš°λ¦¬λŠ” 세상을 더 κΈμ •μ μœΌλ‘œ 바라볼 수 있고, 더 ν–‰λ³΅ν•œ 삢을 μ‚΄ 수 μžˆμŠ΅λ‹ˆλ‹€.
감사λ₯Ό ν‘œν˜„ν•˜λŠ” 것은 μ–΄λ €μš΄ 일이 μ•„λ‹™λ‹ˆλ‹€. μš°λ¦¬λŠ” 맀일 맀일 λ§Žμ€ 것에 λŒ€ν•΄ 감사할 수 μžˆμŠ΅λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, μš°λ¦¬κ°€ 아침에 λˆˆμ„ 뜨고 μ‚΄μ•„ μžˆμ„ 수 μžˆλŠ” 것에 감사할 수 있고, μš°λ¦¬κ°€ μ‚¬λž‘ν•˜λŠ” μ‚¬λžŒλ“€μ΄ 있고 μ•ˆμ „ν•œ μ§‘μ—μ„œ μ‚΄ 수 μžˆλŠ” 것에 감사할 수 μžˆμŠ΅λ‹ˆλ‹€. μš°λ¦¬κ°€ 먹을 μŒμ‹κ³Ό μž…μ„ 옷이 있고, κ΅μœ‘μ„ 받을 수 μžˆλŠ” 것에 감사할 수 μžˆμŠ΅λ‹ˆλ‹€.
μš°λ¦¬λŠ” μž‘μ€ 것에도 감사할 수 μžˆμŠ΅λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, μš°λ¦¬κ°€ λ§›μžˆλŠ” μŒμ‹μ„ 먹을 수 μžˆλŠ” 것에 감사할 수 있고, μ•„λ¦„λ‹€μš΄ 꽃을 λ³Ό 수 μžˆλŠ” 것에 감사할 수 μžˆμŠ΅λ‹ˆλ‹€. μš°λ¦¬κ°€ μΉœμ ˆν•œ μ‚¬λžŒμ„ λ§Œλ‚˜κ±°λ‚˜ 쒋은 μ†Œμ‹μ„ 듀을 λ•Œ 감사할 수 μžˆμŠ΅λ‹ˆλ‹€.
감사λ₯Ό ν‘œν˜„ν•˜λŠ” 것은 우리의 삢을 더 μ’‹κ²Œ λ§Œλ“€ 수 μžˆμŠ΅λ‹ˆλ‹€. μš°λ¦¬κ°€ λͺ¨λ“  것에 λŒ€ν•΄ κ°μ‚¬ν•˜λŠ” 법을 배우면, μš°λ¦¬λŠ” 더 ν–‰λ³΅ν•˜κ³  만쑱슀러운 삢을 μ‚΄ 수 μžˆμŠ΅λ‹ˆλ‹€.

좜λ ₯

[[Question]]
λ…ΈλΈ”λ ˆμŠ€ μ˜€λΈ”λ¦¬μ£Όκ°€ 무슨 λœ»μ΄μ•Ό?

[[Answer]]
λ…ΈλΈ”λ ˆμŠ€ μ˜€λΈ”λ¦¬μ£ΌλŠ” 높은 μ§€μœ„λ‚˜ μž¬μ‚°μ„ 가진 μ‚¬λžŒλ“€μ΄ μ‚¬νšŒμ— 봉사해야 ν•˜λŠ” 의무λ₯Ό μ˜λ―Έν•˜λŠ” λΌν‹΄μ–΄λ‘œ, 'κ·€μ‘±μ˜ 의무'λΌλŠ” λœ»μž…λ‹ˆλ‹€. 이 μš©μ–΄λŠ” λΆ€μœ ν•˜κ³  영ν–₯λ ₯ μžˆλŠ” μ‚¬λžŒλ“€μ—κ²Œ μ‚¬νšŒμ  μ±…μž„μ„ κ°•μ‘°ν•˜λŠ” 데 μ‚¬μš©λ˜μ§€λ§Œ, 사싀상 λͺ¨λ“  μ‚¬λžŒμ—κ²Œ μ μš©λ˜λŠ” κ°œλ…μ΄λΌκ³  ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

[[Question]]
그럼 λͺ¨λ“  μ‚¬λžŒμ΄ λ…ΈλΈ”λ ˆμŠ€ μ˜€λΈ”λ¦¬μ£Όλ₯Ό μ‹€μ²œν•  수 μžˆλŠ” μ˜ˆμ‹œλŠ” 뭐가 μžˆμ–΄?

[[Answer]]
예λ₯Ό λ“€μ–΄, μš°λ¦¬κ°€ 받은 κ΅μœ‘μ„ μ‚¬νšŒμ— ν™˜μ›ν•˜λŠ” 것이 ν•˜λ‚˜μ˜ 방법이 될 수 μžˆμŠ΅λ‹ˆλ‹€. 받은 κ΅μœ‘μ„ λ°”νƒ•μœΌλ‘œ 쒋은 일자리λ₯Ό μ–»κ³ , κ·Έλ₯Ό 톡해 λ²Œμ–΄λ“€μΈ 돈으둜 μ„ΈκΈˆμ„ λ‚΄μ–΄ μ‚¬νšŒ λ°œμ „μ— κΈ°μ—¬ν•  수 μžˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ, μš°λ¦¬κ°€ 배운 지식을 λ‹€λ₯Έ μ‚¬λžŒλ“€κ³Ό κ³΅μœ ν•˜μ—¬ μ‚¬νšŒμ  κ°€μΉ˜λ₯Ό λ†’μ΄λŠ” 것도 λ…ΈλΈ”λ ˆμŠ€ μ˜€λΈ”λ¦¬μ£Όμ˜ μ‹€μ²œμœΌλ‘œ λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€.

[[Question]]
κ·Έλ ‡λ‹€λ©΄ κ°μ‚¬μ˜ νž˜μ€ ꡬ체적으둜 μ–΄λ–€ 영ν–₯을 미쳐?

[[Answer]]
감사λ₯Ό ν‘œν˜„ν•˜λŠ” 것은 우리의 λ‡Œμ— 긍정적인 영ν–₯을 λ―ΈμΉ©λ‹ˆλ‹€. κ°μ‚¬μ˜ ν‘œν˜„μ€ λ‡Œμ—μ„œ 기뢄을 μ’‹κ²Œ ν•˜λŠ” 호λ₯΄λͺ¬μΈ λ„νŒŒλ―Όκ³Ό μ„Έλ‘œν† λ‹Œμ„ λΆ„λΉ„ν•˜κ²Œ λ§Œλ“€μ–΄ 슀트레슀λ₯Ό ν•΄μ†Œν•˜κ³ , 기뢄을 κ°œμ„ ν•˜λ©°, 행볡감을 μ¦κ°€μ‹œν‚΅λ‹ˆλ‹€. λ˜ν•œ, 감사λ₯Ό ν‘œν˜„ν•¨μœΌλ‘œμ¨ μš°λ¦¬λŠ” μ‚¬λ¬Όμ˜ κ°€μΉ˜λ₯Ό 더 깊이 μ΄ν•΄ν•˜κ³  μ†Œμ€‘νžˆ μ—¬κΈ°κ²Œ 되며, μ΄λŠ” 우리의 삢을 더 κΈμ •μ μœΌλ‘œ λ³€ν™”μ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.

[[Question]]
그러면 맀일 감사할 수 μžˆλŠ” μž‘μ€ κ²ƒλ“€μ—λŠ” μ–΄λ–€ 것듀이 μžˆμ„κΉŒ?

[[Answer]]
μš°λ¦¬λŠ” 맀일 μ•„μΉ¨ λˆˆμ„ 뜨고 μ‚΄μ•„ μžˆμŒμ— 감사할 수 있고, μ‚¬λž‘ν•˜λŠ” μ‚¬λžŒλ“€μ΄ 있고, μ•ˆμ „ν•œ μ§‘μ—μ„œ μƒν™œν•  수 μžˆμŒμ— 감사할 수 μžˆμŠ΅λ‹ˆλ‹€. 먹을 μŒμ‹κ³Ό μž…μ„ 옷이 있으며, κ΅μœ‘μ„ 받을 수 μžˆλŠ” κΈ°νšŒκ°€ μžˆλ‹€λŠ” 것도 감사할 수 μžˆλŠ” λΆ€λΆ„μž…λ‹ˆλ‹€. λ˜ν•œ, λ§›μžˆλŠ” μŒμ‹μ„ 먹을 수 있고, μ•„λ¦„λ‹€μš΄ 꽃을 λ³Ό 수 있으며, μΉœμ ˆν•œ μ‚¬λžŒμ„ λ§Œλ‚˜κ±°λ‚˜ 쒋은 μ†Œμ‹μ„ λ“£λŠ” 것 λ“± μž‘μ€ 것듀에도 감사할 수 μžˆμŠ΅λ‹ˆλ‹€.

License

λ³Έ λͺ¨λΈμ€ apache-2.0 λΌμ΄μ„ΌμŠ€λ₯Ό λ”°λ¦…λ‹ˆλ‹€. λͺ¨λΈμ„ μ‚¬μš©ν•˜μ—¬ μƒμ„±λœ 데이터셋을 배포할 경우 λͺ¨λΈ μ‚¬μš©μ„ λͺ…μ‹œν•΄ μ£Όμ‹œκΈ°λ₯Ό κΆŒκ³ λ“œλ¦½λ‹ˆλ‹€.

Thanks to

  • λͺ¨λΈ μ œμž‘μ— μ˜κ°μ„ μ£Όμ‹ , NousResearch/Genstruct-7B
  • A100 ν΄λŸ¬μŠ€ν„°λ₯Ό μ œκ³΅ν•΄μ£Όμ‹ , Sionic AI

Contact