File size: 1,252 Bytes
71baf65
 
 
 
 
 
 
 
 
 
 
 
91886dc
 
 
 
 
 
c4b487b
91886dc
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
---
language:
  - ko
tags:
- summarization
widget:
- text: '[BOS] 안녕, 나는 20대 남자 유치원 교사야. 특이하지? [SEP] 응, 보통 공대생이 많은데 나는 유아 교육에 관심이 많아. [SEP] 내가 사실 좀 여성스러운 면이 있어서 가야금 연주도 배워보고 싶어. [SEP] 고마워, 하지만 사실 조금 게을러서 배울 수 있을지 모르겠어. [SEP] 어떤 음식? 나는 신 음식을 좋아해. [SEP] 그럼 먹어본 음식 중에 가장 특이한 건 뭐야? 난 고래고기야. [SEP] 아, 나는 코가 예민해서 못할 것 같아. </s>'
inference:
  parameters:
    max_length: 200
    top_k: 3
---
# KoBART persona extraction

- 개요 : 한 사용자의 일상 대화 채팅으로 해당 사용자의 페르소나를 추출할 수 있는 모델
- 사용 모델 : [KoBART](https://huggingface.co/gogamza/kobart-base-v2) 
- 데이터 : [AIHub 한국어 멀티 세션 대화](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&dataSetSn=71630)

- 기존 데이터는 존댓말이었는데, 이를 반말로 변환하여 학습
  - 변환시 다음 모델을 사용 : [squarelike/korean-style-converter-6b](https://huggingface.co/squarelike/korean-style-converter-6b)