File size: 2,573 Bytes
00a498a
80b041b
 
 
 
 
 
 
 
 
 
00a498a
80b041b
740363a
 
 
 
 
80b041b
 
 
 
 
 
 
 
cb865c5
80b041b
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
---
language:
  - ko
tags:
- summarization
widget:
- text: '[BOS] 안녕하세요 저는 30대 여성입니다. [SEP] 반갑습니다. 저는 동해에 거주해서 바닷가에 앉아서 물멍하는거 좋아하는데 물멍좋아하세요? [SEP] 수필 좋네요! 저는 물을 보면서 생각정리를 해서 가끔 그런 제가 만족스러워요. [SEP] 점심에 차 한잔 너무 좋네요! 저는 오늘도 자주먹는 단감을 챙겨 바닷가에 앉아 잠시 생각을 했어요 [SEP] 네! 저는 과일은 다 좋아해요. 과일 좋아하세요? [SEP] 저도 딸기 좋아해요! 그리고 귤도 좋아해요!  [SEP] 저랑 취향이 맞네요ㅎㅎ 무슨일 하시나요?? </s>'
inference:
  parameters:
    max_length: 200
    top_k: 5
---


**[Notice] 반말 발화에서 페르소나를 추출 할 수 있는 [V-2](https://huggingface.co/NLPBada/kobart-chat-persona-extraction-v2) 추가 공개!**



# KoBART persona extraction

- 개요 : 한 사용자의 일상 대화 채팅으로 해당 사용자의 페르소나를 추출할 수 있는 모델
- 사용 모델 : [KoBART](https://huggingface.co/gogamza/kobart-base-v2) 
- 데이터 : [AIHub 한국어 멀티 세션 대화](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&dataSetSn=71630)

# 실험 정리
- [깃허브 레포지토리](https://github.com/DonghaeSuh/persona_extraction_model)
- [블로그 정리](https://blog.naver.com/gypsi12/223378404085)

# validation score
- BLEU : 0.4493
|   | Rouge-1 | Rouge-2 | Rouge-l |
| --- | --- | --- | --- |
| recall | 0.5708 | 0.3671 | 0.5679 |
| precision | 0.6247 | 0.3939 | 0.6217 |
| f1 | 0.5913 | 0.3789 | 0.5882 |

# 예시
```
## 입력 ##
['벌써 6일이 지났네요. 그동안 어떻게 지내셨어요?', 
'운동 너무 좋죠! 저는 중고 자동차를 좀 알아볼려고 해요.', 
'제가 차를 잘 몰라서요ㅠ 첫 차라 새차는 부담스러워서 중고를 사보려구요.', 
'아 그래요? 몰랐었는데 진짜 조심해야겠네요ㅠ.', 
'진짜 나쁜 사람들 많네요. 자동차는 금액대도 커서 더 위험할거 같아요.', 
'그러네요! 가을을 싫어하시는군요? 아이고ㅠ 저는 이런 가을에는 음악 듣는걸 좋아해요.', 
'팝 좋죠! 저는 EDM 음악을 좋아해요ㅋㅋ 가을과 별로 안어울리지만 신나는거 같아요. 그럼 또 봐요!']

## 출력 ##
"나는 중고 중고차를 알아볼 것이다,
나는 중고차가 부담스럽다,
나는 가을에 음악을 듣는 것을 좋아한다,
나는 EDM 음악을 좋아한다. "
```