NLPBada's picture
Update README.md
cb865c5 verified
|
raw
history blame
No virus
2.41 kB
---
language:
- ko
tags:
- summarization
widget:
- text: '[BOS] 안녕하세요 저는 30대 여성입니다. [SEP] 반갑습니다. 저는 동해에 거주해서 바닷가에 앉아서 물멍하는거 좋아하는데 물멍좋아하세요? [SEP] 수필 좋네요! 저는 물을 보면서 생각정리를 해서 가끔 그런 제가 만족스러워요. [SEP] 점심에 차 한잔 너무 좋네요! 저는 오늘도 자주먹는 단감을 챙겨 바닷가에 앉아 잠시 생각을 했어요 [SEP] 네! 저는 과일은 다 좋아해요. 과일 좋아하세요? [SEP] 저도 딸기 좋아해요! 그리고 귤도 좋아해요! [SEP] 저랑 취향이 맞네요ㅎㅎ 무슨일 하시나요?? </s>'
inference:
parameters:
max_length: 200
top_k: 5
---
# KoBART persona extraction
- 개요 : 한 사용자의 일상 대화 채팅으로 해당 사용자의 페르소나를 추출할 수 있는 모델
- 사용 모델 : [KoBART](https://huggingface.co/gogamza/kobart-base-v2)
- 데이터 : [AIHub 한국어 멀티 세션 대화](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&dataSetSn=71630)
# 실험 정리
- [깃허브 레포지토리](https://github.com/DonghaeSuh/persona_extraction_model)
- [블로그 정리](https://blog.naver.com/gypsi12/223378404085)
# validation score
- BLEU : 0.4493
| | Rouge-1 | Rouge-2 | Rouge-l |
| --- | --- | --- | --- |
| recall | 0.5708 | 0.3671 | 0.5679 |
| precision | 0.6247 | 0.3939 | 0.6217 |
| f1 | 0.5913 | 0.3789 | 0.5882 |
# 예시
```
## 입력 ##
['벌써 6일이 지났네요. 그동안 어떻게 지내셨어요?',
'운동 너무 좋죠! 저는 중고 자동차를 좀 알아볼려고 해요.',
'제가 차를 잘 몰라서요ㅠ 첫 차라 새차는 부담스러워서 중고를 사보려구요.',
'아 그래요? 몰랐었는데 진짜 조심해야겠네요ㅠ.',
'진짜 나쁜 사람들 많네요. 자동차는 금액대도 커서 더 위험할거 같아요.',
'그러네요! 가을을 싫어하시는군요? 아이고ㅠ 저는 이런 가을에는 음악 듣는걸 좋아해요.',
'팝 좋죠! 저는 EDM 음악을 좋아해요ㅋㅋ 가을과 별로 안어울리지만 신나는거 같아요. 그럼 또 봐요!']
## 출력 ##
"나는 중고 중고차를 알아볼 것이다,
나는 중고차가 부담스럽다,
나는 가을에 음악을 듣는 것을 좋아한다,
나는 EDM 음악을 좋아한다. "
```