eenzeenee
/

t5-base-korean-summarization

text2text-generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

eenzeenee commited on Jan 14, 2023

Commit

e5cbd9e

·

1 Parent(s): 4652695

Update README.md

Files changed (1) hide show

README.md +3 -2

README.md CHANGED Viewed

@@ -26,6 +26,7 @@ from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 model = AutoModelForSeq2SeqLM.from_pretrained('eenzeenee/t5-base-korean-summarization')
 tokenizer = AutoTokenizer.from_pretrained('eenzeenee/t5-base-korean-summarization')
 sample = """
     안녕하세요? 우리 (2학년)/(이 학년) 친구들 우리 친구들 학교에 가서 진짜 (2학년)/(이 학년) 이 되고 싶었는데 학교에 못 가고 있어서 답답하죠?
     그래도 우리 친구들의 안전과 건강이 최우선이니까요 오늘부터 선생님이랑 매일 매일 국어 여행을 떠나보도록 해요.
@@ -43,10 +44,10 @@ sample = """
     어떻게 여러가지 방법으로 읽을까 우리 공부해 보도록 해요. 오늘의 시 나와라 짜잔/! 시가 나왔습니다 시의 제목이 뭔가요? 다툰 날이에요 다툰 날.
     누구랑 다퉜나 동생이랑 다퉜나 언니랑 친구랑? 누구랑 다퉜는지 선생님이 시를 읽어 줄 테니까 한번 생각을 해보도록 해요."""
-inputs = [args.prefix + sample]
-inputs = tokenizer(inputs, max_length=args.max_input_length, truncation=True, return_tensors="pt")
 output = model.generate(**inputs, num_beams=3, do_sample=True, min_length=10, max_length=64)
 decoded_output = tokenizer.batch_decode(output, skip_special_tokens=True)[0]
 result = nltk.sent_tokenize(decoded_output.strip())[0]

 model = AutoModelForSeq2SeqLM.from_pretrained('eenzeenee/t5-base-korean-summarization')
 tokenizer = AutoTokenizer.from_pretrained('eenzeenee/t5-base-korean-summarization')
+prefix = "summarize: "
 sample = """
     안녕하세요? 우리 (2학년)/(이 학년) 친구들 우리 친구들 학교에 가서 진짜 (2학년)/(이 학년) 이 되고 싶었는데 학교에 못 가고 있어서 답답하죠?
     그래도 우리 친구들의 안전과 건강이 최우선이니까요 오늘부터 선생님이랑 매일 매일 국어 여행을 떠나보도록 해요.
     어떻게 여러가지 방법으로 읽을까 우리 공부해 보도록 해요. 오늘의 시 나와라 짜잔/! 시가 나왔습니다 시의 제목이 뭔가요? 다툰 날이에요 다툰 날.
     누구랑 다퉜나 동생이랑 다퉜나 언니랑 친구랑? 누구랑 다퉜는지 선생님이 시를 읽어 줄 테니까 한번 생각을 해보도록 해요."""
+inputs = [prefix + sample]
+inputs = tokenizer(inputs, max_length=512, truncation=True, return_tensors="pt")
 output = model.generate(**inputs, num_beams=3, do_sample=True, min_length=10, max_length=64)
 decoded_output = tokenizer.batch_decode(output, skip_special_tokens=True)[0]
 result = nltk.sent_tokenize(decoded_output.strip())[0]