File size: 906 Bytes
2c5b432 3a5f192 2c5b432 3a5f192 c4acd53 3a5f192 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 |
---
language: ko
license: apache-2.0
---
# team-lucid/t5-v1_1-large-ko
[Google's T5](https://ai.googleblog.com/2020/02/exploring-transfer-learning-with-t5.html) Version 1.1 that trained on korean corpus
t5-v1_1-large-ko์ ํ๊ตญ์ด ์ฝํผ์ค์์ ํ์ต๋ t5 v1.1 ๋ชจ๋ธ์
๋๋ค.
OOV์ ๋ง๊ธฐ ์ํด BBPE๋ฅผ ์ฌ์ฉํ์์ผ๋ฉฐ, HyperCLOVA์์ ํํ์ ๋ถ์์ด ์ฑ๋ฅ์ ๋ํ๋๋ฐ ๋์์ด ๋๋ ๊ฒ์ ๋ณด๊ณ ํ ํฌ๋์ด์ ํ์ต ๊ณผ์ ์์ MeCab์ ์ด์ฉํด ํํ์๊ฐ ์ด์ํ๊ฒ ํ ํฐํ๋์ง ์๋๋ก ํ์์ต๋๋ค.
์ด ์ฐ๊ตฌ๋ ๊ตฌ๊ธ์ TPU Research Cloud(TRC)๋ฅผ ํตํด ์ง์๋ฐ์ Cloud TPU๋ก ํ์ต๋์์ต๋๋ค.
## Usage
```python
from transformers import AutoTokenizer, T5ForConditionalGeneration
tokenizer = AutoTokenizer.from_pretrained('team-lucid/t5-v1_1-large-ko')
model = T5ForConditionalGeneration.from_pretrained('team-lucid/t5-v1_1-large-ko')
``` |