kykim
/

bertshared-kor-base

Text2Text Generation

encoder-decoder

Inference Endpoints

Model card Files Files and versions Community

bertshared-kor-base / README.md

kykim's picture

Create README.md

8ea2767 about 3 years ago

|

raw history blame contribute delete

No virus

499 Bytes

	---
	language: ko
	---

	# Bert base model for Korean

	* 70GB Korean text dataset and 42000 lower-cased subwords are used
	* Check the model performance and other language models for Korean in [github](https://github.com/kiyoungkim1/LM-kor)

	```python
	# only for pytorch in transformers
	from transformers import BertTokenizerFast, EncoderDecoderModel

	tokenizer = BertTokenizerFast.from_pretrained("kykim/bertshared-kor-base")
	model = EncoderDecoderModel.from_pretrained("kykim/bertshared-kor-base")
	```