megagonlabs
/

electra-base-japanese-discriminator

Inference Endpoints

Model card Files Files and versions Community

r-terada commited on Jun 3, 2022

Commit

fb1ba61

•

1 Parent(s): ea834a1

Upload tokenizer_config.json

Files changed (1) hide show

tokenizer_config.json +13 -0

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+ "tokenizer_class": "ElectraSudachipyTokenizer",
+ "do_lower_case": false,
+ "do_word_tokenize": true,
+ "do_subword_tokenize": true,
+ "word_tokenizer_type": "sudachipy",
+ "word_form_type": "dictionary_and_surface",
+ "subword_tokenizer_type": "wordpiece",
+ "model_max_length": 512,
+ "sudachipy_kwargs": {"split_mode":"A","dict_type":"core"},
+ "auto_map": {"AutoTokenizer": ["modeling.ElectraSudachipyTokenizer", null]}
+}