junnyu
/

ChineseBERT-large

Model card Files Files and versions Community

junnyu commited on Jul 12, 2021

Commit

c67bbaa

•

1 Parent(s): b32f01d

Update README.md

Files changed (1) hide show

README.md +12 -17

README.md CHANGED Viewed

@@ -5,13 +5,11 @@ tags:
 inference: False
 ---
-# GlyceBert_pytorch
-## https://github.com/JunnYu/GlyceBert_pytorch
-本项目主要自定义了tokenization_glycebert_fast.py文件中的GlyceBertTokenizerFast代码。从而可以从huggingface.co调用。
 ```python
-pretrained_tokenizer_name = "junnyu/ChineseBERT-large"
-tokenizer = GlyceBertTokenizerFast.from_pretrained(pretrained_tokenizer_name)
 ```
 # Paper
@@ -20,32 +18,29 @@ tokenizer = GlyceBertTokenizerFast.from_pretrained(pretrained_tokenizer_name)
 # Install
 ```bash
-pip install glycebert
 or
-pip install git+https://github.com/JunnYu/GlyceBert_pytorch.git
 ```
 # Usage
 ```python
 import torch
-from transformers import BertConfig as GlyceBertConfig
-from glycebert import GlyceBertForMaskedLM, GlyceBertTokenizerFast
-# 使用我这个里面的tokenizer config和model config
 pretrained_tokenizer_name = "junnyu/ChineseBERT-large"
 pretrained_model_name = "ShannonAI/ChineseBERT-large"
-tokenizer = GlyceBertTokenizerFast.from_pretrained(pretrained_tokenizer_name)
-config = GlyceBertConfig.from_pretrained(pretrained_tokenizer_name)
-chinese_bert = GlyceBertForMaskedLM.from_pretrained(
-    pretrained_model_name, config=config
-)
 text = "北京是[MASK]国的首都。"
 inputs = tokenizer(text, return_tensors="pt")
 print(inputs)
 maskpos = 4
 with torch.no_grad():
     o = chinese_bert(**inputs)
     value, index = o.logits.softmax(-1)[0, maskpos].topk(10)

 inference: False
 ---
+# ChineseBert_pytorch
+本项目主要自定义了tokenization_chinesebert_fast.py文件中的ChineseBertTokenizerFast代码。从而可以从huggingface.co调用。
 ```python
+pretrained_tokenizer_name = "junnyu/ChineseBERT-base"
+tokenizer = ChineseBertTokenizerFast.from_pretrained(pretrained_tokenizer_name)
 ```
 # Paper
 # Install
 ```bash
+pip install chinesebert
 or
+pip install git+https://github.com/JunnYu/ChineseBert_pytorch.git
 ```
 # Usage
 ```python
 import torch
+from transformers import BertConfig as ChineseBertConfig
+from chinesebert import ChineseBertForMaskedLM, ChineseBertTokenizerFast
 pretrained_tokenizer_name = "junnyu/ChineseBERT-large"
 pretrained_model_name = "ShannonAI/ChineseBERT-large"
+tokenizer = ChineseBertTokenizerFast.from_pretrained(pretrained_tokenizer_name)
+config = ChineseBertConfig.from_pretrained(pretrained_tokenizer_name)
+chinese_bert = ChineseBertForMaskedLM.from_pretrained(pretrained_model_name, config=config)
 text = "北京是[MASK]国的首都。"
 inputs = tokenizer(text, return_tensors="pt")
 print(inputs)
 maskpos = 4
 with torch.no_grad():
     o = chinese_bert(**inputs)
     value, index = o.logits.softmax(-1)[0, maskpos].topk(10)