ckiplab
/

bert-base-han-chinese

Inference Endpoints

Model card Files Files and versions Community

ctlin commited on Jul 4, 2022

Commit

9f761b0

•

1 Parent(s): 2d24161

update

Files changed (1) hide show

README.md +7 -7

README.md CHANGED Viewed

@@ -19,10 +19,10 @@ Pretrained model on oldhan Chinese language using a masked language modeling (ML
 ## Training Datasets
 The copyright of the datasets belongs to the Institute of Linguistics, Academia Sinica.
-* [中央研究院上古漢語標記語料庫](http://lingcorpus.iis.sinica.edu.tw/cgi-bin/kiwi/akiwi/kiwi.sh?ukey=-406192123&qtype=-1)
-* [中央研究院中古漢語語料庫](http://lingcorpus.iis.sinica.edu.tw/cgi-bin/kiwi/dkiwi/kiwi.sh?ukey=852967425&qtype=-1)
-* [中央研究院近代漢語語料庫](http://lingcorpus.iis.sinica.edu.tw/cgi-bin/kiwi/pkiwi/kiwi.sh?ukey=-299696128&qtype=-1)
-* [中央研究院現代漢語語料庫](http://lingcorpus.iis.sinica.edu.tw/cgi-bin/kiwi/mkiwi/kiwi.sh)
 ## Contributors
 * Chin-Tung Lin at [CKIP](https://ckip.iis.sinica.edu.tw/)
@@ -36,14 +36,14 @@ The copyright of the datasets belongs to the Institute of Linguistics, Academia
       AutoModel,
     )
-    tokenizer = AutoTokenizer.from_pretrained("ckiplab/oldhan-bert-base-chinese")
-    model = AutoModel.from_pretrained("ckiplab/oldhan-bert-base-chinese")
     ```
 * Using our model for inference
     ```python
     >>> from transformers import pipeline
-    >>> unmasker = pipeline('fill-mask', model='ckiplab/oldhan-bert-base-chinese')
     >>> unmasker("黎[MASK]於變時雍。")
     [{'sequence': '黎 民 於 變 時 雍 。',

 ## Training Datasets
 The copyright of the datasets belongs to the Institute of Linguistics, Academia Sinica.
+* [中央研究院上古漢語標記語料庫](http://lingcorpus.iis.sinica.edu.tw/cgi-bin/kiwi/akiwi/kiwi.sh)
+* [中央研究院中古漢語語料庫](http://lingcorpus.iis.sinica.edu.tw/cgi-bin/kiwi/dkiwi/kiwi.sh)
+* [中央研究院近代漢語語料庫](http://lingcorpus.iis.sinica.edu.tw/cgi-bin/kiwi/pkiwi/kiwi.sh)
+* [中央研究院現代漢語語料庫](http://asbc.iis.sinica.edu.tw)
 ## Contributors
 * Chin-Tung Lin at [CKIP](https://ckip.iis.sinica.edu.tw/)
       AutoModel,
     )
+    tokenizer = AutoTokenizer.from_pretrained("ckiplab/han-bert-base-chinese")
+    model = AutoModel.from_pretrained("ckiplab/han-bert-base-chinese")
     ```
 * Using our model for inference
     ```python
     >>> from transformers import pipeline
+    >>> unmasker = pipeline('fill-mask', model='ckiplab/han-bert-base-chinese')
     >>> unmasker("黎[MASK]於變時雍。")
     [{'sequence': '黎 民 於 變 時 雍 。',