ipipan
/

nlpre_trankit_nkjp_xlm-roberta-large_nkjp-by-type

Model card Files Files and versions Community

martynawck commited on Oct 3, 2023

Commit

9ec2e68

•

1 Parent(s): 55f2ff9

Create README.md

Files changed (1) hide show

README.md +30 -0

README.md ADDED Viewed

	@@ -0,0 +1,30 @@

+# Model description
+- Morphosyntactic analyzer: Trankit
+- Tagset: NKJP
+- Embedding vectors: XLM-RoBERTa-Large
+- Dataset: NLPrePL-NKJP-fair-by-type (https://huggingface.co/datasets/ipipan/nlprepl)
+# How to use
+## Clone
+```
+git clone git@hf.co:ipipan/nlpre_trankit_nkjp_xlm-roberta-large_nkjp-by-type
+```
+## Load model
+```
+import trankit
+model_path = './nlpre_trankit_nkjp_xlm-roberta-large_nkjp-by-type'
+trankit.verify_customized_pipeline(
+    category='customized-mwt', # pipeline category
+    save_dir=model_path, # directory used for saving models in previous steps
+    embedding_name='xlm-roberta-large' # embedding version that we use for training our customized pipeline, by default, it is `xlm-roberta-base`
+)
+model = trankit.Pipeline(lang='customized-mwt', cache_dir=model_path, embedding='xlm-roberta-large')
+```