Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitignore +1 -0
ReadMe.md +47 -0
data/Multitask_case_dev_VST +0 -0
data/Multitask_case_dev_san +0 -0
data/Multitask_case_poetry_san +0 -0
data/Multitask_case_prose_san +0 -0
data/Multitask_case_test_VST +0 -0
data/Multitask_case_test_san +0 -0
data/Multitask_case_train_VST +0 -0
data/Multitask_case_train_san +0 -0
data/Multitask_label_dev_VST +0 -0
data/Multitask_label_dev_san +0 -0
data/Multitask_label_poetry_san +0 -0
data/Multitask_label_prose_san +0 -0
data/Multitask_label_test_VST +0 -0
data/Multitask_label_test_san +0 -0
data/Multitask_label_train_VST +0 -0
data/Multitask_label_train_san +0 -0
data/Multitask_morph_dev_VST +0 -0
data/Multitask_morph_dev_san +0 -0
data/Multitask_morph_poetry_san +0 -0
data/Multitask_morph_prose_san +0 -0
data/Multitask_morph_test_VST +0 -0
data/Multitask_morph_test_san +0 -0
data/Multitask_morph_train_VST +0 -0
data/Multitask_morph_train_san +0 -0
data/combined_1300_test.txt +0 -0
data/ud_pos_ner_dp_dev_VST +0 -0
data/ud_pos_ner_dp_dev_san +0 -0
data/ud_pos_ner_dp_poetry_VST +0 -0
data/ud_pos_ner_dp_poetry_san +0 -0
data/ud_pos_ner_dp_prose_VST +0 -0
data/ud_pos_ner_dp_prose_san +0 -0
data/ud_pos_ner_dp_test_VST +0 -0
data/ud_pos_ner_dp_test_san +0 -0
data/ud_pos_ner_dp_train_VST +0 -0
data/ud_pos_ner_dp_train_san +0 -0
data/ud_pos_ner_dp_train_san_org +0 -0
examples/BiAFF_macro_UAS_LAS.py +108 -0
examples/BiAFF_write_1300_combined.py +48 -0
examples/GraphParser.py +599 -0
examples/GraphParser_MTL_POS.py +633 -0
examples/SequenceTagger.py +589 -0
examples/VST_Pred_Prepare.py +34 -0
examples/VST_macro_score.py +107 -0
examples/eval/conll03eval.v2 +336 -0
examples/eval/conll06eval.pl +1826 -0
examples/macro_UAS_LAS.py +107 -0
examples/write_1300_combined.py +48 -0
run_STBC.sh +75 -0

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ ./saved_models

ReadMe.md ADDED Viewed

	@@ -0,0 +1,47 @@

+Official code for the paper ["Systematic Investigation of Strategies Tailored for Low-Resource Settings for Low-Resource Dependency Parsing"](https://arxiv.org/abs/2201.11374).
+If you use this code please cite our paper.
+## Requirements
+* Python 3.7
+* Pytorch 1.1.0
+* Cuda 9.0
+* Gensim 3.8.1
+We assume that you have installed conda beforehand.
+```
+conda install pytorch==1.1.0 torchvision==0.3.0 cudatoolkit=9.0 -c pytorch
+pip install gensim==3.8.1
+```
+## Pretrained embeddings for Sanskrit
+* Pretrained FastText embeddings for STBC/VST can be obtained from [here](https://drive.google.com/drive/folders/1SwdEqikTq-N2vOL7QSUX2vqi3faZE7bq?usp=sharing). Make sure that `.txt` file is placed at `data/`
+* The main results are reported on the systems trained by combining train and dev splits.
+## How to train model for Sanskrit
+To run proposed system: (1) Pretraining (2) Integration, then simply run bash script `run_STBC.sh` or `run_VST.sh` for the respective dataset. With these scripts you will be able to reproduce our results reported in Section-3 and Table 2.
+```bash
+bash run_STBC.sh
+```
+## Citations
+```
+@misc{sandhan_systematic,
+  doi = {10.48550/ARXIV.2201.11374},
+  url = {https://arxiv.org/abs/2201.11374},
+  author = {Sandhan, Jivnesh and Behera, Laxmidhar and Goyal, Pawan},
+  keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
+  title = {Systematic Investigation of Strategies Tailored for Low-Resource Settings for Low-Resource Dependency Parsing},
+  publisher = {arXiv},
+  year = {2022},
+  copyright = {Creative Commons Attribution 4.0 International}
+}
+```
+## Acknowledgements
+Our ensembled system is built on the top of ["DCST Implementation"](https://github.com/rotmanguy/DCST)

data/Multitask_case_dev_VST ADDED Viewed