KoichiYasuoka
/

deberta-base-ainu-ud-goeswith

@@ -129,31 +129,32 @@
     "112": "SCONJ|\u63a5\u7d9a\u52a9\u8a5e|cc",
     "113": "SCONJ|\u63a5\u7d9a\u52a9\u8a5e|mark",
     "114": "SCONJ|\u63a5\u7d9a\u52a9\u8a5e|root",
-    "115": "SCONJ|\u63a5\u7d9a\u8a5e|case",
-    "116": "SCONJ|\u63a5\u7d9a\u8a5e|mark",
-    "117": "SYM|_|conj",
-    "118": "SYM|_|obj",
-    "119": "VERB|\u4ed6\u52d5\u8a5e|acl",
-    "120": "VERB|\u4ed6\u52d5\u8a5e|advcl",
-    "121": "VERB|\u4ed6\u52d5\u8a5e|amod",
-    "122": "VERB|\u4ed6\u52d5\u8a5e|ccomp",
-    "123": "VERB|\u4ed6\u52d5\u8a5e|conj",
-    "124": "VERB|\u4ed6\u52d5\u8a5e|parataxis",
-    "125": "VERB|\u4ed6\u52d5\u8a5e|root",
-    "126": "VERB|\u5b8c\u5168\u52d5\u8a5e|acl",
-    "127": "VERB|\u5b8c\u5168\u52d5\u8a5e|advcl",
-    "128": "VERB|\u5b8c\u5168\u52d5\u8a5e|parataxis",
-    "129": "VERB|\u5b8c\u5168\u52d5\u8a5e|root",
-    "130": "VERB|\u81ea\u52d5\u8a5e|acl",
-    "131": "VERB|\u81ea\u52d5\u8a5e|advcl",
-    "132": "VERB|\u81ea\u52d5\u8a5e|amod",
-    "133": "VERB|\u81ea\u52d5\u8a5e|ccomp",
-    "134": "VERB|\u81ea\u52d5\u8a5e|conj",
-    "135": "VERB|\u81ea\u52d5\u8a5e|parataxis",
-    "136": "VERB|\u81ea\u52d5\u8a5e|root",
-    "137": "X|_|conj",
-    "138": "X|_|goeswith",
-    "139": "X|_|nsubj"
   },
   "initializer_range": 0.02,
   "intermediate_size": 3072,
@@ -273,31 +274,32 @@
     "SCONJ|\u63a5\u7d9a\u52a9\u8a5e|cc": 112,
     "SCONJ|\u63a5\u7d9a\u52a9\u8a5e|mark": 113,
     "SCONJ|\u63a5\u7d9a\u52a9\u8a5e|root": 114,
-    "SCONJ|\u63a5\u7d9a\u8a5e|case": 115,
-    "SCONJ|\u63a5\u7d9a\u8a5e|mark": 116,
-    "SYM|_|conj": 117,
-    "SYM|_|obj": 118,
-    "VERB|\u4ed6\u52d5\u8a5e|acl": 119,
-    "VERB|\u4ed6\u52d5\u8a5e|advcl": 120,
-    "VERB|\u4ed6\u52d5\u8a5e|amod": 121,
-    "VERB|\u4ed6\u52d5\u8a5e|ccomp": 122,
-    "VERB|\u4ed6\u52d5\u8a5e|conj": 123,
-    "VERB|\u4ed6\u52d5\u8a5e|parataxis": 124,
-    "VERB|\u4ed6\u52d5\u8a5e|root": 125,
-    "VERB|\u5b8c\u5168\u52d5\u8a5e|acl": 126,
-    "VERB|\u5b8c\u5168\u52d5\u8a5e|advcl": 127,
-    "VERB|\u5b8c\u5168\u52d5\u8a5e|parataxis": 128,
-    "VERB|\u5b8c\u5168\u52d5\u8a5e|root": 129,
-    "VERB|\u81ea\u52d5\u8a5e|acl": 130,
-    "VERB|\u81ea\u52d5\u8a5e|advcl": 131,
-    "VERB|\u81ea\u52d5\u8a5e|amod": 132,
-    "VERB|\u81ea\u52d5\u8a5e|ccomp": 133,
-    "VERB|\u81ea\u52d5\u8a5e|conj": 134,
-    "VERB|\u81ea\u52d5\u8a5e|parataxis": 135,
-    "VERB|\u81ea\u52d5\u8a5e|root": 136,
-    "X|_|conj": 137,
-    "X|_|goeswith": 138,
-    "X|_|nsubj": 139
   },
   "layer_norm_eps": 1e-07,
   "max_position_embeddings": 512,

     "112": "SCONJ|\u63a5\u7d9a\u52a9\u8a5e|cc",
     "113": "SCONJ|\u63a5\u7d9a\u52a9\u8a5e|mark",
     "114": "SCONJ|\u63a5\u7d9a\u52a9\u8a5e|root",
+    "115": "SCONJ|\u63a5\u7d9a\u8a5e|advmod",
+    "116": "SCONJ|\u63a5\u7d9a\u8a5e|case",
+    "117": "SCONJ|\u63a5\u7d9a\u8a5e|mark",
+    "118": "SYM|_|conj",
+    "119": "SYM|_|obj",
+    "120": "VERB|\u4ed6\u52d5\u8a5e|acl",
+    "121": "VERB|\u4ed6\u52d5\u8a5e|advcl",
+    "122": "VERB|\u4ed6\u52d5\u8a5e|amod",
+    "123": "VERB|\u4ed6\u52d5\u8a5e|ccomp",
+    "124": "VERB|\u4ed6\u52d5\u8a5e|conj",
+    "125": "VERB|\u4ed6\u52d5\u8a5e|parataxis",
+    "126": "VERB|\u4ed6\u52d5\u8a5e|root",
+    "127": "VERB|\u5b8c\u5168\u52d5\u8a5e|acl",
+    "128": "VERB|\u5b8c\u5168\u52d5\u8a5e|advcl",
+    "129": "VERB|\u5b8c\u5168\u52d5\u8a5e|parataxis",
+    "130": "VERB|\u5b8c\u5168\u52d5\u8a5e|root",
+    "131": "VERB|\u81ea\u52d5\u8a5e|acl",
+    "132": "VERB|\u81ea\u52d5\u8a5e|advcl",
+    "133": "VERB|\u81ea\u52d5\u8a5e|amod",
+    "134": "VERB|\u81ea\u52d5\u8a5e|ccomp",
+    "135": "VERB|\u81ea\u52d5\u8a5e|conj",
+    "136": "VERB|\u81ea\u52d5\u8a5e|parataxis",
+    "137": "VERB|\u81ea\u52d5\u8a5e|root",
+    "138": "X|_|conj",
+    "139": "X|_|goeswith",
+    "140": "X|_|nsubj"
   },
   "initializer_range": 0.02,
   "intermediate_size": 3072,
     "SCONJ|\u63a5\u7d9a\u52a9\u8a5e|cc": 112,
     "SCONJ|\u63a5\u7d9a\u52a9\u8a5e|mark": 113,
     "SCONJ|\u63a5\u7d9a\u52a9\u8a5e|root": 114,
+    "SCONJ|\u63a5\u7d9a\u8a5e|advmod": 115,
+    "SCONJ|\u63a5\u7d9a\u8a5e|case": 116,
+    "SCONJ|\u63a5\u7d9a\u8a5e|mark": 117,
+    "SYM|_|conj": 118,
+    "SYM|_|obj": 119,
+    "VERB|\u4ed6\u52d5\u8a5e|acl": 120,
+    "VERB|\u4ed6\u52d5\u8a5e|advcl": 121,
+    "VERB|\u4ed6\u52d5\u8a5e|amod": 122,
+    "VERB|\u4ed6\u52d5\u8a5e|ccomp": 123,
+    "VERB|\u4ed6\u52d5\u8a5e|conj": 124,
+    "VERB|\u4ed6\u52d5\u8a5e|parataxis": 125,
+    "VERB|\u4ed6\u52d5\u8a5e|root": 126,
+    "VERB|\u5b8c\u5168\u52d5\u8a5e|acl": 127,
+    "VERB|\u5b8c\u5168\u52d5\u8a5e|advcl": 128,
+    "VERB|\u5b8c\u5168\u52d5\u8a5e|parataxis": 129,
+    "VERB|\u5b8c\u5168\u52d5\u8a5e|root": 130,
+    "VERB|\u81ea\u52d5\u8a5e|acl": 131,
+    "VERB|\u81ea\u52d5\u8a5e|advcl": 132,
+    "VERB|\u81ea\u52d5\u8a5e|amod": 133,
+    "VERB|\u81ea\u52d5\u8a5e|ccomp": 134,
+    "VERB|\u81ea\u52d5\u8a5e|conj": 135,
+    "VERB|\u81ea\u52d5\u8a5e|parataxis": 136,
+    "VERB|\u81ea\u52d5\u8a5e|root": 137,
+    "X|_|conj": 138,
+    "X|_|goeswith": 139,
+    "X|_|nsubj": 140
   },
   "layer_norm_eps": 1e-07,
   "max_position_embeddings": 512,

maker.py CHANGED Viewed

@@ -15,8 +15,9 @@ class UDgoeswithDataset(object):
       dep,c="-|_|dep",[]
       for s in r:
         t=s.split("\t")
-        if len(t)==10 and t[0].isdecimal():
-          c.append(t)
         elif c!=[]:
           for x in [1,2]:
             d=list(c)
@@ -42,8 +43,8 @@ from transformers import AutoTokenizer,AutoConfig,AutoModelForTokenClassificatio
 tkz=AutoTokenizer.from_pretrained(src)
 trainDS=UDgoeswithDataset("train.conllu",tkz)
 lid=trainDS.label2id
-cfg=AutoConfig.from_pretrained(src,num_labels=len(lid),label2id=lid,id2label={i:l for l,i in lid.items()},ignore_mismatched_sizes=True)
-arg=TrainingArguments(num_train_epochs=3,per_device_train_batch_size=64,output_dir="/tmp",overwrite_output_dir=True,save_total_limit=2,learning_rate=5e-05,warmup_ratio=0.1)
 trn=Trainer(args=arg,data_collator=DataCollatorForTokenClassification(tkz),model=AutoModelForTokenClassification.from_pretrained(src,config=cfg,ignore_mismatched_sizes=True),train_dataset=trainDS)
 trn.train()
 trn.save_model(tgt)

       dep,c="-|_|dep",[]
       for s in r:
         t=s.split("\t")
+        if len(t)==10:
+          if t[0].isdecimal():
+            c.append(t)
         elif c!=[]:
           for x in [1,2]:
             d=list(c)
 tkz=AutoTokenizer.from_pretrained(src)
 trainDS=UDgoeswithDataset("train.conllu",tkz)
 lid=trainDS.label2id
+cfg=AutoConfig.from_pretrained(src,num_labels=len(lid),label2id=lid,id2label={i:l for l,i in lid.items()},ignore_mismatched_sizes=True,task_specific_params=None)
+arg=TrainingArguments(num_train_epochs=3,per_device_train_batch_size=16,output_dir="/tmp",overwrite_output_dir=True,save_total_limit=2,learning_rate=5e-05,warmup_ratio=0.1)
 trn=Trainer(args=arg,data_collator=DataCollatorForTokenClassification(tkz),model=AutoModelForTokenClassification.from_pretrained(src,config=cfg,ignore_mismatched_sizes=True),train_dataset=trainDS)
 trn.train()
 trn.save_model(tgt)

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:001a50855b2baa0d1d140f455bb1b56a1945fbd05037a16451d5464272d4a2d9
-size 419800339

 version https://git-lfs.github.com/spec/v1
+oid sha256:bcadf30041fc773bdc1d871b11411b9810f9f19c0cb52eab4350d68935f65513
+size 419803411