iproskurina commited on Mar 9, 2023

Commit

59d18c0

•

1 Parent(s): d387cbe

Update spaCy pipeline

Browse files

Files changed (43) hide show

en_grammar_checker-any-py3-none-any.whl +2 -2
meta.json +17 -17
training/articles/config.cfg +6 -4
training/articles/meta.json +6 -4
training/articles/spancat/cfg +2 -1
training/articles/spancat/model +2 -2
training/articles/tokenizer +2 -2
training/articles/transformer/model +2 -2
training/articles/vocab/strings.json +2 -2
training/grammar_major/config.cfg +10 -8
training/grammar_major/meta.json +6 -4
training/grammar_major/spancat/cfg +2 -1
training/grammar_major/spancat/model +2 -2
training/grammar_major/tokenizer +2 -2
training/grammar_major/transformer/model +2 -2
training/grammar_major/vocab/strings.json +2 -2
training/grammar_minor/config.cfg +8 -8
training/grammar_minor/meta.json +4 -6
training/grammar_minor/spancat/cfg +1 -2
training/grammar_minor/spancat/model +2 -2
training/grammar_minor/tokenizer +2 -2
training/grammar_minor/transformer/model +2 -2
training/grammar_minor/vocab/strings.json +2 -2
training/punctuation/config.cfg +4 -3
training/punctuation/meta.json +3 -3
training/punctuation/spancat/model +1 -1
training/punctuation/tokenizer +2 -2
training/punctuation/transformer/model +2 -2
training/punctuation/vocab/strings.json +2 -2
training/spelling/config.cfg +6 -5
training/spelling/meta.json +5 -5
training/spelling/spancat/cfg +2 -2
training/spelling/spancat/model +1 -1
training/spelling/tokenizer +2 -2
training/spelling/transformer/model +2 -2
training/spelling/vocab/strings.json +2 -2
training/vocabulary/config.cfg +9 -7
training/vocabulary/meta.json +7 -5
training/vocabulary/spancat/cfg +3 -2
training/vocabulary/spancat/model +2 -2
training/vocabulary/tokenizer +2 -2
training/vocabulary/transformer/model +2 -2
training/vocabulary/vocab/strings.json +2 -2

en_grammar_checker-any-py3-none-any.whl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6445e092baab35c56feffddb9f55318961754755bf94c76c8ccfbd8eff3adf04
-size 27023

 version https://git-lfs.github.com/spec/v1
+oid sha256:022e2aa7c5fe1b54f173deb7dd82b65f03bd5cc28900a0a0caadfebb6a377338
+size 2441455340

meta.json CHANGED Viewed

@@ -7,16 +7,21 @@
   "email":"",
   "url":"",
   "license":"CC BY-SA 3.0",
-  "spacy_version":">=3.5.0",
-  "spacy_git_version":"61dfdd9fb",
   "vectors":{
     "width":0,
     "vectors":0,
     "keys":0,
     "name":null
-  },
-  "labels":{
   },
   "pipeline":[
     "punctuation",
@@ -34,18 +39,9 @@
     "grammar_minor",
     "vocabulary"
   ],
-  "disabled":[
-  ],
-  "parent_package":"spacy",
-  "requirements":[
-    "spacy-transformers>=1.0.0"
-  ],
-  "sources":[
-    {
-      "license":"MIT"
-    }
-  ],
   "performance":{
     "spans_articles_p":0.8274481176,
     "spans_articles_r":0.8197202306,
@@ -149,5 +145,9 @@
       }
     }
   },
-  "speed":5613.7287946692
 }

   "email":"",
   "url":"",
   "license":"CC BY-SA 3.0",
+  "spacy_version":">=3.5.0,<3.6.0",
+  "parent_package":"spacy",
+  "requirements":[
+    "spacy-transformers>=1.0.0"
+  ],
+  "sources":[
+    {
+      "license":"MIT"
+    }
+  ],
   "vectors":{
     "width":0,
     "vectors":0,
     "keys":0,
     "name":null
   },
   "pipeline":[
     "punctuation",
     "grammar_minor",
     "vocabulary"
   ],
+  "labels":{
+  },
   "performance":{
     "spans_articles_p":0.8274481176,
     "spans_articles_r":0.8197202306,
       }
     }
   },
+  "speed":5613.7287946692,
+  "spacy_git_version":"61dfdd9fb",
+  "disabled":[
+  ]
 }

training/articles/config.cfg CHANGED Viewed

@@ -97,12 +97,13 @@ frozen_components = []
 seed = 0
 gpu_allocator = "pytorch"
 dropout = 0.1
-patience = 1600
 max_epochs = 0
 max_steps = 20000
-eval_frequency = 200
 annotating_components = []
 before_to_disk = null
 [training.batcher]
 @batchers = "spacy.batch_by_padded.v1"
@@ -113,7 +114,7 @@ get_length = null
 [training.logger]
 @loggers = "spacy.WandbLogger.v3"
-project_name = "adwiser"
 remove_config_values = ["paths.train","paths.dev","corpora.train.path","corpora.dev.path"]
 model_log_interval = 1000
 log_dataset_dir = null
@@ -140,7 +141,8 @@ initial_rate = 0.00005
 spans_sc_f = 0.5
 spans_sc_p = 0.0
 spans_sc_r = 0.0
-spans_Articles_f = 0.5
 [pretraining]

 seed = 0
 gpu_allocator = "pytorch"
 dropout = 0.1
+patience = 3000
 max_epochs = 0
 max_steps = 20000
+eval_frequency = 500
 annotating_components = []
 before_to_disk = null
+before_update = null
 [training.batcher]
 @batchers = "spacy.batch_by_padded.v1"
 [training.logger]
 @loggers = "spacy.WandbLogger.v3"
+project_name = "grammar_checker"
 remove_config_values = ["paths.train","paths.dev","corpora.train.path","corpora.dev.path"]
 model_log_interval = 1000
 log_dataset_dir = null
 spans_sc_f = 0.5
 spans_sc_p = 0.0
 spans_sc_r = 0.0
+spans_Articles_f = 0.01
+spans_Determiners_f = 0.49
 [pretraining]

training/articles/meta.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "lang":"en",
   "name":"pipeline",
   "version":"0.0.0",
-  "spacy_version":">=3.3.0,<3.4.0",
   "description":"",
   "author":"",
   "email":"",
@@ -21,7 +21,8 @@
     ],
     "spancat":[
-      "Articles"
     ]
   },
   "pipeline":[
@@ -40,7 +41,8 @@
     "spans_sc_p":0.0,
     "spans_sc_r":0.0,
     "spans_Articles_f":0.0,
-    "transformer_loss":100.8329219741,
-    "spancat_loss":2964.9278720927
   }
 }

   "lang":"en",
   "name":"pipeline",
   "version":"0.0.0",
+  "spacy_version":">=3.5.0,<3.6.0",
   "description":"",
   "author":"",
   "email":"",
     ],
     "spancat":[
+      "Articles",
+      "Determiners"
     ]
   },
   "pipeline":[
     "spans_sc_p":0.0,
     "spans_sc_r":0.0,
     "spans_Articles_f":0.0,
+    "spans_Determiners_f":0.0,
+    "transformer_loss":105.063624234,
+    "spancat_loss":5765.2548046919
   }
 }

training/articles/spancat/cfg CHANGED Viewed

@@ -1,6 +1,7 @@
 {
   "labels":[
-    "Articles"
   ],
   "spans_key":"articles",
   "threshold":0.5,

 {
   "labels":[
+    "Articles",
+    "Determiners"
   ],
   "spans_key":"articles",
   "threshold":0.5,

training/articles/spancat/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5bcd34ab7d5ff9adb0214059514deb98fb9c131f29d0a0a7a4c520fcafd3e875
-size 4723491

 version https://git-lfs.github.com/spec/v1
+oid sha256:4c35e698ee5d227a921ebfc90e99e502db197e5c2897b6c574f14a32e8630821
+size 4724007

training/articles/tokenizer CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f0f3f5297dc14c5fd94488174149bd87b5f24dff28e6be993eb3ea7a92e53417
-size 78126

 version https://git-lfs.github.com/spec/v1
+oid sha256:b014e8bba4958b120af2d0c1c63eabb7c00379f2bacaf10df7c5325efd2ea467
+size 77066

training/articles/transformer/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2036ce8a5df6924d046d42dd67dc03f670b4d1d25c2d8073de95822165e9a5ed
-size 434208023

 version https://git-lfs.github.com/spec/v1
+oid sha256:1ffd19d8ecc91a52ab4494d5ed5dce4469a3ae220895b98c5b63705fadac330b
+size 434208137

training/articles/vocab/strings.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e6c403d7808ec8eeeafe465538d7df7f45c1202362b29c9c627a7ed8302dc210
-size 287029

 version https://git-lfs.github.com/spec/v1
+oid sha256:121520107d12556bee02dbe233c8b08eab86d33fd2839eaf7505679d63227ad9
+size 289348

training/grammar_major/config.cfg CHANGED Viewed

@@ -97,12 +97,13 @@ frozen_components = []
 seed = 0
 gpu_allocator = "pytorch"
 dropout = 0.1
-patience = 1600
 max_epochs = 0
 max_steps = 20000
-eval_frequency = 200
 annotating_components = []
 before_to_disk = null
 [training.batcher]
 @batchers = "spacy.batch_by_padded.v1"
@@ -113,7 +114,7 @@ get_length = null
 [training.logger]
 @loggers = "spacy.WandbLogger.v3"
-project_name = "adwiser"
 remove_config_values = ["paths.train","paths.dev","corpora.train.path","corpora.dev.path"]
 model_log_interval = 1000
 log_dataset_dir = null
@@ -137,13 +138,14 @@ total_steps = 20000
 initial_rate = 0.00005
 [training.score_weights]
-spans_sc_f = 0.5
 spans_sc_p = 0.0
 spans_sc_r = 0.0
-spans_Agreement_errors_f = 0.13
-spans_Prepositions_f = 0.12
-spans_Redundant_comp_f = 0.14
-spans_Tense_choice_f = 0.11
 [pretraining]

 seed = 0
 gpu_allocator = "pytorch"
 dropout = 0.1
+patience = 3000
 max_epochs = 0
 max_steps = 20000
+eval_frequency = 500
 annotating_components = []
 before_to_disk = null
+before_update = null
 [training.batcher]
 @batchers = "spacy.batch_by_padded.v1"
 [training.logger]
 @loggers = "spacy.WandbLogger.v3"
+project_name = "grammar_checker"
 remove_config_values = ["paths.train","paths.dev","corpora.train.path","corpora.dev.path"]
 model_log_interval = 1000
 log_dataset_dir = null
 initial_rate = 0.00005
 [training.score_weights]
+spans_sc_f = 0.51
 spans_sc_p = 0.0
 spans_sc_r = 0.0
+spans_Absence_comp_sent_f = 0.15
+spans_Agreement_errors_f = 0.09
+spans_Prepositions_f = 0.08
+spans_Redundant_comp_f = 0.1
+spans_Tense_choice_f = 0.07
 [pretraining]

training/grammar_major/meta.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "lang":"en",
   "name":"pipeline",
   "version":"0.0.0",
-  "spacy_version":">=3.3.0,<3.4.0",
   "description":"",
   "author":"",
   "email":"",
@@ -21,8 +21,9 @@
     ],
     "spancat":[
-      "Agreement_errors",
       "Prepositions",
       "Tense_choice",
       "Redundant_comp"
     ]
@@ -42,11 +43,12 @@
     "spans_sc_f":0.0,
     "spans_sc_p":0.0,
     "spans_sc_r":0.0,
     "spans_Agreement_errors_f":0.0,
     "spans_Prepositions_f":0.0,
     "spans_Redundant_comp_f":0.0,
     "spans_Tense_choice_f":0.0,
-    "transformer_loss":155.2905472092,
-    "spancat_loss":4539.9674681051
   }
 }

   "lang":"en",
   "name":"pipeline",
   "version":"0.0.0",
+  "spacy_version":">=3.5.0,<3.6.0",
   "description":"",
   "author":"",
   "email":"",
     ],
     "spancat":[
+      "Absence_comp_sent",
       "Prepositions",
+      "Agreement_errors",
       "Tense_choice",
       "Redundant_comp"
     ]
     "spans_sc_f":0.0,
     "spans_sc_p":0.0,
     "spans_sc_r":0.0,
+    "spans_Absence_comp_sent_f":0.0,
     "spans_Agreement_errors_f":0.0,
     "spans_Prepositions_f":0.0,
     "spans_Redundant_comp_f":0.0,
     "spans_Tense_choice_f":0.0,
+    "transformer_loss":216.1842367096,
+    "spancat_loss":10959.7070766776
   }
 }

training/grammar_major/spancat/cfg CHANGED Viewed

@@ -1,7 +1,8 @@
 {
   "labels":[
-    "Agreement_errors",
     "Prepositions",
     "Tense_choice",
     "Redundant_comp"
   ],

 {
   "labels":[
+    "Absence_comp_sent",
     "Prepositions",
+    "Agreement_errors",
     "Tense_choice",
     "Redundant_comp"
   ],

training/grammar_major/spancat/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3e9fbf9b48ca97b5fe06e25c549763cea2b182321819a81a2ea9b61eede20cfa
-size 4725039

 version https://git-lfs.github.com/spec/v1
+oid sha256:cca1ce63e726d8e2d50e58a0ed7306d96a3f65a97192d5dd296ccc57dd65b685
+size 4725555

training/grammar_major/tokenizer CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f0f3f5297dc14c5fd94488174149bd87b5f24dff28e6be993eb3ea7a92e53417
-size 78126

 version https://git-lfs.github.com/spec/v1
+oid sha256:b014e8bba4958b120af2d0c1c63eabb7c00379f2bacaf10df7c5325efd2ea467
+size 77066

training/grammar_major/transformer/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:745dee6d568bdaf5acde6d3cb6fd6cccfed39741771b1f36ea1d94968d43b2ff
-size 434208023

 version https://git-lfs.github.com/spec/v1
+oid sha256:09516ade4845a1fd132ee39328e46af1fe8c75178a3b7d87f717a9586e62a23d
+size 434208137

training/grammar_major/vocab/strings.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6ef59bf11f594ff3dbb5802fd852d888513130a338f18d441d0738d16cfd1d9f
-size 173293

 version https://git-lfs.github.com/spec/v1
+oid sha256:c8f06faf2807cf7c9eba22f9a969617b204b21fa9181a0392919a6ecd8a24f5b
+size 182743

training/grammar_minor/config.cfg CHANGED Viewed

@@ -97,12 +97,13 @@ frozen_components = []
 seed = 0
 gpu_allocator = "pytorch"
 dropout = 0.1
-patience = 1600
 max_epochs = 0
 max_steps = 20000
-eval_frequency = 200
 annotating_components = []
 before_to_disk = null
 [training.batcher]
 @batchers = "spacy.batch_by_padded.v1"
@@ -113,7 +114,7 @@ get_length = null
 [training.logger]
 @loggers = "spacy.WandbLogger.v3"
-project_name = "adwiser"
 remove_config_values = ["paths.train","paths.dev","corpora.train.path","corpora.dev.path"]
 model_log_interval = 1000
 log_dataset_dir = null
@@ -140,11 +141,10 @@ initial_rate = 0.00005
 spans_sc_f = 0.5
 spans_sc_p = 0.0
 spans_sc_r = 0.0
-spans_Determiners_f = 0.18
-spans_Noun_number_f = 0.01
-spans_Numerals_f = 0.13
-spans_Verb_pattern_f = 0.12
-spans_Word_order_f = 0.07
 [pretraining]

 seed = 0
 gpu_allocator = "pytorch"
 dropout = 0.1
+patience = 3000
 max_epochs = 0
 max_steps = 20000
+eval_frequency = 500
 annotating_components = []
 before_to_disk = null
+before_update = null
 [training.batcher]
 @batchers = "spacy.batch_by_padded.v1"
 [training.logger]
 @loggers = "spacy.WandbLogger.v3"
+project_name = "grammar_checker"
 remove_config_values = ["paths.train","paths.dev","corpora.train.path","corpora.dev.path"]
 model_log_interval = 1000
 log_dataset_dir = null
 spans_sc_f = 0.5
 spans_sc_p = 0.0
 spans_sc_r = 0.0
+spans_Noun_number_f = 0.02
+spans_Numerals_f = 0.19
+spans_Verb_pattern_f = 0.19
+spans_Word_order_f = 0.1
 [pretraining]

training/grammar_minor/meta.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "lang":"en",
   "name":"pipeline",
   "version":"0.0.0",
-  "spacy_version":">=3.3.0,<3.4.0",
   "description":"",
   "author":"",
   "email":"",
@@ -21,10 +21,9 @@
     ],
     "spancat":[
       "Verb_pattern",
-      "Determiners",
       "Numerals",
-      "Word_order",
       "Noun_number"
     ]
   },
@@ -43,12 +42,11 @@
     "spans_sc_f":0.0,
     "spans_sc_p":0.0,
     "spans_sc_r":0.0,
-    "spans_Determiners_f":0.0,
     "spans_Noun_number_f":0.0,
     "spans_Numerals_f":0.0,
     "spans_Verb_pattern_f":0.0,
     "spans_Word_order_f":0.0,
-    "transformer_loss":74.2849839284,
-    "spancat_loss":3224.212622695
   }
 }

   "lang":"en",
   "name":"pipeline",
   "version":"0.0.0",
+  "spacy_version":">=3.5.0,<3.6.0",
   "description":"",
   "author":"",
   "email":"",
     ],
     "spancat":[
+      "Word_order",
       "Verb_pattern",
       "Numerals",
       "Noun_number"
     ]
   },
     "spans_sc_f":0.0,
     "spans_sc_p":0.0,
     "spans_sc_r":0.0,
     "spans_Noun_number_f":0.0,
     "spans_Numerals_f":0.0,
     "spans_Verb_pattern_f":0.0,
     "spans_Word_order_f":0.0,
+    "transformer_loss":99.9441129311,
+    "spancat_loss":3890.6939574572
   }
 }

training/grammar_minor/spancat/cfg CHANGED Viewed

@@ -1,9 +1,8 @@
 {
   "labels":[
     "Verb_pattern",
-    "Determiners",
     "Numerals",
-    "Word_order",
     "Noun_number"
   ],
   "spans_key":"grammar_minor",

 {
   "labels":[
+    "Word_order",
     "Verb_pattern",
     "Numerals",
     "Noun_number"
   ],
   "spans_key":"grammar_minor",

training/grammar_minor/spancat/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0e0283722a11d5a844cd733d76a12574c63e598f946c2d5843a6f81d80ec9dbe
-size 4725555

 version https://git-lfs.github.com/spec/v1
+oid sha256:d61ee1924aa0506de865309bed18c6971257a33d78a8818bceadf0bf40302019
+size 4725039

training/grammar_minor/tokenizer CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f0f3f5297dc14c5fd94488174149bd87b5f24dff28e6be993eb3ea7a92e53417
-size 78126

 version https://git-lfs.github.com/spec/v1
+oid sha256:b014e8bba4958b120af2d0c1c63eabb7c00379f2bacaf10df7c5325efd2ea467
+size 77066

training/grammar_minor/transformer/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a214501cb8a98fc0d7934072baa83b46d144b0f255f60afd65c190c2ed876d61
-size 434208023

 version https://git-lfs.github.com/spec/v1
+oid sha256:4d42e4d76dc45e2eb8b60a150e5e0445a1ed86933a2f45007babeefa73b934ed
+size 434208137

training/grammar_minor/vocab/strings.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:169ca15549fd804567ae7d8222e75f320265558fb39b5b90add91046eb7a3723
-size 201573

 version https://git-lfs.github.com/spec/v1
+oid sha256:8fa56d47ed9e1b90027c9fe2cc5bf277964169dfa5d986559a698c63fa81ae72
+size 198085

training/punctuation/config.cfg CHANGED Viewed

@@ -97,12 +97,13 @@ frozen_components = []
 seed = 0
 gpu_allocator = "pytorch"
 dropout = 0.1
-patience = 1600
 max_epochs = 0
 max_steps = 20000
-eval_frequency = 200
 annotating_components = []
 before_to_disk = null
 [training.batcher]
 @batchers = "spacy.batch_by_padded.v1"
@@ -113,7 +114,7 @@ get_length = null
 [training.logger]
 @loggers = "spacy.WandbLogger.v3"
-project_name = "adwiser"
 remove_config_values = ["paths.train","paths.dev","corpora.train.path","corpora.dev.path"]
 model_log_interval = 1000
 log_dataset_dir = null

 seed = 0
 gpu_allocator = "pytorch"
 dropout = 0.1
+patience = 3000
 max_epochs = 0
 max_steps = 20000
+eval_frequency = 500
 annotating_components = []
 before_to_disk = null
+before_update = null
 [training.batcher]
 @batchers = "spacy.batch_by_padded.v1"
 [training.logger]
 @loggers = "spacy.WandbLogger.v3"
+project_name = "grammar_checker"
 remove_config_values = ["paths.train","paths.dev","corpora.train.path","corpora.dev.path"]
 model_log_interval = 1000
 log_dataset_dir = null

training/punctuation/meta.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "lang":"en",
   "name":"pipeline",
   "version":"0.0.0",
-  "spacy_version":">=3.3.0,<3.4.0",
   "description":"",
   "author":"",
   "email":"",
@@ -40,7 +40,7 @@
     "spans_sc_p":0.0,
     "spans_sc_r":0.0,
     "spans_Punctuation_f":0.0,
-    "transformer_loss":155.9655457946,
-    "spancat_loss":2200.9864988542
   }
 }

   "lang":"en",
   "name":"pipeline",
   "version":"0.0.0",
+  "spacy_version":">=3.5.0,<3.6.0",
   "description":"",
   "author":"",
   "email":"",
     "spans_sc_p":0.0,
     "spans_sc_r":0.0,
     "spans_Punctuation_f":0.0,
+    "transformer_loss":172.0570048221,
+    "spancat_loss":3528.349909951
   }
 }

training/punctuation/spancat/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:80d8d230b00ce3dfdf04de2e52fc4d14b2ac8e98e0c785e889c5e795940c06b2
 size 4723491

 version https://git-lfs.github.com/spec/v1
+oid sha256:03b50aed75d78f66bc433cddd3fe327f35b211ff17db30a5ce07f2c2663db003
 size 4723491

training/punctuation/tokenizer CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f0f3f5297dc14c5fd94488174149bd87b5f24dff28e6be993eb3ea7a92e53417
-size 78126

 version https://git-lfs.github.com/spec/v1
+oid sha256:b014e8bba4958b120af2d0c1c63eabb7c00379f2bacaf10df7c5325efd2ea467
+size 77066

training/punctuation/transformer/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2a3cab4830ec3d78cf951043924a896eb0146f4647f4adf3160ac035127f6fd6
-size 434208023

 version https://git-lfs.github.com/spec/v1
+oid sha256:de2907121fc5ce12a161537cd083df61e6c2e6d584a49e5171cac51c2ced0b32
+size 434208137

training/punctuation/vocab/strings.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:26013a15de37a4180447eed7bd1ab0359f9481e2ed063d9c0c5f6201ba164d30
-size 139281

 version https://git-lfs.github.com/spec/v1
+oid sha256:c8cf3162ed4f20a4c130de403ffbbb31eceb774b687e37e2a6d2309d2234a761
+size 139157

training/spelling/config.cfg CHANGED Viewed

@@ -97,12 +97,13 @@ frozen_components = []
 seed = 0
 gpu_allocator = "pytorch"
 dropout = 0.1
-patience = 1600
 max_epochs = 0
 max_steps = 20000
-eval_frequency = 200
 annotating_components = []
 before_to_disk = null
 [training.batcher]
 @batchers = "spacy.batch_by_padded.v1"
@@ -113,7 +114,7 @@ get_length = null
 [training.logger]
 @loggers = "spacy.WandbLogger.v3"
-project_name = "adwiser"
 remove_config_values = ["paths.train","paths.dev","corpora.train.path","corpora.dev.path"]
 model_log_interval = 1000
 log_dataset_dir = null
@@ -140,8 +141,8 @@ initial_rate = 0.00005
 spans_sc_f = 0.5
 spans_sc_p = 0.0
 spans_sc_r = 0.0
-spans_Capitalisation_f = 0.45
-spans_Spelling_f = 0.05
 [pretraining]

 seed = 0
 gpu_allocator = "pytorch"
 dropout = 0.1
+patience = 3000
 max_epochs = 0
 max_steps = 20000
+eval_frequency = 500
 annotating_components = []
 before_to_disk = null
+before_update = null
 [training.batcher]
 @batchers = "spacy.batch_by_padded.v1"
 [training.logger]
 @loggers = "spacy.WandbLogger.v3"
+project_name = "grammar_checker"
 remove_config_values = ["paths.train","paths.dev","corpora.train.path","corpora.dev.path"]
 model_log_interval = 1000
 log_dataset_dir = null
 spans_sc_f = 0.5
 spans_sc_p = 0.0
 spans_sc_r = 0.0
+spans_Capitalisation_f = 0.46
+spans_Spelling_f = 0.04
 [pretraining]

training/spelling/meta.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "lang":"en",
   "name":"pipeline",
   "version":"0.0.0",
-  "spacy_version":">=3.3.0,<3.4.0",
   "description":"",
   "author":"",
   "email":"",
@@ -21,8 +21,8 @@
     ],
     "spancat":[
-      "Spelling",
-      "Capitalisation"
     ]
   },
   "pipeline":[
@@ -42,7 +42,7 @@
     "spans_sc_r":0.0,
     "spans_Capitalisation_f":0.0,
     "spans_Spelling_f":0.0,
-    "transformer_loss":44.0993431434,
-    "spancat_loss":2243.7531562905
   }
 }

   "lang":"en",
   "name":"pipeline",
   "version":"0.0.0",
+  "spacy_version":">=3.5.0,<3.6.0",
   "description":"",
   "author":"",
   "email":"",
     ],
     "spancat":[
+      "Capitalisation",
+      "Spelling"
     ]
   },
   "pipeline":[
     "spans_sc_r":0.0,
     "spans_Capitalisation_f":0.0,
     "spans_Spelling_f":0.0,
+    "transformer_loss":66.6583146576,
+    "spancat_loss":3508.9703819749
   }
 }

training/spelling/spancat/cfg CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "labels":[
-    "Spelling",
-    "Capitalisation"
   ],
   "spans_key":"spelling",
   "threshold":0.5,

 {
   "labels":[
+    "Capitalisation",
+    "Spelling"
   ],
   "spans_key":"spelling",
   "threshold":0.5,

training/spelling/spancat/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9a115c30432686880e39e77d6d3d1a862d44334c8711dba4113575f85baa9d1a
 size 4724007

 version https://git-lfs.github.com/spec/v1
+oid sha256:9f921a2fffab88db8651cf3858d1acac3c73c26e5014a1fc55da21bb39ac72fe
 size 4724007

training/spelling/tokenizer CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f0f3f5297dc14c5fd94488174149bd87b5f24dff28e6be993eb3ea7a92e53417
-size 78126

 version https://git-lfs.github.com/spec/v1
+oid sha256:b014e8bba4958b120af2d0c1c63eabb7c00379f2bacaf10df7c5325efd2ea467
+size 77066

training/spelling/transformer/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:92ad13e7ffe5523eb6e644ff92cfb78a909ff71756d3c80cff1e7124d1559835
-size 434208023

 version https://git-lfs.github.com/spec/v1
+oid sha256:f7d615362cf525b2373d9237d580f6b0f34e79b63c25e47be2d4b075de43cfe4
+size 434208137

training/spelling/vocab/strings.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ac0eded0abfa2f25a418b9fd9b9164a068608ecd16746d0b6595b53e508eff7b
-size 597160

 version https://git-lfs.github.com/spec/v1
+oid sha256:789839bc7c391d42d0ee973fbde3d4fefe329020e0410d3341bd023ef3953dcc
+size 597048

training/vocabulary/config.cfg CHANGED Viewed

@@ -97,12 +97,13 @@ frozen_components = []
 seed = 0
 gpu_allocator = "pytorch"
 dropout = 0.1
-patience = 1600
 max_epochs = 0
 max_steps = 20000
-eval_frequency = 200
 annotating_components = []
 before_to_disk = null
 [training.batcher]
 @batchers = "spacy.batch_by_padded.v1"
@@ -113,7 +114,7 @@ get_length = null
 [training.logger]
 @loggers = "spacy.WandbLogger.v3"
-project_name = "adwiser"
 remove_config_values = ["paths.train","paths.dev","corpora.train.path","corpora.dev.path"]
 model_log_interval = 1000
 log_dataset_dir = null
@@ -140,10 +141,11 @@ initial_rate = 0.00005
 spans_sc_f = 0.5
 spans_sc_p = 0.0
 spans_sc_r = 0.0
-spans_Category_confusion_f = 0.11
-spans_Formational_affixes_f = 0.23
-spans_lex_item_choice_f = 0.03
-spans_lex_part_choice_f = 0.13
 [pretraining]

 seed = 0
 gpu_allocator = "pytorch"
 dropout = 0.1
+patience = 3000
 max_epochs = 0
 max_steps = 20000
+eval_frequency = 500
 annotating_components = []
 before_to_disk = null
+before_update = null
 [training.batcher]
 @batchers = "spacy.batch_by_padded.v1"
 [training.logger]
 @loggers = "spacy.WandbLogger.v3"
+project_name = "grammar_checker"
 remove_config_values = ["paths.train","paths.dev","corpora.train.path","corpora.dev.path"]
 model_log_interval = 1000
 log_dataset_dir = null
 spans_sc_f = 0.5
 spans_sc_p = 0.0
 spans_sc_r = 0.0
+spans_Category_confusion_f = 0.09
+spans_Formational_affixes_f = 0.18
+spans_Word_choice_f = 0.12
+spans_lex_item_choice_f = 0.02
+spans_lex_part_choice_f = 0.1
 [pretraining]

training/vocabulary/meta.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "lang":"en",
   "name":"pipeline",
   "version":"0.0.0",
-  "spacy_version":">=3.3.0,<3.4.0",
   "description":"",
   "author":"",
   "email":"",
@@ -21,10 +21,11 @@
     ],
     "spancat":[
-      "lex_part_choice",
       "Category_confusion",
       "Formational_affixes",
-      "lex_item_choice"
     ]
   },
   "pipeline":[
@@ -44,9 +45,10 @@
     "spans_sc_r":0.0,
     "spans_Category_confusion_f":0.0,
     "spans_Formational_affixes_f":0.0,
     "spans_lex_item_choice_f":0.0,
     "spans_lex_part_choice_f":0.0,
-    "transformer_loss":125.5026042824,
-    "spancat_loss":5766.8357456917
   }
 }

   "lang":"en",
   "name":"pipeline",
   "version":"0.0.0",
+  "spacy_version":">=3.5.0,<3.6.0",
   "description":"",
   "author":"",
   "email":"",
     ],
     "spancat":[
       "Category_confusion",
+      "lex_item_choice",
+      "lex_part_choice",
       "Formational_affixes",
+      "Word_choice"
     ]
   },
   "pipeline":[
     "spans_sc_r":0.0,
     "spans_Category_confusion_f":0.0,
     "spans_Formational_affixes_f":0.0,
+    "spans_Word_choice_f":0.0,
     "spans_lex_item_choice_f":0.0,
     "spans_lex_part_choice_f":0.0,
+    "transformer_loss":173.7833097329,
+    "spancat_loss":12657.1661671125
   }
 }

training/vocabulary/spancat/cfg CHANGED Viewed

@@ -1,9 +1,10 @@
 {
   "labels":[
-    "lex_part_choice",
     "Category_confusion",
     "Formational_affixes",
-    "lex_item_choice"
   ],
   "spans_key":"vocabulary",
   "threshold":0.5,

 {
   "labels":[
     "Category_confusion",
+    "lex_item_choice",
+    "lex_part_choice",
     "Formational_affixes",
+    "Word_choice"
   ],
   "spans_key":"vocabulary",
   "threshold":0.5,

training/vocabulary/spancat/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:957b3c814e94d3c5b233a697e7556a64d7529130f06b649c3e056b5a9511c079
-size 4725039

 version https://git-lfs.github.com/spec/v1
+oid sha256:d56402bec71548a712f888f0db3d34597457fdfff031ad827ccbce7bbb42d079
+size 4725555

training/vocabulary/tokenizer CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f0f3f5297dc14c5fd94488174149bd87b5f24dff28e6be993eb3ea7a92e53417
-size 78126

 version https://git-lfs.github.com/spec/v1
+oid sha256:b014e8bba4958b120af2d0c1c63eabb7c00379f2bacaf10df7c5325efd2ea467
+size 77066

training/vocabulary/transformer/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1fac564f7a1784543ea4ea9f680cce25f7258ef0df9832544f826506318cd323
-size 434208023

 version https://git-lfs.github.com/spec/v1
+oid sha256:4f273e80465b0b3f1fcdc6df201ca82089a8c5578832c4f216281d883398e3d3
+size 434208137

training/vocabulary/vocab/strings.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:820d6e5b6b5855296d3f920b104d62fb7d1cd1edd2b095c10c01b481a1a5f388
-size 192211

 version https://git-lfs.github.com/spec/v1
+oid sha256:68ef8ebb8714b2871e7f5a109d6ce10f255ddb33230b3b0f4ffeae67e53ae7f9
+size 199757