Priyanka-Balivada commited on
Commit
d80a2db
1 Parent(s): 0e3fea1

Update spaCy pipeline

Browse files
README.md CHANGED
@@ -13,13 +13,13 @@ model-index:
13
  metrics:
14
  - name: NER Precision
15
  type: precision
16
- value: 0.1791044776
17
  - name: NER Recall
18
  type: recall
19
- value: 0.3333333333
20
  - name: NER F Score
21
  type: f_score
22
- value: 0.2330097087
23
  ---
24
  | Feature | Description |
25
  | --- | --- |
@@ -49,8 +49,8 @@ model-index:
49
 
50
  | Type | Score |
51
  | --- | --- |
52
- | `ENTS_F` | 23.30 |
53
- | `ENTS_P` | 17.91 |
54
- | `ENTS_R` | 33.33 |
55
- | `TRANSFORMER_LOSS` | 9550392.37 |
56
- | `NER_LOSS` | 2471774.14 |
 
13
  metrics:
14
  - name: NER Precision
15
  type: precision
16
+ value: 1.0
17
  - name: NER Recall
18
  type: recall
19
+ value: 1.0
20
  - name: NER F Score
21
  type: f_score
22
+ value: 1.0
23
  ---
24
  | Feature | Description |
25
  | --- | --- |
 
49
 
50
  | Type | Score |
51
  | --- | --- |
52
+ | `ENTS_F` | 100.00 |
53
+ | `ENTS_P` | 100.00 |
54
+ | `ENTS_R` | 100.00 |
55
+ | `TRANSFORMER_LOSS` | 0.00 |
56
+ | `NER_LOSS` | 0.00 |
config.cfg CHANGED
@@ -1,6 +1,6 @@
1
  [paths]
2
  train = "./drive/MyDrive/Product IBM/train.spacy"
3
- dev = "./drive/MyDrive/Product IBM/test.spacy"
4
  vectors = null
5
  init_tok2vec = null
6
 
@@ -92,7 +92,7 @@ gpu_allocator = ${system.gpu_allocator}
92
  dropout = 0.1
93
  patience = 1600
94
  max_epochs = 0
95
- max_steps = 2000
96
  eval_frequency = 200
97
  frozen_components = []
98
  annotating_components = []
 
1
  [paths]
2
  train = "./drive/MyDrive/Product IBM/train.spacy"
3
+ dev = "./drive/MyDrive/Product IBM/train.spacy"
4
  vectors = null
5
  init_tok2vec = null
6
 
 
92
  dropout = 0.1
93
  patience = 1600
94
  max_epochs = 0
95
+ max_steps = 1000
96
  eval_frequency = 200
97
  frozen_components = []
98
  annotating_components = []
en_Product_Catalog-any-py3-none-any.whl CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:2dfc30086b12283630b17f5fa4f9859e658ab058c10af3191f9c2b28990336b1
3
- size 421959211
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:a93a8a8c356b9d2dd1b85a86d90263f53c02f3bced93afe3587590db7c10c187
3
+ size 424180572
meta.json CHANGED
@@ -40,48 +40,43 @@
40
 
41
  ],
42
  "performance":{
43
- "ents_f":0.2330097087,
44
- "ents_p":0.1791044776,
45
- "ents_r":0.3333333333,
46
  "ents_per_type":{
47
  "Product":{
48
- "p":0.1176470588,
49
- "r":0.25,
50
- "f":0.16
51
  },
52
- "Metering":{
53
- "p":0.2380952381,
54
- "r":0.625,
55
- "f":0.3448275862
56
  },
57
- "Reservoir":{
58
- "p":0.0,
59
- "r":0.0,
60
- "f":0.0
61
  },
62
  "Operating":{
63
- "p":0.3076923077,
64
- "r":0.75,
65
- "f":0.4363636364
66
  },
67
- "Lubricant":{
68
- "p":0.0,
69
- "r":0.0,
70
- "f":0.0
71
  },
72
  "PAGE":{
73
- "p":0.0,
74
- "r":0.0,
75
- "f":0.0
76
- },
77
- "Page":{
78
- "p":0.0,
79
- "r":0.0,
80
- "f":0.0
81
  }
82
  },
83
- "transformer_loss":95503.9236874724,
84
- "ner_loss":24717.7414470388
85
  },
86
  "requirements":[
87
  "spacy-transformers>=1.3.4,<1.4.0"
 
40
 
41
  ],
42
  "performance":{
43
+ "ents_f":1.0,
44
+ "ents_p":1.0,
45
+ "ents_r":1.0,
46
  "ents_per_type":{
47
  "Product":{
48
+ "p":1.0,
49
+ "r":1.0,
50
+ "f":1.0
51
  },
52
+ "Lubricant":{
53
+ "p":1.0,
54
+ "r":1.0,
55
+ "f":1.0
56
  },
57
+ "Metering":{
58
+ "p":1.0,
59
+ "r":1.0,
60
+ "f":1.0
61
  },
62
  "Operating":{
63
+ "p":1.0,
64
+ "r":1.0,
65
+ "f":1.0
66
  },
67
+ "Reservoir":{
68
+ "p":1.0,
69
+ "r":1.0,
70
+ "f":1.0
71
  },
72
  "PAGE":{
73
+ "p":1.0,
74
+ "r":1.0,
75
+ "f":1.0
 
 
 
 
 
76
  }
77
  },
78
+ "transformer_loss":0.0000308286,
79
+ "ner_loss":0.0000346953
80
  },
81
  "requirements":[
82
  "spacy-transformers>=1.3.4,<1.4.0"
ner/model CHANGED
Binary files a/ner/model and b/ner/model differ
 
transformer/model CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:c69b47953727318e86bb2f42cdf017eb39b85c76e7ada68add0832bac7cc645a
3
  size 502027402
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:2274c1ec3f56cc7512c11a4bd8b991fe76d8cbe2412c37236430a833ab26a7d2
3
  size 502027402
vocab/strings.json CHANGED
@@ -63,24 +63,17 @@
63
  "):",
64
  "*",
65
  ",",
66
- ",016-0,05",
67
- ",016-013",
68
  ",03",
69
- ",05",
70
  ",20",
71
  ",25",
72
  ",38",
73
  ",97",
74
- ",ddd-d,dd",
75
- ",ddd-ddd",
76
  "-",
77
  "-((",
78
  "-))",
79
  "-/",
80
  "-0",
81
  "-3",
82
- "-32",
83
- "-33",
84
  "-8",
85
  "-D",
86
  "-O",
@@ -140,7 +133,6 @@
140
  "0,0018",
141
  "0,003",
142
  "0,03",
143
- "0,05",
144
  "0,052",
145
  "0,066",
146
  "0,20",
@@ -149,22 +141,6 @@
149
  "0,5",
150
  "0,6",
151
  "0.0",
152
- "0.001",
153
- "0.001-0.0030",
154
- "0.001-0.008",
155
- "0.0012",
156
- "0.0012-0.0305",
157
- "0.0030",
158
- "0.0030-0.0244",
159
- "0.0061",
160
- "0.0061-0.0793",
161
- "0.0079",
162
- "0.0079-0.0799",
163
- "0.008",
164
- "0.0244",
165
- "0.0305",
166
- "0.0793",
167
- "0.0799",
168
  "0.086",
169
  "0.12",
170
  "0.13",
@@ -182,27 +158,11 @@
182
  "0.91",
183
  "0.o",
184
  "000",
185
- "001",
186
- "002",
187
- "002-050",
188
  "003",
189
- "008",
190
- "012",
191
- "013",
192
- "016",
193
  "018",
194
- "02",
195
- "02-050",
196
- "030",
197
- "040",
198
  "045",
199
- "05",
200
- "05-040",
201
- "050",
202
  "052",
203
- "061",
204
  "066",
205
- "079",
206
  "086",
207
  "0_0",
208
  "0_o",
@@ -215,11 +175,8 @@
215
  "1.83",
216
  "1.88",
217
  "10",
218
- "10-130",
219
  "100",
220
- "100-315",
221
  "1000",
222
- "103",
223
  "10a.m",
224
  "10a.m.",
225
  "10p.m",
@@ -230,45 +187,20 @@
230
  "11p.m",
231
  "11p.m.",
232
  "12",
233
- "1200",
234
- "1200-3500",
235
- "124",
236
- "126",
237
- "127",
238
- "127-240",
239
- "128",
240
  "12a.m",
241
  "12a.m.",
242
  "12p.m",
243
  "12p.m.",
244
- "13",
245
- "13-131",
246
- "130",
247
- "131",
248
- "132",
249
- "133",
250
- "134",
251
- "136",
252
  "14",
253
  "140",
254
- "140-300",
255
- "1450",
256
- "1450-4570",
257
- "1453",
258
  "15",
259
- "150",
260
- "153",
261
  "156",
262
  "16",
263
  "167",
264
  "17",
265
  "18",
266
- "180",
267
  "1812",
268
  "1826",
269
- "183",
270
- "1850",
271
- "1850-3500",
272
  "1a.m",
273
  "1a.m.",
274
  "1p.m",
@@ -279,44 +211,31 @@
279
  "2.39",
280
  "20",
281
  "200",
282
- "2030",
283
- "2030-4350",
284
  "2156",
285
- "2180",
286
- "2183",
287
  "22",
288
  "23",
289
  "24",
290
  "24,6",
291
  "240",
292
- "244",
293
  "250",
294
  "26",
295
  "28",
296
  "283167",
297
  "289",
298
  "29",
299
- "2HV",
300
  "2a.m",
301
  "2a.m.",
302
- "2hv",
303
  "2p.m",
304
  "2p.m.",
305
  "3",
306
  "3.96",
307
  "30",
308
- "300",
309
- "303",
310
- "305",
311
  "31",
312
- "315",
313
  "33",
314
  "333",
315
  "34",
316
  "35",
317
- "350",
318
  "3500",
319
- "353",
320
  "36",
321
  "38",
322
  "392",
@@ -331,17 +250,10 @@
331
  "4",
332
  "4,6",
333
  "40",
334
- "400",
335
  "405",
336
- "41",
337
  "42",
338
  "435",
339
- "4350",
340
- "4353",
341
  "45",
342
- "450",
343
- "453",
344
- "4570",
345
  "462",
346
  "4:8",
347
  "4a.m",
@@ -365,8 +277,6 @@
365
  "5p.m.",
366
  "6",
367
  "6-2",
368
- "60",
369
- "600",
370
  "652",
371
  "667",
372
  "676",
@@ -378,8 +288,6 @@
378
  "7",
379
  "715",
380
  "74",
381
- "793",
382
- "799",
383
  "7a.m",
384
  "7a.m.",
385
  "7p.m",
@@ -396,12 +304,8 @@
396
  "826",
397
  "82676",
398
  "82885",
399
- "83",
400
- "83-240",
401
  "83667",
402
  "846",
403
- "850",
404
- "870",
405
  "876715",
406
  "885",
407
  "886",
@@ -544,7 +448,6 @@
544
  "Aug.",
545
  "August",
546
  "B",
547
- "B-doser",
548
  "Bil",
549
  "Bros",
550
  "Bros.",
@@ -677,9 +580,6 @@
677
  "Ky",
678
  "Ky.",
679
  "L",
680
- "L-1",
681
- "LG",
682
- "LG-doser",
683
  "La",
684
  "La.",
685
  "Let",
@@ -800,7 +700,6 @@
800
  "PW",
801
  "Pa",
802
  "Pa.",
803
- "Page",
804
  "Pal",
805
  "Pennsylvania",
806
  "Ph",
@@ -818,10 +717,6 @@
818
  "S",
819
  "S.C.",
820
  "S30",
821
- "SL-1",
822
- "SL-32",
823
- "SL-32HV",
824
- "SL-33",
825
  "Sen",
826
  "Sen.",
827
  "Sep",
@@ -859,7 +754,6 @@
859
  "Those",
860
  "V",
861
  "V.V",
862
- "VR",
863
  "V_V",
864
  "Va",
865
  "Va.",
@@ -897,7 +791,6 @@
897
  "X++",
898
  "X-ddd",
899
  "X-ddd-d",
900
- "X-xxxx",
901
  "X.",
902
  "X.X",
903
  "X.X.",
@@ -906,10 +799,6 @@
906
  "XD",
907
  "XDD",
908
  "XX",
909
- "XX-d",
910
- "XX-dd",
911
- "XX-ddXX",
912
- "XX-xxxx",
913
  "XXX",
914
  "XXX-ddd",
915
  "XXXX",
@@ -983,7 +872,6 @@
983
  "adjustable",
984
  "adm",
985
  "adm.",
986
- "age",
987
  "ai",
988
  "ak",
989
  "ak.",
@@ -1005,16 +893,12 @@
1005
  "ark",
1006
  "ark.",
1007
  "as",
1008
- "asL",
1009
  "ash",
1010
- "asl",
1011
  "ass",
1012
  "aug",
1013
  "aug.",
1014
  "ave",
1015
- "ax.",
1016
  "b",
1017
- "b-doser",
1018
  "b.",
1019
  "because",
1020
  "bil",
@@ -1063,10 +947,6 @@
1063
  "d.d",
1064
  "d.dd",
1065
  "d.ddd",
1066
- "d.ddd-d.ddd",
1067
- "d.ddd-d.dddd",
1068
- "d.dddd",
1069
- "d.dddd-d.dddd",
1070
  "d.x",
1071
  "d:d",
1072
  "dX",
@@ -1075,12 +955,9 @@
1075
  "dare",
1076
  "dd",
1077
  "dd,d",
1078
- "dd-ddd",
1079
  "dd.dd",
1080
  "ddd",
1081
- "ddd-ddd",
1082
  "dddd",
1083
- "dddd-dddd",
1084
  "ddx.x",
1085
  "ddx.x.",
1086
  "dec",
@@ -1095,7 +972,6 @@
1095
  "doin'",
1096
  "doing",
1097
  "doin\u2019",
1098
- "doser",
1099
  "dr",
1100
  "dr.",
1101
  "dx.x",
@@ -1190,7 +1066,6 @@
1190
  "ing",
1191
  "inn",
1192
  "in\u2019",
1193
- "ion",
1194
  "is",
1195
  "is.",
1196
  "iss",
@@ -1219,15 +1094,12 @@
1219
  "ky",
1220
  "ky.",
1221
  "l",
1222
- "l-1",
1223
  "l.",
1224
  "la",
1225
  "la.",
1226
  "let",
1227
  "let's",
1228
  "let\u2019s",
1229
- "lg",
1230
- "lg-doser",
1231
  "lif",
1232
  "ll",
1233
  "ll.",
@@ -1247,9 +1119,6 @@
1247
  "mar.",
1248
  "mass",
1249
  "mass.",
1250
- "max",
1251
- "max.",
1252
- "max.150",
1253
  "may",
1254
  "ma\u2019am",
1255
  "mcp",
@@ -1378,7 +1247,6 @@
1378
  "pm",
1379
  "pps30",
1380
  "pr.",
1381
- "prelubrication",
1382
  "product",
1383
  "prof",
1384
  "prof.",
@@ -1412,7 +1280,6 @@
1412
  "sep.",
1413
  "sept",
1414
  "sept.",
1415
- "ser",
1416
  "sh.",
1417
  "sha",
1418
  "shall",
@@ -1420,10 +1287,6 @@
1420
  "she's",
1421
  "she\u2019s",
1422
  "should",
1423
- "sl-1",
1424
- "sl-32",
1425
- "sl-32hv",
1426
- "sl-33",
1427
  "somethin",
1428
  "somethin'",
1429
  "something",
@@ -1478,7 +1341,6 @@
1478
  "va.",
1479
  "ve",
1480
  "vin",
1481
- "vr",
1482
  "vs",
1483
  "vs.",
1484
  "w",
@@ -1518,7 +1380,6 @@
1518
  "x'xxxx",
1519
  "x-ddd",
1520
  "x-ddd-d",
1521
- "x-xxxx",
1522
  "x.",
1523
  "x.X",
1524
  "x.d",
@@ -1540,17 +1401,10 @@
1540
  "xx'",
1541
  "xx'x",
1542
  "xx'xx",
1543
- "xx-d",
1544
- "xx-dd",
1545
- "xx-ddxx",
1546
- "xx-xxxx",
1547
  "xx.",
1548
- "xxX",
1549
  "xxx",
1550
  "xxx'x",
1551
  "xxx-ddd",
1552
- "xxx.",
1553
- "xxx.ddd",
1554
  "xxx/xx",
1555
  "xxxdd",
1556
  "xxxx",
 
63
  "):",
64
  "*",
65
  ",",
 
 
66
  ",03",
 
67
  ",20",
68
  ",25",
69
  ",38",
70
  ",97",
 
 
71
  "-",
72
  "-((",
73
  "-))",
74
  "-/",
75
  "-0",
76
  "-3",
 
 
77
  "-8",
78
  "-D",
79
  "-O",
 
133
  "0,0018",
134
  "0,003",
135
  "0,03",
 
136
  "0,052",
137
  "0,066",
138
  "0,20",
 
141
  "0,5",
142
  "0,6",
143
  "0.0",
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
144
  "0.086",
145
  "0.12",
146
  "0.13",
 
158
  "0.91",
159
  "0.o",
160
  "000",
 
 
 
161
  "003",
 
 
 
 
162
  "018",
 
 
 
 
163
  "045",
 
 
 
164
  "052",
 
165
  "066",
 
166
  "086",
167
  "0_0",
168
  "0_o",
 
175
  "1.83",
176
  "1.88",
177
  "10",
 
178
  "100",
 
179
  "1000",
 
180
  "10a.m",
181
  "10a.m.",
182
  "10p.m",
 
187
  "11p.m",
188
  "11p.m.",
189
  "12",
 
 
 
 
 
 
 
190
  "12a.m",
191
  "12a.m.",
192
  "12p.m",
193
  "12p.m.",
 
 
 
 
 
 
 
 
194
  "14",
195
  "140",
 
 
 
 
196
  "15",
 
 
197
  "156",
198
  "16",
199
  "167",
200
  "17",
201
  "18",
 
202
  "1812",
203
  "1826",
 
 
 
204
  "1a.m",
205
  "1a.m.",
206
  "1p.m",
 
211
  "2.39",
212
  "20",
213
  "200",
 
 
214
  "2156",
 
 
215
  "22",
216
  "23",
217
  "24",
218
  "24,6",
219
  "240",
 
220
  "250",
221
  "26",
222
  "28",
223
  "283167",
224
  "289",
225
  "29",
 
226
  "2a.m",
227
  "2a.m.",
 
228
  "2p.m",
229
  "2p.m.",
230
  "3",
231
  "3.96",
232
  "30",
 
 
 
233
  "31",
 
234
  "33",
235
  "333",
236
  "34",
237
  "35",
 
238
  "3500",
 
239
  "36",
240
  "38",
241
  "392",
 
250
  "4",
251
  "4,6",
252
  "40",
 
253
  "405",
 
254
  "42",
255
  "435",
 
 
256
  "45",
 
 
 
257
  "462",
258
  "4:8",
259
  "4a.m",
 
277
  "5p.m.",
278
  "6",
279
  "6-2",
 
 
280
  "652",
281
  "667",
282
  "676",
 
288
  "7",
289
  "715",
290
  "74",
 
 
291
  "7a.m",
292
  "7a.m.",
293
  "7p.m",
 
304
  "826",
305
  "82676",
306
  "82885",
 
 
307
  "83667",
308
  "846",
 
 
309
  "876715",
310
  "885",
311
  "886",
 
448
  "Aug.",
449
  "August",
450
  "B",
 
451
  "Bil",
452
  "Bros",
453
  "Bros.",
 
580
  "Ky",
581
  "Ky.",
582
  "L",
 
 
 
583
  "La",
584
  "La.",
585
  "Let",
 
700
  "PW",
701
  "Pa",
702
  "Pa.",
 
703
  "Pal",
704
  "Pennsylvania",
705
  "Ph",
 
717
  "S",
718
  "S.C.",
719
  "S30",
 
 
 
 
720
  "Sen",
721
  "Sen.",
722
  "Sep",
 
754
  "Those",
755
  "V",
756
  "V.V",
 
757
  "V_V",
758
  "Va",
759
  "Va.",
 
791
  "X++",
792
  "X-ddd",
793
  "X-ddd-d",
 
794
  "X.",
795
  "X.X",
796
  "X.X.",
 
799
  "XD",
800
  "XDD",
801
  "XX",
 
 
 
 
802
  "XXX",
803
  "XXX-ddd",
804
  "XXXX",
 
872
  "adjustable",
873
  "adm",
874
  "adm.",
 
875
  "ai",
876
  "ak",
877
  "ak.",
 
893
  "ark",
894
  "ark.",
895
  "as",
 
896
  "ash",
 
897
  "ass",
898
  "aug",
899
  "aug.",
900
  "ave",
 
901
  "b",
 
902
  "b.",
903
  "because",
904
  "bil",
 
947
  "d.d",
948
  "d.dd",
949
  "d.ddd",
 
 
 
 
950
  "d.x",
951
  "d:d",
952
  "dX",
 
955
  "dare",
956
  "dd",
957
  "dd,d",
 
958
  "dd.dd",
959
  "ddd",
 
960
  "dddd",
 
961
  "ddx.x",
962
  "ddx.x.",
963
  "dec",
 
972
  "doin'",
973
  "doing",
974
  "doin\u2019",
 
975
  "dr",
976
  "dr.",
977
  "dx.x",
 
1066
  "ing",
1067
  "inn",
1068
  "in\u2019",
 
1069
  "is",
1070
  "is.",
1071
  "iss",
 
1094
  "ky",
1095
  "ky.",
1096
  "l",
 
1097
  "l.",
1098
  "la",
1099
  "la.",
1100
  "let",
1101
  "let's",
1102
  "let\u2019s",
 
 
1103
  "lif",
1104
  "ll",
1105
  "ll.",
 
1119
  "mar.",
1120
  "mass",
1121
  "mass.",
 
 
 
1122
  "may",
1123
  "ma\u2019am",
1124
  "mcp",
 
1247
  "pm",
1248
  "pps30",
1249
  "pr.",
 
1250
  "product",
1251
  "prof",
1252
  "prof.",
 
1280
  "sep.",
1281
  "sept",
1282
  "sept.",
 
1283
  "sh.",
1284
  "sha",
1285
  "shall",
 
1287
  "she's",
1288
  "she\u2019s",
1289
  "should",
 
 
 
 
1290
  "somethin",
1291
  "somethin'",
1292
  "something",
 
1341
  "va.",
1342
  "ve",
1343
  "vin",
 
1344
  "vs",
1345
  "vs.",
1346
  "w",
 
1380
  "x'xxxx",
1381
  "x-ddd",
1382
  "x-ddd-d",
 
1383
  "x.",
1384
  "x.X",
1385
  "x.d",
 
1401
  "xx'",
1402
  "xx'x",
1403
  "xx'xx",
 
 
 
 
1404
  "xx.",
 
1405
  "xxx",
1406
  "xxx'x",
1407
  "xxx-ddd",
 
 
1408
  "xxx/xx",
1409
  "xxxdd",
1410
  "xxxx",