it_spacy_ner_trf / vocab /strings.json
nickprock's picture
Update spaCy pipeline
1ded0d6
[
"\t",
"\n",
" ",
" ",
"\"",
"'",
"''",
"'-(",
"'-)",
"(",
"(((",
"(*>",
"(*_*)",
"(-8",
"(-:",
"(-;",
"(-_-)",
"(-d",
"(._.)",
"(:",
"(;",
"(=",
"(>_<)",
"(^_^)",
"(o:",
"(x:",
"(x_x)",
"(\u00ac_\u00ac)",
"(\u0ca0_\u0ca0)",
"(\u256f\u00b0\u25a1\u00b0\uff09\u256f\ufe35\u253b\u2501\u253b",
")",
")))",
")-:",
")/\u00af",
"):",
"*",
",",
"-",
"-((",
"-))",
"-/",
"-0",
"-3",
"-8",
"-D",
"-O",
"-P",
"-X",
"-_-",
"-__-",
"-d",
"-o",
"-p",
"-up",
"-x",
"-|",
".",
"..",
"...",
"....",
".C.",
"._.",
".a.",
".d.",
".so",
"/",
"/3",
"/d",
"0",
"0.0",
"0.o",
"0_0",
"0_o",
"1",
"3",
"33",
"333",
"8",
"8)",
"8-",
"8-)",
"8-D",
"8-d",
"8D",
"8d",
":",
":'(",
":')",
":'-(",
":'-)",
":(",
":((",
":(((",
":()",
":)",
":))",
":)))",
":*",
":-(",
":-((",
":-(((",
":-)",
":-))",
":-)))",
":-*",
":-/",
":-0",
":-3",
":->",
":-D",
":-O",
":-P",
":-X",
":-]",
":-d",
":-o",
":-p",
":-x",
":-|",
":-}",
":/",
":0",
":1",
":3",
":>",
":D",
":O",
":P",
":X",
":]",
":d",
":o",
":o)",
":p",
":x",
":x)",
":|",
":}",
":\u2019(",
":\u2019)",
":\u2019-(",
":\u2019-)",
";",
";)",
";-)",
";-D",
";-X",
";-d",
";D",
";X",
";_;",
";d",
"<",
"<.<",
"</3",
"</d",
"<3",
"<33",
"<333",
"<d",
"<dd",
"<ddd",
"<space>",
"<xxxx>",
"=",
"=(",
"=)",
"=/",
"=3",
"=D",
"=X",
"=[",
"=]",
"=d",
"=|",
">",
">.<",
">.>",
">:(",
">:o",
">:x",
"><(((*>",
"@",
"@_@",
"A",
"Armani",
"Art",
"Art.",
"Avv",
"Avv.",
"C",
"C++",
"C.",
"C.so",
"Ciao",
"Civ",
"Civ.",
"Cod",
"Cod.",
"Cost",
"Cost.",
"D",
"E",
"E'",
"E\u2019",
"F",
"F.",
"G",
"Giacomo",
"J",
"Jr",
"Jr.",
"K",
"K.",
"L",
"L'",
"L'art.",
"L\u2019",
"L\u2019art.",
"M",
"Milano",
"O",
"O.O",
"O.o",
"O_O",
"O_o",
"P",
"PER",
"Proc",
"Proc.",
"S",
"St",
"St.",
"V",
"V.V",
"V_V",
"Vivo",
"X'",
"X'xxx.",
"X++",
"X.",
"X.X",
"X.x",
"X.xx",
"XD",
"XDD",
"XX",
"XXX",
"X_X",
"X_x",
"Xx",
"Xx.",
"Xxx",
"Xxx.",
"Xxxx",
"Xxxx.",
"Xxxxx",
"X\u2019",
"X\u2019xxx.",
"[",
"[-:",
"[:",
"[=",
"\\",
"\\\")",
"\\n",
"\\t",
"\\x",
"]",
"]=",
"^",
"^_^",
"^__^",
"^___^",
"_*)",
"_-)",
"_.)",
"_<)",
"_^)",
"__-",
"__^",
"_\u00ac)",
"_\u0ca0)",
"a",
"a.",
"a.C.",
"a.c.",
"ace",
"ag.",
"ail",
"al",
"al.",
"all",
"all'",
"all'art.",
"all-path",
"all\u2019",
"all\u2019art.",
"ani",
"ano",
"armani",
"art",
"art.",
"artt",
"artt.",
"ass",
"ath",
"att",
"att.",
"avv",
"avv.",
"b",
"b.",
"by",
"by-pass",
"c",
"c++",
"c.",
"c.d",
"c.d.",
"c.so",
"c/c",
"cc.",
"ce>",
"centro",
"centro-sinistra",
"check",
"check-up",
"ciao",
"civ",
"civ.",
"cm",
"cm.",
"cod",
"cod.",
"col",
"col.",
"cost",
"cost.",
"d",
"d)",
"d-",
"d-)",
"d-X",
"d.",
"d.C.",
"d.c.",
"d.d",
"d.x",
"dX",
"d_d",
"d_x",
"da",
"dall'",
"dall'art.",
"dall\u2019",
"dall\u2019art.",
"dd",
"ddd",
"de",
"de\"",
"dell'",
"dell'art.",
"dell\u2019",
"dell\u2019art.",
"distr",
"distr.",
"e",
"e'",
"e-mail",
"e.",
"e/o",
"ecc",
"ecc.",
"eck",
"eek",
"el.",
"end",
"est",
"etc",
"etc.",
"ett",
"e\u2019",
"f",
"f.",
"g",
"g.",
"giacomo",
"h",
"h.",
"i",
"i.",
"iao",
"it",
"iv.",
"ivo",
"j",
"j.",
"jr",
"jr.",
"k",
"k.",
"l",
"l'",
"l'art.",
"l.",
"lavoro",
"ll'",
"ll\u2019",
"l\u2019",
"l\u2019art.",
"m",
"m.",
"mail",
"milano",
"n",
"n.",
"n.c",
"nell'",
"nell'art.",
"nell\u2019",
"nell\u2019art.",
"nord",
"nord-est",
"n\u00b0",
"o",
"o.",
"o.0",
"o.O",
"o.o",
"o_0",
"o_O",
"o_o",
"oc.",
"od.",
"of.",
"ol.",
"omo",
"ono",
"ord",
"oro",
"ost",
"p",
"p.",
"p.a",
"pag",
"pag.",
"pass",
"path",
"po",
"po'",
"po\u2019",
"proc",
"proc.",
"prof",
"prof.",
"q",
"q.",
"r",
"r.",
"r.l",
"roc",
"rof",
"rt.",
"rtt",
"s",
"s.",
"s.n.c",
"s.p.a",
"s.p.a.",
"s.r.l",
"sett",
"sett.",
"sett..",
"sinistra",
"sono",
"space",
"ss",
"ss.",
"st",
"st.",
"str",
"t",
"t.",
"t..",
"tc.",
"tel",
"tel.",
"tr.",
"tra",
"tro",
"tt.",
"u",
"u.",
"up",
"v",
"v.",
"v.v",
"v_v",
"vivo",
"vv.",
"w",
"w.",
"week",
"week-end",
"x",
"x'",
"x'xxx.",
"x-xxxx",
"x.",
"x.X",
"x.X.",
"x.d",
"x.x",
"x.x.",
"x.x.x",
"x.x.x.",
"x/x",
"xD",
"xDD",
"xX",
"xXX",
"x_X",
"x_d",
"x_x",
"xd",
"xdd",
"xx",
"xx\"",
"xx'",
"xx-xxxx",
"xx.",
"xxx",
"xxx'",
"xxx'xxx.",
"xxx-xxxx",
"xxx.",
"xxxx",
"xxxx'",
"xxxx'xxx.",
"xxxx-xx",
"xxxx-xxx",
"xxxx-xxxx",
"xxxx.",
"xxxx..",
"xxxx\u2019",
"xxxx\u2019xxx.",
"xxx\u2019",
"xxx\u2019xxx.",
"xx\u2019",
"x\u00b0",
"x\u2019",
"x\u2019xxx.",
"x\ufe35x",
"y",
"y.",
"z",
"z.",
"|",
"}",
"\u00a0",
"\u00ac",
"\u00ac_\u00ac",
"\u00af",
"\u00af\\(x)/\u00af",
"\u00af\\(\u30c4)/\u00af",
"\u00b0",
"\u00b0C.",
"\u00b0F.",
"\u00b0K.",
"\u00b0X.",
"\u00b0c.",
"\u00b0f.",
"\u00b0k.",
"\u00b0x.",
"\u00e4",
"\u00e4.",
"\u00f6",
"\u00f6.",
"\u00fc",
"\u00fc.",
"\u0ca0",
"\u0ca0_\u0ca0",
"\u0ca0\ufe35\u0ca0",
"\u2014",
"\u2019",
"\u2019-(",
"\u2019-)",
"\u2019\u2019",
"\u2501",
"\u253b",
"\u253b\u2501\u253b",
"\u256f",
"\u25a1",
"\ufe35",
"\uff09"
]