en_pipeline / vocab /strings.json
pvrwork's picture
Update spaCy pipeline
607e3a8
[
"\t",
"\n",
" ",
" ",
"\"",
"'",
"''",
"'-(",
"'-)",
"'Cause",
"'Cos",
"'Coz",
"'Cuz",
"'S",
"'X",
"'Xxx",
"'Xxxxx",
"'am",
"'bout",
"'cause",
"'cos",
"'coz",
"'cuz",
"'d",
"'em",
"'ll",
"'m",
"'nuff",
"'re",
"'s",
"'ve",
"'x",
"'xx",
"'xxx",
"'xxxx",
"'y",
"(",
"(((",
"(*>",
"(*_*)",
"(-8",
"(-:",
"(-;",
"(-_-)",
"(-d",
"(._.)",
"(:",
"(;",
"(=",
"(>_<)",
"(^_^)",
"(o:",
"(x:",
"(x_x)",
"(\u00ac_\u00ac)",
"(\u0ca0_\u0ca0)",
"(\u256f\u00b0\u25a1\u00b0\uff09\u256f\ufe35\u253b\u2501\u253b",
")",
")))",
")-:",
")/\u00af",
"):",
"*",
",",
"-",
"-((",
"-))",
"-/",
"-0",
"-3",
"-8",
"-D",
"-O",
"-P",
"-X",
"-_-",
"-__-",
"-d",
"-o",
"-p",
"-x",
"-|",
".",
".C.",
".D.",
".E.",
".G.",
".H.",
".J.",
".M.",
".Y.",
"._.",
".e.",
".g.",
".m.",
".s.",
"/",
"/3",
"/d",
"/or",
"0",
"0.0",
"0.o",
"000",
"001",
"002",
"003",
"004",
"005",
"006",
"007",
"008",
"009",
"01",
"010",
"011",
"012",
"013",
"014",
"015",
"016",
"017",
"018",
"019",
"02",
"020",
"021",
"022",
"023",
"03",
"04",
"05",
"06",
"07",
"08",
"09",
"0_0",
"0_o",
"1",
"10",
"10:00",
"10:15",
"10:30",
"10:45",
"10a.m",
"10a.m.",
"10p.m",
"10p.m.",
"11",
"11:15",
"11:30",
"11a.m",
"11a.m.",
"11p.m",
"11p.m.",
"12",
"12:45",
"12a.m",
"12a.m.",
"12p.m",
"12p.m.",
"13",
"14",
"15",
"16",
"17",
"18",
"19",
"1980",
"1981",
"1982",
"1983",
"1984",
"1985",
"1986",
"1987",
"1988",
"1989",
"1990",
"1991",
"1992",
"1993",
"1994",
"1995",
"1996",
"1997",
"1998",
"1999",
"1:00",
"1a.m",
"1a.m.",
"1p.m",
"1p.m.",
"2",
"20",
"2000",
"2001",
"2002",
"2003",
"2004",
"2005",
"2006",
"2007",
"2008",
"2009",
"2010",
"2011",
"2012",
"2013",
"2014",
"2015",
"2016",
"2017",
"2018",
"2019",
"2020",
"2021",
"2022",
"2023",
"21",
"22",
"23",
"24",
"25",
"26",
"27",
"28",
"29",
"2:00",
"2:15",
"2a.m",
"2a.m.",
"2p.m",
"2p.m.",
"3",
"30",
"31",
"33",
"333",
"3:00",
"3:15",
"3:30",
"3:45",
"3a.m",
"3a.m.",
"3p.m",
"3p.m.",
"4",
"4:00",
"4:15",
"4:30",
"4:45",
"4a.m",
"4a.m.",
"4p.m",
"4p.m.",
"5",
"5:00",
"5a.m",
"5a.m.",
"5p.m",
"5p.m.",
"6",
"6:15",
"6:30",
"6:45",
"6a.m",
"6a.m.",
"6p.m",
"6p.m.",
"7",
"7:00",
"7:30",
"7:45",
"7a.m",
"7a.m.",
"7p.m",
"7p.m.",
"8",
"8)",
"8-",
"8-)",
"8-D",
"8-d",
"8:00",
"8:15",
"8:30",
"8:45",
"8D",
"8a.m",
"8a.m.",
"8d",
"8p.m",
"8p.m.",
"9",
"980",
"981",
"982",
"983",
"984",
"985",
"986",
"987",
"988",
"989",
"990",
"991",
"992",
"993",
"994",
"995",
"996",
"997",
"998",
"999",
"9:15",
"9:30",
"9:45",
"9a.m",
"9a.m.",
"9p.m",
"9p.m.",
":",
":'(",
":')",
":'-(",
":'-)",
":(",
":((",
":(((",
":()",
":)",
":))",
":)))",
":*",
":-(",
":-((",
":-(((",
":-)",
":-))",
":-)))",
":-*",
":-/",
":-0",
":-3",
":->",
":-D",
":-O",
":-P",
":-X",
":-]",
":-d",
":-o",
":-p",
":-x",
":-|",
":-}",
":/",
":0",
":00",
":1",
":15",
":3",
":30",
":45",
":>",
":D",
":O",
":P",
":X",
":]",
":d",
":o",
":o)",
":p",
":x",
":x)",
":|",
":}",
":\u2019(",
":\u2019)",
":\u2019-(",
":\u2019-)",
";",
";)",
";-)",
";-D",
";-X",
";-d",
";D",
";X",
";_;",
";d",
"<",
"<.<",
"</3",
"</d",
"<3",
"<33",
"<333",
"<d",
"<dd",
"<ddd",
"<space>",
"<xxxx>",
"=",
"=(",
"=)",
"=/",
"=3",
"=D",
"=X",
"=[",
"=]",
"=d",
"=|",
">",
">.<",
">.>",
">:(",
">:o",
">:x",
"><(((*>",
"@",
"@_@",
"A",
"AM",
"ATE",
"Adm",
"Adm.",
"After",
"Ai",
"Ak",
"Ak.",
"Ala",
"Ala.",
"Alabama",
"Alaska",
"Apr",
"Apr.",
"April",
"Are",
"Ariz",
"Ariz.",
"Arizona",
"Ark",
"Ark.",
"Arkansas",
"As",
"Aug",
"Aug.",
"August",
"B",
"Before",
"Bros",
"Bros.",
"C",
"C'm",
"C++",
"C.",
"Ca",
"Calif",
"Calif.",
"California",
"Can",
"Cause",
"Co",
"Co.",
"Colo",
"Colo.",
"Colorado",
"Conn",
"Conn.",
"Connecticut",
"Corp",
"Corp.",
"Cos",
"Could",
"Coz",
"Cuz",
"C\u2019m",
"D",
"D.",
"D.C.",
"Dare",
"Dec",
"Dec.",
"December",
"Del",
"Del.",
"Delaware",
"Did",
"Do",
"Does",
"Doin",
"Doin'",
"Doin\u2019",
"Dr",
"Dr.",
"E",
"E.G.",
"E.g",
"E.g.",
"EXT",
"F",
"F.",
"Feb",
"Feb.",
"February",
"Fla",
"Fla.",
"Florida",
"Friday",
"G",
"Ga",
"Ga.",
"Gen",
"Gen.",
"Georgia",
"Goin",
"Goin'",
"Goin\u2019",
"Gon",
"Got",
"Gov",
"Gov.",
"H",
"Had",
"Has",
"Have",
"Havin",
"Havin'",
"Havin\u2019",
"He",
"He's",
"He\u2019s",
"How",
"How's",
"How\u2019s",
"I",
"I.E.",
"I.e",
"I.e.",
"Ia",
"Ia.",
"Id",
"Id.",
"Idaho",
"Ill",
"Ill.",
"Illinois",
"Inc",
"Inc.",
"Ind",
"Ind.",
"Indiana",
"Iowa",
"Is",
"It",
"It's",
"It\u2019s",
"J",
"Jan",
"Jan.",
"January",
"Jr",
"Jr.",
"Jul",
"Jul.",
"July",
"Jun",
"Jun.",
"June",
"K",
"K.",
"Kan",
"Kan.",
"Kans",
"Kans.",
"Kansas",
"Kentucky",
"Ky",
"Ky.",
"L",
"La",
"La.",
"Let",
"Let's",
"Let\u2019s",
"Louisiana",
"Lovin",
"Lovin'",
"Lovin\u2019",
"Ltd",
"Ltd.",
"M",
"Ma'am",
"Mar",
"Mar.",
"March",
"Mass",
"Mass.",
"Massachusetts",
"May",
"Ma\u2019am",
"Md",
"Md.",
"Messrs",
"Messrs.",
"Mich",
"Mich.",
"Michigan",
"Might",
"Minn",
"Minn.",
"Minnesota",
"Miss",
"Miss.",
"Mississippi",
"Mo",
"Mo.",
"Monday",
"Mont",
"Mont.",
"Mount",
"Mr",
"Mr.",
"Mrs",
"Mrs.",
"Ms",
"Ms.",
"Mt",
"Mt.",
"Must",
"N",
"N.C.",
"N.D.",
"N.H.",
"N.J.",
"N.M.",
"N.Y.",
"Neb",
"Neb.",
"Nebr",
"Nebr.",
"Nebraska",
"Need",
"Nev",
"Nev.",
"Nevada",
"New Hampshire",
"New Jersey",
"New Mexico",
"New York",
"North Carolina",
"North Dakota",
"Not",
"Nothin",
"Nothin'",
"Nothin\u2019",
"Nov",
"Nov.",
"November",
"Nuthin",
"Nuthin'",
"Nuthin\u2019",
"O",
"O'clock",
"O.O",
"O.o",
"O_O",
"O_o",
"Oct",
"Oct.",
"October",
"Okla",
"Okla.",
"Oklahoma",
"Ol",
"Ol'",
"Ol\u2019",
"Ore",
"Ore.",
"Oregon",
"Ought",
"Over",
"O\u2019clock",
"P",
"PERIOD_TEXT",
"PM",
"Pa",
"Pa.",
"Pennsylvania",
"Ph",
"Ph.D.",
"Prof",
"Prof.",
"R",
"ROOT",
"Rep",
"Rep.",
"Rev",
"Rev.",
"S",
"S.C.",
"Saturday",
"Sen",
"Sen.",
"Sep",
"Sep.",
"Sept",
"Sept.",
"September",
"Sha",
"She",
"She's",
"She\u2019s",
"Should",
"Simone",
"Somethin",
"Somethin'",
"Somethin\u2019",
"South Carolina",
"St",
"St.",
"Sunday",
"T",
"Tenn",
"Tenn.",
"Tennessee",
"That",
"That's",
"That\u2019s",
"The",
"There",
"There's",
"There\u2019s",
"These",
"They",
"This",
"This's",
"This\u2019s",
"Those",
"Thursday",
"Tuesday",
"V",
"V.V",
"V_V",
"Va",
"Va.",
"Virginia",
"W",
"Was",
"Wash",
"Wash.",
"Washington",
"We",
"Wednesday",
"Were",
"What",
"What's",
"What\u2019s",
"When",
"When's",
"When\u2019s",
"Where",
"Where's",
"Where\u2019s",
"Who",
"Who's",
"Who\u2019s",
"Why",
"Why's",
"Why\u2019s",
"Wis",
"Wis.",
"Wisconsin",
"Wo",
"Would",
"X'x",
"X'xxxx",
"X++",
"X.",
"X.X",
"X.X.",
"X.x",
"X.x.",
"XD",
"XDD",
"XX",
"XXX",
"XXXX",
"XXXX_XXXX",
"X_X",
"X_x",
"Xx",
"Xx'",
"Xx'x",
"Xx'xx",
"Xx.",
"Xx.X.",
"Xxx",
"Xxx'x",
"Xxx.",
"Xxxx",
"Xxxx'",
"Xxxx'x",
"Xxxx.",
"Xxxxx",
"Xxxxx'",
"Xxxxx'x",
"Xxxxx.",
"Xxxxx\u2019",
"Xxxxx\u2019x",
"Xxxx\u2019",
"Xxxx\u2019x",
"Xxx\u2019x",
"Xx\u2019",
"Xx\u2019x",
"Xx\u2019xx",
"X\u2019x",
"X\u2019xxxx",
"Y",
"You",
"[",
"[-:",
"[:",
"[=",
"\\",
"\\\")",
"\\n",
"\\t",
"\\x",
"]",
"]=",
"^",
"^_^",
"^__^",
"^___^",
"_*)",
"_-)",
"_.)",
"_<)",
"_^)",
"__-",
"__^",
"_\u00ac)",
"_\u0ca0)",
"a",
"a.",
"a.m",
"a.m.",
"about",
"ace",
"ack",
"adm",
"adm.",
"after",
"afternoon",
"ai",
"ak",
"ak.",
"ala",
"ala.",
"all",
"am",
"an.",
"and",
"and/or",
"annual",
"ans",
"apr",
"apr.",
"april",
"ar.",
"ard",
"are",
"ariz",
"ariz.",
"ark",
"ark.",
"ary",
"as",
"ash",
"ass",
"at",
"ate",
"aug",
"aug.",
"august",
"ave",
"b",
"b.",
"back",
"because",
"before",
"ber",
"board",
"bout",
"br.",
"bros",
"bros.",
"c",
"c'm",
"c++",
"c.",
"ca",
"calif",
"calif.",
"can",
"cause",
"ce>",
"ch.",
"co",
"co.",
"colo",
"colo.",
"come",
"conn",
"conn.",
"corp",
"corp.",
"cos",
"could",
"coz",
"ct.",
"cuz",
"c\u2019m",
"d",
"d)",
"d-",
"d-)",
"d-X",
"d.",
"d.c.",
"d.d",
"d.x",
"d:dd",
"dX",
"d_d",
"d_x",
"dare",
"date",
"day",
"dd",
"dd:dd",
"ddd",
"dddd",
"ddx.x",
"ddx.x.",
"dec",
"dec.",
"december",
"del",
"del.",
"did",
"dm.",
"do",
"does",
"doin",
"doin'",
"doing",
"doin\u2019",
"dr",
"dr.",
"dx.x",
"dx.x.",
"e",
"e's",
"e.",
"e.g",
"e.g.",
"early",
"eas",
"eb.",
"ebr",
"ec.",
"eed",
"eks",
"el.",
"em",
"en",
"en.",
"enn",
"enough",
"ent",
"ep.",
"ept",
"ere",
"ese",
"ets",
"ev.",
"evening",
"ext",
"e\u2019s",
"f",
"f.",
"feb",
"feb.",
"february",
"fla",
"fla.",
"following",
"friday",
"from",
"g",
"g.",
"ga",
"ga.",
"gen",
"gen.",
"general",
"gets",
"ght",
"goin",
"goin'",
"going",
"goin\u2019",
"gon",
"gonna",
"got",
"gov",
"gov.",
"h",
"h.",
"had",
"has",
"hat",
"have",
"havin",
"havin'",
"having",
"havin\u2019",
"he",
"he's",
"hen",
"hey",
"he\u2019s",
"hin",
"his",
"how",
"how's",
"how\u2019s",
"i",
"i.",
"i.e",
"i.e.",
"ia",
"ia.",
"ich",
"id",
"id.",
"if.",
"ill",
"ill.",
"in'",
"inc",
"inc.",
"ind",
"ind.",
"ing",
"inn",
"in\u2019",
"iod",
"is",
"is.",
"iss",
"it",
"it's",
"it\u2019s",
"iz.",
"j",
"j.",
"jan",
"jan.",
"january",
"jr",
"jr.",
"jul",
"jul.",
"july",
"jun",
"jun.",
"june",
"k",
"k.",
"kan",
"kan.",
"kans",
"kans.",
"kla",
"ky",
"ky.",
"l",
"l.",
"la",
"la.",
"late",
"let",
"let's",
"let\u2019s",
"lif",
"ll",
"ll.",
"lo.",
"lovin",
"lovin'",
"loving",
"lovin\u2019",
"ltd",
"ltd.",
"m",
"m.",
"ma'am",
"madam",
"mar",
"mar.",
"march",
"mass",
"mass.",
"may",
"ma\u2019am",
"md",
"md.",
"meeting",
"messrs",
"messrs.",
"mich",
"mich.",
"mid",
"might",
"minn",
"minn.",
"miss",
"miss.",
"mo",
"mo.",
"monday",
"mont",
"mont.",
"months",
"morning",
"mr",
"mr.",
"mrs",
"mrs.",
"ms",
"ms.",
"mt",
"mt.",
"must",
"n",
"n's",
"n't",
"n.",
"n.c.",
"n.d.",
"n.h.",
"n.j.",
"n.m.",
"n.y.",
"na",
"nc.",
"nd.",
"neb",
"neb.",
"nebr",
"nebr.",
"need",
"nev",
"nev.",
"next",
"nn.",
"not",
"nothin",
"nothin'",
"nothing",
"nothin\u2019",
"nov",
"nov.",
"november",
"ns.",
"nt",
"nt.",
"nuff",
"nuthin",
"nuthin'",
"nuthin\u2019",
"n\u2019s",
"n\u2019t",
"o",
"o'clock",
"o's",
"o.",
"o.0",
"o.O",
"o.o",
"o_0",
"o_O",
"o_o",
"ock",
"oct",
"oct.",
"october",
"oes",
"of.",
"oin",
"okla",
"okla.",
"ol",
"ol'",
"old",
"olo",
"ol\u2019",
"on",
"one",
"ongoing",
"onn",
"ont",
"oon",
"or",
"ore",
"ore.",
"orp",
"os.",
"ose",
"ought",
"out",
"ov.",
"over",
"overseas",
"o\u2019clock",
"o\u2019s",
"p",
"p.",
"p.m",
"p.m.",
"pa",
"pa.",
"period",
"period_text",
"ph",
"ph.d.",
"pm",
"pr.",
"present",
"prof",
"prof.",
"pt.",
"q",
"q.",
"r",
"r.",
"ral",
"rch",
"re",
"re.",
"rep",
"rep.",
"rev",
"rev.",
"ril",
"riz",
"rk.",
"rly",
"rof",
"rom",
"ros",
"rp.",
"rs.",
"s",
"s's",
"s.",
"s.c.",
"saturday",
"sen",
"sen.",
"sep",
"sep.",
"sept",
"sept.",
"september",
"sh.",
"sha",
"shall",
"she",
"she's",
"she\u2019s",
"should",
"simone",
"somethin",
"somethin'",
"something",
"somethin\u2019",
"space",
"srs",
"ss.",
"st",
"st.",
"sunday",
"s\u2019s",
"t",
"t's",
"t.",
"ta",
"td.",
"tenn",
"tenn.",
"ter",
"that",
"that's",
"that\u2019s",
"the",
"them",
"there",
"there's",
"there\u2019s",
"these",
"they",
"this",
"this's",
"this\u2019s",
"those",
"ths",
"thursday",
"to",
"tuesday",
"t\u2019s",
"u",
"u.",
"ual",
"uff",
"ug.",
"ul.",
"uld",
"uly",
"un.",
"une",
"us",
"use",
"ust",
"v",
"v.",
"v.s",
"v.s.",
"v.v",
"v_v",
"va",
"va.",
"ve",
"ver",
"vin",
"vs",
"vs.",
"w",
"w's",
"w.",
"w/o",
"was",
"wash",
"wash.",
"we",
"wednesday",
"weeks",
"were",
"what",
"what's",
"what\u2019s",
"when",
"when's",
"when\u2019s",
"where",
"where's",
"where\u2019s",
"who",
"who's",
"who\u2019s",
"why",
"why's",
"why\u2019s",
"will",
"wis",
"wis.",
"without",
"wo",
"would",
"w\u2019s",
"x",
"x'",
"x'x",
"x'xxxx",
"x.",
"x.X",
"x.d",
"x.x",
"x.x.",
"x/x",
"xD",
"xDD",
"xX",
"xXX",
"x_X",
"x_d",
"x_x",
"xd",
"xdd",
"xx",
"xx'",
"xx'x",
"xx'xx",
"xx.",
"xxx",
"xxx'x",
"xxx/xx",
"xxxx",
"xxxx'",
"xxxx'x",
"xxxx\u2019",
"xxxx\u2019x",
"xxx\u2019x",
"xx\u2019",
"xx\u2019x",
"xx\u2019xx",
"x\u2019",
"x\u2019x",
"x\u2019xxxx",
"x\ufe35x",
"y",
"y'",
"y's",
"y.",
"you",
"y\u2019",
"y\u2019s",
"z",
"z.",
"|",
"}",
"\u00a0",
"\u00ac",
"\u00ac_\u00ac",
"\u00af",
"\u00af\\(x)/\u00af",
"\u00af\\(\u30c4)/\u00af",
"\u00b0",
"\u00b0C.",
"\u00b0F.",
"\u00b0K.",
"\u00b0X.",
"\u00b0c.",
"\u00b0f.",
"\u00b0k.",
"\u00b0x.",
"\u00e4",
"\u00e4.",
"\u00f6",
"\u00f6.",
"\u00fc",
"\u00fc.",
"\u0ca0",
"\u0ca0_\u0ca0",
"\u0ca0\ufe35\u0ca0",
"\u2014",
"\u2018",
"\u2018S",
"\u2018X",
"\u2018s",
"\u2018x",
"\u2019",
"\u2019-(",
"\u2019-)",
"\u2019Cause",
"\u2019Cos",
"\u2019Coz",
"\u2019Cuz",
"\u2019S",
"\u2019X",
"\u2019Xxx",
"\u2019Xxxxx",
"\u2019am",
"\u2019bout",
"\u2019cause",
"\u2019cos",
"\u2019coz",
"\u2019cuz",
"\u2019d",
"\u2019em",
"\u2019ll",
"\u2019m",
"\u2019nuff",
"\u2019re",
"\u2019s",
"\u2019ve",
"\u2019x",
"\u2019xx",
"\u2019xxx",
"\u2019xxxx",
"\u2019y",
"\u2019\u2019",
"\u2501",
"\u253b",
"\u253b\u2501\u253b",
"\u256f",
"\u25a1",
"\ufe35",
"\uff09"
]