diff --git "a/stopwords.py" "b/stopwords.py" --- "a/stopwords.py" +++ "b/stopwords.py" @@ -57,168 +57,485 @@ stopwords = { "ʼn", ], "ar": [ - "،", + "آخر", + "آنَا", "أ", - "ا", + "أثناء", + "أحد", + "أصبح", + "أصبحت", + "أغلب", + "أكثر", + "أكون", + "ألا", + "أم", + "أما", + "أمام", + "أن", + "أنا", + "أنت", + "أنتم", + "أنَا", + "أو", + "أولئك", + "أولٰئك", + "أي", + "أية", + "أين", + "أينما", + "أَ", + "أَثنَاءَ", + "أَلَّا", + "أَم", + "أَمَامَ", + "أَمَّا", + "أَن", + "أَنَّ", + "أَو", + "أَي", + "أَينَ", + "أَينَمَا", + "أَيّ", + "إبان", + "إثر", + "إحدى", + "إذ", + "إذا", + "إزا", + "إزاء", + "إل", + "إلا", + "إلى", + "إلي", + "إليها", + "إما", + "إن", + "إنما", + "إنّ", + "إيا", + "إِثرَ", + "إِذ", + "إِذًا", + "إِذَا", + "إِزَاءَ", + "إِلَى", + "إِلَّا", + "إِمَّا", + "إِن", + "إِنَّ", + "إِنَّمَا", + "إِيَّا", "اثر", - "اجل", - "احد", - "اخرى", + "اثناء", + "اذ", "اذا", - "اربعة", - "اطار", - "اعادة", - "اعلنت", - "اف", - "اكثر", - "اكد", + "ازا", + "ازاء", + "ال", "الا", - "الاخيرة", - "الان", - "الاول", - "الاولى", "التى", "التي", - "الثاني", - "الثانية", - "الذاتي", "الذى", "الذي", "الذين", - "السابق", - "الف", - "الماضي", - "المقبل", - "الوقت", + "الغاية", + "الـ", + "الـــ", + "الفوق", + "اللاتى", + "اللاتي", + "اللتان", + "اللتين", + "اللذان", + "اللذين", + "اللواتي", + "اللي", "الى", - "اليوم", + "الي", + "ام", "اما", "امام", - "امس", "ان", - "انه", - "انها", + "انا", + "انتم", + "انما", "او", - "اول", + "اولئك", + "اى", "اي", - "ايار", - "ايام", - "ايضا", + "اين", + "اينما", + "اَل", + "اَلَّذِي", "ب", - "باسم", - "بان", - "برس", - "بسبب", - "بشكل", + "بأنفسهم", + "بات", + "باتت", + "بس", "بعد", + "بعدما", "بعض", - "بن", - "به", - "بها", + "بعيد", + "بغزة", + "بـ", + "بل", + "بما", + "بهم", + "بيد", "بين", - "تم", - "ثلاثة", + "بينما", + "بَس", + "بَعدَ", + "بَعدَمَا", + "بَل", + "بَيدَ", + "بَينَ", + "بَينَمَا", + "بُعَيدَ", + "بِ", + "تحت", + "تحـــت", + "تصبح", + "تعد", + "تكن", + "تكون", + "تكونون", + "تلك", + "تَحتَ", + "تُجَاهَ", "ثم", - "جميع", - "حاليا", + "ثُمَّ", + "جراء", + "جَرَّاء", "حتى", + "حسب", + "حسبما", "حوالى", + "حوالي", "حول", + "حولي", + "حيال", "حيث", + "حيثما", "حين", + "حينما", + "حَتَّى", + "حَسَب", + "حَسَبَ", + "حَسَبَمَا", + "حَولَ", + "حَوَالَى", + "حَيثُ", + "حِينَ", + "حِينَمَا", + "حِيَالَ", "خلال", + "خَلفَ", + "خِلَالَ", "دون", + "دُونَ", + "ذا", + "ذاك", "ذلك", - "زيارة", - "سنة", - "سنوات", - "شخصا", - "صباح", - "صفر", + "ذو", + "ذي", + "ذَا", + "ذَاكَ", + "ذُو", + "ذٰلك", + "ذٰلِكَ", + "��اح", + "ربما", + "ربمــا", + "رغم", + "ريثما", + "رَغمَ", + "رَيثَمَا", + "رُبَّمَا", + "س", + "سائر", + "سواء", + "سوف", + "سوى", + "سَ", + "سَوفَ", + "سِوَى", + "شبه", + "شو", + "صار", + "صوب", "ضد", "ضمن", - "عام", - "عاما", + "ضِدَّ", + "ضِمنَ", + "طال", + "طالما", + "طالَما", + "طوال", + "طيلة", + "طَالَمَا", + "طِوَالَ", + "طِيلَةَ", + "عبر", + "عدا", "عدة", - "عدد", - "عدم", - "عشر", - "عشرة", + "عشان", + "عـــلى", + "عـــندما", + "عــلى", + "عقب", + "عل", + "علـى", "على", - "عليه", - "عليها", + "علي", + "علّ", + "عم", "عن", + "عنا", "عند", "عندما", - "غدا", + "عوض", + "عَاد", + "عَبرَ", + "عَدَا", + "عَشان", + "عَقِبَ", + "عَلَى", + "عَلَّ", + "عَم", + "عَن", + "عِندَ", + "عِندَمَا", + "عِوَضَ", + "غالبية", + "غدت", "غير", - "ـ", + "غَيرَ", "ف", - "فان", + "فتئ", + "فـ", + "فـي", + "فور", + "فوق", "فى", "في", - "فيه", - "فيها", - "قال", + "فيما", + "فَ", + "فَورَ", + "فَوقَ", + "فِي", + "فِيمَا", + "ق", + "قبالة", "قبل", + "قبيل", "قد", - "قوة", + "قرابة", + "قرب", + "قيد", + "قَبلَ", + "قَد", + "قَيدَ", + "قُبَالَةَ", + "قُبَيلَ", + "قُربَ", + "قُرَابَةَ", + "ك", + "كأن", + "كأنما", + "كامل", "كان", "كانت", + "كانوا", + "كذا", + "كـ", "كل", - "كلم", + "كلا", + "كلتا", + "كلما", + "كلي", + "كم", "كما", + "كن", + "كنا", + "كنت", + "كون", + "كى", + "كي", + "كيف", + "كَ", + "كَأَنَّ", + "كَأَنَّمَا", + "كَان", + "كَذَا", + "كَلَّا", + "كَم", + "كَمَا", + "كَي", + "كَيفَ", + "كُل", + "كُلَّمَا", + "كِلَا", + "ل", + "لأن", "لا", + "لازم", + "لان", "لدى", - "لقاء", + "لدي", + "لذا", + "لذلك", + "لذٰلك", + "لسنا", + "لـ", + "لقد", "لكن", - "للامم", + "لكى", + "لكي", "لم", + "لما", + "لماذا", "لن", - "له", - "لها", - "لوكالة", + "لهم", + "لو", + "لولا", + "ليس", + "ليست", + "ليسوا", + "لَ", + "لَا", + "لَازِم", + "لَدَى", + "لَم", + "لَمَّا", + "لَن", + "لَو", + "لَولَا", + "لَيس", + "لُو", + "لِ", + "لِأَن", + "لِأَنَّ", + "لِئَلّا", + "لِذَا", + "لِذٰلِكَ", + "لِكَي", + "لِمَاذَا", + "لٰكن", + "لٰكِن", + "لٰكِنَّ", + "م", "ما", - "مايو", - "مساء", + "ماذا", + "مالم", + "ماهو", + "ماهُوَ", + "متى", + "مثـــل", + "مثل", + "مثلما", + "مش", "مع", + "معظم", + "مــن", + "مـن", "مقابل", - "مليار", - "مليون", + "مما", + "ممكن", "من", + "منتصف", "منذ", - "منها", + "مهما", + "مين", + "مَا", + "مَاذَا", + "مَالَم", + "مَتَى", + "مَعَ", + "مَن", + "مَهمَا", + "مُقَابِلَ", + "مُمكِن", + "مُنذُ", + "مِثلَ", + "مِثلَمَا", + "مِمَّا", + "مِن", + "نا", + "��اهيك", + "نحسب", + "نحن", "نحو", - "نفسه", - "نهاية", + "نصف", + "نعم", + "نكون", + "ني", + "نَاهِيك", + "نَحوَ", + "نَعَم", + "ه", + "هؤلاء", + "ها", + "هاتان", + "هاتين", + "هاد", + "هاي", "هذا", + "هذان", + "هذــه", "هذه", - "هناك", + "هذين", + "هـــذه", + "هــــذه", + "هكذا", + "هل", + "هم", + "هما", + "هن", "هو", + "هى", "هي", + "هَا", + "هَل", + "هُ", + "هُو", + "هُوَ", + "هِ", + "هٰؤلاء", + "هٰذا", + "هٰذان", + "هٰذه", + "هٰذَا", + "هٰكذا", + "هٰكَذَا", "و", - "و6", - "واحد", - "واضاف", - "واضافت", - "واكد", - "وان", - "واوضح", - "وفي", - "وقال", - "وقالت", - "وقد", + "وأسلم", + "وراء", + "وسامراء", + "وسط", + "وســـط", + "وغربه", + "وفق", + "وقتما", "وقف", - "وكان", - "وكانت", "ولا", - "ولم", - "ومن", - "وهو", + "ولَا", "وهي", + "وَ", + "وَرَاءَ", + "وَسطَ", + "وِفقَ", + "وِلّا", + "ي", + "يا", + "يجعل", + "يزال", + "يصبح", + "يكن", "يكون", - "يمكن", - "يوم", + "يكونا", + "يَا", + "ِي", ], "bn": [ "অনেক", @@ -339,30 +656,30 @@ stopwords = { "হয়", ], "ca": [ + "-ho", + "-la", + "-lo", + "-ne", + "-se", "a", "abans", - "ací", - "ah", - "així", "això", "al", - "aleshores", "algun", "alguna", "algunes", "alguns", - "alhora", - "allà", - "allí", + "algú", "allò", "als", "altra", "altre", "altres", "amb", - "ambdues", - "ambdós", - "apa", + "aqueix", + "aqueixa", + "aqueixes", + "aqueixos", "aquell", "aquella", "aquelles", @@ -370,125 +687,252 @@ stopwords = { "aquest", "aquesta", "aquestes", + "aquestos", "aquests", - "aquí", - "baix", + "bastant", + "bastants", + "bé", "cada", + "cadascun", "cadascuna", - "cadascunes", - "cadascuns", "cadascú", + "cap", + "cert", + "certa", + "certes", + "certs", "com", + "con", "contra", - "d'un", - "d'una", - "d'unes", - "d'uns", - "dalt", + "d", + "d'", + "da", + "damunt", + "darrere", + "davant", "de", "del", "dels", "des", - "després", + "dient", + "diferent", + "diferents", "dins", "dintre", - "donat", - "doncs", + "dir", + "divers", + "diverses", + "diversos", "durant", - "e", - "eh", + "eixa", + "eixe", + "eixes", + "eixos", "el", + "ell", + "ella", + "elles", + "ells", "els", "em", + "emperò", "en", - "encara", + "endavant", + "enfront", "ens", "entre", + "envers", + "era", "eren", "es", - "esta", + "estan", + "estant", + "estar", + "estaran", + "estarem", + "estaria", + "estarien", + "estarà", + "estat", + "estava", "estaven", + "este", + "estem", + "estes", "esteu", + "estic", + "estiguem", + "estiguessin", + "estigui", + "estiguin", + "estigués", + "estos", "està", - "estàvem", - "estàveu", "et", - "etc", "ets", + "excepte", + "extra", + "fa", + "faci", + "facin", + "facis", + "faig", + "fan", + "faran", + "farem", + "fareu", + "faria", + "farien", + "faries", + "faràs", + "faràs", + "faré", + "faríem", + "faríeu", + "fas", + "feia", + "feien", + "feies", + "fem", + "fent", + "fer", + "fes", + "fessin", + "fessis", + "fet", + "feu", "fins", - "fora", - "gairebé", + "foren", + "fos", + "fossin", + "fou", + "front", + "fèiem", + "fèieu", + "féssiu", + "gaire", + "gaires", + "gràcies", "ha", + "hagi", + "hagin", + "haguem", + "haguessin", + "haguessis", + "hagut", + "hagués", + "haguéssim", + "haguéssin", + "haguéssiu", "han", "has", + "hauran", + "haurem", + "haureu", + "hauria", + "haurien", + "hauries", + "haurà", + "hauràs", + "hauré", + "hauríem", + "hauríeu", + "havent", + "haver", "havia", + "havien", + "havies", + "havíem", + "havíeu", "he", "hem", "heu", "hi", "ho", + "hom", + "hàgim", "i", - "igual", - "iguals", - "ja", - "l'hi", + "in", + "jo", + "l", + "l", + "l'", "la", + "las", "les", "li", - "li'n", - "llavors", - "m'he", - "ma", - "mal", + "llur", + "llurs", + "lo", + "los", + "ls", + "m", + "m", + "m'", "malgrat", + "mancant", + "massa", "mateix", "mateixa", "mateixes", "mateixos", "me", "mentre", + "menys", + "mes", "meu", "meus", "meva", "meves", + "mi", + "mitjançant", "molt", "molta", "moltes", "molts", - "mon", - "mons", - "més", - "n'he", - "n'hi", + "moltíssim", + "moltíssima", + "moltíssimes", + "moltíssims", + "n", + "n'", "ne", "ni", + "ningun", + "ninguna", + "ningunes", + "ninguns", + "ningú", "no", - "nogensmenys", - "només", + "nombroses", + "nombrós", + "nos", "nosaltres", "nostra", "nostre", "nostres", + "ns", "o", - "oh", - "oi", "on", - "pas", + "os", "pel", "pels", "per", + "perqu", "perquè", "però", "poc", "poca", "pocs", "poques", - "potser", - "propi", + "prou", "qual", "quals", + "qualsevol", "quan", "quant", + "quantes", + "quants", "que", "quelcom", "qui", @@ -497,400 +941,306 @@ stopwords = { "quines", "quins", "què", - "s'ha", - "s'han", + "rere", + "respecte", + "s", + "s", + "s'", "sa", - "semblant", - "semblants", + "sabent", + "salvant", + "se", + "segons", + "sens", + "sense", + "sent", + "ser", + "seran", + "serem", + "seria", + "serien", + "serà", + "seré", + "seríem", "ses", "seu", "seus", "seva", "seves", "si", + "siguem", + "sigui", + "siguin", + "sigut", + "sinó", "sobre", - "sobretot", - "solament", - "sols", - "son", - "sons", + "som", "sota", - "sou", + "su", + "suficient", + "séssim", "sóc", "són", - "t'ha", - "t'han", - "t'he", - "ta", + "t", + "t'", "tal", - "també", - "tampoc", - "tan", + "tals", "tant", "tanta", "tantes", + "tants", + "te", + "tenc", + "tendran", + "tendrem", + "tendreu", + "tendria", + "tendrien", + "tendries", + "tendràs", + "tendràs", + "tendré", + "tendríem", + "tendríeu", + "tenen", + "tenia", + "tenien", + "tenies teníem", + "tenim", + "tenir", + "teniu", + "tens", + "teníeu", "teu", "teus", "teva", - "teves", - "ton", - "tons", + "ti", + "tinc", + "tindran", + "tindre", + "tindrem", + "tindreu", + "tindria", + "tindrien", + "tindries", + "tindràs", + "tindràs", + "tindré", + "tindríem", + "tindríeu", + "tingut", "tot", "tota", + "total", "totes", + "tothom", "tots", + "tu", + "té", + "u", + "ultra", "un", "una", "unes", "uns", "us", "va", + "vagi", + "vagin", "vaig", "vam", "van", - "vas", - "veu", + "varen", + "vau", + "vers", + "versus", + "via", + "vora", + "vos", "vosaltres", - "vostra", "vostre", - "vostres", + "vostè", + "vostès", + "vàrem", + "y", "érem", - "éreu", "és", ], "en": [ "a", - "a's", - "able", + "a.k.a", + "aboard", "about", "above", + "abt", + "accord", "according", - "accordingly", "across", - "actually", "after", - "afterwards", - "again", "against", - "ain't", + "ago", + "aground", + "ahead", + "aka", + "ala", + "albeit", "all", - "allow", - "allows", - "almost", - "alone", "along", - "already", - "also", + "alongside", "although", - "always", "am", + "amid", + "amidst", "among", "amongst", + "amoung", "an", "and", + "and/or", "another", "any", + "any1", "anybody", - "anyhow", "anyone", "anything", - "anyway", - "anyways", - "anywhere", - "apart", - "appear", - "appreciate", - "appropriate", "are", - "aren't", "around", "as", "aside", - "ask", - "asking", - "associated", + "astride", "at", - "available", + "atop", "away", - "awfully", "b", + "b/c", + "b/t", + "back", + "base", + "based", + "bc", "be", - "became", "because", - "become", - "becomes", - "becoming", "been", "before", - "beforehand", "behind", "being", - "believe", "below", + "beneath", "beside", "besides", - "best", - "better", "between", "beyond", + "board", "both", - "brief", + "btwn", "but", "by", - "c", - "c'mon", - "c's", - "came", "can", - "can't", - "cannot", - "cant", "cause", - "causes", - "certain", - "certainly", - "changes", - "clearly", - "co", - "com", - "come", - "comes", - "concerning", - "consequently", - "consider", - "considering", - "contain", - "containing", - "contains", - "corresponding", + "circa", + "cos", "could", - "couldn't", - "course", - "currently", - "d", - "definitely", - "described", + "coz", + "cus", + "depend", + "depending", "despite", "did", - "didn't", - "different", "do", "does", - "doesn't", - "doing", - "don't", - "done", "down", - "downwards", + "due", "during", - "e", "each", - "edu", - "eg", - "eight", "either", "else", - "elsewhere", - "enough", - "entirely", - "especially", - "et", - "etc", "even", "ever", "every", "everybody", "everyone", "everything", - "everywhere", - "ex", - "exactly", - "example", "except", - "f", - "far", - "few", - "fifth", - "first", - "five", - "followed", - "following", - "follows", "for", - "former", - "formerly", "forth", - "four", "from", - "further", - "furthermore", - "g", "get", "gets", "getting", + "give", "given", - "gives", - "go", - "goes", - "going", - "gone", "got", - "gotten", - "greetings", - "h", "had", - "hadn't", - "happens", - "hardly", + "half", "has", - "hasn't", + "hav", "have", - "haven't", "having", "he", - "he's", - "hello", - "help", - "hence", "her", - "here", - "here's", - "hereafter", - "hereby", - "herein", - "hereupon", "hers", "herself", - "hi", "him", "himself", "his", - "hither", - "hopefully", "how", - "howbeit", "however", "i", "i'd", - "i'll", - "i'm", - "i've", - "ie", "if", - "ignored", - "immediate", "in", - "inasmuch", - "inc", - "indeed", - "indicate", - "indicated", - "indicates", - "inner", - "insofar", + "include", + "including", + "inside", "instead", "into", - "inward", "is", - "isn't", "it", - "it'd", - "it'll", "it's", "its", "itself", - "j", - "just", - "k", - "keep", - "keeps", - "kept", - "know", - "known", - "knows", - "l", - "last", - "lately", - "later", - "latter", - "latterly", - "least", - "less", "lest", - "let", - "let's", "like", - "liked", - "likely", - "little", - "look", - "looking", - "looks", - "ltd", - "m", - "mainly", + "made", "many", "may", - "maybe", "me", - "mean", - "meanwhile", - "merely", "might", - "more", - "moreover", + "mine", + "minus", "most", - "mostly", "much", "must", "my", "myself", - "n", - "name", - "namely", - "nd", + "nary", "near", - "nearly", - "necessary", - "need", - "needs", + "nearby", "neither", - "never", - "nevertheless", - "new", "next", - "nine", + "nigh", "no", "nobody", - "non", "none", "noone", "nor", - "normally", "not", "nothing", - "novel", - "now", - "nowhere", - "o", - "obviously", + "notwithstanding", "of", "off", - "often", - "oh", - "ok", - "okay", - "old", "on", + "onboard", "once", "one", "ones", + "oneself", "only", "onto", + "opposite", "or", "other", "others", - "otherwise", "ought", "our", "ours", @@ -898,406 +1248,337 @@ stopwords = { "out", "outside", "over", - "overall", + "overt", "own", - "p", - "particular", - "particularly", + "past", "per", - "perhaps", - "placed", - "please", "plus", - "possible", - "presumably", - "probably", - "provides", - "q", - "que", + "prior", "quite", - "qv", - "r", "rather", - "rd", "re", - "really", - "reasonably", + "regard", "regarding", "regardless", - "regards", - "relatively", - "respectively", - "right", - "s", - "said", - "same", - "saw", - "say", - "saying", - "says", - "second", - "secondly", - "see", - "seeing", - "seem", - "seemed", - "seeming", - "seems", - "seen", + "round", + "s/he", + "save", "self", - "selves", - "sensible", - "sent", - "serious", - "seriously", - "seven", - "several", "shall", "she", "should", - "shouldn't", + "side", "since", - "six", "so", "some", "somebody", - "somehow", "someone", "something", - "sometime", - "sometimes", - "somewhat", - "somewhere", - "soon", - "sorry", - "specified", - "specify", - "specifying", - "still", - "sub", "such", - "sup", "sure", - "t", - "t's", - "take", - "taken", - "tell", - "tends", - "th", + "teh", "than", - "thank", "thanks", - "thanx", "that", - "that's", - "thats", "the", "their", "theirs", "them", "themselves", "then", - "thence", "there", - "there's", - "thereafter", - "thereby", - "therefore", - "therein", - "theres", - "thereupon", "these", "they", - "they'd", - "they'll", "they're", - "they've", - "think", - "third", + "thier", "this", - "thorough", - "thoroughly", + "tho", "those", + "thou", "though", - "three", "through", "throughout", "thru", - "thus", + "thy", + "til", + "till", "to", "together", "too", - "took", "toward", "towards", - "tried", - "tries", - "truly", - "try", - "trying", - "twice", - "two", "u", - "un", "under", - "unfortunately", + "underneath", "unless", - "unlikely", + "unlike", "until", "unto", "up", "upon", + "ur", "us", "use", - "used", - "useful", - "uses", - "using", - "usually", - "uucp", - "v", - "value", - "various", - "very", + "versus", "via", - "viz", "vs", - "w", - "want", - "wants", + "vs.", + "w/", + "w/o", + "w/out", "was", - "wasn't", - "way", "we", - "we'd", - "we'll", - "we're", - "we've", - "welcome", - "well", - "went", "were", - "weren't", "what", - "what's", "whatever", + "whatnot", "when", - "whence", "whenever", "where", - "where's", - "whereafter", "whereas", - "whereby", - "wherein", - "whereupon", "wherever", "whether", "which", "while", + "whilst", "whither", "who", "who's", "whoever", - "whole", "whom", + "whomever", "whose", "why", "will", - "willing", - "wish", "with", "within", "without", - "won't", - "wonder", + "wo", + "worth", "would", - "wouldn't", - "x", - "y", - "yes", + "wud", + "y'all", + "ya", "yet", + "yo", "you", - "you'd", - "you'll", "you're", - "you've", "your", + "youre", "yours", "yourself", "yourselves", - "z", - "zero", ], "es": [ "a", - "actualmente", - "acuerdo", - "adelante", - "ademas", - "además", - "adrede", - "afirmó", - "agregó", - "ahi", + "a fin de que", + "a medida que", + "a menos que", + "a modo de", + "a no ser que", + "a poco que", + "a que", + "abandono", + "acerca", + "acostumbra", + "adónde", "ahora", - "ahí", - "al", + "al igual que", + "al lado de", "algo", + "alguien", "alguna", "algunas", "alguno", "algunos", "algún", - "alli", - "allí", "alrededor", + "ambas", "ambos", - "ampleamos", - "antano", - "antaño", "ante", - "anterior", - "antes", + "aparece", + "aparecen", + "apareció", + "aparte", "apenas", - "aproximadamente", "aquel", "aquella", "aquellas", "aquello", "aquellos", - "aqui", + "aquesa", + "aquesas", + "aquesos", + "aquesta", + "aquestas", + "aquesto", + "aquestos", "aquél", "aquélla", "aquéllas", "aquéllos", - "aquí", - "arriba", - "arribaabajo", - "aseguró", - "asi", + "arrepentir", + "arrepentiréis", "así", - "atras", + "así como", + "así que", + "atlético", "aun", "aunque", - "ayer", - "añadió", "aún", - "b", "bajo", "bastante", + "bastantes", "bien", - "breve", - "buen", - "buena", - "buenas", - "bueno", - "buenos", - "c", "cada", "casi", "cerca", + "chance", "cierta", "ciertas", "cierto", "ciertos", - "cinco", - "claro", - "comentó", + "comenzado", + "comenzó", + "comienzan", "como", + "como quiera que", + "como si", "con", + "con tal de", + "con tal que", + "conforme", "conmigo", - "conocer", - "conseguimos", - "conseguir", + "conque", "considera", + "consideradas", + "consideran", "consideró", "consigo", - "consigue", - "consiguen", - "consigues", + "contendrán", "contigo", + "continuaba", + "continuar", + "continuaron", + "continuase", + "continuó", + "continúa", "contra", - "cosas", - "creo", + "corresponden", + "corresponder", "cual", + "cual si", "cuales", + "cualesquier", + "cualesquiera", "cualquier", + "cualquiera", + "cuan", "cuando", "cuanta", "cuantas", "cuanto", + "cuanto quiera que", "cuantos", - "cuatro", - "cuenta", + "cuya", + "cuyas", + "cuyo", + "cuyos", + "cuàles", "cuál", "cuáles", + "cuán", "cuándo", "cuánta", "cuántas", "cuánto", "cuántos", "cómo", - "d", "da", - "dado", - "dan", + "dado que", "dar", "de", + "de manera que", + "de modo que", + "deba", "debajo", + "deban", + "debas", "debe", + "debemos", "deben", + "deber", + "deberá", + "deberán", + "debería", + "deberíamos", + "deberían", + "debes", "debido", - "decir", - "dejó", + "debiera", + "debieron", + "debimos", + "debió", + "debo", + "debía", + "debíamos", + "debían", + "declaraba", + "declarada", + "declarado", + "declarase", + "declaro", + "declaró", + "dejaban", + "dejado", + "dejan", + "dejará", "del", "delante", + "demasiada", + "demasiadas", "demasiado", + "demasiados", "demás", + "den", "dentro", - "deprisa", + "dentro_de", + "des", "desde", - "despacio", - "despues", "después", - "detras", "detrás", - "dia", - "dias", - "dice", - "dicen", + "di", + "dicha", + "dichas", "dicho", - "dieron", + "dichos", "diferente", "diferentes", - "dijeron", - "dijo", - "dio", + "distintas", + "distinto", + "distintos", + "diversas", + "diverso", + "diversos", + "don", "donde", "dos", "durante", - "día", - "días", "dónde", - "e", - "ejemplo", + "echar", "el", + "el que", "ella", "ellas", "ello", "ellos", - "embargo", - "empleais", - "emplean", - "emplear", - "empleas", - "empleo", "en", + "en cambio", + "en caso de", + "en la medida en que", + "en tanto que", "encima", - "encuentra", "enfrente", - "enseguida", "entonces", "entre", "era", @@ -1305,346 +1586,418 @@ stopwords = { "eran", "eras", "eres", + "ergo", "es", "esa", "esas", + "escasa", + "escasas", + "escaso", + "escasos", + "escrito", "ese", "eso", + "eso que", "esos", + "esotra", + "esotro", "esta", "estaba", + "estabais", + "estabamos", "estaban", + "estabas", "estado", - "estados", - "estais", "estamos", "estan", + "estando", "estar", + "estaremos", "estará", + "estarán", + "estaré", + "estaría", + "estaríamos", + "estarían", + "estarías", "estas", "este", + "estemos", "esto", "estos", + "estotra", + "estotro", "estoy", + "estuve", + "estuviera", + "estuvieran", + "estuvieron", + "estuviese", + "estuviesen", + "estuvimos", "estuvo", "está", + "estábamos", + "estáis", "están", + "estás", + "esté", + "estén", "ex", "excepto", - "existe", - "existen", - "explicó", - "expresó", - "f", - "fin", - "final", + "frente", "fue", "fuera", + "fueran", + "fuere", "fueron", + "fuese", + "fuesen", "fui", "fuimos", - "g", - "general", - "gran", - "grandes", - "gueno", - "h", - "ha", + "gracias", + "gracias_a", + "habeis", "haber", - "habia", - "habla", - "hablan", + "haberle", + "haberse", + "habido", + "habiendo", + "habiéndo", + "habremos", "habrá", + "habrán", + "habrás", + "habré", + "habría", + "habríamos", + "habrían", + "habéis", "había", + "habíamos", "habían", + "habías", "hace", - "haceis", - "hacemos", - "hacen", "hacer", - "hacerlo", - "haces", "hacia", - "haciendo", - "hago", + "hacía", + "halla", "han", + "has", "hasta", + "hasta que", "hay", "haya", + "hayamos", + "hayan", + "hayas", "he", "hecho", "hemos", - "hicieron", - "hizo", - "horas", - "hoy", + "hola", + "hubiera", + "hubieran", + "hubieron", + "hubiese", + "hubiesen", + "hubiéramos", "hubo", - "i", - "igual", + "iba", + "iban", + "ido", "incluso", - "indicó", - "informo", - "informó", - "intenta", - "intentais", - "intentamos", - "intentan", - "intentar", - "intentas", - "intento", "ir", - "j", - "junto", - "k", - "l", + "irá", + "irán", + "iré", + "iría", + "junto a", "la", - "lado", - "largo", "las", "le", "lejos", "les", - "llegó", - "lleva", - "llevar", "lo", "los", "luego", - "lugar", - "m", - "mal", - "manera", - "manifestó", + "mal que", "mas", - "mayor", "me", "mediante", - "medio", - "mejor", - "mencionó", "menos", - "menudo", + "mes", "mi", - "mia", - "mias", "mientras", - "mio", - "mios", + "mientras que", "mis", "misma", "mismas", "mismo", "mismos", - "modo", - "momento", + "mismísimo", + "morir", + "moriría", + "mostrado", + "mostraron", "mucha", "muchas", + "muchisimas", + "muchisimio", + "muchisimo", "mucho", "muchos", - "muy", + "muchísima", + "muchísimas", + "muchísimo", + "muchísimos", "más", + "más bien", "mí", "mía", "mías", "mío", "míos", - "n", "nada", "nadie", + "negar", "ni", + "ni que", + "ningun", "ninguna", "ningunas", "ninguno", "ningunos", "ningún", "no", + "no obstante", + "noche", + "nombrado", + "nombró", "nos", - "nosotras", "nosotros", "nuestra", "nuestras", "nuestro", "nuestros", - "nueva", - "nuevas", - "nuevo", - "nuevos", - "nunca", "o", - "ocho", "os", "otra", "otras", "otro", "otros", - "p", - "pais", + "pa", "para", - "parece", - "parte", + "para que", + "parezca", "partir", - "pasada", - "pasado", - "paìs", - "peor", + "pasar", "pero", - "pesar", + "po", "poca", "pocas", "poco", "pocos", + "podamos", "podeis", "podemos", "poder", - "podria", - "podriais", - "podriamos", - "podrian", - "podrias", + "podes", + "podido", + "podras", + "podre", + "podremos", + "podriaís", "podrá", "podrán", + "podrás", + "podré", + "podréis", "podría", + "podríamos", "podrían", + "podéis", + "podía", + "podíamos", + "podían", "poner", + "poquito", "por", + "por el contrario", + "por ende", + "por eso", + "por lo que", + "por mucho que", + "por más que", + "por no hablar de", + "por si", "porque", - "posible", - "primer", - "primera", - "primero", - "primeros", - "principalmente", - "pronto", + "pos", + "post", + "pre", + "pro", "propia", "propias", "propio", "propios", - "proximo", - "próximo", - "próximos", + "pude", + "pudiendo", + "pudiera", + "pudieran", + "pudieras", + "pudieron", + "pudiese", + "pudiesen", + "pudimos", "pudo", "pueda", + "puedan", + "puedas", "puede", "pueden", + "puedes", "puedo", "pues", - "q", - "qeu", + "puesto", + "puesto que", "que", + "queda", + "quedaba", + "quedan", "quedó", "queremos", + "querer", + "queriendo", "quien", "quienes", + "quienesquiera", + "quienquier", + "quienquiera", + "quiera", "quiere", - "quiza", - "quizas", - "quizá", - "quizás", + "quisiera", "quién", "quiénes", "qué", - "r", - "raras", - "realizado", - "realizar", - "realizó", - "repente", - "respecto", - "s", + "re", + "resulta", + "resultado", + "resultaría", + "resulte", "sabe", - "sabeis", - "sabemos", - "saben", "saber", - "sabes", + "sabiendo", + "salen", + "salir", + "salió", "salvo", "se", "sea", + "seamos", "sean", - "segun", - "segunda", - "segundo", + "seas", + "seguir", + "seguirá", + "seguía", "según", - "seis", + "semejante", + "semejantes", + "semi", + "sendas", + "sendo", + "sendos", "ser", - "sera", "será", "serán", + "serás", + "seré", + "seréis", "sería", - "señaló", + "serían", + "serías", "si", + "si bien", + "si y solo si", "sido", - "siempre", + "siempre que", "siendo", - "siete", + "siente", + "siento", + "siga", + "sigamos", "sigue", - "siguiente", "sin", "sino", + "siquiera", "sobre", - "sois", - "sola", - "solamente", - "solas", - "solo", - "solos", + "sobrer", + "sobrir", + "soler", + "solían", "somos", "son", "soy", - "soyos", - "su", - "supuesto", + "sub", + "suele", + "suelen", + "suelo", + "super", + "supo", + "sur", "sus", "suya", "suyas", "suyo", + "suyos", "sé", "sí", - "sólo", - "t", "tal", - "tambien", - "también", - "tampoco", - "tan", + "tales", + "tanta", + "tantas", "tanto", - "tarde", + "tantos", + "tantísima", + "tantísimas", + "tantísimos", "te", - "temprano", + "tendremos", + "tendrian", "tendrá", "tendrán", - "teneis", + "tendría", + "tendrían", "tenemos", "tener", "tenga", + "tengan", "tengo", + "tenia", "tenido", + "teniendo", + "tenéis", "tenía", - "tercera", + "teníamos", + "tenían", + "terminas", "ti", - "tiempo", "tiene", "tienen", + "tienes", "toda", "todas", - "todavia", "todavía", + "todes", "todo", "todos", - "total", - "trabaja", - "trabajais", - "trabajamos", - "trabajan", - "trabajar", - "trabajas", - "trabajo", + "trabajado", + "trans", "tras", - "trata", - "través", - "tres", "tu", "tus", + "tuve", + "tuviera", + "tuvieron", + "tuviese", "tuvo", "tuya", "tuyas", @@ -1652,50 +2005,56 @@ stopwords = { "tuyos", "tú", "u", - "ultimo", "un", "una", "unas", + "une", + "unir", "uno", "unos", - "usa", - "usais", - "usamos", - "usan", - "usar", - "usas", - "uso", "usted", "ustedes", - "v", "va", - "vais", - "valor", "vamos", "van", "varias", "varios", + "varía", + "vas", "vaya", - "veces", + "vayan", + "venir", + "venía", "ver", - "verdad", - "verdadera", - "verdadero", - "vez", + "vice", + "vieron", + "vino", + "vis a vis", + "visto que", + "volver", + "volverá", + "volveríamos", + "volvió", + "vos", "vosotras", "vosotros", "voy", + "vuelva", + "vuelvan", + "vuelve", + "vuelven", "vuestra", "vuestras", "vuestro", "vuestros", - "w", - "x", + "vía", "y", "ya", + "ya que", "yo", - "z", + "ámbos", "él", + "éramos", "ésa", "ésas", "ése", @@ -1703,154 +2062,1299 @@ stopwords = { "ésta", "éstas", "éste", + "ésto", "éstos", + "íbamos", + "ó", + "ú", "última", "últimas", "último", "últimos", + "\ufeffdesde", + "\ufeffel", + "\ufeffen", + "\ufeffla", + "\ufefflas", ], "eu": [ - "al", + "*edin", + "*edun", + "*ezan", + "aitzitik", + "ala", + "alabaina", + "aldiz", + "alegia", + "alta", "anitz", + "anitzek", + "anitzeko", + "anitzez", + "antzera", "arabera", + "ari", + "ari_izan", + "ariko", + "arren", "asko", + "askoan", + "askok", + "askoko", + "askorekin", + "askoren", + "askorengan", + "askorentzat", + "askori", + "askorik", + "askotako", + "askotan", + "askotariko", + "askotatik", + "askotaz", + "askotxo", + "askoz", + "at", + "aunitz", + "aurka", + "aurkako", + "aurretik", + "azpian", + "azpitik", + "ba", + "bada", + "badago", + "badezake", + "badidazu", + "badiezu", + "badio", + "badiogu", + "badiote", + "badiougu", + "badiozu", + "badira", + "badirela", + "baditu", + "baditugu", + "badituzte", + "badituzu", + "badu", + "badugu", + "badugun", + "badut", + "badute", + "baduzu", + "bagara", + "bagatzaizkio", + "bagenu", + "baginen", + "bai", + "baietz", + "baikaituzte", + "bailegoen", + "bailituen", + "bailitzake", + "bailitzateke", "baina", + "bainan", + "bainintzen", + "bainizkion", + "baino", + "baita", + "baitabil", + "baitaiteke", + "baitan", + "baitaude", + "baitiete", + "baitigu", + "baitio", + "baitiote", + "baitira", + "baititu", + "baititugu", + "baitituzte", + "baitituzu", + "baititzaket", + "baitizkio", + "baitu", + "baitugu", + "baitute", + "baituzu", + "baitzaio", + "baitzaizkio", + "baitzara", + "baitzegoen", + "baitzen", + "baitzeuden", + "baitzien", + "baitzion", + "baitzioten", + "baitziren", + "baitzitekeen", + "baitzituen", + "baitzitzaion", + "baitzuen", + "baitzuten", + "baizik", + "baizituen", + "baldin", + "balego", + "balira", + "baliteke", + "balitu", + "balituzkete", + "balitz", + "balitzait", + "balu", + "balute", + "banintz", + "banitu", + "banu", + "barik", + "barru", "bat", - "batean", - "batek", - "bati", + "batera", + "batera\x97", + "batere", + "batzu", "batzuei", "batzuek", + "batzuekin", + "batzuen", + "batzuengatik", + "batzuentzat", + "batzuetako", + "batzuetakoak", "batzuetan", + "batzuetara", + "batzuetatik", + "batzuez", "batzuk", + "batzutako", + "batzutan", + "bazaigu", + "bazaizu", + "bazara", + "bazen", + "bazina", + "baziren", + "bazituen", + "bazituzten", + "bazuen", + "bazuten", + "bederen", + "behintzat", "bera", + "beragatik", + "beraiei", "beraiek", - "berau", + "beraiekin", + "beraien", + "beraietaz", + "berak", + "berarekin", + "beraren", + "berarengan", + "berarengana", + "berarengandik", + "berarengatik", + "berarentzat", + "berari", "berauek", + "berauen", + "berauetan", + "beraz", + "berbera", + "berberagatik", + "berberak", + "berberarekin", + "berberaren", + "berberera", "bere", - "berori", - "beroriek", + "berea", + "bereak", + "berean", + "berek", + "bereko", + "berekoa", + "berekoak", + "beren", + "beretan", + "beretik", + "beretzat", + "berriz", + "bertze", + "bertzeekin", + "bertzela", + "bestalde", + "bestaldean", "beste", + "bestea", + "besteak", + "bestean", + "bestearekiko", + "bestearekin", + "bestearen", + "bestearengandik", + "besteari", + "besteaz", + "besteei", + "besteen", + "besteengandik", + "besteetan", + "besteko", + "bestekoa", + "bestela", + "bestera", + "besterantz", + "besterik", + "bestetan", + "bestetik", "bezala", + "bezalako", + "bezalakoa", + "bezalakoen", + "bidez", + "bitartean", + "bitarteko", + "bitarterako", + "bitartez", "da", + "dabil", + "dabiltza", + "dadila", + "dadin", "dago", + "dagoela", + "dagoelako", + "dagoen", + "dagoena", + "dagoenaren", + "dagoenean", + "dagoenez", + "daiteekenaren", + "daiteke", + "daitekeela", + "daitekeen", + "daitekeena", + "daitekeenaren", + "daitekeenez", + "daiteken", + "daitezela", + "daitezen", + "daitezke", + "daitezkeelako", + "daitezkeelarik", + "daitezkeen", + "daitezkeenak", + "daitezkela", + "dakizuke", + "danok", + "daude", + "daudela", + "daudelako", + "dauden", + "daudenak", + "daudenek", + "daudenen", + "daudenik", + "dautzuet", + "dela", + "delako", + "delarik", + "den", + "dena", + "denak", + "denaren", + "denarentzat", + "denari", + "denean", + "denek", + "denen", + "denera", + "denerako", + "denetan", + "denetarik", + "denetik", + "denez", + "denik", + "denok", + "denon", + "denona", + "denontzat", + "deus", + "dexente", + "dezadan", + "dezagun", + "dezake", + "dezakedala", + "dezakedan", + "dezakedanean", + "dezakeela", + "dezakeen", + "dezakeena", + "dezakegu", + "dezakegula", + "dezakegun", + "dezakela", + "dezakelako", + "dezaket", + "dezakete", + "dezaketela", + "dezaketen", + "dezakezu", + "dezakezuen", + "dezakezuenez", + "dezakezunez", + "dezala", + "dezan", + "dezaten", + "dezente", + "dezenterekin", + "dezentetan", + "diat", + "didala", + "didana", + "didate", + "didazue", + "die", + "diegu", + "diegun", + "diela", + "dien", + "dienak", + "diet", + "diete", + "dietela", + "dietelako", + "dietenean", + "diezaiekete", + "diezaiokeena", + "diezaiokete", + "diezaiola", + "diezaioten", + "diezaizkioke", + "diezazkioke", + "diezazkiokeen", + "digu", + "digun", + "digute", + "digutela", + "diguten", + "digutenean", + "diguzu", + "dik", + "din", + "dinat", + "dio", + "diogu", + "diogulako", + "diogun", + "diola", + "dion", + "diona", + "dionean", + "dionez", + "diot", + "diote", + "diotela", + "dioten", + "diotena", + "diotenak", + "diotenek", + "diozu", "dira", + "direla", + "direlako", + "direlakoan", + "direlakotz", + "diren", + "direnak", + "direnean", + "direnek", + "direnen", + "direnetan", + "direnez", + "direnik", + "dit", + "ditake", + "ditazke", + "ditin", "ditu", + "ditudala", + "ditudalako", + "ditudan", + "ditudanean", + "dituela", + "dituelako", + "dituelarik", + "dituen", + "dituena", + "dituenak", + "dituenean", + "ditugu", + "ditugula", + "ditugun", + "ditugunez", + "ditun", + "ditut", + "dituzte", + "dituztela", + "dituztelako", + "dituzten", + "dituztenak", + "dituztenean", + "dituztenek", + "dituztenekin", + "dituztenen", + "dituzu", + "dituzue", + "dituzuen", + "dituzula", + "dituzun", + "dituzunik", + "ditzagun", + "ditzake", + "ditzakeen", + "ditzakegu", + "ditzakegula", + "ditzakete", + "ditzaketela", + "ditzaketelako", + "ditzaketen", + "ditzakezu", + "ditzan", + "dizkidazu", + "dizkie", + "dizkien", + "dizkiet", + "dizkiete", + "dizkigu", + "dizkigula", + "dizkigunak", + "dizkigute", + "dizkio", + "dizkiola", + "dizkion", + "dizkiot", + "dizkiotela", + "dizkit", + "dizkizuet", + "dizkizugu", + "dizu", + "dizuet", + "dizugu", + "dizut", + "dizute", "du", + "duan", + "dudala", + "dudalarik", + "dudan", + "dudanak", + "dudanarekin", + "dudanean", + "dudanik", + "duela", + "duelako", + "duelakoan", + "duen", + "duena", + "duenak", + "duenaren", + "duenarentzat", + "duenari", + "duenean", + "duenentz", + "duenez", + "duenik", + "dugu", + "dugula", + "dugulako", + "dugun", + "duguna", + "dugunari", + "dugunean", + "dugunez", + "dugunik", + "duk", + "dun", + "dunala", + "dut", "dute", + "dutela", + "dutelako", + "dutelakoan", + "duten", + "dutena", + "dutenagatik", + "dutenak", + "dutenaren", + "dutenean", + "dutenek", + "duteneko", + "dutenen", + "dutenena", + "dutenenetatik", + "dutenentz", + "dutenetakoa", + "dutenetik", + "dutenez", + "duzu", + "duzue", + "duzuela", + "duzuen", + "duzuenean", + "duzuenez", + "duzula", + "duzun", + "duzunarekin", + "ea", "edo", - "egin", + "edonor", + "edota", + "edozein", + "edozeinek", + "edozer", + "edozertarako", + "elgarrekin", + "elgarri", + "elkar", + "elkarrekiko", + "elkarrekin", + "elkarren", + "elkarri", + "ene", + "era", "ere", + "esker", "eta", "eurak", + "eurei", + "eurek", + "eurekin", + "euren", + "eurentzat", "ez", + "ezan", + "ezazu", + "ezazue", + "ezean", + "ezein", + "ezen", + "ezer", + "ezerekin", + "ezerk", + "ezertarako", + "ezertaz", + "ezertxo", + "ezetz", + "ezik", + "ezta", + "gabe", + "gabeko", "gainera", + "gainerakoan", + "gainerat", + "gainera\x97", + "gainetik", + "gaitezen", + "gaitezke", + "gaitezkeela", + "gaitu", + "gaituela", + "gaituzte", + "gaituztenak", + "gara", + "garela", + "garelako", + "garen", + "garenez", + "garenok", + "gaude", + "gaudenak", + "gehiago", + "gehiagoan", + "gehiagok", + "gehiagoko", + "gehiagorekin", + "gehiegi", + "gehiegirik", + "gehiegitxo", + "gehien", + "gehiena", + "gehienak", + "gehienek", + "gehienekin", + "gehienentzako", + "gehienentzat", + "gehienetako", + "gehienetan", + "gehienok", + "gehientsu", + "gehientsuen", + "gehitxo", + "gehixeago", + "genbiltzan", + "genezake", + "genien", + "genion", + "genituela", + "genituelako", + "genituen", + "genituzke", + "genituzkeelako", + "genizkion", + "genizuen", + "genizun", + "genuela", + "genuelako", + "genuen", + "genuenean", + "genuenetik", + "genuenez", + "genuke", + "genukeen", + "geratu", + "geratzen", + "geroztik", + "geu", + "geure", + "geuregan", + "geuri", + "ginela", + "ginen", + "ginenean", + "ginenekoa", + "gintezkeela", + "gintuen", + "gintuenagatik", + "gintunan", + "gintuzten", + "gintzaizkion", "gu", + "guk", + "gure", + "gurean", + "gurekin", + "guretzat", + "guri", + "gutako", + "gutaz", + "guti", + "gutiz", + "gutiz-gehien", + "gutiz-gehienek", "gutxi", + "gutxiago", + "gutxiagorako", + "gutxiagorekin", + "gutxian", + "gutxien", + "gutxienez", + "gutxik", + "gutxiko", + "gutxira", + "gutxiren", + "gutxitan", + "guzi", + "guziak", + "guziarekin", + "guziekin", + "guzientzat", "guzti", - "haiei", + "guztia", + "guztiagatik", + "guztiak", + "guztian", + "guztiarekin", + "guztiaren", + "guztiari", + "guztiaz", + "guztiei", + "guztiek", + "guztien", + "guztiengan", + "guztientzako", + "guztientzat", + "guztietako", + "guztietan", + "guztietara", + "guztietatik", + "guztiez", + "guztioi", + "guztiok", + "guztion", + "guztionak", + "guztionen", + "guztiontzat", + "guztira", + "guztitako", + "haatik", "haiek", + "haiekin", + "haien", + "haiengan", + "haiengandik", + "haietako", "haietan", + "haietatik", + "hainbat", + "hainbatek", + "hainbaten", + "hainbatez", + "hainbertze", "hainbeste", - "hala", - "han", - "handik", - "hango", - "hara", + "hainbesterako", + "haiteke", + "haiz", + "halaber", + "halere", + "harekin", + "haren", + "harena", + "harentzat", + "hargatik", "hari", "hark", + "hartako", "hartan", + "hartara", + "hartarako", + "hartatik", "hau", + "haudala", "hauei", "hauek", + "hauekin", + "hauen", + "hauetako", "hauetan", - "hemen", - "hemendik", - "hemengo", + "hauetara", + "hauetarako", + "hauetarik", + "hauetatik", + "hauexek", + "hauez", + "hauxe", + "heu", + "heure", + "hhriek", "hi", - "hona", + "hik", + "hinduan", + "hintzen", + "hire", + "hiri", + "honegatik", "honek", - "honela", + "honekin", + "honen", + "honengatik", + "honentzat", + "honetako", "honetan", + "honetara", + "honetarako", + "honetatik", + "honetaz", + "honez", "honi", - "hor", "hori", "horiei", "horiek", + "horiekin", + "horien", + "horientzat", + "horietako", + "horietakoren", "horietan", - "horko", - "horra", + "horietarako", + "horietariko", + "horietatik", + "horiez", + "horixe", + "horregatik", "horrek", - "horrela", + "horrekin", + "horren", + "horrenbeste", + "horrenbestez", + "horrengatik", + "horretako", "horretan", + "horretantxe", + "horretara", + "horretarako", + "horretatik", + "horretaz", + "horrexegatik", + "horrexekin", + "horrexetan", + "horrez", + "horrezaz", "horri", - "hortik", + "hortaz", + "huan", + "huntan", "hura", - "izan", + "huraxe", + "iezaidazu", + "iezaiezu", + "iezaion", + "iezaiozu", + "inor", + "inoren", + "inorentzako", + "inori", + "inork", + "inortaz", + "irian", + "itzazu", + "izaki", + "kontra", + "lezake", + "lezakeen", + "lezakete", + "lezan", + "liekeela", + "liezaiokeen", + "lioke", + "liokeela", + "liokeen", + "lirateke", + "liratekeela", + "liteke", + "litekeela", + "litekeen", + "litekeena", + "litezke", + "lituzkeela", + "lituzkeen", + "lituzkete", + "litzaidake", + "litzaiguke", + "litzateke", + "litzatekeela", + "litzatekeelako", + "litzatekela", + "lizateke", + "luke", + "lukeela", + "lukeelako", + "lukeen", + "lukeena", + "lukete", + "luketen", + "nabil", + "nago", + "nahiko", + "nahikoa", + "nahikorik", + "nahiz", + "naiteke", + "naiz", + "naizela", + "naizen", + "naizenean", + "naizenetan", + "naizenetik", + "naizenez", + "naizenik", + "nau", + "nauen", + "nauenarentzat", + "nauenean", + "nauk", + "naun", + "naute", + "nautela", + "nauzu", + "nauzun", + "nazan", + "nazaten", + "nazazu", + "nazazun", + "nenbilen", + "nengoela", + "nengoen", + "nere", + "neu", + "neuk", + "neure", + "nezake", "ni", - "noiz", - "nola", - "non", - "nondik", - "nongo", + "nian", + "nien", + "nigan", + "nik", + "ninduen", + "ninduten", + "nintekeela", + "nintzaion", + "nintzateke", + "nintzatekeela", + "nintzela", + "nintzelako", + "nintzen", + "nintzenean", + "nion", + "nire", + "nirea", + "niregan", + "niregana", + "niregatik", + "nirekin", + "niretzako", + "niretzat", + "niri", + "nitaz", + "nituela", + "nituen", + "nituzke", + "nizuke", "nor", - "nora", + "norbait", + "norbaitek", + "norbaitekin", + "norbaiten", + "norbaitengana", + "norbaitentzat", + "norbaiti", + "norbera", + "norberak", + "norberaren", + "norbere", + "noren", + "nori", + "nork", + "nornahi", + "nornahik", + "nortzuk", + "nortzuren", + "nuela", + "nuen", + "nuena", + "nuenean", + "nuenetik", + "nuke", + "nukeela", + "omen", + "ondoan", + "ondoko", + "ondora", + "ondoren", + "ondorengo", + "ondotik", + "ordea", + "ordez", + "orduan", + "oro_har", + "orobat", + "orohar", + "orok", + "ororen", + "orori", + "ostean", + "ostera", + "osterantzean", + "pean", + "piskat", + "pixka_bat", + "pixkat", + "pranko", + "ugari", + "ugarik", + "ugarirekin", + "ugariren", + "ugaritan", + "zagok", + "zaidan", + "zaidanaren", + "zaie", + "zaiela", + "zaien", + "zaienez", + "zaigu", + "zaigun", + "zaiguna", + "zaigunean", + "zaik", + "zaio", + "zaiola", + "zaiolako", + "zaion", + "zaiona", + "zait", + "zaitez", + "zaitezen", + "zaitu", + "zaitut", + "zaituzte", + "zaitzakegu", + "zaizkidan", + "zaizkie", + "zaizkiela", + "zaizkien", + "zaizkigu", + "zaizkio", + "zaizkiola", + "zaizkion", + "zaizkit", + "zaizkizu", + "zaizkizue", + "zaizkizun", + "zaizu", + "zaizue", + "zara", + "zarela", + "zarete", + "zatekeela", + "zatekeen", + "zatzait", + "zaude", "ze", + "zebilen", + "zedin", + "zegoan", + "zegoela", + "zegoelako", + "zegoen", + "zegoenez", + "zegok", + "zehar", "zein", + "zeina", + "zeinek", + "zeinen", + "zeintzu", + "zeintzuetan", + "zeintzuk", + "zela", + "zelako", + "zelarik", "zen", + "zena", + "zenak", + "zenarekin", + "zenari", "zenbait", + "zenbaitek", + "zenbaiten", + "zenbaitetan", + "zenbaiti", + "zenbaitzuk", "zenbat", + "zenbateraino", + "zenean", + "zenekoa", + "zenetik", + "zenez", + "zeniguten", + "zenigutenez", + "zenik", + "zenituen", + "zenitzakeen", + "zenuela", + "zenuen", + "zenuke", + "zenukete", + "zenutela", + "zenuten", + "zeozer", "zer", - "zergatik", + "zer_edo_zer", + "zerbait", + "zerbaitek", + "zerbaitengatik", + "zerbaitetarako", + "zeren", + "zerendako", + "zeri", + "zerk", + "zertan", + "zertara", + "zertarako", + "zertaz", + "zertxobait", + "zeu", + "zeudela", + "zeudelako", + "zeuden", + "zeudenak", + "zeuk", + "zeure", + "zezakeen", + "zezaken", + "zezaketen", + "zezala", + "zezan", + "zezaten", + "zidan", + "zidatelako", + "zidaten", + "zidatena", + "zidatenak", + "zidatenean", + "ziela", + "zien", + "zienez", + "zietela", + "zietelako", + "zieten", + "ziezaion", + "zigun", + "zigunez", + "ziguten", + "zinan", + "zinen", + "zintudan", + "zintuztela", + "zintuztenean", + "ziola", + "ziolako", + "ziolarik", + "zion", + "ziona", + "zionean", + "zionez", + "zioten", + "ziotenak", + "zirela", + "zirelako", + "zirelakoan", + "zirelarik", "ziren", + "zirenak", + "zirenean", + "zirenetik", + "zirenez", + "zirenik", + "ziren\x97", + "zirezte", + "zitekeela", + "zitekeen", + "zitekeena", + "zitekeenik", + "zitezen", + "zitezkeela", + "zitezkeelakoan", + "zitezkeen", + "zituela", + "zituelako", + "zituelarik", "zituen", + "zituenean", + "zituenei", + "zituztela", + "zituztelarik", + "zituzten", + "zituztenak", + "zituztenetik", + "zitzaidakeen", + "zitzaidala", + "zitzaidan", + "zitzaien", + "zitzaigun", + "zitzaiola", + "zitzaion", + "zitzaionagatik", + "zitzaionean", + "zitzaizkidan", + "zitzaizkien", + "zitzaizkienean", + "zitzaizkigun", + "zitzaizkion", + "zitzaizkon", + "zitzaizun", + "zitzakeen", + "zitzaketenak", + "zizioten", + "zizkidaten", + "zizkien", + "zizkienik", + "zizkieten", + "zizkigun", + "zizkiola", + "zizkion", + "zizkiona", + "zizkioten", + "zizkiotenekin", + "zizuen", + "zizun", + "zoin", + "zonbat", "zu", + "zuei", "zuek", + "zuela", + "zuelako", + "zuelarik", "zuen", + "zuena", + "zuenak", + "zuenarentzat", + "zuenean", + "zuenetik", + "zuenez", + "zuenik", + "zuentzako", + "zuetako", + "zuetaz", + "zugandik", + "zuk", + "zukeen", + "zuketen", + "zure", + "zureak", + "zurekin", + "zuretzat", + "zutela", + "zutelako", + "zutelarik", "zuten", + "zutena", + "zutenean", + "zuteneko", + "zutenetik", + "zutenez", ], "fr": [ "a", - "abord", - "absolument", "afin", - "ah", "ai", "aie", - "ailleurs", + "aient", "ainsi", "ait", - "allaient", - "allo", + "alias", + "aller", "allons", - "allô", - "alors", - "anterieur", - "anterieure", - "anterieures", "apres", "après", "as", - "assez", - "attendu", "au", + "au-delà", "aucun", "aucune", - "aujourd", - "aujourd'hui", - "aupres", + "aucunes", + "aucuns", + "aujourd'", + "auprès", "auquel", "aura", + "aurai", "auraient", + "aurais", "aurait", + "aurions", + "aurons", "auront", - "aussi", + "autant", + "autour", "autre", - "autrefois", - "autrement", "autres", "autrui", - "aux", "auxquelles", "auxquels", "avaient", @@ -1858,380 +3362,219 @@ stopwords = { "avait", "avant", "avec", + "avez", + "aviez", + "avions", "avoir", "avons", "ayant", - "b", - "bah", - "bas", - "basee", - "bat", - "beau", + "ayez", + "ayons", "beaucoup", - "bien", - "bigre", - "boum", - "bravo", - "brrr", - "c", + "c'est-à-dire", + "c-à-d.", + "ca", "car", "ce", "ceci", "cela", "celle", "celle-ci", - "celle-là", "celles", "celles-ci", - "celles-là", "celui", "celui-ci", "celui-là", "cent", - "cependant", "certain", "certaine", "certaines", "certains", - "certes", "ces", "cet", "cette", "ceux", "ceux-ci", "ceux-là", + "cf.", "chacun", "chacune", "chaque", - "cher", - "chers", "chez", - "chiche", - "chut", - "chère", - "chères", "ci", "cinq", - "cinquantaine", - "cinquante", - "cinquantième", - "cinquième", - "clac", - "clic", "combien", "comme", "comment", - "comparable", - "comparables", - "compris", "concernant", "contre", - "couic", - "crac", - "d", - "da", + "cà", + "d'après", + "d'autres", "dans", "de", - "debout", - "dedans", "dehors", - "deja", - "delà", "depuis", - "dernier", - "derniere", - "derriere", "derrière", "des", - "desormais", - "desquelles", - "desquels", - "dessous", - "dessus", "deux", - "deuxième", - "deuxièmement", + "devait", "devant", - "devers", + "devez", + "devions", + "devoir", + "devons", "devra", - "different", - "differentes", - "differents", - "différent", - "différente", - "différentes", - "différents", - "dire", - "directe", - "directement", - "dit", - "dite", - "dits", - "divers", - "diverse", - "diverses", - "dix", - "dix-huit", - "dix-neuf", - "dix-sept", - "dixième", + "devraient", + "devrait", + "devrions", + "devrons", + "devront", "doit", "doivent", "donc", "dont", - "douze", - "douzième", - "dring", "du", - "duquel", "durant", "dès", - "désormais", - "e", - "effet", - "egale", - "egalement", - "egales", - "eh", + "début", + "dû", "elle", "elle-même", "elles", "elles-mêmes", "en", - "encore", - "enfin", "entre", + "entres", "envers", "environ", "es", "est", "et", + "etaient", "etant", - "etc", "etre", - "eu", - "euh", + "eut", "eux", "eux-mêmes", - "exactement", "excepté", - "extenso", - "exterieur", - "f", + "eût", + "faire", "fais", "faisaient", + "faisait", "faisant", "fait", - "façon", + "faite", + "faites", + "fasse", + "fassent", + "fera", + "ferait", "feront", - "fi", - "flac", - "floc", + "firent", + "fit", "font", - "g", - "gens", - "h", - "ha", - "hein", - "hem", - "hep", - "hi", - "ho", - "holà", - "hop", + "furent", + "fussent", + "fut", + "fût", + "für", + "grâce", "hormis", "hors", - "hou", - "houp", - "hue", - "hui", - "huit", - "huitième", - "hum", - "hurrah", - "hé", - "hélas", "i", "il", "ils", - "importe", - "j", + "iront", "je", - "jusqu", "jusque", - "juste", - "k", - "l", + "l'on", "la", - "laisser", + "ladite", "laquelle", - "las", "le", + "le/lui", + "ledit", "lequel", "les", + "lesdites", "lesquelles", "lesquels", "leur", "leurs", - "longtemps", "lors", "lorsque", "lui", - "lui-meme", + "lui-aussi", "lui-même", "là", - "lès", - "m", "ma", "maint", - "maintenant", + "maintes", "mais", - "malgre", "malgré", - "maximale", "me", - "meme", - "memes", - "merci", "mes", "mien", - "mienne", - "miennes", - "miens", - "mille", - "mince", - "minimale", "moi", - "moi-meme", "moi-même", - "moindres", "moins", "mon", - "moyennant", - "multiple", - "multiples", - "même", - "mêmes", - "n", - "na", - "naturel", - "naturelle", - "naturelles", "ne", - "neanmoins", - "necessaire", - "necessairement", - "neuf", - "neuvième", "ni", - "nombreuses", - "nombreux", - "non", + "nonobstant", "nos", - "notamment", "notre", "nous", "nous-mêmes", - "nouveau", "nul", - "néanmoins", "nôtre", "nôtres", - "o", - "oh", - "ohé", - "ollé", - "olé", "on", "ont", "onze", - "onzième", - "ore", "ou", - "ouf", - "ouias", - "oust", - "ouste", "outre", - "ouvert", - "ouverte", - "ouverts", - "o|", "où", - "p", - "paf", - "pan", "par", "parce", - "parfois", - "parle", - "parlent", - "parler", "parmi", - "parseme", - "partant", - "particulier", - "particulière", - "particulièrement", "pas", - "passé", "pendant", - "pense", - "permet", "personne", "peu", "peut", "peuvent", "peux", - "pff", - "pfft", - "pfut", - "pif", - "pire", - "plein", - "plouf", + "plupart", "plus", "plusieurs", - "plutôt", - "possessif", - "possessifs", - "possible", - "possibles", - "pouah", "pour", "pourquoi", - "pourrais", + "pourra", + "pourraient", "pourrait", + "pourrez", + "pourrons", + "pourront", "pouvait", - "prealable", - "precisement", - "premier", - "première", - "premièrement", - "pres", - "probable", - "probante", - "procedant", - "proche", + "pouvez", + "pouvoir", + "pouvons", + "presque", "près", - "psitt", "pu", "puis", "puisque", - "pur", - "pure", - "q", + "puisse", + "puissent", + "puissions", "qu", "quand", "quant", - "quant-à-soi", - "quanta", "quarante", - "quatorze", "quatre", - "quatre-vingt", - "quatrième", - "quatrièmement", "que", "quel", "quelconque", @@ -2240,55 +3583,33 @@ stopwords = { "quelqu'un", "quelque", "quelques", + "quelques-unes", + "quelques-uns", + "quelqu’un", "quels", "qui", "quiconque", - "quinze", + "quid", "quoi", "quoique", - "r", - "rare", - "rarement", - "rares", - "relative", - "relativement", - "remarquable", - "rend", - "rendre", - "restant", - "reste", - "restent", - "restrictif", - "retour", - "revoici", - "revoilà", "rien", - "s", "sa", - "sacrebleu", - "sait", "sans", - "sapristi", "sauf", "se", - "sein", - "seize", "selon", - "semblable", - "semblaient", - "semble", - "semblent", - "sent", - "sept", - "septième", "sera", + "serai", "seraient", + "serais", "serait", + "seras", + "serez", + "seriez", + "serions", + "serons", "seront", "ses", - "seul", - "seule", - "seulement", "si", "sien", "sienne", @@ -2296,126 +3617,74 @@ stopwords = { "siens", "sinon", "six", - "sixième", "soi", "soi-même", + "soient", + "sois", "soit", - "soixante", + "sommes", "son", "sont", "sous", - "souvent", - "specifique", - "specifiques", - "speculatif", - "stop", - "strictement", - "subtiles", - "suffisant", - "suffisante", - "suffit", + "soyez", + "soyons", "suis", - "suit", - "suivant", - "suivante", - "suivantes", - "suivants", - "suivre", - "superpose", "sur", - "surtout", - "t", + "t-il", "ta", - "tac", + "tandis", "tant", - "tardive", + "tantôt", "te", "tel", "telle", - "tellement", "telles", - "tels", - "tenant", - "tend", - "tenir", - "tente", "tes", - "tic", "tien", - "tienne", - "tiennes", - "tiens", - "toc", "toi", - "toi-même", "ton", - "touchant", - "toujours", "tous", "tout", "toute", - "toutefois", "toutes", - "treize", - "trente", - "tres", "trois", - "troisième", - "troisièmement", - "trop", - "très", - "tsoin", - "tsouin", + "tte", "tu", - "té", - "u", "un", "une", "unes", - "uniformement", - "unique", - "uniques", "uns", - "v", + "unt", "va", "vais", - "vas", + "van", "vers", + "versus", "via", - "vif", - "vifs", - "vingt", - "vivat", - "vive", - "vives", - "vlan", "voici", "voilà", + "voir", + "voire", "vont", "vos", "votre", "vous", - "vous-mêmes", + "vous-même", + "vs", "vu", - "vé", - "vôtre", - "vôtres", - "w", - "x", "y", - "z", - "zut", "à", - "â", + "á", "ça", - "ès", "étaient", "étais", "était", "étant", + "étiez", + "étions", "été", + "êtes", "être", - "ô", ], "hi": [ "अंदर", @@ -2645,361 +3914,429 @@ stopwords = { "होने", ], "id": [ + "Anda", "ada", + "adakah", "adalah", "adanya", + "adapaun", "adapun", - "agak", - "agaknya", "agar", "akan", - "akankah", + "akau", "akhirnya", + "akibat", + "akibatnya", "aku", - "akulah", - "amat", - "amatlah", + "alias", "anda", - "andalah", + "aneka", "antar", "antara", "antaranya", "apa", - "apaan", "apabila", "apakah", "apalagi", - "apatah", + "apapun", + "asal", + "atas", "atau", "ataukah", "ataupun", "bagai", - "bagaikan", "bagaimana", "bagaimanakah", "bagaimanapun", "bagi", + "bagi-nya", "bahkan", "bahwa", "bahwasanya", + "baik", + "bakal", + "balik", "banyak", + "banyaknya", + "baru", + "bawah", "beberapa", "begini", - "beginian", - "beginikah", "beginilah", "begitu", - "begitukah", - "begitulah", - "begitupun", + "belakang", + "beliau", "belum", - "belumlah", + "beragam", "berapa", "berapakah", - "berapalah", - "berapapun", - "bermacam", + "berbagai", + "berberapa", + "berdasar", + "berdasarkan", + "berdiri", + "berdirinya", + "berikut", + "berkat", "bersama", - "betulkah", - "biasa", - "biasanya", + "bersamanya", + "berupa", + "beserta", + "betapa", "bila", - "bilakah", + "bilamana", "bisa", - "bisakah", "boleh", - "bolehkah", - "bolehlah", + "buah", "buat", "bukan", "bukankah", "bukanlah", "bukannya", - "cuma", - "dahulu", + "buruh", + "cara", "dalam", + "dalamnya", "dan", "dapat", "dari", + "darimana", "daripada", "dekat", "demi", "demikian", - "demikianlah", "dengan", + "dengannya", "depan", + "dg", "di", "dia", - "dialah", "diantara", "diantaranya", - "dikarenakan", - "dini", + "diatas", + "dibalik", + "dibandingkan", + "dibawah", + "dibawahnya", + "dibeberapa", + "dibelakang", + "diberbagai", + "didalam", + "didalamnya", + "diluar", + "dimana", "diri", "dirinya", + "disaat", + "disamping", + "disebelah", + "disekeliling", + "diseluruh", "disini", - "disinilah", - "dong", - "dulu", - "enggak", - "enggaknya", - "entah", - "entahlah", - "hal", - "hampir", + "ditepi", + "dng", + "dr", + "engkau", + "gambar", + "gimana", + "hadap", + "hai", "hanya", - "hanyalah", "harus", - "haruslah", - "harusnya", - "hendak", - "hendaklah", - "hendaknya", - "hingga", + "hei", "ia", "ialah", - "ibarat", - "ingin", - "inginkah", - "inginkan", "ini", "inikah", "inilah", + "inipun", + "isi", + "isinya", "itu", - "itukah", + "itua", "itulah", + "itupun", + "iye", + "jadi", "jangan", - "jangankan", - "janganlah", + "jauh", + "jelang", + "jenis", "jika", - "jikalau", "juga", - "justru", - "kala", + "kah", "kalau", - "kalaulah", - "kalaupun", "kalian", + "kalo", "kami", "kamilah", "kamu", - "kamulah", "kan", "kapan", "kapankah", - "kapanpun", "karena", "karenanya", + "kau", "ke", - "kecil", + "kebanyakan", + "kecuali", + "kedalam", + "kedepan", + "kedua", + "keduanya", + "keliling", + "keluar", "kemudian", + "kena", "kenapa", + "kendati", "kepada", + "kepadaku", + "kepadamu", "kepadanya", + "kepusatnya", + "kerana", + "keseluruhan", + "keseluruhannya", + "kesemuanya", "ketika", + "ketimbang", "khususnya", - "kini", - "kinilah", - "kiranya", + "kira", "kita", - "kitalah", "kok", + "koq", + "kpd", + "ku", + "la", "lagi", - "lagian", "lah", "lain", "lainnya", "lalu", "lama", - "lamanya", - "lebih", + "lantaran", + "lantas", + "layak", + "layaknya", + "lengah", + "lewat", + "loh", + "luar", "macam", "maka", "makanya", - "makin", - "malah", + "maksud", + "maksudnya", "malahan", "mampu", - "mampukah", "mana", + "manakah", "manakala", - "manalagi", - "masih", - "masihkah", + "manapun", + "masa", "masing", - "mau", + "masing-masing", "maupun", + "mayoritas", "melainkan", "melalui", - "memang", + "melawan", + "melewati", + "menajak", + "menbeli", + "mengajak", "mengapa", + "mengenai", + "mengenainya", + "menjadi", + "menjelang", + "menuju", + "menurut", + "menurutmu", "mereka", - "merekalah", + "merekapun", "merupakan", "meski", + "meskipn", "meskipun", + "misalkan", + "misalnya", + "msl", + "mulai", "mungkin", - "mungkinkah", - "nah", "namun", - "nanti", - "nantinya", - "nyaris", + "nya", "oleh", "olehnya", + "orang", "pada", "padahal", "padanya", - "paling", - "pantas", "para", - "pasti", - "pastilah", + "pasca", + "pd", "per", - "percuma", - "pernah", + "perihal", + "perlu", "pula", "pun", - "rupanya", "saat", "saatnya", - "saja", - "sajalah", - "saling", "sama", "sambil", "sampai", + "sampai-sampai", + "samping", "sana", - "sangat", - "sangatlah", + "sang", + "satu", + "satu-satunya", + "satunya", "saya", - "sayalah", - "se", + "seakan", + "seandainya", + "seantero", "sebab", - "sebabnya", "sebagai", "sebagaimana", - "sebagainya", + "sebagian", "sebaliknya", + "sebangsa", "sebanyak", - "sebegini", - "sebegitu", + "sebelah", "sebelum", "sebelumnya", - "sebenarnya", - "seberapa", - "sebetulnya", - "sebisanya", + "seberang", + "seberat", + "sebesar", "sebuah", + "secara", "sedang", "sedangkan", - "sedemikian", + "sedangkkan", + "sedari", "sedikit", "sedikitnya", + "seekor", "segala", - "segalanya", - "segera", + "segenap", "seharusnya", "sehingga", + "sehubungan", + "seiring", "sejak", - "sejenak", + "sejauh", + "sejenis", + "sejumlah", "sekali", - "sekalian", "sekaligus", "sekalipun", - "sekarang", - "seketika", - "sekiranya", "sekitar", "sekitarnya", - "sela", - "selagi", "selain", "selaku", - "selalu", "selama", - "selamanya", + "selesai", + "seluas", "seluruh", - "seluruhnya", "semacam", - "semakin", - "semasih", - "semaunya", + "semasa", + "semenjak", "sementara", "sempat", "semua", "semuanya", - "semula", "sendiri", - "sendirinya", - "seolah", + "senilai", "seorang", "sepanjang", - "sepantasnya", - "sepantasnyalah", + "sepasang", + "sepeninggal", "seperti", "sepertinya", - "sering", - "seringnya", + "sepeti", + "sepucuk", + "seputar", + "serangkaian", + "seraya", "serta", - "serupa", - "sesaat", - "sesama", - "sesegera", - "sesekali", + "sesampai", + "sesampainya", "seseorang", + "sesuai", "sesuatu", - "sesuatunya", "sesudah", - "sesudahnya", + "setebal", "setelah", - "seterusnya", + "setelahnya", + "setengah", "setiap", - "setidaknya", + "setinggi", + "seusai", "sewaktu", + "si", "siapa", "siapakah", "siapapun", + "silakan", "sini", "sinilah", + "situ", + "soal", "suatu", "sudah", - "sudahkah", - "sudahlah", "supaya", - "tadi", - "tadinya", "tak", + "tan", + "tangguh", "tanpa", "tapi", + "tatkala", "telah", + "tempat", + "tengah", + "tengahnya", "tentang", - "tentu", - "tentulah", - "tentunya", - "terdiri", + "tepat", + "tepatnya", + "teratas", "terhadap", "terhadapnya", - "terlalu", - "terlebih", + "termasuk", + "ternyata", "tersebut", - "tersebutlah", "tertentu", + "terutama", + "tesebut", + "tetap", "tetapi", + "tiada", "tiap", "tidak", "tidakkah", "tidaklah", - "toh", - "waduh", - "wah", - "wahai", + "tidaknya", + "tsb", + "tt", + "ttg", + "tuh", + "tujuh", + "untuk", + "untukmu", + "untuknya", + "untung", + "usah", + "usai", + "via", + "waktu", "walau", "walaupun", - "wong", + "ya", "yaitu", "yakni", "yang", + "yg", ], "mr": [ "अधिक", @@ -3104,395 +4441,586 @@ stopwords = { ], "pt": [ "a", - "acerca", - "adeus", + "a cabo de", + "a caminho de", + "a despeito de", + "a favor de", + "a fim de", + "a menos que", + "a não ser", + "a não ser que", + "a partir de", + "a propósito", + "a respeito de", + "a título de", + "abaixo de", + "acima", + "acima de", + "afinal", + "afora", "agora", + "agora que", + "ai", "ainda", - "algmas", + "ainda mais", "algo", + "algum", + "alguma", "algumas", "alguns", - "ali", + "alguém", "além", + "além de", + "ambas", "ambos", - "ano", - "anos", + "andar", + "andou", + "ante", "antes", + "anti", + "antre", "ao", - "aos", + "ao cabo de", + "ao invés de", + "ao lado", + "ao longo de", + "ao passo que", + "ao redor de", + "aos cuidados de", "apenas", - "apoio", - "apontar", + "apesar de", + "apesar de que", "após", "aquela", "aquelas", "aquele", "aqueles", - "aqui", "aquilo", "as", "assim", + "assim como", + "assim que", + "atras", "através", + "através de", + "atráis", "atrás", + "atrás de", "até", + "até que", + "auto", + "avante", "aí", - "baixo", "bastante", "bem", - "bom", - "breve", + "bem como", "cada", - "caminho", - "catorze", - "cedo", - "cento", - "certamente", - "certeza", + "cara a cara", + "caso", + "cerca", "cima", - "cinco", - "coisa", "com", + "comigo", "como", - "comprido", - "conhecido", - "conselho", + "como se", + "conforme", + "connosco", + "conosco", + "conquanto", + "consigo", + "consoante", + "contanto", + "contanto que", + "contigo", "contra", - "corrente", - "custa", - "cá", + "contudo", + "convosco", + "cuja", + "cujas", + "cujo", + "cujos", + "d'", + "d.", "da", + "dada", + "dado", + "dado que", + "dali", "daquela", + "daquelas", "daquele", - "dar", - "das", + "daqui", + "daqui a", + "daí", "de", - "debaixo", + "de modo que", + "dela", + "delas", + "dele", + "deles", "demais", + "dentre", "dentro", + "dentro de", "depois", + "depois de", "desde", - "desligado", + "desde que", "dessa", + "dessas", "desse", + "desses", "desta", + "destas", "deste", + "destes", + "detrás de", + "deva", + "devam", "deve", "devem", + "devemos", + "devendo", + "dever", + "deveria", + "deveriam", "deverá", - "dez", - "dezanove", - "dezasseis", - "dezassete", - "dezoito", - "dia", - "diante", - "direita", - "diz", - "dizem", - "dizer", - "do", - "dois", - "dos", - "doze", - "duas", - "dá", - "dão", - "dúvida", + "deverão", + "deviam", + "devido", + "devido a", + "devo", + "diante de", + "disso", + "diversas", + "diversos", + "do que", + "donde", + "doutros", + "dum", + "duma", + "durante", "e", + "e/ou", + "eba", + "eis", "ela", "elas", "ele", "eles", + "eles/elas", "em", + "em cima de", + "em frente a", + "em meio a", + "em nome de", + "em prol de", + "em relação a", + "em torno de", + "em vez de", + "em virtude de", + "em vista de", + "em volta de", + "embaixo de", "embora", "enquanto", "entre", + "entretanto", "então", "era", + "eram", + "ergo", "essa", "essas", "esse", "esses", "esta", "estado", + "estamos", + "estando", "estar", + "estarem", + "estaria", + "estariam", + "estarmos", "estará", + "estarão", "estas", "estava", + "estavam", "este", + "esteja", + "estejam", "estes", "esteve", - "estive", "estivemos", + "estiver", "estiveram", - "estiveste", - "estivestes", + "estiverem", + "estivesse", + "estivessem", "estou", "está", - "estás", + "estávamos", "estão", "eu", - "exemplo", - "falta", - "fará", - "favor", - "faz", - "fazeis", - "fazem", - "fazemos", - "fazer", - "fazes", - "fazia", - "faço", - "fez", - "fim", - "final", + "excepto", + "exceto", + "fica", + "ficado", + "ficamos", + "ficando", + "ficar", + "ficaram", + "ficaria", + "ficou", + "fiquei", "foi", "fomos", "for", "fora", + "fora de", "foram", - "forma", - "foste", - "fostes", + "forem", + "fosse", + "fossem", + "frente a", "fui", - "geral", - "grande", - "grandes", - "grupo", - "hoje", - "horas", + "fôr", + "gente", + "graças", + "graças a", + "havendo", + "haver", + "haverem", + "havia", + "haviam", + "houver", + "houvesse", "há", - "iniciar", - "inicio", + "i.e.", + "ia", + "iam", + "ido", + "igual a", + "inté", + "invés de", "ir", + "ireii", + "irem", + "iremos", + "iria", + "iriam", "irá", + "irão", "isso", - "ista", - "iste", "isto", + "junto a", + "junto com", "já", - "lado", - "ligado", - "local", + "já que", + "la", + "las", + "lhe", + "lhes", + "lo", "logo", - "longe", - "lugar", + "logo que", + "los", "lá", - "maior", - "maioria", - "maiorias", "mais", + "mais de", + "mais do que", + "mais que", "mal", + "malgrado", "mas", "me", - "meio", - "menor", + "mediante", "menos", - "meses", + "mesma", + "mesmas", "mesmo", + "mesmo que", + "mesmo se", + "mesmos", "meu", "meus", - "mil", + "mim", "minha", "minhas", - "momento", + "muita", + "muitas", "muito", + "muito menos", "muitos", - "máximo", - "mês", + "muitíssimo", + "n'", "na", + "na frente de", + "na sequência de", "nada", "naquela", "naquele", + "naqueles", + "naquilo", "nas", + "nele", + "neles", "nem", + "nenhum", "nenhuma", + "nenhumas", + "nenhuns", "nessa", + "nessas", "nesse", + "nesses", "nesta", + "nestas", "neste", + "nestes", + "ninguém", "no", - "noite", - "nome", + "no que", "nos", + "nosco", "nossa", "nossas", "nosso", "nossos", - "nova", - "nove", - "novo", - "novos", "num", "numa", - "nunca", - "não", - "nível", "nós", - "número", "o", - "obra", - "obrigada", - "obrigado", - "oitava", - "oitavo", - "oito", + "o(s)", "onde", - "ontem", - "onze", + "onde quer que", + "ora", "os", "ou", "outra", "outras", + "outrem", "outro", "outros", + "outrém", + "oxalá", + "p'ra", + "p/", + "pa", "para", + "para com", + "para que", "parece", - "parte", - "partir", - "pegar", - "pela", - "pelas", + "parecer", "pelo", - "pelos", - "perto", - "pessoas", + "per", + "perante", + "perantes", + "permanece", + "permanecer", + "perto de", "pode", "podem", + "podemos", + "podendo", "poder", + "poderei", + "poderem", + "poderemos", + "poderia", + "poderiam", "poderá", + "poderão", + "poderíamos", "podia", - "ponto", - "pontos", + "podiam", + "podíamos", + "pois", "por", + "por causa de", + "por causa que", + "por conta de", + "por entre", + "por isso", + "por isto", + "por meio de", + "por trás", + "por trás de", + "por volta de", + "porquanto", "porque", - "porquê", - "posição", - "possivelmente", + "portanto", + "porém", + "possa", + "possam", + "possamos", "posso", - "possível", "pouca", + "poucas", "pouco", - "povo", - "primeira", - "primeiro", - "promeiro", - "próprio", - "próximo", + "poucos", + "pouquíssimos", + "pra", + "precisam", + "precisar", + "precisaram", + "precisarão", + "precisou", + "prestes a", + "pretender", + "pretendiam", + "pro", + "pré", + "pré-", + "pró", + "pude", + "pudemos", "puderam", + "puderem", + "pudesse", + "pudessem", + "pós", "pôde", - "põe", - "põem", + "pôr", + "público", + "q.b.", + "quais", + "quaisquer", "qual", "qualquer", "quando", + "quanta", + "quantas", "quanto", - "quarta", - "quarto", - "quatro", + "quanto a", + "quanto baste", + "quanto mais", + "quantos", "que", "quem", "quer", - "quero", - "questão", - "quieto", - "quinta", - "quinto", - "quinze", + "quão", "quê", - "relação", - "sabe", - "saber", + "rente a", + "rente de", + "rumo a", "se", - "segunda", + "se bem que", + "se e somente se", + "se-", "segundo", - "sei", - "seis", + "seja", + "sejam", "sem", - "sempre", + "sem falar de", + "sempre que", + "sendo", + "sendo que", + "senão", "ser", + "serei", + "serem", + "seremos", "seria", - "sete", + "seriam", + "sermos", + "será", + "serão", "seu", "seus", - "sexta", - "sexto", - "sim", - "sistema", + "si", + "sido", "sob", "sobre", - "sois", - "somente", "somos", "sou", + "sse", "sua", "suas", + "sub", "são", - "sétima", - "sétimo", + "sê", + "só que", + "sôbre", + "ta", + "tais", "tal", - "talvez", - "também", + "tampouco", + "tanta", + "tantas", "tanto", - "tarde", + "tantos", "te", "tem", "temos", - "tempo", - "tendes", + "tende", + "tendo", + "tenha", + "tenham", + "tenhamos", "tenho", - "tens", + "tentado", "tentar", "tentaram", - "tente", - "tentei", "ter", - "terceira", - "terceiro", + "terei", + "terem", + "teremos", + "teria", + "teriam", + "termos", + "terá", + "terão", + "teríamos", "teu", "teus", "teve", - "tipo", + "ti", + "tido", + "tinha", + "tinham", "tive", "tivemos", + "tiver", "tiveram", - "tiveste", - "tivestes", + "tiverem", + "tivesse", + "tivessem", + "to", "toda", "todas", + "todavia", "todo", "todos", - "trabalhar", - "trabalho", - "treze", - "três", + "trás", "tu", "tua", "tuas", "tudo", + "tá", "tão", + "tão logo", + "té", "têm", + "tínhamos", + "ultra", "um", "uma", + "uma vez que", "umas", "uns", - "usa", - "usar", "vai", "vais", - "valor", - "veja", - "vem", - "vens", - "ver", - "verdade", - "verdadeiro", - "vez", - "vezes", - "viagem", - "vindo", - "vinte", + "vamos", + "varias", + "varios", + "versus", + "via", + "visto", + "visto que", + "voce", "você", "vocês", "vos", @@ -3500,49 +5028,28 @@ stopwords = { "vossas", "vosso", "vossos", + "vou", + "vs", + "vá", + "várias", "vários", "vão", - "vêm", + "vérsus", "vós", - "zero", "à", + "à beira de", + "à custa de", + "à expensa de", + "à luz de", + "à medida que", + "àquela", + "àqueles", "às", - "área", + "às custas de", + "às expensas de", "é", - "és", - "último", - ], - "so": [ - "aad", - "albaabkii", - "atabo", - "ay", - "ayaa", - "ayee", - "ayuu", - "dhan", - "hadana", - "in", - "inuu", - "isku", - "jiray", - "jirtay", - "ka", - "kale", - "kasoo", - "ku", - "kuu", - "lakin", - "markii", - "oo", - "si", - "soo", - "uga", - "ugu", - "uu", - "waa", - "waxa", - "waxuu", + "íamos", + "\u200b\u200bem", ], "sw": [ "akasema", @@ -4140,651 +5647,168 @@ stopwords = { "یہبں", ], "vi": [ - "a ha", - "a-lô", - "ai", - "ai ai", - "ai nấy", - "alô", - "amen", - "anh", - "bao giờ", - "bao lâu", - "bao nhiêu", - "bao nả", - "bay biến", - "biết", - "biết bao", - "biết bao nhiêu", - "biết chừng nào", - "biết mấy", - "biết đâu", - "biết đâu chừng", - "biết đâu đấy", - "bà", - "bài", - "bác", - "bây bẩy", - "bây chừ", - "bây giờ", - "bây nhiêu", - "bèn", - "béng", - "bông", - "bạn", - "bản", - "bất chợt", - "bất cứ", - "bất giác", - "bất kì", - "bất kể", - "bất kỳ", - "bất luận", - "bất nhược", - "bất quá", - "bất thình lình", - "bất tử", - "bất đồ", - "bấy", - "bấy chầy", - "bấy chừ", - "bấy giờ", - "bấy lâu", - "bấy lâu nay", - "bấy nay", + "bên", "bấy nhiêu", - "bập bà bập bõm", - "bập bõm", - "bắt đầu từ", "bằng", - "bằng không", - "bằng nấy", - "bằng ấy", - "bển", - "bệt", - "bị", - "bỏ mẹ", - "bỗng", - "bỗng chốc", - "bỗng dưng", - "bỗng không", - "bỗng nhiên", - "bỗng đâu", - "bộ", - "bội phần", - "bớ", "bởi", - "bởi chưng", - "bởi nhưng", - "bởi thế", - "bởi vì", - "bởi vậy", - "bức", - "cao", - "cha", - "cha chả", - "chao ôi", - "chiếc", + "cc", + "chao", "cho", - "cho nên", - "cho tới", - "cho tới khi", - "cho đến", - "cho đến khi", - "choa", - "chu cha", - "chui cha", - "chung cục", - "chung qui", - "chung quy", - "chung quy lại", - "chuyện", - "chành chạnh", - "chí chết", + "cho dù", + "chán", "chính", - "chính là", - "chính thị", - "chùn chùn", - "chùn chũn", - "chú", - "chú mày", - "chú mình", - "chúng mình", - "chúng ta", - "chúng tôi", - "chăn chắn", - "chăng", - "chưa", - "chầm chập", - "chậc", - "chắc", - "chắc hẳn", - "chẳng lẽ", - "chẳng những", - "chẳng nữa", - "chẳng phải", - "chết nỗi", - "chết thật", - "chết tiệt", - "chỉ", - "chỉn", - "chốc chốc", - "chớ", - "chớ chi", - "chợt", - "chủn", + "chút", "chứ", - "chứ lị", - "coi bộ", - "coi mòi", - "con", - "cu cậu", - "cuốn", - "cuộc", - "càng", "các", "cái", - "cây", "còn", "có", - "có chăng là", - "có dễ", - "có thể", "có vẻ", - "cóc khô", - "cô", - "cô mình", - "công nhiên", "cùng", - "cùng cực", - "cùng nhau", - "cùng với", - "căn", - "căn cắt", - "cũng", - "cũng như", - "cũng vậy", - "cũng vậy thôi", - "cơ", - "cơ chừng", - "cơ hồ", "cơ mà", - "cơn", "cả", - "cả thảy", - "cả thể", - "cảm ơn", - "cần", - "cật lực", - "cật sức", - "cậu", - "cổ lai", "của", - "cứ", - "cứ việc", - "cực lực", "do", - "do vì", "do vậy", "do đó", "duy", - "dào", - "dì", - "dù cho", - "dù rằng", + "dù", + "dù sao", + "dù vậy", "dưới", + "dường như", "dạ", - "dần dà", - "dần dần", - "dầu sao", "dẫu", - "dẫu sao", - "dễ sợ", - "dễ thường", - "dở chừng", - "dữ", - "em", + "dẫu vậy", "giữa", "gì", "hay", - "hoàn toàn", + "hay là", "hoặc", - "hơn", + "hơn nữa", + "hả", "hầu hết", - "họ", - "hỏi", - "khi", - "khác", - "không", - "luôn", + "hết", + "hề", + "hễ", + "không những", + "l", "là", - "làm", "lên", - "lúc", - "lại", - "lần", - "lớn", - "muốn", + "lại nữa", + "lẫn", + "lắm", "mà", - "mình", + "mà còn", + "mấy", + "mặc dù", + "mặt khác", + "mọi", "mỗi", - "một", - "một cách", - "mới", - "mợ", + "một chút", + "một nửa", + "một số", + "một vài", + "một ít", "ngay", - "ngay cả", - "ngay khi", - "ngay lúc", - "ngay lập tức", - "ngay tức khắc", - "ngay từ", - "nghe chừng", - "nghe đâu", - "nghen", - "nghiễm nhiên", - "nghỉm", "ngoài", "ngoài ra", - "ngoải", - "ngày", - "ngày càng", - "ngày ngày", - "ngày xưa", - "ngày xửa", - "ngôi", - "ngõ hầu", - "ngăn ngắt", - "ngươi", - "người", - "ngọn", - "ngọt", - "ngộ nhỡ", - "nh", - "nhau", - "nhiên hậu", - "nhiều", - "nhiệt liệt", - "nhung nhăng", - "nhà", - "nhân dịp", - "nhân tiện", + "ngược lại", + "nhá", + "nhân", "nhé", - "nhón nhén", "như", - "như chơi", - "như không", - "như quả", - "như thể", - "như tuồng", "như vậy", "nhưng", - "nhưng mà", - "nhược bằng", - "nhất", - "nhất loạt", - "nhất luật", - "nhất mực", - "nhất nhất", - "nhất quyết", - "nhất sinh", - "nhất thiết", - "nhất tâm", - "nhất tề", - "nhất đán", - "nhất định", - "nhận", + "nhất là", + "nhằm", "nhỉ", - "nhỡ ra", + "nhờ", "những", - "những ai", - "những như", "nào", "này", + "nè", "nên", - "nên chi", - "nó", - "nóc", - "nói", - "năm", - "nơi", - "nấy", "nếu", "nếu như", - "nền", - "nọ", - "nớ", - "nức nở", + "nửa", "nữa", - "oai oái", - "oái", - "pho", - "phè", - "phóc", - "phót", - "phăn phắt", - "phương chi", - "phải", - "phải chi", - "phải chăng", - "phắt", - "phỉ phui", - "phỏng", - "phỏng như", - "phốc", - "phụt", - "phứt", + "phía", + "phần lớn", "qua", - "qua quít", - "qua quýt", - "quyết", - "quyết nhiên", - "quyển", - "quá", - "quá chừng", - "quá lắm", - "quá sá", - "quá thể", - "quá trời", - "quá xá", - "quá đỗi", - "quá độ", - "quá ư", - "quý hồ", "quả", - "quả là", - "quả tang", - "quả thật", - "quả tình", - "quả vậy", - "quả đúng", "ra", - "ra phết", - "ra sao", - "ra trò", - "ren rén", - "riu ríu", "riêng", - "riệt", - "rày", - "ráo", - "ráo trọi", - "rén", - "rích", - "rón rén", - "rút cục", - "răng", - "rất", + "rùi", "rằng", - "rằng là", - "rốt cuộc", - "rốt cục", "rồi", - "rứa", - "sa sả", + "sang", "sao", "sau", - "sau chót", - "sau cuối", - "sau cùng", - "sau đó", - "so", - "song le", - "suýt", - "sì", - "sạch", - "sất", - "sắp", - "sẽ", - "số", - "số là", - "sốt sột", - "sở dĩ", - "sự", - "tanh", - "tha hồ", - "than ôi", - "thanh", + "song", + "thay", "theo", - "thi thoảng", - "thoạt", - "thoạt nhiên", - "thoắt", - "thuần", - "thà", - "thà là", - "thà rằng", - "thành ra", - "thành thử", - "thái quá", - "tháng", + "thiệt", "thì", - "thì thôi", - "thình lình", - "thím", + "thí dụ", "thôi", - "thúng thắng", - "thương ôi", - "thường", - "thảo hèn", - "thảo nào", - "thấy", - "thẩy", - "thậm", - "thậm chí", - "thật lực", - "thật ra", - "thật vậy", + "thật", "thế", "thế là", "thế mà", - "thế nào", - "thế nên", - "thế ra", - "thế thì", - "thế à", - "thếch", - "thỉnh thoảng", - "thỏm", - "thốc", - "thốc tháo", - "thốt", - "thốt nhiên", - "thộc", - "thời gian", - "thục mạng", - "thửa", - "thực ra", - "thực sự", - "thực vậy", - "tiếp theo", - "tiếp đó", - "tiện thể", - "toà", - "toé khói", - "toẹt", + "thế nhưng", + "toàn", + "toàn bộ", + "toàn thể", "trong", "trên", "trước", - "trước kia", - "trước nay", - "trước tiên", - "trước đây", - "trước đó", - "trếu tráo", - "trển", - "trệt", - "trệu trạo", - "trỏng", - "trời đất ơi", - "trừ phi", + "trời", "tuy", "tuy nhiên", - "tuy rằng", - "tuy thế", "tuy vậy", - "tuyệt nhiên", - "tuần tự", - "tuốt luốt", - "tuốt tuồn tuột", - "tuốt tuột", - "tà tà", - "tênh", - "tít mù", - "tò te", - "tôi", - "tông tốc", - "tù tì", - "tăm tắp", + "tóm lại", "tại", - "tại vì", - "tấm", - "tấn", "tất cả", - "tất thảy", - "tất tần tật", - "tất tật", - "tắp", - "tắp lự", - "tọt", - "tỏ ra", - "tỏ vẻ", - "tốc tả", - "tối ư", - "tột", - "tớ", + "tận", + "tổ", "tới", - "tức thì", - "tức tốc", + "tức", + "tức là", "từ", - "từng", - "tự vì", - "tựu trung", - "veo", - "veo veo", - "việc", - "vung thiên địa", - "vung tàn tán", - "vung tán tàn", + "ui", "và", + "vài", + "vài ba", "vào", - "vâng", - "vèo", "vì", - "vì chưng", "vì thế", "vì vậy", - "ví bằng", - "ví dù", - "ví phỏng", - "ví thử", - "vô hình trung", - "vô kể", - "vô luận", + "ví dụ", + "vô", + "vô số", "vô vàn", - "văng tê", - "vạn nhất", - "vả chăng", - "vả lại", - "vẫn", "vậy", "vậy là", - "vậy thì", + "vậy mà", "về", - "vị tất", - "vốn dĩ", "với", - "với lại", - "vở", - "vụt", - "vừa", - "vừa mới", - "xa xả", - "xiết bao", - "xon xón", - "xoành xoạch", - "xoét", - "xoẳn", - "xoẹt", - "xuất kì bất ý", - "xuất kỳ bất ý", - "xuể", "xuống", - "xăm xúi", - "xăm xăm", - "xăm xắm", - "xềnh xệch", - "xệp", "à", - "à ơi", - "ào", - "á", - "á à", - "ái", - "ái chà", - "ái dà", - "áng", - "âu là", - "ô hay", - "ô hô", - "ô kê", - "ô kìa", - "ôi chao", - "ôi thôi", - "ông", - "úi", - "úi chà", - "úi dào", - "ý", - "ý chừng", - "ý da", - "đang", + "đa số", "đi", - "điều", - "đành đạch", - "đáng lí", - "đáng lý", - "đáng lẽ", - "đánh đùng", - "đáo để", + "đâu", "đây", - "đã", "đó", + "đôi", "được", - "đại loại", - "đại nhân", - "đại phàm", - "đại để", + "đấy", "đến", - "đến nỗi", - "đều", "để", - "ơ", - "ơ hay", - "ơ kìa", - "ơi", - "ư", + "đối với", "ạ", - "��� ơi", "ấy", - "ầu ơ", - "ắt", - "ắt hẳn", - "ắt là", - "ối dào", - "ối giời", - "ối giời ơi", - "ồ", - "ổng", - "ớ", - "ờ", "ở", - "ở trên", - "ủa", - "ứ hự", - "ứ ừ", - "ừ", - "ử", ], "yo": [ "a", @@ -4849,547 +5873,1573 @@ stopwords = { "ọ̀pọ̀lọpọ̀", ], "zh": [ - "、", - "。", - "〈", - "〉", - "《", - "》", + "", "一", + "一争", + "一些", "一切", - "一则", - "一方面", "一旦", - "一来", - "一样", - "一般", - "七", - "万一", - "三", - "上下", + "一点", + "一爭", + "上", + "上前", + "上表", + "下", + "不", "不仅", + "不会", "不但", + "不僅", "不光", + "不关", + "不准", "不单", - "不只", - "不如", - "不怕", - "不惟", - "不成", - "不拘", - "不比", - "不然", - "不特", - "不独", + "不可", + "不單", + "不够", + "不夠", + "不应", + "不得", + "不想", + "不愿", + "不應", + "不是", + "不會", + "不準", + "不用", "不管", + "不經", + "不肯", + "不能", + "不要", + "不該", + "不論", "不论", - "不过", - "不问", + "不该", + "不過", + "不需", + "不願", "与", "与其", - "与否", - "与此同时", "且", - "两者", + "且是", + "並", + "並且", + "並非", "个", + "个人", + "中", "临", "为", "为了", + "为人", "为什么", - "为何", - "为着", - "乃", + "主", "乃至", - "么", "之", - "之一", + "之上", + "之下", + "之中", + "之內", + "之内", + "之初", + "之前", + "之后", + "之外", + "之後", "之所以", - "之类", - "乌乎", - "乎", - "乘", - "九", + "之时", + "之時", + "之間", + "之间", "也", - "也好", - "也罢", + "也是", + "书", "了", - "二", + "争辩", + "事", "于", - "于是", - "于是乎", - "云云", - "五", + "井", + "亚", + "亞", + "亦为", + "亦是", + "亦為", + "亭", + "亲", + "人", + "人人", "人家", "什么", - "什么样", + "什麼", + "今", + "仍是", + "仍算", "从", - "从而", "他", - "他人", "他们", + "他俩", + "他倆", + "他們", + "代", + "令", "以", - "以便", - "以免", + "以上", + "以下", + "以为", + "以來", + "以前", + "以北", "以及", + "以后", + "以外", + "以往", + "以後", + "以来", + "以為", + "以爲", "以至", - "以至于", - "以致", "们", + "价", "任", "任何", - "任凭", + "众", + "会", + "传", + "伪", + "似乎", "似的", "但", "但是", + "位", + "低", + "住", + "体", "何", - "何况", - "何处", - "何时", + "何方", + "佛", + "作", "作为", + "作為", "你", "你们", - "使得", - "例如", + "你們", + "你自己", + "你门", + "佬", + "併", + "使", + "來", + "供", "依", + "依据", + "依據", "依照", - "俺", - "俺们", - "倘", - "倘使", - "倘或", - "倘然", + "依靠", + "侠", + "侧", + "侨", + "侯", + "便是", + "係", + "保存", + "保級", + "保级", + "俠", + "信", + "修复", + "修復", + "個", + "個人", + "們", "倘若", - "借", + "借助", + "借由", + "借着", + "值", "假使", "假如", - "假若", + "偏", + "做", + "側", + "偽", + "傳", + "傻", "像", - "八", - "六", - "兮", + "像是", + "僑", + "價", + "儘管", + "元", + "先", + "光", + "光棍", + "党", + "內", + "內外", + "全", + "全体", + "全副", + "全套", + "全部", + "全體", + "公", + "关", "关于", + "关心", + "兵", "其", - "其一", "其中", - "其二", "其他", "其余", "其它", - "其次", - "具体地说", - "具体说来", - "再者", - "再说", - "冒", + "其餘", + "典", + "兼", + "内", + "内外", + "军", + "冠", + "冢", "冲", - "况且", + "冷", + "准", + "准备", + "减慢", "几", - "几时", "凭", "凭借", - "则", + "出手", + "刀", + "分", + "分布", + "列", + "则为", + "则是", + "初", + "別", + "別人", "别", + "别人", "别的", - "别说", "到", + "到处", + "制", + "券", + "剂", + "則是", + "則為", + "前", + "前任", "前后", - "前者", - "加之", + "前後", + "剑", + "剧", + "副", + "劇", + "劍", + "劑", + "力", + "办", + "办学", + "功", + "加", + "劣", + "努力", + "包", + "包裹", + "化", + "区", + "医", + "區", + "半", + "单", + "卡", + "卫", "即", - "即令", "即使", "即便", - "即或", - "即若", + "却是", + "卻", + "卻是", + "卿", + "厂", + "厅", + "历届", + "压", + "原", + "去", + "县", "又", + "又或", + "又是", "及", - "及其", - "及至", - "反之", - "反过来", - "反过来说", + "友", + "发展", + "发育", + "变", + "变得", + "口", + "古", "另", - "另一方面", "另外", "只是", "只有", + "只能", "只要", - "只限", - "叫", - "叮咚", "可", "可以", "可是", - "可见", + "可能", + "台", + "史", + "叶", + "号", + "司", + "吃", "各", "各个", "各位", + "各個", + "各天", + "各州", + "各式", + "各樣", "各种", + "各种各样", + "各種", + "各種各樣", + "各类", + "各級", + "各级", "各自", + "各項", + "各類", + "各项", "同", - "同时", + "同年", + "名", + "后", "向", - "向着", - "吓", "吗", - "否则", + "君", + "否", "吧", - "吧哒", - "吱", "呀", - "呃", - "呕", - "呗", - "呜", - "呜呼", + "员", "呢", - "呵", - "呸", - "呼哧", - "咋", + "周", + "味", "和", - "咚", - "咦", - "咱", + "和美", "咱们", - "咳", - "哇", - "哈", - "哈哈", - "哉", - "哎", - "哎呀", - "哎哟", - "哗", - "哟", - "哦", - "哩", + "品", + "哈尔滨", + "哈爾濱", + "員", "哪", "哪个", "哪些", + "哪個", "哪儿", - "哪天", - "哪年", + "哪兒", "哪怕", - "哪样", - "哪边", + "哪裏", + "哪裡", "哪里", - "哼", - "哼唷", - "唉", + "唯有", + "商", "啊", - "啐", - "啥", "啦", - "啪达", - "喂", - "喏", - "喔唷", - "嗡嗡", + "喇", + "喜", + "喜欢", + "喜歡", + "單", + "單憑", + "嗎", "嗬", - "嗯", - "嗳", - "嘎", - "嘎登", - "嘘", "嘛", - "嘻", - "嘿", - "四", + "嘴", + "器", + "回", "因", "因为", + "因应", + "因應", "因此", - "因而", - "固然", + "因為", + "团", + "园", + "围", + "国", + "图", + "圆", + "圈", + "國", + "圍", + "園", + "圓", + "圖", + "團", + "土", + "圣", "在", - "在下", + "在內", + "在内", "地", + "场", + "坊", + "坟", + "坡", + "型", + "埋", + "城", + "埤", + "執政", + "基", + "基于", + "基於", + "堂", + "堡", + "堤", + "報", + "場", + "塔", + "塘", + "墓", + "墙", + "增長", + "增长", + "墟", + "墳", + "壓", + "士", + "处", + "外", "多", "多少", + "多次", + "夜", + "够", + "夠", + "夢", + "大", + "大家", + "天", + "头", + "夹", + "夾", + "奏", + "奖", + "套", + "女", + "女士们", + "女士门", + "奸", "她", "她们", + "她俩", + "她倆", + "她們", + "好", + "好了", + "好像", "如", - "如上所述", "如何", - "如其", + "如同", "如果", - "如此", - "如若", - "宁", - "宁可", + "妃", + "妇", + "妳", + "妹", + "始", + "娘", + "婆", + "婦", + "子", + "孔", + "字", + "季", + "学", + "學", "宁愿", - "宁肯", "它", "它们", + "它們", + "安全", + "宏", + "宗", + "官", + "实属", + "审", + "客", + "室", + "宫", + "宮", + "家", + "宽", + "富", + "實屬", + "審", + "寬", "对", "对于", + "对方", + "对此", + "寺", "将", - "尔后", - "尚且", + "將", + "對", + "對方", + "對於", + "對此", + "小", + "尖", "就", "就是", - "就是说", - "尽", + "就算", + "尸", "尽管", - "岂但", - "己", + "局", + "层", + "屋", + "屍", + "展", + "属", + "層", + "屬", + "屯", + "山", + "屿", + "岗", + "岛", + "岩", + "岭", + "岸", + "峡", + "峰", + "島", + "峽", + "崖", + "崗", + "嶺", + "嶼", + "川", + "州", + "工", + "左右", + "差", + "巷", + "币", + "市", + "布", + "师", + "希望", + "帝", + "带", + "師", + "席", + "帮", + "帶", + "帽", + "幣", + "幫", + "年", "并", "并且", - "开外", + "并非", + "幾", + "庄", + "床", + "庐", + "库", + "应", + "应当", + "应该", + "底", + "店", + "庙", + "府", + "度", + "座", + "庫", + "庭", + "廟", + "廠", + "廬", + "廳", + "廷", + "建基於", + "开口", "开始", - "归", + "式", + "弯", + "張", + "強", + "弹", + "强", + "彈", + "彎", "当", - "当着", - "彼", + "当中", + "当届", + "录", + "形", + "形容", + "形成", + "影响", + "影響", "彼此", "往", + "径", "待", + "很多", + "後", + "徑", + "徒", "得", - "怎", - "怎么", - "怎么办", + "得宠", + "得寵", + "從", + "御", + "微", + "徽", + "心", + "必", + "必須", + "必须", + "志", + "快", + "态", "怎么样", - "怎样", - "总之", - "总的来看", - "总的来说", - "总的说来", - "总而言之", - "恰恰相反", + "怎樣", + "怎麼", + "怕", + "性", + "怪", + "总", + "恆", + "恋", + "恒", "您", - "慢说", + "想", + "愛", + "感", + "感到", + "感覺", + "感觉", + "愿意", + "態", + "憑", + "憑藉", + "懂", + "懂得", + "應", + "應當", + "應該", + "懒得", + "戀", + "戏", "我", "我们", + "我們", + "我自己", + "我门", "或", "或是", "或者", + "战", + "截止", + "截至", + "戰", + "戲", + "戶", + "户", + "房", "所", "所以", + "所有", + "手", + "才是", "打", + "执政", "把", - "抑或", - "拿", + "报", + "拖", + "持續", "按", "按照", - "换句话说", - "换言之", + "挡", + "损失", "据", - "接着", - "故", - "故此", - "旁人", - "无宁", + "排行", + "接唱", + "接触", + "接觸", + "控制", + "推进", + "推進", + "描述", + "損失", + "擋", + "據", + "支", + "教", + "敢", + "数", + "整", + "整个", + "整個", + "整场", + "整块", + "整場", + "整塊", + "整套", + "整所", + "整架", + "整片", + "整顆", + "整颗", + "數", + "文", + "斋", + "斗", + "新", + "方", + "於", + "族", + "旗", "无论", "既", "既是", "既然", - "时候", + "日", + "日趋", + "日趨", + "旧", + "时", + "星", "是", - "是的", + "是否", + "是否是", + "是次", + "显", + "显得", + "時", + "晚", + "暖", + "暗", + "暨", + "曲", + "更为", + "更是", + "更為", + "更趋", + "更趨", + "書", "替", + "會", + "會不會", + "月", "有", "有些", "有关", "有的", - "望", + "有關", + "服", "朝", - "朝着", + "期", + "期間", + "期间", + "未能", + "末", "本", - "本着", + "本人", + "本地", + "本屆", + "本届", + "本班", + "本身", + "术", + "机", + "权", + "杆", + "材", + "村", + "束", "来", - "来着", - "极了", - "果然", - "果真", + "杯", + "板", + "林", + "枪", + "架", "某", "某个", "某些", + "某個", + "某种", + "某種", + "染色", + "柜", + "树", + "校", + "株", + "核", "根据", + "根據", + "格", + "案", + "档", + "桥", + "桨", + "桿", + "梁", + "梁耀忠", + "梦", + "棍", + "棒", + "棚", + "椭", + "業", + "楼", + "榜", + "槍", + "槳", + "樂", + "樂意", + "樓", + "樹", + "橋", + "橙", + "機", + "橢", + "檔", + "櫃", + "權", + "次", + "欲", + "款", + "歌", + "正", "正如", + "正是", "此", - "此外", - "此间", - "毋宁", + "此套", + "此次", + "此种", + "此種", + "此等", + "此类", + "此項", + "此類", + "此项", + "歷", + "歷屆", + "死", + "段", + "殿", + "母", + "毎年", "每", + "每个", + "每位", + "每個", + "每元", + "每升", + "每卡", + "每周", + "每天", + "每幅", + "每年", + "每座", "每当", + "每戶", + "每户", + "每所", + "每日", + "每枚", + "每次", + "每段", + "每片", + "每秒", + "每組", + "每组", + "每边", + "每週", + "每邊", + "每間", + "每间", + "每队", + "每隊", + "每集", + "每首", + "毒", "比", - "比如", - "比方", + "比如說", + "比起", + "氏", + "气", + "氣", + "水", + "永保", + "江", + "池", + "沒", + "沒有", + "沒能", + "沟", + "没", + "没有", + "没能", + "河", + "治军", + "治軍", + "沼", "沿", "沿着", - "漫说", - "焉", - "然则", - "然后", - "然而", - "��", - "照着", + "沿著", + "況且", + "泉", + "法", + "波", + "洋", + "洞", + "洲", + "派", + "流沙", + "浅", + "浊", + "浓", + "浦", + "海", + "涉世", + "涌", + "液", + "淡", + "深", + "深感", + "混", + "淺", + "清", + "減慢", + "渡", + "港", + "湖", + "湾", + "準", + "準備", + "溝", + "溥仪", + "溥儀", + "溪", + "满", + "满洲", + "滩", + "滿", + "滿洲", + "潮", + "澡", + "澳", + "濁", + "濃", + "灘", + "灣", + "火", + "炉", + "炎", + "炮", + "点", + "為", + "為了", + "為人", + "烃", + "烟", + "热", + "烴", + "無", + "無論", + "煙", + "熟", + "熱", + "營", + "爐", + "爭取", + "爭辯", + "爱", + "爲", + "父", + "爷", + "爺", + "牆", + "片", + "版", + "牌", + "牠", + "牠們", + "物", + "犯", + "状", + "狀", + "狂", + "狗", + "狮", + "猫", + "獅", + "獎", + "獲利", + "率", + "王", + "班", + "球", + "琴", "甚么", - "甚而", "甚至", + "甚至是", + "甚麼", + "甚麽", + "生", "用", "由", "由于", - "由此可见", + "由於", + "电", + "男", + "町", + "画", + "界", + "畔", + "畫", + "當", + "當中", + "當屆", + "病", + "症", + "癌", + "癖", + "發展", + "發育", "的", + "的話", "的话", - "相对而言", - "省得", + "皮", + "盃", + "监管", + "盖因", + "監管", + "目", + "直到", + "直至", + "相对", + "相對", + "相比", + "省", + "看", + "看似", + "看得", + "眼", + "眾", + "眾多", "着", - "着呢", - "矣", + "督", + "瞭", + "短", + "石", + "矿", + "码", + "砲", + "硅", + "碑", + "碱", + "碼", + "礁", + "礦", + "礼", + "社", + "祂", + "神", + "祠", + "禮", "离", - "第", + "离开", + "秀", + "私交", + "秋", + "种", + "科", + "秤", + "稅", + "税", + "種", + "突感", + "窑", + "窟", + "窯", + "站", + "端", + "競選", + "符", + "笨", "等", - "等等", "管", - "紧接着", - "纵", - "纵令", + "管理", + "箱", + "節", + "篇", + "籍", + "米", + "类", + "粉", + "精", + "糖", + "系", + "紀", + "紅", + "紋", + "純", + "紙", + "級", + "素", + "組", + "結", + "給", + "綉", + "經", + "經由", + "經過", + "綜", + "綫", + "綱", + "網", + "線", + "緣", + "縣", + "縱使", + "總", + "繞", + "繼", + "红", + "级", + "纪", + "纯", + "纲", "纵使", - "纵然", + "纸", + "纹", + "线", + "组", "经", + "经由", "经过", - "结果", + "结", + "绕", "给", - "继而", - "综上所述", - "罢了", + "绣", + "继", + "综", + "网", + "罩", + "罪", + "署", + "羊", + "美", + "群", + "翁", + "老", "者", "而", "而且", - "而况", - "而外", "而已", "而是", - "而言", + "而非", + "聖", + "肉", + "肯", + "肺", + "胎", + "胚", + "胶", "能", - "腾", + "能否", + "能够", + "能夠", + "脚", + "脸", + "腔", + "腳", + "腿", + "膜", + "膠", + "臉", + "臨", "自", - "自个儿", "自从", - "自各儿", "自家", "自己", + "自從", + "自我", "自身", "至", "至于", + "至於", + "臺", + "與", + "與其", + "舊", + "舞", + "舟", + "舰", + "舱", + "船", + "艇", + "艙", + "艦", + "色", + "节", + "花", "若", "若是", - "若非", - "莫若", + "茶", + "药", + "莊", + "获利", + "菌", + "菜", + "营", + "葉", + "著", + "蓋因", + "蓝", + "藉", + "藉助", + "藉由", + "藉著", + "藍", + "藤", + "藥", + "藩", + "處", + "號", "虽", "虽则", "虽然", - "虽说", + "蛙", + "行", + "術", + "街", + "衛", + "衣", + "表", + "表现", + "表現", + "表示", "被", + "装", + "裏", + "裔", + "裙", + "裝", + "裡", + "裡面", + "裤", + "製", + "褲", "要", - "要不", - "要不是", - "要不然", + "要不要", "要么", "要是", - "让", + "要求", + "親", + "覺得", + "觀", + "观", + "觉得", + "角", + "計劃", + "記", + "詞", + "試圖", + "詩", + "話", + "該", + "該屆", + "該批", + "該族", + "該條", + "該段", + "該組", + "該集", + "該項", + "誌", + "認為", + "認識", + "語", + "誤信", + "說", + "誰", + "課", + "請", + "論", + "諸", + "諸如", + "謂", + "證", + "譜", + "變", + "變得", + "认为", + "认识", + "记", + "许多", + "许许多多", "论", - "设使", - "设若", + "证", + "词", + "诗", + "话", "该", - "诸位", + "该届", + "该批", + "该族", + "该条", + "该段", + "该组", + "该集", + "语", + "误信", + "说", + "请", + "诸", + "诸如", + "课", "谁", - "谁知", - "赶", + "谓", + "谱", + "谷", + "豆", + "象", + "貓", + "負債", + "費", + "資", + "賣", + "質", + "賽", + "负债", + "质", + "费", + "资", + "赛", "起", - "起见", + "起伏", + "起来", "趁", - "趁着", - "越是", + "超", + "趋", + "趋于", + "趨", + "趨於", + "距", + "距离", + "距離", "跟", + "路", + "躁", + "身", + "車", + "軍", + "軒", + "軟", + "軸", + "較", + "輕", + "车", + "轩", + "软", + "轴", + "轻", "较", - "较之", + "辦", + "辦學", "边", + "达到", "过", + "过后", + "运作", + "近", + "还", "还是", "还有", "这", - "这个", - "这么", - "这么些", - "这么样", - "这么点儿", "这些", - "这会儿", "这儿", - "这就是说", - "这时", + "这养", "这样", - "这边", + "这次", + "这种", "这里", - "进而", + "远", "连", + "连任", "连同", + "迷", + "追溯", + "透过", + "透過", + "這", + "這些", + "這個", + "這兒", + "這樣", + "這樣子", + "這次", + "這種", + "這裏", + "這裡", + "這邊", + "這麼", + "通", "通过", - "遵照", + "通過", + "逢", + "連", + "連任", + "連同", + "週", + "運作", + "過", + "過後", + "道", + "達到", + "遠", + "選舉", + "還是", + "邊", "那", "那个", - "那么", - "那么些", - "那么样", "那些", - "那会儿", "那儿", - "那时", + "那兒", "那样", - "那边", + "那樣", + "那裏", + "那裡", + "那邊", "那里", - "鄙人", - "鉴于", - "阿", + "邦", + "邨", + "郎", + "郡", + "部", + "都", + "都是", + "鄉", + "配", + "酒", + "酸", + "醣", + "醫", + "里", + "里面", + "重", + "量", + "金", + "針", + "針對", + "銘", + "鋼", + "錄", + "錦", + "鍋", + "鍵", + "鎊", + "鎮", + "鏈", + "鏡", + "鐵", + "鑒於", + "针", + "针对", + "钢", + "铁", + "铭", + "链", + "锅", + "锦", + "键", + "镇", + "镜", + "長", + "长", + "門", + "開口", + "開始", + "間", + "閣", + "閣下", + "關", + "關心", + "關於", + "门", + "间", + "阁", + "队", + "阶", + "际", + "陆", + "降解", + "院", "除", "除了", - "除此之外", + "除外", "除非", + "陵", + "陸", + "隊", + "階", "随", - "随着", - "零", - "非但", - "非徒", + "随同", + "隔", + "際", + "隨", + "隨同", + "难过", + "集", + "雖", + "雖則", + "雖然", + "離", + "離開", + "難過", + "電", + "需", + "需要", + "非", "靠", - "顺", - "顺着", + "面", + "音", + "頂", + "須", + "頭", + "頭個", + "題", + "額", + "願意", + "類", + "顯", + "顯得", + "顶", + "须", + "题", + "额", + "風", + "风", + "飯", + "餅", + "餐", + "館", + "饃", "首先", - "︿", - "!", - "#", - "$", - "%", - "&", - "(", - ")", - "*", - "+", - ",", - "0", - "1", - "2", - "3", - "4", - "5", - "6", - "7", - "8", - "9", - ":", - ";", - "<", - ">", - "?", - "@", - "[", - "]", - "{", - "|", - "}", - "~", - "¥", + "點", ], }