Fernando Carneiro commited on
Commit
24940da
1 Parent(s): 5c8dfaa
Files changed (1) hide show
  1. README.md +5 -5
README.md CHANGED
@@ -51,12 +51,12 @@ inputs = [
51
 
52
  tokenizer.demojizer = lambda x: demojize(x, language='pt')
53
 
54
- [tokenizer.tokenize(s) for s in inputs]
55
 
56
- # Tokenizer first normalize sentences
57
- ['Procuro', 'um', 'amor', ',', 'que', 'seja', 'bom', 'pra', 'mim', '...', 'vou', 'procurar', ',', 'eu', 'vou', 'até', 'o', 'fim', ':nota_musical:']
58
- ['Que', 'jogo', 'ontem', '@USER', ':mãos_juntas:']
59
- ['D@@', 'emo@@', 'j@@', 'izer', 'para', 'Py@@', 'thon', 'é', ':polegar_para_cima:', 'e', 'está', 'disponível', 'em', 'HTTPURL']
60
 
61
 
62
  ```
 
51
 
52
  tokenizer.demojizer = lambda x: demojize(x, language='pt')
53
 
54
+ [tokenizer.normalizeTweet(s) for s in inputs]
55
 
56
+ # Tokenizer first normalizes tweet sentences
57
+ ['Procuro um amor , que seja bom pra mim ... vou procurar , eu vou até o fim :nota_musical:',
58
+ 'Que jogo ontem @USER :mãos_juntas:',
59
+ 'Demojizer para Python é :polegar_para_cima: e está disponível em HTTPURL']
60
 
61
 
62
  ```