sandrarrey
commited on
Commit
•
79e5305
1
Parent(s):
59ea314
Update README.md
Browse files
README.md
CHANGED
@@ -35,7 +35,7 @@ No adestramento, utilizamos corpora auténticos e sintéticos do [ProxectoNós](
|
|
35 |
|
36 |
+ Tokenización dos datasets feita co tokenizador de linguakit: https://github.com/citiususc/Linguakit
|
37 |
|
38 |
-
+ O vocabulario para os modelos foi xerado a través do script [learn_bpe.py](https://github.com/OpenNMT/OpenNMT-py/blob/master/tools/learn_bpe.py) da
|
39 |
|
40 |
+ Utilizando o .yaml deste repositorio pode replicar o proceso de adestramento do seguinte xeito:
|
41 |
|
|
|
35 |
|
36 |
+ Tokenización dos datasets feita co tokenizador de linguakit: https://github.com/citiususc/Linguakit
|
37 |
|
38 |
+
+ O vocabulario para os modelos foi xerado a través do script [learn_bpe.py](https://github.com/OpenNMT/OpenNMT-py/blob/master/tools/learn_bpe.py) da OpenNMT
|
39 |
|
40 |
+ Utilizando o .yaml deste repositorio pode replicar o proceso de adestramento do seguinte xeito:
|
41 |
|