Update README.md
Browse files
README.md
CHANGED
@@ -29,13 +29,20 @@ Aut茅nticos e Sint茅ticos (Translitera莽茫o)[Colocar Paper]
|
|
29 |
|
30 |
**Procedemento de adestramento**
|
31 |
|
32 |
-
Tokenization feita co tokenizador de linguakit https://github.com/citiususc/Linguakit
|
33 |
|
34 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
35 |
|
36 |
**Hiperpar谩metros**
|
37 |
|
38 |
-
|
39 |
|
40 |
**Avaliaci贸n**
|
41 |
A avalaci贸n dos modelos 茅 feita cunha mistura de tests desenvolvidos internamente
|
|
|
29 |
|
30 |
**Procedemento de adestramento**
|
31 |
|
32 |
+
+ Tokenization dos datasets feita co tokenizador de linguakit https://github.com/citiususc/Linguakit
|
33 |
|
34 |
+
+ O vocabulario para os modelos foi xerado a trav茅s do script [learn_bpe.py](https://github.com/OpenNMT/OpenNMT-py/blob/master/tools/learn_bpe.py) da open NMT
|
35 |
+
|
36 |
+
+ Usando o .yaml neste repositorio pode replicar o proceso de adestramento do seguinte xeito
|
37 |
+
|
38 |
+
```bash
|
39 |
+
onmt_build_vocab -config bpe-en-gl_emb.yaml -n_sample 100000
|
40 |
+
onmt_train -config bpe-en-gl_emb.yaml
|
41 |
+
```
|
42 |
|
43 |
**Hiperpar谩metros**
|
44 |
|
45 |
+
Os par谩metros usados para o desenvolvimento do modelo poden ser consultados directamente no mesmo ficheiro .yaml bpe-en-gl_emb.yaml
|
46 |
|
47 |
**Avaliaci贸n**
|
48 |
A avalaci贸n dos modelos 茅 feita cunha mistura de tests desenvolvidos internamente
|