File size: 3,146 Bytes
9ce8c62
 
 
 
 
 
 
 
 
 
 
 
 
07baa93
9ce8c62
07baa93
9ce8c62
b1e6d99
de9b079
07baa93
9ce8c62
 
 
 
 
 
 
 
 
 
b1e6d99
 
 
 
2ac5a9c
b1e6d99
 
 
 
 
 
 
 
 
 
 
 
0d6ec9f
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
---
license: apache-2.0
datasets:
- mt_eng_vietnamese
language:
- en
- vi
tags:
- translation
- t5
- en-vi
- vi-en
---
# gozu888/Envit5-tuned

This model is a fine-tuned version of VietAI/envit5-translation on the mt_eng_vietnamese dataset. It achieves the following results on the evaluation set:

- Loss: 0.1988
- BLEU: 34.46
  
## Model Details

### Model Description

<!-- Provide a longer summary of what this model is. -->

- **Developed by:** gozu888
- **Model type:** T5
- **Finetuned from model [optional]:** [VietAI/envit5-translation](https://huggingface.co/VietAI/envit5-translation)

### Hyperparameters
The following hyperparameters were used during training:
- Repo: [simpleT5](https://github.com/Shivanandroy/simpleT5)
- Dataset: [mt_eng_vietnamese](https://huggingface.co/datasets/mt_eng_vietnamese) + custom (~40%)
```python
    model.train(
        train_df=train_df,
        eval_df=test_df,
        source_max_token_len=128,
        target_max_token_len=128,
        batch_size=32,
        max_epochs=15,
        use_gpu=True,
        save_only_last_epoch=True,
        precision=16,
        dataloader_num_workers=4
    )
```
### Examples

+ This fine-tuned model, which was trained using only 128 token lengths, is most effective at sentence-by-sentence translation.

```json
[
"en: I do not believe a human being can be creative.",
"en: If we perceive creation around us with a certain profoundness, we can imitate in many different ways, in permutations and combinations, and seem creative in society, but actually, we are not really creative.",
"en: Everything that can be created has already been done in creation.",
"en: We are clever craftsmen at the most.",
"en: If you define the word \“creativity\” as really creating something – whether you make a movie, paint something, build a building, speak, or whatever else – this is not really creative – it is clever imitation.",
"en: Because we have paid attention to different aspects of life, we are able to imitate in ways that others have not thought possible.",
]
```

```json
[
"vi: Tôi không tin rằng một con người có thể sáng tạo.",
"vi: Nếu chúng ta cảm nhận được sự sáng tạo xung quanh mình với một sự sâu sắc nhất định, chúng ta có thể bắt chước theo nhiều cách khác nhau, trong hoán vị và sự kết hợp, và có vẻ sáng tạo trong xã hội, nhưng thực sự, chúng ta không thực sự sáng tạo.",
"vi: Mọi thứ có thê được tạo ra đã được làm trong tạo hóa.",
"vi: Chúng ta là những thợ thủ công tài tình nhất.",
"vi: Nếu bạn định nghĩa từ \"sáng tạo\" là thực sự tạo ra thứ gì đó - cho dù là làm một bộ phim, vẽ thứ gì đó, xây một toà nhà, nói năng, hay bất cứ thứ gì khác - điều này không thực sự sáng tạo - nó là sự bắt chước thông minh.",
"vi: Bởi vì chúng ta đã chú tâm đến những khía cạnh khác nhau của cuộc sống, chúng ta có thể bắt chước theo những cách mà những người khác không nghĩ là có thể.",
]
```