jonatasgrosman commited on
Commit
ce33427
1 Parent(s): 65ea5d5

update eval results

Browse files
README.md CHANGED
@@ -9,6 +9,7 @@ datasets:
9
  - mozilla-foundation/common_voice_11_0
10
  metrics:
11
  - wer
 
12
  model-index:
13
  - name: Whisper Large Portuguese
14
  results:
@@ -28,6 +29,22 @@ model-index:
28
  - name: CER
29
  type: cer
30
  value: 1.6052355927195898
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
31
  ---
32
 
33
  # Whisper Large Portuguese
@@ -59,6 +76,8 @@ transcription = transcriber("path/to/my_audio.wav")
59
 
60
  ## Evaluation
61
 
 
 
62
  ### Common Voice 11
63
 
64
  | | CER | WER |
@@ -74,7 +93,9 @@ transcription = transcriber("path/to/my_audio.wav")
74
  | --- | --- | --- |
75
  | [jonatasgrosman/whisper-large-pt-cv11](https://huggingface.co/jonatasgrosman/whisper-large-pt-cv11) | 4.88 | 12.08 |
76
  | [jonatasgrosman/whisper-large-pt-cv11](https://huggingface.co/jonatasgrosman/whisper-large-pt-cv11) + text normalization | 5.46 | 8.57 |
77
- | [jonatasgrosman/whisper-large-pt-cv11](https://huggingface.co/jonatasgrosman/whisper-large-pt-cv11) + text normalization + removal of samples with numbers | 3.36 | 6.05 |
 
78
  | [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) | 3.52 | 10.55 |
79
  | [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) + text normalization | 4.19 | 7.04 |
80
- | [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) + text normalization + removal of samples with numbers | 3.56 | 6.15 |
 
9
  - mozilla-foundation/common_voice_11_0
10
  metrics:
11
  - wer
12
+ - cer
13
  model-index:
14
  - name: Whisper Large Portuguese
15
  results:
29
  - name: CER
30
  type: cer
31
  value: 1.6052355927195898
32
+ - task:
33
+ name: Automatic Speech Recognition
34
+ type: automatic-speech-recognition
35
+ dataset:
36
+ name: google/fleurs pt_br
37
+ type: google/fleurs
38
+ config: pt_br
39
+ split: test
40
+ args: pt_br
41
+ metrics:
42
+ - name: WER
43
+ type: wer
44
+ value: 8.56762285333714
45
+ - name: CER
46
+ type: cer
47
+ value: 5.462965196208485
48
  ---
49
 
50
  # Whisper Large Portuguese
76
 
77
  ## Evaluation
78
 
79
+ We perform evaluation of the model using the test split of two datasets, the [Common Voice 11](https://huggingface.co/datasets/mozilla-foundation/common_voice_11_0) (same dataset used for the fine-tuning) and the [Fleurs](https://huggingface.co/datasets/google/fleurs) (dataset not seen during the fine-tuning). As Whisper can transcribe casing and punctuation, I performed the model evaluation in 2 different scenarios, one using the raw text and the other using the normalized text (lowercase + removal of punctuations). Additionally, for the Fleurs dataset, I evaluated the model in a scenario where there are no transcriptions of numerical values since the way these values are described in this dataset is different from how they are described in the dataset used in fine-tuning (Common Voice), so it is expected that this difference in the way of describing numerical values will affect the performance of the model for this type of transcription in Fleurs.
80
+
81
  ### Common Voice 11
82
 
83
  | | CER | WER |
93
  | --- | --- | --- |
94
  | [jonatasgrosman/whisper-large-pt-cv11](https://huggingface.co/jonatasgrosman/whisper-large-pt-cv11) | 4.88 | 12.08 |
95
  | [jonatasgrosman/whisper-large-pt-cv11](https://huggingface.co/jonatasgrosman/whisper-large-pt-cv11) + text normalization | 5.46 | 8.57 |
96
+ | [jonatasgrosman/whisper-large-pt-cv11](https://huggingface.co/jonatasgrosman/whisper-large-pt-cv11) + keep only non-numeric samples | 2.35 | 9.00 |
97
+ | [jonatasgrosman/whisper-large-pt-cv11](https://huggingface.co/jonatasgrosman/whisper-large-pt-cv11) + text normalization + keep only non-numeric samples | 3.36 | 6.05 |
98
  | [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) | 3.52 | 10.55 |
99
  | [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) + text normalization | 4.19 | 7.04 |
100
+ | [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) + keep only non-numeric samples | 2.61 | 9.29 |
101
+ | [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) + text normalization + keep only non-numeric samples | 3.56 | 6.15 |
evaluation_cv11_test.json CHANGED
@@ -2,6 +2,8 @@
2
  "raw": {
3
  "cer": 0.0251556372013005,
4
  "wer": 0.09564805574818598,
 
 
5
  "references": [
6
  "Xeque-mate",
7
  "É necessário fornecer, quando formulado, uma avaliação.",
@@ -17396,6 +17398,8 @@
17396
  "normalized": {
17397
  "cer": 0.016052355927195897,
17398
  "wer": 0.048166641448529786,
 
 
17399
  "references": [
17400
  "xeque mate",
17401
  "é necessário fornecer quando formulado uma avaliação ",
2
  "raw": {
3
  "cer": 0.0251556372013005,
4
  "wer": 0.09564805574818598,
5
+ "non_numeric_samples_cer": 0.0251556372013005,
6
+ "non_numeric_samples_wer": 0.09564805574818598,
7
  "references": [
8
  "Xeque-mate",
9
  "É necessário fornecer, quando formulado, uma avaliação.",
17398
  "normalized": {
17399
  "cer": 0.016052355927195897,
17400
  "wer": 0.048166641448529786,
17401
+ "non_numeric_samples_cer": 0.016052355927195897,
17402
+ "non_numeric_samples_wer": 0.048166641448529786,
17403
  "references": [
17404
  "xeque mate",
17405
  "é necessário fornecer quando formulado uma avaliação ",
evaluation_fleurs_test.json CHANGED
@@ -2,6 +2,8 @@
2
  "raw": {
3
  "cer": 0.048782744819821554,
4
  "wer": 0.12084038353073887,
 
 
5
  "references": [
6
  "Em muitas outras cidades da Itália e no resto do mundo, especialmente na Polônia, arranjos similares foram feitos, permitindo o acompanhamento por um grande número de pessoas.",
7
  "O escritório de gerência de emergência das Marianas do Norte disseram que não havia danos reportados no país.",
@@ -1848,6 +1850,8 @@
1848
  "normalized": {
1849
  "cer": 0.05462965196208485,
1850
  "wer": 0.0856762285333714,
 
 
1851
  "references": [
1852
  "em muitas outras cidades da itália e no resto do mundo especialmente na polônia arranjos similares foram feitos permitindo o acompanhamento por um grande número de pessoas ",
1853
  "o escritório de gerência de emergência das marianas do norte disseram que não havia danos reportados no país ",
2
  "raw": {
3
  "cer": 0.048782744819821554,
4
  "wer": 0.12084038353073887,
5
+ "non_numeric_samples_cer": 0.023466183693758427,
6
+ "non_numeric_samples_wer": 0.09003507074616036,
7
  "references": [
8
  "Em muitas outras cidades da Itália e no resto do mundo, especialmente na Polônia, arranjos similares foram feitos, permitindo o acompanhamento por um grande número de pessoas.",
9
  "O escritório de gerência de emergência das Marianas do Norte disseram que não havia danos reportados no país.",
1850
  "normalized": {
1851
  "cer": 0.05462965196208485,
1852
  "wer": 0.0856762285333714,
1853
+ "non_numeric_samples_cer": 0.03360758611072375,
1854
+ "non_numeric_samples_wer": 0.06055188032659872,
1855
  "references": [
1856
  "em muitas outras cidades da itália e no resto do mundo especialmente na polônia arranjos similares foram feitos permitindo o acompanhamento por um grande número de pessoas ",
1857
  "o escritório de gerência de emergência das marianas do norte disseram que não havia danos reportados no país ",
evaluation_whisper-large-v2_cv11_test.json CHANGED
@@ -2,6 +2,8 @@
2
  "raw": {
3
  "cer": 0.04322850602866349,
4
  "wer": 0.13918441215770513,
 
 
5
  "references": [
6
  "Xeque-mate",
7
  "É necessário fornecer, quando formulado, uma avaliação.",
@@ -17396,6 +17398,8 @@
17396
  "normalized": {
17397
  "cer": 0.028362444828419743,
17398
  "wer": 0.07020729308518686,
 
 
17399
  "references": [
17400
  "xeque mate",
17401
  "é necessário fornecer quando formulado uma avaliação ",
2
  "raw": {
3
  "cer": 0.04322850602866349,
4
  "wer": 0.13918441215770513,
5
+ "non_numeric_samples_cer": 0.04322850602866349,
6
+ "non_numeric_samples_wer": 0.13918441215770513,
7
  "references": [
8
  "Xeque-mate",
9
  "É necessário fornecer, quando formulado, uma avaliação.",
17398
  "normalized": {
17399
  "cer": 0.028362444828419743,
17400
  "wer": 0.07020729308518686,
17401
+ "non_numeric_samples_cer": 0.028362444828419743,
17402
+ "non_numeric_samples_wer": 0.07020729308518686,
17403
  "references": [
17404
  "xeque mate",
17405
  "é necessário fornecer quando formulado uma avaliação ",
evaluation_whisper-large-v2_fleurs_test.json CHANGED
@@ -2,6 +2,8 @@
2
  "raw": {
3
  "cer": 0.03522598456164162,
4
  "wer": 0.10547095318668923,
 
 
5
  "references": [
6
  "Em muitas outras cidades da Itália e no resto do mundo, especialmente na Polônia, arranjos similares foram feitos, permitindo o acompanhamento por um grande número de pessoas.",
7
  "O escritório de gerência de emergência das Marianas do Norte disseram que não havia danos reportados no país.",
@@ -1848,6 +1850,8 @@
1848
  "normalized": {
1849
  "cer": 0.04187067364511227,
1850
  "wer": 0.07035821321535607,
 
 
1851
  "references": [
1852
  "em muitas outras cidades da itália e no resto do mundo especialmente na polônia arranjos similares foram feitos permitindo o acompanhamento por um grande número de pessoas ",
1853
  "o escritório de gerência de emergência das marianas do norte disseram que não havia danos reportados no país ",
2
  "raw": {
3
  "cer": 0.03522598456164162,
4
  "wer": 0.10547095318668923,
5
+ "non_numeric_samples_cer": 0.026064787928302146,
6
+ "non_numeric_samples_wer": 0.0929374773249486,
7
  "references": [
8
  "Em muitas outras cidades da Itália e no resto do mundo, especialmente na Polônia, arranjos similares foram feitos, permitindo o acompanhamento por um grande número de pessoas.",
9
  "O escritório de gerência de emergência das Marianas do Norte disseram que não havia danos reportados no país.",
1850
  "normalized": {
1851
  "cer": 0.04187067364511227,
1852
  "wer": 0.07035821321535607,
1853
+ "non_numeric_samples_cer": 0.035649540809211705,
1854
+ "non_numeric_samples_wer": 0.061505453245127836,
1855
  "references": [
1856
  "em muitas outras cidades da itália e no resto do mundo especialmente na polônia arranjos similares foram feitos permitindo o acompanhamento por um grande número de pessoas ",
1857
  "o escritório de gerência de emergência das marianas do norte disseram que não havia danos reportados no país ",