pere commited on
Commit
9c59172
1 Parent(s): dbdc85a

updated template

Browse files
Files changed (1) hide show
  1. README.md +53 -70
README.md CHANGED
@@ -36,22 +36,6 @@ This model is trained 200 additional steps on top of the main model. The output
36
 
37
  Introducing the **_Norwegian NB-Whisper Medium model_**, proudly developed by the National Library of Norway. NB-Whisper is a cutting-edge series of models designed for automatic speech recognition (ASR) and speech translation. These models are based on the work of [OpenAI's Whisper](https://arxiv.org/abs/2212.04356). Each model in the series has been trained for 250,000 steps, utilizing a diverse dataset of 8 million samples. These samples consist of aligned audio clips, each 30 seconds long, culminating in a staggering 66,000 hours of speech. For an in-depth understanding of our training methodology and dataset composition, keep an eye out for our upcoming article.
38
 
39
- <center>
40
- <figure>
41
- <video controls>
42
- <source src="https://huggingface.co/NbAiLab/nb-whisper-small-beta/resolve/main/king.mp4" type="video/mp4">
43
- Your browser does not support the video tag.
44
- </video>
45
- <figcaption><a href="https://www.royalcourt.no/tale.html?tid=137662&sek=28409&scope=27248" target="_blank">Speech given by His Majesty The King of Norway at the garden party hosted by Their Majesties The King and Queen at the Palace Park on 1st of September 2016.</a> Transcribed using the Small model.</figcaption>
46
- </figure>
47
- </center>
48
-
49
-
50
- ## Model Details
51
-
52
- The NB-Whisper series offers models in five distinct sizes: Tiny, Base, Small, Medium, and Large, each designed to cater to different requirements. These models are balanced for common use cases.
53
-
54
-
55
  | Model Size | Parameters | Model |
56
  |------------|------------|------------|
57
  | Tiny | 39M | [NB-Whisper Tiny](https://huggingface.co/NbAiLabBeta/nb-whisper-tiny) |
@@ -60,12 +44,13 @@ The NB-Whisper series offers models in five distinct sizes: Tiny, Base, Small, M
60
  | Medium | 769M | [NB-Whisper Medium](https://huggingface.co/NbAiLabBeta/nb-whisper-medium) |
61
  | Large | 1550M | [NB-Whisper Large](https://huggingface.co/NbAiLabBeta/nb-whisper-large) |
62
 
63
- Additionally, there are two variants available for each size:
64
 
 
 
 
65
  - **Verbatim version**: This lower-cased variant is more literal and suitable for tasks requiring detailed transcription, such as linguistic analysis.
66
  - **Semantic version**: This variant focuses less on verbatim accuracy but captures the essence of content, ideal for meeting minutes and subtitling.
67
 
68
- All models are used in the same manner. Here are the available models:
69
 
70
  | Model Size | Parameters | Verbatim version | Semantic version |
71
  |------------|------------|------------|------------------|
@@ -76,8 +61,6 @@ All models are used in the same manner. Here are the available models:
76
  | Large | 1550M | [Large - verbatim](https://huggingface.co/NbAiLabBeta/nb-whisper-large-verbatim) | [Large - semantic](https://huggingface.co/NbAiLabBeta/nb-whisper-large-semantic) |
77
 
78
 
79
- Please refer to the OpenAI Whisper model card for more details about the backbone model.
80
-
81
  ### Model Description
82
 
83
  - **Developed by:** [NB AI-Lab](https://ai.nb.no/)
@@ -90,13 +73,25 @@ Please refer to the OpenAI Whisper model card for more details about the backbon
90
  - **Paper:** _Coming soon_
91
  - **Demo:** _See Spaces on this page_
92
 
 
 
 
 
 
 
 
 
 
 
 
 
93
  ## How to Use the Models
94
 
95
  ### Online Demos
96
  You can try the models directly through the HuggingFace Inference API, accessible on the right side of this page. Be aware that initially, the model needs to load and will run on limited CPU capacity, which might be slow. To enhance your experience, we are temporarily hosting some models on TPUs for a few days, significantly boosting their performance. Explore these under the **Spaces** section on the [Main Page](https://huggingface.co/NbAiLabBeta/).
97
 
98
  ### Local Setup with HuggingFace
99
- Alternatively, you can download the models for local usage. The Tiny, Base, and Small models are optimized for CPU execution. For the Medium and Large models, we recommend a system equipped with a GPU to ensure efficient processing. Setting up and using these models with HuggingFace's Transformers is straightforward, provided you have [Python](https://www.python.org/downloads/) installed on your machine. For practical demonstrations, refer to examples using this [sample mp3 file](https://github.com/NbAiLab/nb-whisper/raw/main/audio/king.mp3).
100
 
101
  ```bash
102
  # Download the sample file
@@ -129,30 +124,40 @@ asr("king.mp3", generate_kwargs={'task': 'transcribe', 'language': 'no'})
129
  ```
130
  </details>
131
 
132
- Examining the output, we see that there are multiple repetitions in the end. This is because the default length is 30 seconds and the video is 1:25 minutes. By passing the ```chunk_lengt_s``` argument, we can transcribe longer file.
 
133
 
134
  ```python
 
135
  asr("king.mp3", chunk_length_s=30, generate_kwargs={'task': 'transcribe', 'language': 'no'})
 
 
 
 
 
 
 
 
 
 
 
 
 
136
  ```
137
  <details>
138
  <summary>Expected output</summary>
139
 
 
140
  ```json
141
  {
142
- {'text': ' Nordmenn er nordlendinger, trøndere, sørlendinger og folk fra alle andre regioner. Nordmenn er også innvandret fra Afghanistan, Pakistan, Polen, Sverige, Somalia og Syria. Det er ikke alltid så lett å si hvor vi er fra, hvilken nasjonalitet vi er fra. Hvilken nasjonalitet vi er fra. Hvilken nasjonalitet vi er fra. Hvilken nasjonalitet vi er fra. Hvilken nasjonalitet vi er fra. Hvilken nasjonalitet vi er fra, hvilken nasjonalitet vi tilhører. Det vi kaller hjem, er der hjertet vårt er, og det kan ikke alltid plasseres innenfor landegrenser. Nordmenn er jenter som er glad i jenter, gutter som er glad i gutter, og jenter og gutter som er glad i hverandre. Nordmenn trommer på Gud, Allah, Altet og ingenting. Nordmenn liker Grieg, Kygo, Helbilis og Kari Bremnes. Med andre ord, Norge er dere. Norge er oss. Mitt største håp for Norge er at vi skal klare å ta vare på hverandre, at vi skal bygge dette landet videre på tillit, fellesskap og raushet.'}
143
- ```
144
- </details>
145
-
146
- Here the output looks a lot better. We can also ask the model to output timestamps:
147
- ```python
148
- asr("king.mp3", chunk_length_s=30, return_timestamps=True, generate_kwargs={'task': 'transcribe', 'language': 'no'})
149
  ```
150
- <details>
151
- <summary>Expected output</summary>
152
 
 
153
  ```json
154
  {
155
- {'text': ' Nordmenn er nordlendinger, trøndere, sørlendinger og folk fra alle andre regioner. Nordmenn er også innvandret fra Afghanistan, Pakistan, Polen, Sverige, Somalia og Syria. Det er ikke alltid så lett å si hvor vi er fra, hvilken nasjonalitet vi er fra. Hvilken nasjonalitet vi er fra. hvilken nasjonalitet vi tilhører. Det vi kaller hjem, er der hjertet vårt er, og det kan ikke alltid plasseres innenfor landegrenser. Nordmenn er jenter som er glad i jenter, gutter som er glad i gutter, og jenter og gutter som er glad i hverandre. Nordmenn trommer på Gud, Allah, Altet og ingenting. Nordmenn liker Grieg, Kygo, Helbiles og Kari Bremnes. Med andre ord, Norge er dere. Norge er oss. Mitt største håp for Norge er at vi skal klare å ta vare på hverandre, at vi skal bygge dette landet videre på tillit, fellesskap og raushet.',
156
  'chunks': [{'timestamp': (0.0, 5.46),
157
  'text': ' Nordmenn er nordlendinger, trøndere, sørlendinger'},
158
  {'timestamp': (5.52, 8.68), 'text': ' og folk fra alle andre regioner.'},
@@ -179,59 +184,37 @@ asr("king.mp3", chunk_length_s=30, return_timestamps=True, generate_kwargs={'tas
179
  'text': ' Mitt største håp for Norge er at vi skal klare å ta vare på hverandre,'},
180
  {'timestamp': (78.12, 84.68),
181
  'text': ' at vi skal bygge dette landet videre på tillit, fellesskap og raushet.'}]}
182
- ```
183
- </details>
184
-
185
- Some other cool features to look into:
186
-
187
- ```python
188
- # Transcribe to Nynorsk
189
- asr("king.mp3", chunk_length_s=30, generate_kwargs={'task': 'transcribe', 'language': 'nn'})
190
  ```
191
 
192
- <details>
193
- <summary>Expected output</summary>
194
-
195
  ```json
196
  {
197
- "text": "Nordmenn er nordlendingar, trøndarar, sørlendingar og folk frå alle andre regionar. Nordmenn er også innvandra frå Afghanistan, Pakistan, Polen, Sverige, Somalia og Syria. Det er ikkje alltid så lett å seie kvar vi er frå, kva nasjonalitet vi tilhøyrer. Det vi kallar heim, er der hjartet vårt er, og det kan ikkje alltid plasserast innanfor landegrenser. Nordmenn er jenter som er glad i jenter, gutar som erade i gutar, og jenter og gutar som er glade i kvarandre. Nordmenn trommar på Gud, Allah, Altet og ingenting. Nordmenn liker Grieg, Kygo, Helbiles og Kari Bremnes. Med andre ord, Noreg er dere! Noreg er oss. Mitt største håp for Noreg er at vi skal klare å ta vare på kvarandre, at vi skal byggje dette landet vidare på tillit, fellesskap og raushet."
 
 
 
 
 
 
 
198
  }
199
  ```
200
- </details>
201
-
202
- ```python
203
- # Transcribe to English
204
- asr("king.mp3", chunk_length_s=30, generate_kwargs={'task': 'transcribe', 'language': 'en'})
205
- ```
206
- <details>
207
- <summary>Expected output</summary>
208
 
 
209
  ```json
210
  {
211
- "text": "Norwegians are Norwegians, trønders, southerners and people from all other regions. Norwegians are also invaded from Afghanistan, Pakistan, Poland, Sweden, Somalia and Suria. It is not always so easy to say where we are from, what nationality we belong to. What we call home is where our heart is, and it cannot always be placed within national borders. Norwegians are girls who like girls, boys who like boys, and girls and boys who like each other. Norwegians thrump on God, Allah, Altet and nothing. Norwegians like Grieg, Kygo, Helbilis and Kari Bremnes. In other words, Norway is you. Norway is us. My biggest hope for Norway is that we should be able to take care of each other, that we should build this country on trust, community and generosity."
212
  }
213
  ```
214
- </details>
215
-
216
- ```python
217
- # Return Word Level Timestamps
218
- asr("king.mp3", chunk_length_s=30, return_timestamps="word", generate_kwargs={'task': 'transcribe', 'language': 'no'})
219
- ```
220
-
221
- <details>
222
- <summary>Expected output</summary>
223
 
 
224
  ```json
225
  {
226
- "text": "Nordmenn er nordlendinger, trøndere, sørlendinger og folk fra alle andre regioner. Nordmenn er også innvandret fra Afghanistan, Pakistan, Polen, Sverige, Somalia og Syria. Det er ikke alltid lett å si hvor vi er fra, hvilken nasjonalitet vi tilhører. Det vi kaller hjem, er der hjertet vårt er, og det kan ikke alltid plasseres innenfor landegrenser. Nordmenn er jenter som er glad i jenter, gutter som er glad i gutter, og jenter og gutter som er glad i hverandre. Nordmenn trommer Gud, Allah, Altet og ingenting. Nordmenn liker Grieg, Kygo, Helbilis og Kari Bremnes. Med andre ord, Norge er dere. Norge er oss. Mitt største håp for Norge er at vi skal klare å ta vare hverandre, at vi skal bygge dette landet videre på tillit, fellesskap og raushet.",
227
- "chunks": [
228
- {"text": "Nordmenn", "timestamp": [0.72, 1.42]},
229
- {"text": "er", "timestamp": [1.42, 1.74]},
230
- // ... more chunks ...
231
- {"text": "raushet.", "timestamp": [83.1, 84.88]}
232
- ]
233
  }
234
  ```
 
235
  </details>
236
 
237
  ### Whisper CPP
@@ -279,7 +262,7 @@ Using these models without adequate risk assessment and mitigation could be cons
279
  The model was trained using Jax/Flax and converted to PyTorch, Tensorflow, whisper.cpp, and ONXX formats. These are available under `Files and versions`. We welcome requests for conversion to other formats. All training code and scripts are released under the Apache License 2.0 in the GitHub repository [nb-whisper](https://github.com/NbAiLab/nb-whisper/).
280
 
281
  ## Citation & Contributors
282
- The NB-Whisper Medium model is a product of the NoSTram project led by Per Egil Kummervold ([@pere](https://huggingface.co/pere) at the National Library of Norway. Key contributors include Javier de la Rosa ([@versae](https://huggingface.co/versae), Freddy Wetjen ([@](https://huggingface.co/freddyw), and Rolv-Arild Braaten ([@Rolv-Arild](https://huggingface.co/Rolv-Arild). NB AI-Lab, under the direction of Svein Arne Brygfjeld ([@Brygfjeld](https://huggingface.co/Brygfjeld), supported the project's successful completion. A detailed paper on our process and findings is forthcoming.
283
 
284
  ## Disclaimer
285
 
 
36
 
37
  Introducing the **_Norwegian NB-Whisper Medium model_**, proudly developed by the National Library of Norway. NB-Whisper is a cutting-edge series of models designed for automatic speech recognition (ASR) and speech translation. These models are based on the work of [OpenAI's Whisper](https://arxiv.org/abs/2212.04356). Each model in the series has been trained for 250,000 steps, utilizing a diverse dataset of 8 million samples. These samples consist of aligned audio clips, each 30 seconds long, culminating in a staggering 66,000 hours of speech. For an in-depth understanding of our training methodology and dataset composition, keep an eye out for our upcoming article.
38
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
39
  | Model Size | Parameters | Model |
40
  |------------|------------|------------|
41
  | Tiny | 39M | [NB-Whisper Tiny](https://huggingface.co/NbAiLabBeta/nb-whisper-tiny) |
 
44
  | Medium | 769M | [NB-Whisper Medium](https://huggingface.co/NbAiLabBeta/nb-whisper-medium) |
45
  | Large | 1550M | [NB-Whisper Large](https://huggingface.co/NbAiLabBeta/nb-whisper-large) |
46
 
 
47
 
48
+
49
+ ### Specialised Models
50
+ While the main models are suitable for most transcription task, we demonstrate how easy it is to change the output of the main model. The following models are trained 250 additional steps from the main models above, and might be suitable for more targetted use cases:
51
  - **Verbatim version**: This lower-cased variant is more literal and suitable for tasks requiring detailed transcription, such as linguistic analysis.
52
  - **Semantic version**: This variant focuses less on verbatim accuracy but captures the essence of content, ideal for meeting minutes and subtitling.
53
 
 
54
 
55
  | Model Size | Parameters | Verbatim version | Semantic version |
56
  |------------|------------|------------|------------------|
 
61
  | Large | 1550M | [Large - verbatim](https://huggingface.co/NbAiLabBeta/nb-whisper-large-verbatim) | [Large - semantic](https://huggingface.co/NbAiLabBeta/nb-whisper-large-semantic) |
62
 
63
 
 
 
64
  ### Model Description
65
 
66
  - **Developed by:** [NB AI-Lab](https://ai.nb.no/)
 
73
  - **Paper:** _Coming soon_
74
  - **Demo:** _See Spaces on this page_
75
 
76
+ ## Example transcription
77
+ <center>
78
+ <figure>
79
+ <video controls>
80
+ <source src="https://huggingface.co/NbAiLab/nb-whisper-small-beta/resolve/main/king.mp4" type="video/mp4">
81
+ Your browser does not support the video tag.
82
+ </video>
83
+ <figcaption><a href="https://www.royalcourt.no/tale.html?tid=137662&sek=28409&scope=27248" target="_blank">Speech given by His Majesty The King of Norway at the garden party hosted by Their Majesties The King and Queen at the Palace Park on 1st of September 2016.</a> Transcribed using the Small model.</figcaption>
84
+ </figure>
85
+ </center>
86
+
87
+
88
  ## How to Use the Models
89
 
90
  ### Online Demos
91
  You can try the models directly through the HuggingFace Inference API, accessible on the right side of this page. Be aware that initially, the model needs to load and will run on limited CPU capacity, which might be slow. To enhance your experience, we are temporarily hosting some models on TPUs for a few days, significantly boosting their performance. Explore these under the **Spaces** section on the [Main Page](https://huggingface.co/NbAiLabBeta/).
92
 
93
  ### Local Setup with HuggingFace
94
+ Alternatively, you can run the models locally. The Tiny, Base, and Small models are optimized for CPU execution. For the Medium and Large models, we recommend a system equipped with a GPU to ensure efficient processing. Setting up and using these models with HuggingFace's Transformers is straightforward, provided you have [Python](https://www.python.org/downloads/) installed on your machine. For practical demonstrations, refer to examples using this [sample mp3 file](https://github.com/NbAiLab/nb-whisper/raw/main/audio/king.mp3).
95
 
96
  ```bash
97
  # Download the sample file
 
124
  ```
125
  </details>
126
 
127
+ #### Extended HuggingFace
128
+ Examining the output above, we see that there are multiple repetitions at the end. This is because the default length is 30 seconds and the video is 1:25 minutes. By passing the ```chunk_lengt_s``` argument, we can transcribe longer file. The examples below also illustrates how to transcribe to English or Nynorsk, and how to get timestamps for sentences and words.
129
 
130
  ```python
131
+ # Long Transcripts
132
  asr("king.mp3", chunk_length_s=30, generate_kwargs={'task': 'transcribe', 'language': 'no'})
133
+
134
+ # Return Timestamps
135
+ asr("king.mp3", chunk_length_s=30, return_timestamps=True, generate_kwargs={'task': 'transcribe', 'language': 'no'})
136
+
137
+ # Return Word Level Timestamps
138
+ asr("king.mp3", chunk_length_s=30, return_timestamps="word", generate_kwargs={'task': 'transcribe', 'language': 'no'})
139
+
140
+ # Transcribe to Nynorsk
141
+ asr("king.mp3", chunk_length_s=30, generate_kwargs={'task': 'transcribe', 'language': 'nn'})
142
+
143
+ # Transcribe to English
144
+ asr("king.mp3", chunk_length_s=30, generate_kwargs={'task': 'transcribe', 'language': 'en'})
145
+
146
  ```
147
  <details>
148
  <summary>Expected output</summary>
149
 
150
+ Long transcripts:
151
  ```json
152
  {
153
+ {'text': ' Nordmenn er nordlendinger, trøndere, sørlendinger og folk fra alle andre regioner. Nordmenn er også innvandret fra Afghanistan, Pakistan, Polen, Sverige, Somalia og Syria. Det er ikke alltid så lett å si hvor vi er fra, hvilken nasjonalitet vi er fra. Hvilken nasjonalitet vi er fra. Hvilken nasjonalitet vi er fra. Hvilken nasjonalitet vi er fra. Hvilken nasjonalitet vi er fra. Hvilken nasjonalitet vi er fra, hvilken nasjonalitet vi tilhører. Det vi kaller hjem, er der hjertet vårt er, og det kan ikke alltid plasseres innenfor landegrenser. Nordmenn er jenter som er glad i jenter, gutter som er glad i gutter, og jenter og gutter som er glad i hverandre. Nordmenn trommer på Gud, Allah, Altet og ingenting. Nordmenn liker Grieg, Kygo, Helbilis og Kari Bremnes. Med andre ord, Norge er dere. Norge er oss. Mitt største håp for Norge er at vi skal klare å ta vare på hverandre, at vi skal bygge dette landet videre på tillit, fellesskap og raushet.'}
154
+ }
 
 
 
 
 
155
  ```
 
 
156
 
157
+ Timestamps:
158
  ```json
159
  {
160
+ {'text': ' Nordmenn er nordlendinger, trøndere, sørlendinger og folk fra alle andre regioner. Nordmenn er også innvandret fra Afghanistan, Pakistan, Polen, Sverige, Somalia og Syria. Det er ikke alltid så lett å si hvor vi er fra, hvilken nasjonalitet vi er fra. Hvilken nasjonalitet vi er fra. hvilken nasjonalitet vi tilhører. Det vi kaller hjem, er der hjertet vårt er, og det kan ikke alltid plasseres innenfor landegrenser. Nordmenn er jenter som er glad i jenter, gutter som er glad i gutter, og jenter og gutter som er glad i hverandre. Nordmenn trommer på Gud, Allah, Altet og ingenting. Nordmenn liker Grieg, Kygo, Helbiles og Kari Bremnes. Med andre ord, Norge er dere. Norge er oss. Mitt største håp for Norge er at vi skal klare å ta vare på hverandre, at vi skal bygge dette landet videre på tillit, fellesskap og raushet.',
161
  'chunks': [{'timestamp': (0.0, 5.46),
162
  'text': ' Nordmenn er nordlendinger, trøndere, sørlendinger'},
163
  {'timestamp': (5.52, 8.68), 'text': ' og folk fra alle andre regioner.'},
 
184
  'text': ' Mitt største håp for Norge er at vi skal klare å ta vare på hverandre,'},
185
  {'timestamp': (78.12, 84.68),
186
  'text': ' at vi skal bygge dette landet videre på tillit, fellesskap og raushet.'}]}
187
+ }
 
 
 
 
 
 
 
188
  ```
189
 
190
+ Word Level Timestamps:
 
 
191
  ```json
192
  {
193
+ {"text": "Nordmenn er nordlendinger, trøndere, sørlendinger og folk fra alle andre regioner. Nordmenn er også innvandret fra Afghanistan, Pakistan, Polen, Sverige, Somalia og Syria. Det er ikke alltid så lett å si hvor vi er fra, hvilken nasjonalitet vi tilhører. Det vi kaller hjem, er der hjertet vårt er, og det kan ikke alltid plasseres innenfor landegrenser. Nordmenn er jenter som er glad i jenter, gutter som er glad i gutter, og jenter og gutter som er glad i hverandre. Nordmenn trommer på Gud, Allah, Altet og ingenting. Nordmenn liker Grieg, Kygo, Helbilis og Kari Bremnes. Med andre ord, Norge er dere. Norge er oss. Mitt største håp for Norge er at vi skal klare å ta vare på hverandre, at vi skal bygge dette landet videre på tillit, fellesskap og raushet.",
194
+ "chunks": [
195
+ {"text": "Nordmenn", "timestamp": [0.72, 1.42]},
196
+ {"text": "er", "timestamp": [1.42, 1.74]},
197
+ // ... more chunks ...
198
+ {"text": "raushet.", "timestamp": [83.1, 84.88]}
199
+ ]
200
+ }
201
  }
202
  ```
 
 
 
 
 
 
 
 
203
 
204
+ Nynorsk:
205
  ```json
206
  {
207
+ {"text": "Nordmenn er nordlendingar, trøndarar, sørlendingar og folk frå alle andre regionar. Nordmenn er også innvandra frå Afghanistan, Pakistan, Polen, Sverige, Somalia og Syria. Det er ikkje alltid lett å seie kvar vi er frå, kva nasjonalitet vi tilhøyrer. Det vi kallar heim, er der hjartet vårt er, og det kan ikkje alltid plasserast innanfor landegrenser. Nordmenn er jenter som er glad i jenter, gutar som erade i gutar, og jenter og gutar som er glade i kvarandre. Nordmenn trommar Gud, Allah, Altet og ingenting. Nordmenn liker Grieg, Kygo, Helbiles og Kari Bremnes. Med andre ord, Noreg er dere! Noreg er oss. Mitt største håp for Noreg er at vi skal klare å ta vare kvarandre, at vi skal byggje dette landet vidare tillit, fellesskap og raushet."}
208
  }
209
  ```
 
 
 
 
 
 
 
 
 
210
 
211
+ English:
212
  ```json
213
  {
214
+ {"text": "Norwegians are Norwegians, trønders, southerners and people from all other regions. Norwegians are also invaded from Afghanistan, Pakistan, Poland, Sweden, Somalia and Suria. It is not always so easy to say where we are from, what nationality we belong to. What we call home is where our heart is, and it cannot always be placed within national borders. Norwegians are girls who like girls, boys who like boys, and girls and boys who like each other. Norwegians thrump on God, Allah, Altet and nothing. Norwegians like Grieg, Kygo, Helbilis and Kari Bremnes. In other words, Norway is you. Norway is us. My biggest hope for Norway is that we should be able to take care of each other, that we should build this country on trust, community and generosity."}
 
 
 
 
 
 
215
  }
216
  ```
217
+
218
  </details>
219
 
220
  ### Whisper CPP
 
262
  The model was trained using Jax/Flax and converted to PyTorch, Tensorflow, whisper.cpp, and ONXX formats. These are available under `Files and versions`. We welcome requests for conversion to other formats. All training code and scripts are released under the Apache License 2.0 in the GitHub repository [nb-whisper](https://github.com/NbAiLab/nb-whisper/).
263
 
264
  ## Citation & Contributors
265
+ The NB-Whisper Medium model is a product of the NoSTram project led by Per Egil Kummervold ([@pere](https://huggingface.co/pere)) at the National Library of Norway. Key contributors include Javier de la Rosa ([@versae](https://huggingface.co/versae)), Freddy Wetjen ([@freddyw](https://huggingface.co/freddyw)), and Rolv-Arild Braaten ([@Rolv-Arild](https://huggingface.co/Rolv-Arild)). NB AI-Lab, under the direction of Svein Arne Brygfjeld ([@Brygfjeld](https://huggingface.co/Brygfjeld)), supported the project's successful completion. A detailed paper on our process and findings is forthcoming.
266
 
267
  ## Disclaimer
268