khanhld
/

wav2vec2-base-vietnamese-160h

Automatic Speech Recognition

Inference Endpoints

Model card Files Files and versions

khanhld commited on May 9, 2022

Commit

552b1c8

•

1 Parent(s): 128a1fa

update readme

Files changed (1) hide show

README.md +7 -3

README.md CHANGED Viewed

@@ -74,10 +74,12 @@ We also provide code for Pre-training and Fine-tuning the Wav2vec2 model (not av
 |with LM| in progress | in progress |
 <a name = "example" ></a>
-### Example Usage
 ```python
 from transformers import Wav2Vec2Processor, Wav2Vec2ForCTC
 import librosa
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 processor = Wav2Vec2Processor.from_pretrained("khanhld/wav2vec2-base-vietnamese-160h")
@@ -94,10 +96,12 @@ def transcribe(wav):
 wav, _ = librosa.load('path/to/your/audio/file', sr = 16000)
 print(f"transcript: {transcribe(wav)}")
 ```
 <a name = "evaluation"></a>
-### Evaluation
 ```python
 from transformers import Wav2Vec2Processor, Wav2Vec2ForCTC
 from datasets import load_dataset
@@ -115,7 +119,7 @@ model.to(device)
 model.eval()
 # Load dataset
-test_dataset = load_dataset("mozilla-foundation/common_voice_8_0", "vi", split="test")
 test_dataset = test_dataset.cast_column("audio", Audio(sampling_rate=16000))
 chars_to_ignore = r'[,?.!\-;:"“%\'�]' # ignore special characters

 |with LM| in progress | in progress |
 <a name = "example" ></a>
+### Example Usage [![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/drive/1blz1KclnIfbOp8o2fW3WJgObOQ9SMGBo?usp=sharing)
 ```python
 from transformers import Wav2Vec2Processor, Wav2Vec2ForCTC
 import librosa
+import torch
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 processor = Wav2Vec2Processor.from_pretrained("khanhld/wav2vec2-base-vietnamese-160h")
 wav, _ = librosa.load('path/to/your/audio/file', sr = 16000)
 print(f"transcript: {transcribe(wav)}")
 ```
 <a name = "evaluation"></a>
+### Evaluation [![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/drive/1XQCq4YGLnl23tcKmYeSwaksro4IgC_Yi?usp=sharing)
 ```python
 from transformers import Wav2Vec2Processor, Wav2Vec2ForCTC
 from datasets import load_dataset
 model.eval()
 # Load dataset
+test_dataset = load_dataset("mozilla-foundation/common_voice_8_0", "vi", split="test", use_auth_token="your_huggingface_auth_token")
 test_dataset = test_dataset.cast_column("audio", Audio(sampling_rate=16000))
 chars_to_ignore = r'[,?.!\-;:"“%\'�]' # ignore special characters