flax-community
/

wav2vec2-spanish

Automatic Speech Recognition

Inference Endpoints

Model card Files Files and versions Community

mariagrandury commited on Jul 15, 2021

Commit

b8db3fd

•

1 Parent(s): 5670b4e

Set up

Files changed (3) hide show

.gitignore +2 -0
requirements.txt +12 -0
test_setup.py +17 -0

.gitignore ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ venv/
2	+ data_cache/

requirements.txt ADDED Viewed

	@@ -0,0 +1,12 @@

+librosa
+ffmpeg
+dataclasses
+pathlib
+tqdm
+numpy
+tensorflow
+datasets
+transformers
+flax
+jax
+optax

test_setup.py ADDED Viewed

	@@ -0,0 +1,17 @@

+# from https://github.com/huggingface/transformers/tree/master/examples/research_projects/jax-projects#tpu-vm
+from transformers import FlaxRobertaModel, RobertaTokenizerFast
+from datasets import load_dataset
+import jax
+dataset = load_dataset('oscar', "unshuffled_deduplicated_en", split='train', streaming=True)
+dummy_input = next(iter(dataset))["text"]
+tokenizer = RobertaTokenizerFast.from_pretrained("roberta-base")
+input_ids = tokenizer(dummy_input, return_tensors="np").input_ids[:, :10]
+model = FlaxRobertaModel.from_pretrained("julien-c/dummy-unknown")
+# run a forward pass, should return an object `FlaxBaseModelOutputWithPooling`
+model(input_ids)
+print("hello!")