sanchit-gandhi
/

flax-wav2vec2-2-bart-large-cv9-feature-encoder

Automatic Speech Recognition

speech-encoder-decoder

Inference Endpoints

Model card Files Files and versions Community

sanchit-gandhi HF staff commited on Jun 1, 2022

Commit

03be9c0

•

1 Parent(s): 8f8f0d5

146ecm8l: saving weights and logs of step 10k

Files changed (3) hide show

flax_model.msgpack +3 -0
nohup.out +2 -2
run_cv9.sh +42 -0

flax_model.msgpack ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:671bcc5a57c4f53c53a5fd90632217839c037a7e52557c808bde40c06cdfa004
+size 2353616717

nohup.out CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ff7c786b45a6845a8e77375046d4927ea7c18cea820a6b9c2f86061d6716f2f2
-size 10931583

 version https://git-lfs.github.com/spec/v1
+oid sha256:b3e2c8a38a9a4efed95bb3b51b7726042c407557f84caad27f76fea720cd2e12
+size 8155416

run_cv9.sh ADDED Viewed

	@@ -0,0 +1,42 @@

+#!/usr/bin/env bash
+python ./run_flax_speech_recognition_seq2seq.py \
+	--dataset_name=mozilla-foundation/common_voice_9_0 \
+	--model_name_or_path=sanchit-gandhi/flax-wav2vec2-2-bart-large-scan \
+	--dataset_config_name=en \
+	--train_split_name=train \
+	--eval_split_name=validation \
+	--test_split_name=test \
+	--dataset_cache_dir=/home/sanchitgandhi/cache/huggingface/datasets \
+	--output_dir=./flax-wav2vec2-2-bart-large-cv9-feature-encoder \
+	--preprocessing_num_workers=1 \
+	--id_column_name=client_id \
+	--length_column_name=input_length \
+	--text_column_name=sentence \
+	--overwrite_output_dir \
+	--per_device_train_batch_size=8 \
+	--per_device_eval_batch_size=4 \
+	--logging_steps=25 \
+	--max_steps=50000 \
+	--eval_steps=10000 \
+	--save_steps=10000 \
+	--gradient_checkpointing \
+	--max_duration_in_seconds=20 \
+	--max_target_length=128 \
+	--generation_max_length=40 \
+	--generation_num_beams=1 \
+	--generation_length_penalty=1.2 \
+	--final_generation_max_length=200 \
+	--final_generation_num_beams=5 \
+	--learning_rate=1e-4 \
+	--warmup_steps=500 \
+	--save_total_limit=1 \
+	--freeze_feature_encoder=False \
+	--predict_with_generate \
+	--do_lower_case \
+	--do_eval \
+	--do_train \
+	--do_predict \
+	--push_to_hub \
+	--use_auth_token \
+	--wandb_project=commonvoice_9_0 \
+	--wandb_name=flax-wav2vec2-2-bart-large-cv9-feature-encoder