mattchurgin
/

xls-r-eng

Automatic Speech Recognition

mozilla-foundation/common_voice_7_0

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

xls-r-eng / test_install.py

mattchurgin's picture

Training in progress, step 5

745e35f almost 3 years ago

583 Bytes

	from transformers import AutoModelForCTC, AutoProcessor
	from datasets import load_dataset
	import torch

	dummy_dataset = load_dataset("common_voice", "ab", split="test")

	model = AutoModelForCTC.from_pretrained("hf-internal-testing/tiny-random-wav2vec2")

	model.to("cuda")

	processor = AutoProcessor.from_pretrained("hf-internal-testing/tiny-random-wav2vec2")

	input_values = processor(dummy_dataset[0]["audio"]["array"], return_tensors="pt", sampling_rate=16_000).input_values
	input_values = input_values.to("cuda")

	logits = model(input_values).logits

	assert logits.shape[-1] == 32