{ "citation": "", "description": "", "features": { "context": { "text": { "dtype": "string", "_type": "Value" }, "audio": { "sampling_rate": 16000, "_type": "Audio" } }, "instruction": { "audio": { "dtype": "null", "_type": "Value" }, "text": { "dtype": "string", "_type": "Value" } }, "answer": { "audio": { "dtype": "null", "_type": "Value" }, "text": { "dtype": "string", "_type": "Value" } }, "other_attributes": {}, "salmonn_7b": { "answer": { "dtype": "string", "_type": "Value" }, "model_prediction": { "dtype": "string", "_type": "Value" }, "task_type": { "dtype": "string", "_type": "Value" }, "text": { "dtype": "string", "_type": "Value" } }, "wavllm_fairseq": { "answer": { "dtype": "string", "_type": "Value" }, "model_prediction": { "dtype": "string", "_type": "Value" }, "task_type": { "dtype": "string", "_type": "Value" }, "text": { "dtype": "string", "_type": "Value" } }, "Qwen2-Audio-7B-Instruct": { "answer": { "dtype": "string", "_type": "Value" }, "model_prediction": { "dtype": "string", "_type": "Value" }, "task_type": { "dtype": "string", "_type": "Value" }, "text": { "dtype": "string", "_type": "Value" } }, "whisper_large_v3_with_llama_3_8b_instruct": { "answer": { "dtype": "string", "_type": "Value" }, "model_prediction": { "dtype": "string", "_type": "Value" }, "task_type": { "dtype": "string", "_type": "Value" }, "text": { "dtype": "string", "_type": "Value" } }, "mowe_audio": { "answer": { "dtype": "string", "_type": "Value" }, "model_prediction": { "dtype": "string", "_type": "Value" }, "task_type": { "dtype": "string", "_type": "Value" }, "text": { "dtype": "string", "_type": "Value" } }, "qwen_audio_chat": { "answer": { "dtype": "string", "_type": "Value" }, "model_prediction": { "dtype": "string", "_type": "Value" }, "task_type": { "dtype": "string", "_type": "Value" }, "text": { "dtype": "string", "_type": "Value" } } }, "homepage": "", "license": "" }