Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2407.10759

Audio-language model series based on Qwen2

Running

145

🌍

Qwen2 Audio Instruct Demo
Qwen2-Audio Technical Report

Paper • 2407.10759 • Published Jul 15 • 55
Qwen/Qwen2-Audio-7B

Audio-Text-to-Text • Updated Nov 20 • 7.92k • 79
Qwen/Qwen2-Audio-7B-Instruct

Audio-Text-to-Text • Updated Nov 20 • 425k • 276

Running on CPU Upgrade

902

🏢

Anychat
Running

179

🐢

Qwen2.5 Coder Artifacts
Running

780

🔍

QwQ-32B-Preview

QwQ-32B-Preview
Running on CPU Upgrade

12k

🏆

Open LLM Leaderboard

Track, rank and evaluate open LLMs and chatbots

audio-language-model-architecture

Qwen2-Audio Technical Report

Paper • 2407.10759 • Published Jul 15 • 55
Audio Mamba: Bidirectional State Space Model for Audio Representation Learning

Paper • 2406.03344 • Published Jun 5 • 18

Qwen2-Audio Technical Report

Paper • 2407.10759 • Published Jul 15 • 55

Stable Audio Open

Paper • 2407.14358 • Published Jul 19 • 23
Qwen2-Audio Technical Report

Paper • 2407.10759 • Published Jul 15 • 55
kyutai/moshiko-pytorch-bf16

Updated Sep 18 • 107k • 155
Presto! Distilling Steps and Layers for Accelerating Music Generation

Paper • 2410.05167 • Published Oct 7 • 15

Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15 • 160
Qwen2-Audio Technical Report

Paper • 2407.10759 • Published Jul 15 • 55
Running on CPU Upgrade

12k

🏆

Open LLM Leaderboard

Track, rank and evaluate open LLMs and chatbots

Qwen2-Audio Technical Report

Paper • 2407.10759 • Published Jul 15 • 55
Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15 • 160
Gemma 2: Improving Open Language Models at a Practical Size

Paper • 2408.00118 • Published Jul 31 • 75
EXAONE 3.0 7.8B Instruction Tuned Language Model

Paper • 2408.03541 • Published Aug 7 • 34

Autoregressive Speech Synthesis without Vector Quantization

Paper • 2407.08551 • Published Jul 11 • 14
Qwen2-Audio Technical Report

Paper • 2407.10759 • Published Jul 15 • 55

Papers I want to read

Papers in my to-read list

RLHF Workflow: From Reward Modeling to Online RLHF

Paper • 2405.07863 • Published May 13 • 66
Chameleon: Mixed-Modal Early-Fusion Foundation Models

Paper • 2405.09818 • Published May 16 • 126
Meteor: Mamba-based Traversal of Rationale for Large Language and Vision Models

Paper • 2405.15574 • Published May 24 • 53
An Introduction to Vision-Language Modeling

Paper • 2405.17247 • Published May 27 • 86

SoundCTM: Uniting Score-based and Consistency Models for Text-to-Sound Generation

Paper • 2405.18503 • Published May 28 • 9
DITTO-2: Distilled Diffusion Inference-Time T-Optimization for Music Generation

Paper • 2405.20289 • Published May 30 • 10
LiveSpeech: Low-Latency Zero-shot Text-to-Speech via Autoregressive Modeling of Audio Discrete Codes

Paper • 2406.02897 • Published Jun 5 • 13
Audio Mamba: Bidirectional State Space Model for Audio Representation Learning

Paper • 2406.03344 • Published Jun 5 • 18

Previous
1
2
Next

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs