1 31 92

Mwangi PRO

Benson

AI & ML interests

None yet

Recent Activity

liked a model about 4 hours ago

Benson/ACE-0.6B-512px

updated a model about 5 hours ago

Benson/ACE-0.6B-512px

published a model about 9 hours ago

Benson/ACE-0.6B-512px

View all activity

Organizations

None yet

Benson's activity

liked a model about 4 hours ago

Benson/ACE-0.6B-512px

Updated about 5 hours ago • 1

updated a model about 5 hours ago

Benson/ACE-0.6B-512px

Updated about 5 hours ago • 1

published a model about 9 hours ago

Benson/ACE-0.6B-512px

Updated about 5 hours ago • 1

liked a model about 15 hours ago

nari-labs/Dia-1.6B

Text-to-Speech • Updated about 15 hours ago • 18.7k • 808

upvoted a paper about 16 hours ago

Vidi: Large Multimodal Models for Video Understanding and Editing

Paper • 2504.15681 • Published 2 days ago • 12

liked a Space about 22 hours ago

Describe Anything

⚡

Generate descriptions from masked images

upvoted a paper 1 day ago

Complex-Edit: CoT-Like Instruction Generation for Complexity-Controllable Image Editing Benchmark

Paper • 2504.13143 • Published 6 days ago • 8

liked a dataset 1 day ago

UCSC-VLAA/Complex-Edit

Viewer • Updated 3 days ago • 1.06k • 200 • 4

liked a Space 4 days ago

728

Open ASR Leaderboard

🏆

Request evaluation for new speech models

upvoted an article 10 days ago

Article

Fine-Tune Whisper with 🤗 Transformers

Nov 3, 2022

• 218

upvoted a paper 12 days ago

VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning

Paper • 2504.07960 • Published 13 days ago • 46

upvoted 2 papers 14 days ago

A Unified Agentic Framework for Evaluating Conditional Image Generation

Paper • 2504.07046 • Published 14 days ago • 30

VideoChat-R1: Enhancing Spatio-Temporal Perception via Reinforcement Fine-Tuning

Paper • 2504.06958 • Published 15 days ago • 10

liked a model 14 days ago

canopylabs/3b-hi-ft-research_release

Text-to-Speech • Updated 15 days ago • 1.15k • 15

upvoted a collection 14 days ago

Orpheus Multilingual Research Release

Collection

Beta Release of multilingual models. • 12 items • Updated 13 days ago • 76

liked a Space 18 days ago

text cut object

✂

Cut out objects from images using prompts or bounding boxes

liked a Space 19 days ago

156

Gemini 3D Co-Drawing

🌖

Gemini native image for 3D co-drawing

updated a model 21 days ago

Benson/musetalk_obama

Updated 21 days ago

liked a model 21 days ago

ByteDance/MegaTTS3

Text-to-Speech • Updated 20 days ago • 3.6k • 355

liked a Space 24 days ago

VideoMind 2B

💡

A Chain-of-LoRA Agent for Long Video Reasoning