Michael Hale

mhale

AI & ML interests

None yet

Recent Activity

upvoted a paper 5 days ago

Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model

upvoted a paper 5 days ago

InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models

upvoted a paper 12 days ago

One-Minute Video Generation with Test-Time Training

View all activity

Organizations

mhale's activity

upvoted 2 papers 5 days ago

Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model

Paper • 2504.08685 • Published 12 days ago • 120

InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models

Paper • 2504.10479 • Published 9 days ago • 239

upvoted 3 papers 12 days ago

upvoted 6 papers 19 days ago

A Comprehensive Survey on Long Context Language Modeling

Paper • 2503.17407 • Published Mar 20 • 49

Gemma 3 Technical Report

Paper • 2503.19786 • Published 29 days ago • 47

Wan: Open and Advanced Large-Scale Video Generative Models

Paper • 2503.20314 • Published 28 days ago • 49

Qwen2.5-Omni Technical Report

Paper • 2503.20215 • Published 28 days ago • 140

MoCha: Towards Movie-Grade Talking Character Synthesis

Paper • 2503.23307 • Published 24 days ago • 128

Multi-Token Attention

Paper • 2504.00927 • Published 22 days ago • 45

upvoted 8 papers about 1 month ago

YuE: Scaling Open Foundation Models for Long-Form Music Generation

Paper • 2503.08638 • Published Mar 11 • 63

One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation

Paper • 2503.13358 • Published Mar 17 • 96

Charting and Navigating Hugging Face's Model Atlas

Paper • 2503.10633 • Published Mar 13 • 77

SmolDocling: An ultra-compact vision-language model for end-to-end multi-modal document conversion

Paper • 2503.11576 • Published Mar 14 • 97

PLADIS: Pushing the Limits of Attention in Diffusion Models at Inference Time by Leveraging Sparsity

Paper • 2503.07677 • Published Mar 10 • 83

ReCamMaster: Camera-Controlled Generative Rendering from A Single Video

Paper • 2503.11647 • Published Mar 14 • 135

Personalize Anything for Free with Diffusion Transformer

Paper • 2503.12590 • Published Mar 16 • 44

Cube: A Roblox View of 3D Intelligence

Paper • 2503.15475 • Published Mar 19 • 29

upvoted a paper about 2 months ago

Magma: A Foundation Model for Multimodal AI Agents

Paper • 2502.13130 • Published Feb 18 • 58