Lin Huang's picture

264 1

Lin Huang

Lin17

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 5 days ago

VACE: All-in-One Video Creation and Editing

upvoted a paper 5 days ago

Seedream 2.0: A Native Chinese-English Bilingual Image Generation Foundation Model

upvoted a paper 5 days ago

LMM-R1: Empowering 3B LMMs with Strong Reasoning Abilities Through Two-Stage Rule-Based RL

View all activity

Organizations

None yet

Lin17's activity

upvoted 20 papers 5 days ago

VACE: All-in-One Video Creation and Editing

Paper • 2503.07598 • Published 25 days ago • 43

Seedream 2.0: A Native Chinese-English Bilingual Image Generation Foundation Model

Paper • 2503.07703 • Published 25 days ago • 34

LMM-R1: Empowering 3B LMMs with Strong Reasoning Abilities Through Two-Stage Rule-Based RL

Paper • 2503.07536 • Published 25 days ago • 83

TrajectoryCrafter: Redirecting Camera Trajectory for Monocular Videos via Diffusion Models

Paper • 2503.05638 • Published 28 days ago • 18

R1-Zero's "Aha Moment" in Visual Reasoning on a 2B Non-SFT Model

Paper • 2503.05132 • Published 29 days ago • 52

Unified Reward Model for Multimodal Understanding and Generation

Paper • 2503.05236 • Published 28 days ago • 112

YOLOE: Real-Time Seeing Anything

Paper • 2503.07465 • Published 25 days ago • 7

PE3R: Perception-Efficient 3D Reconstruction

Paper • 2503.07507 • Published 25 days ago • 10

Effective and Efficient Masked Image Generation Models

Paper • 2503.07197 • Published 25 days ago • 11

EasyControl: Adding Efficient and Flexible Control for Diffusion Transformer

Paper • 2503.07027 • Published 25 days ago • 27

AnyMoLe: Any Character Motion In-betweening Leveraging Video Diffusion Models

Paper • 2503.08417 • Published 24 days ago • 8

Motion Anything: Any to Motion Generation

Paper • 2503.06955 • Published 25 days ago • 29

Reangle-A-Video: 4D Video Generation as Video-to-Video Translation

Paper • 2503.09151 • Published 23 days ago • 30

TPDiff: Temporal Pyramid Video Diffusion Model

Paper • 2503.09566 • Published 23 days ago • 43

Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models

Paper • 2503.09573 • Published 23 days ago • 67

PoseLess: Depth-Free Vision-to-Joint Control via Direct Image Mapping with VLM

Paper • 2503.07111 • Published 25 days ago • 3

Piece it Together: Part-Based Concepting with IP-Priors

Paper • 2503.10365 • Published 22 days ago • 8

Autoregressive Image Generation with Randomized Parallel Decoding

Paper • 2503.10568 • Published 22 days ago • 8

Long Context Tuning for Video Generation

Paper • 2503.10589 • Published 22 days ago • 14

Open-Sora 2.0: Training a Commercial-Level Video Generation Model in $200k

Paper • 2503.09642 • Published 24 days ago • 17