1 14 1

Shi Minglei

MingleiShi

AI & ML interests

None yet

Recent Activity

upvoted a paper 21 days ago

Any2Caption:Interpreting Any Condition to Caption for Controllable Video Generation

upvoted a paper 23 days ago

Wan: Open and Advanced Large-Scale Video Generative Models

upvoted a paper 23 days ago

Qwen2.5-Omni Technical Report

View all activity

Organizations

None yet

MingleiShi's activity

upvoted a paper 21 days ago

Any2Caption:Interpreting Any Condition to Caption for Controllable Video Generation

Paper • 2503.24379 • Published 23 days ago • 75

upvoted 2 papers 23 days ago

Wan: Open and Advanced Large-Scale Video Generative Models

Paper • 2503.20314 • Published 28 days ago • 49

Qwen2.5-Omni Technical Report

Paper • 2503.20215 • Published 28 days ago • 140

upvoted a paper 29 days ago

Position: Interactive Generative Video as Next-Generation Game Engine

Paper • 2503.17359 • Published Mar 21 • 62

commented 4 papers about 1 month ago

authored a paper about 1 month ago

DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers

Paper • 2503.14487 • Published Mar 18 • 27

upvoted 3 papers about 1 month ago

DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers

Paper • 2503.14487 • Published Mar 18 • 27

ReCamMaster: Camera-Controlled Generative Rendering from A Single Video

Paper • 2503.11647 • Published Mar 14 • 135

MM-Eureka: Exploring Visual Aha Moment with Rule-based Large-scale Reinforcement Learning

Paper • 2503.07365 • Published Mar 10 • 60

upvoted a paper 2 months ago

ZeroBench: An Impossible Visual Benchmark for Contemporary Large Multimodal Models

Paper • 2502.09696 • Published Feb 13 • 44

upvoted a paper 3 months ago

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 385

upvoted a collection 6 months ago

Daily Papers

Collection

1 item • Updated Oct 26, 2023 • 80

upvoted 4 papers 7 months ago

Emu3: Next-Token Prediction is All You Need

Paper • 2409.18869 • Published Sep 27, 2024 • 95

Making Text Embedders Few-Shot Learners

Paper • 2409.15700 • Published Sep 24, 2024 • 31

3DTopia-XL: Scaling High-quality 3D Asset Generation via Primitive Diffusion

Paper • 2409.12957 • Published Sep 19, 2024 • 22

Oryx MLLM: On-Demand Spatial-Temporal Understanding at Arbitrary Resolution

Paper • 2409.12961 • Published Sep 19, 2024 • 26

liked a model 10 months ago

stabilityai/stable-diffusion-3-medium

Text-to-Image • Updated Aug 12, 2024 • 16k • • 4.76k