Lu Sheng's picture

11 1

Lu Sheng

lsheng2024

·

https://lucassheng.github.io/

AI & ML interests

3D Vision, Embodied AI

Recent Activity

upvoted a paper about 1 month ago

Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection

upvoted a paper about 1 month ago

Diffusion as Shader: 3D-aware Video Diffusion for Versatile Video Generation Control

liked a Space 2 months ago

huanngzh/MV-Adapter-T2MV-Anime

View all activity

Organizations

lsheng2024's activity

upvoted 2 papers about 1 month ago

Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection

Paper • 2412.04455 • Published Dec 5, 2024 • 38

Diffusion as Shader: 3D-aware Video Diffusion for Versatile Video Generation Control

Paper • 2501.03847 • Published Jan 7 • 23

upvoted 2 papers 2 months ago

MV-Adapter: Multi-view Consistent Image Generation Made Easy

Paper • 2412.03632 • Published Dec 4, 2024 • 24

MIDI: Multi-Instance Diffusion for Single Image to 3D Scene Generation

Paper • 2412.03558 • Published Dec 4, 2024 • 16

upvoted a paper 4 months ago

WorldSimBench: Towards Video Generation Models as World Simulators

Paper • 2410.18072 • Published Oct 23, 2024 • 20

upvoted a paper 9 months ago

Ouroboros3D: Image-to-3D Generation via 3D-aware Recursive Diffusion

Paper • 2406.03184 • Published Jun 5, 2024 • 20

upvoted 4 papers 12 months ago

CityDreamer: Compositional Generative Model of Unbounded 3D Cities

Paper • 2309.00610 • Published Sep 1, 2023 • 19

ChEF: A Comprehensive Evaluation Framework for Standardized Assessment of Multimodal Large Language Models

Paper • 2311.02692 • Published Nov 5, 2023 • 1

LAMM: Language-Assisted Multi-Modal Instruction-Tuning Dataset, Framework, and Benchmark

Paper • 2306.06687 • Published Jun 11, 2023 • 1

MP5: A Multi-modal Open-ended Embodied System in Minecraft via Active Perception

Paper • 2312.07472 • Published Dec 12, 2023 • 2

upvoted a paper about 1 year ago

From GPT-4 to Gemini and Beyond: Assessing the Landscape of MLLMs on Generalizability, Trustworthiness and Causality through Four Modalities

Paper • 2401.15071 • Published Jan 26, 2024 • 37