Long(Tony) Lian's picture

Long(Tony) Lian PRO

longlian

·

https://tonylian.com/

TonyLianLong

AI & ML interests

None yet

Recent Activity

updated a model 1 day ago

longlian/dam_3b_v1_self_contained

updated a model 9 days ago

longlian/dam_3b_v1_self_contained

updated a model 9 days ago

longlian/dam_3b_v1_self_contained

View all activity

Organizations

longlian's activity

upvoted 5 papers 2 months ago

Movie Gen: A Cast of Media Foundation Models

Paper • 2410.13720 • Published Oct 17 • 89

Rectified Diffusion: Straightness Is Not Your Need in Rectified Flow

Paper • 2410.07303 • Published Oct 9 • 18

Aria: An Open Multimodal Native Mixture-of-Experts Model

Paper • 2410.05993 • Published Oct 8 • 107

MonST3R: A Simple Approach for Estimating Geometry in the Presence of Motion

Paper • 2410.03825 • Published Oct 4 • 18

AuroraCap: Efficient, Performant Video Detailed Captioning and a New Benchmark

Paper • 2410.03051 • Published Oct 4 • 4

upvoted 4 papers 3 months ago

Video Instruction Tuning With Synthetic Data

Paper • 2410.02713 • Published Oct 3 • 38

Contrastive Localized Language-Image Pre-Training

Paper • 2410.02746 • Published Oct 3 • 32

Training Language Models to Self-Correct via Reinforcement Learning

Paper • 2409.12917 • Published Sep 19 • 135

Language Models Learn to Mislead Humans via RLHF

Paper • 2409.12822 • Published Sep 19 • 9

upvoted a paper 4 months ago

In-Context Imitation Learning via Next-Token Prediction

Paper • 2408.15980 • Published Aug 28 • 9

upvoted 3 papers 5 months ago

OpenDevin: An Open Platform for AI Software Developers as Generalist Agents

Paper • 2407.16741 • Published Jul 23 • 68

VILA^2: VILA Augmented VILA

Paper • 2407.17453 • Published Jul 24 • 39

Shape of Motion: 4D Reconstruction from a Single Video

Paper • 2407.13764 • Published Jul 18 • 19

upvoted a paper 6 months ago

Cambrian-1: A Fully Open, Vision-Centric Exploration of Multimodal LLMs

Paper • 2406.16860 • Published Jun 24 • 58

upvoted a paper 10 months ago

Panda-70M: Captioning 70M Videos with Multiple Cross-Modality Teachers

Paper • 2402.19479 • Published Feb 29 • 32

upvoted 3 papers 11 months ago

LLM-grounded Video Diffusion Models

Paper • 2309.17444 • Published Sep 29, 2023 • 2

Rethinking Patch Dependence for Masked Autoencoders

Paper • 2401.14391 • Published Jan 25 • 23

Towards A Better Metric for Text-to-Video Generation

Paper • 2401.07781 • Published Jan 15 • 14

upvoted 2 papers 12 months ago

Mixtral of Experts

Paper • 2401.04088 • Published Jan 8 • 157

Unified-IO 2: Scaling Autoregressive Multimodal Models with Vision, Language, Audio, and Action

Paper • 2312.17172 • Published Dec 28, 2023 • 26