1 6 4

Hao Shao

deepcs233

https://hao-shao.com/

deepcs233

AI & ML interests

None yet

Recent Activity

updated a dataset 14 days ago

deepcs233/Visual-CoT

updated a model 14 days ago

deepcs233/VisCoT-7b-336

authored a paper 16 days ago

LMDrive: Closed-Loop End-to-End Driving with Large Language Models

View all activity

Organizations

deepcs233's activity

updated a dataset 14 days ago

deepcs233/Visual-CoT

Preview • Updated 14 days ago • 508 • 12

updated a model 14 days ago

deepcs233/VisCoT-7b-336

Text Generation • Updated 14 days ago • 57 • 2

authored 4 papers 16 days ago

LMDrive: Closed-Loop End-to-End Driving with Large Language Models

Paper • 2312.07488 • Published Dec 12, 2023

Visual CoT: Unleashing Chain-of-Thought Reasoning in Multi-Modal Language Models

Paper • 2403.16999 • Published Mar 25, 2024 • 4

MoVA: Adapting Mixture of Vision Experts to Multimodal Context

Paper • 2404.13046 • Published Apr 19, 2024 • 1

VividFace: A Diffusion-Based Hybrid Framework for High-Fidelity Video Face Swapping

Paper • 2412.11279 • Published 19 days ago • 12

upvoted a paper 17 days ago

VividFace: A Diffusion-Based Hybrid Framework for High-Fidelity Video Face Swapping

Paper • 2412.11279 • Published 19 days ago • 12

commented a paper 17 days ago

VividFace: A Diffusion-Based Hybrid Framework for High-Fidelity Video Face Swapping

Paper • 2412.11279 • Published 19 days ago • 12 •

upvoted a paper 18 days ago

Causal Diffusion Transformers for Generative Modeling

Paper • 2412.12095 • Published 18 days ago • 23

authored a paper 18 days ago

EasyRef: Omni-Generalized Group Image Reference for Diffusion Models via Multimodal LLM

Paper • 2412.09618 • Published 22 days ago • 21

upvoted 2 papers 22 days ago

EasyRef: Omni-Generalized Group Image Reference for Diffusion Models via Multimodal LLM

Paper • 2412.09618 • Published 22 days ago • 21

StreamChat: Chatting with Streaming Video

Paper • 2412.08646 • Published 23 days ago • 17

updated 3 models about 1 month ago

upvoted a paper 7 months ago

Exploring the Role of Large Language Models in Prompt Encoding for Diffusion Models

Paper • 2406.11831 • Published Jun 17, 2024 • 21

updated a collection 7 months ago

VisCoT

Collection

Visual CoT: Unleashing Chain-of-Thought Reasoning in the Multi-Modal Language Model • 5 items • Updated Jun 13, 2024 • 2

liked a dataset 7 months ago

deepcs233/Visual-CoT

Preview • Updated 14 days ago • 508 • 12