ZhaWennnn's picture

23 10

ZhaWennnn

Komeras

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 27 days ago

The Stochastic Parrot on LLM's Shoulder: A Summative Assessment of Physical Concept Understanding

liked a model 27 days ago

Zyphra/Zonos-v0.1-hybrid

upvoted a paper 27 days ago

VMamba: Visual State Space Model

View all activity

Organizations

None yet

Komeras's activity

upvoted a paper 27 days ago

The Stochastic Parrot on LLM's Shoulder: A Summative Assessment of Physical Concept Understanding

Paper • 2502.08946 • Published 30 days ago • 184

liked a model 27 days ago

Zyphra/Zonos-v0.1-hybrid

Text-to-Speech • Updated 27 days ago • 58.4k • 1.04k

upvoted 18 papers 27 days ago

VMamba: Visual State Space Model

Paper • 2401.10166 • Published Jan 18, 2024 • 40

DiffusionGPT: LLM-Driven Text-to-Image Generation System

Paper • 2401.10061 • Published Jan 18, 2024 • 30

Rethinking FID: Towards a Better Evaluation Metric for Image Generation

Paper • 2401.09603 • Published Nov 30, 2023 • 18

ICON: Incremental CONfidence for Joint Pose and Radiance Field Optimization

Paper • 2401.08937 • Published Jan 17, 2024 • 8

SiT: Exploring Flow and Diffusion-based Generative Models with Scalable Interpolant Transformers

Paper • 2401.08740 • Published Jan 16, 2024 • 14

WorldDreamer: Towards General World Models for Video Generation via Predicting Masked Tokens

Paper • 2401.09985 • Published Jan 18, 2024 • 17

GARField: Group Anything with Radiance Fields

Paper • 2401.09419 • Published Jan 17, 2024 • 21

SceneVerse: Scaling 3D Vision-Language Learning for Grounded Scene Understanding

Paper • 2401.09340 • Published Jan 17, 2024 • 21

ChatQA: Building GPT-4 Level Conversational QA Models

Paper • 2401.10225 • Published Jan 18, 2024 • 36

Towards A Better Metric for Text-to-Video Generation

Paper • 2401.07781 • Published Jan 15, 2024 • 16

Quantum Denoising Diffusion Models

Paper • 2401.07049 • Published Jan 13, 2024 • 14

Tuning Language Models by Proxy

Paper • 2401.08565 • Published Jan 16, 2024 • 23

Scalable Pre-training of Large Autoregressive Image Models

Paper • 2401.08541 • Published Jan 16, 2024 • 38

Object-Centric Diffusion for Efficient Video Editing

Paper • 2401.05735 • Published Jan 11, 2024 • 11

A Shocking Amount of the Web is Machine Translated: Insights from Multi-Way Parallelism

Paper • 2401.05749 • Published Jan 11, 2024 • 10

LEGO:Language Enhanced Multi-modal Grounding Model

Paper • 2401.06071 • Published Jan 11, 2024 • 13

Towards Conversational Diagnostic AI

Paper • 2401.05654 • Published Jan 11, 2024 • 19

TOFU: A Task of Fictitious Unlearning for LLMs

Paper • 2401.06121 • Published Jan 11, 2024 • 19