Siteng Huang's picture

3 4 1

Siteng Huang

huangsiteng

·

https://kyonhuang.top/

AI & ML interests

vision-language models

Recent Activity

authored a paper about 1 month ago

Accelerating Diffusion Transformers with Token-wise Feature Caching

authored a paper about 1 month ago

Rethinking Token Reduction in MLLMs: Towards a Unified Paradigm for Training-Free Acceleration

authored a paper about 1 month ago

CARP: Visuomotor Policy Learning via Coarse-to-Fine Autoregressive Prediction

View all activity

Organizations

None yet

huangsiteng's activity

upvoted a paper about 1 month ago

CARP: Visuomotor Policy Learning via Coarse-to-Fine Autoregressive Prediction

Paper • 2412.06782 • Published Dec 9, 2024 • 6

upvoted a paper about 2 months ago

Rethinking Token Reduction in MLLMs: Towards a Unified Paradigm for Training-Free Acceleration

Paper • 2411.17686 • Published Nov 26, 2024 • 19

upvoted a paper 4 months ago

PiTe: Pixel-Temporal Alignment for Large Video-Language Model

Paper • 2409.07239 • Published Sep 11, 2024 • 12

upvoted a paper 10 months ago

Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference

Paper • 2403.14520 • Published Mar 21, 2024 • 33