6 44 39

Yongxin Guo

Yongxin-Guo

https://gyxxyg.github.io/yongxinguo/

gyxxyg

AI & ML interests

None yet

Recent Activity

upvoted a paper 20 days ago

TULIP: Towards Unified Language-Image Pretraining

upvoted a paper 20 days ago

Stop Overthinking: A Survey on Efficient Reasoning for Large Language Models

upvoted a paper 20 days ago

ViSpeak: Visual Instruction Feedback in Streaming Videos

View all activity

Organizations

Yongxin-Guo's activity

upvoted 3 papers 20 days ago

upvoted a paper about 1 month ago

Unified Reward Model for Multimodal Understanding and Generation

Paper • 2503.05236 • Published Mar 7 • 116

upvoted 2 papers 2 months ago

Critique Fine-Tuning: Learning to Critique is More Effective than Learning to Imitate

Paper • 2501.17703 • Published Jan 29 • 58

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Paper • 2501.17161 • Published Jan 28 • 120

upvoted 4 papers 3 months ago

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published Jan 14 • 285

OpenAI o1 System Card

Paper • 2412.16720 • Published Dec 21, 2024 • 34

Next Token Prediction Towards Multimodal Intelligence: A Comprehensive Survey

Paper • 2412.18619 • Published Dec 16, 2024 • 58

HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs

Paper • 2412.18925 • Published Dec 25, 2024 • 101

upvoted 10 papers 4 months ago

Parallelized Autoregressive Visual Generation

Paper • 2412.15119 • Published Dec 19, 2024 • 54

Are Your LLMs Capable of Stable Reasoning?

Paper • 2412.13147 • Published Dec 17, 2024 • 95

Autoregressive Video Generation without Vector Quantization

Paper • 2412.14169 • Published Dec 18, 2024 • 14

Smarter, Better, Faster, Longer: A Modern Bidirectional Encoder for Fast, Memory Efficient, and Long Context Finetuning and Inference

Paper • 2412.13663 • Published Dec 18, 2024 • 143

How to Synthesize Text Data without Model Collapse?

Paper • 2412.14689 • Published Dec 19, 2024 • 53

Progressive Multimodal Reasoning via Active Retrieval

Paper • 2412.14835 • Published Dec 19, 2024 • 74

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 364

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published Dec 13, 2024 • 97

GenEx: Generating an Explorable World

Paper • 2412.09624 • Published Dec 12, 2024 • 96

DeepSeek-VL2: Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding

Paper • 2412.10302 • Published Dec 13, 2024 • 18