Yuandong Tian's picture

4 1

Yuandong Tian

tydsh

·

https://yuandong-tian.com/

AI & ML interests

Reinforcement Learning, Optimization, Representation Learning

Recent Activity

authored a paper 24 days ago

SWEET-RL: Training Multi-Turn LLM Agents on Collaborative Reasoning Tasks

authored a paper 2 months ago

Token Assorted: Mixing Latent and Text Tokens for Improved Language Model Reasoning

authored a paper 3 months ago

Towards General-Purpose Model-Free Reinforcement Learning

View all activity

Organizations

None yet

Papers 22

arxiv:2503.15478

arxiv:2502.03275

arxiv:2501.16142

arxiv:2501.10799

models

None public yet

datasets

None public yet