Junfeng Tian's picture

2

Junfeng Tian

rgtjf

AI & ML interests

None yet

Organizations

None yet

Collections 2

Papers 6

arxiv:2409.04774

arxiv:2404.15702

arxiv:2310.05126

arxiv:2307.02499

models 13

rgtjf/ppo-Pyramids

Reinforcement Learning • Updated Oct 21, 2024 • 28

rgtjf/ppo-SnowballTarget

Reinforcement Learning • Updated Oct 18, 2024 • 21

rgtjf/Reinforce-2048

Reinforcement Learning • Updated Oct 17, 2024

rgtjf/Qwen2-UtK-72B-128K

Updated Oct 17, 2024 • 4

rgtjf/LLama3.1-UtK-8B-128K

Updated Oct 17, 2024 • 2

rgtjf/Qwen2-UtK-ChatQA2-7B-128K

Updated Oct 17, 2024 • 2

rgtjf/Qwen2-UtK-ChatQA2-72B-128K

Updated Oct 17, 2024 • 4

rgtjf/Qwen2-UtK-7B-128K

Updated Oct 17, 2024 • 8

rgtjf/Reinforce-1024

Reinforcement Learning • Updated Oct 17, 2024

rgtjf/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Oct 16, 2024 • 4

datasets

None public yet