1 1

Cly

Akikaaa

AI & ML interests

None yet

Recent Activity

updated a model about 2 months ago

Akikaaa/ppo-SnowballTarget

published a model about 2 months ago

Akikaaa/ppo-SnowballTarget

updated a model about 2 months ago

Akikaaa/Reinforce-CartPole-v1

View all activity

Organizations

None yet

Akikaaa's activity

updated a model about 2 months ago

Akikaaa/ppo-SnowballTarget

Reinforcement Learning • Updated Feb 3 • 13

published a model about 2 months ago

Akikaaa/ppo-SnowballTarget

Reinforcement Learning • Updated Feb 3 • 13

updated a model about 2 months ago

Akikaaa/Reinforce-CartPole-v1

Reinforcement Learning • Updated Feb 2

published a model about 2 months ago

Akikaaa/Reinforce-CartPole-v1

Reinforcement Learning • Updated Feb 2

updated a model about 2 months ago

Akikaaa/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jan 31 • 8

published a model about 2 months ago

Akikaaa/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jan 31 • 8

updated a model about 2 months ago

Akikaaa/Taxi-v3

Reinforcement Learning • Updated Jan 30

published a model about 2 months ago

Akikaaa/Taxi-v3

Reinforcement Learning • Updated Jan 30

updated a model about 2 months ago

Akikaaa/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Jan 30

published a model about 2 months ago

Akikaaa/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Jan 30

updated a model 3 months ago

Akikaaa/ppo-LunarLander-v2

Reinforcement Learning • Updated Jan 4 • 4

New activity in Qwen/Qwen2.5-0.5B-Instruct 3 months ago

Does this model apply SFT or SFT+RL during post-training?

#8 opened 3 months ago by

Akikaaa

liked a model 5 months ago

mlabonne/Meta-Llama-3-8B

Text Generation • Updated May 2, 2024 • 72 • 1