Edit Models filters

Inference Endpoints

AutoTrain Compatible

text-generation-inference

reinforcement-learning

Other with no match

4-bit precision

text-embeddings-inference

8-bit precision

Carbon Emissions

Mixture of Experts

Models

44,918

Full-text search

Active filters: reinforcement-learning

PKU-Alignment/beaver-7b-v1.0-reward

Reinforcement Learning • Updated Apr 20 • 4.4k • 15

PKU-Alignment/beaver-7b-v1.0-cost

Reinforcement Learning • Updated Apr 20 • 4.16k • 8

nishchalprasad/lunar_lander_v2-PPO

Reinforcement Learning • Updated Jul 16, 2023 • 2 • 1

nicklashansen/tdmpc2

Reinforcement Learning • Updated Oct 26, 2023 • 12

Dhanraj1503/deep_reinforcement_learning

Reinforcement Learning • Updated Jan 15 • 1 • 1

jat-project/jat

Reinforcement Learning • Updated Apr 29 • 354 • 78

PKU-Alignment/beaver-7b-unified-cost

Reinforcement Learning • Updated Apr 20 • 76 • 1

SriSougandhika/ppo-LunarLander-v2

Reinforcement Learning • Updated May 15 • 1

cheryyunl/Make-An-Agent

Reinforcement Learning • Updated 10 days ago • 2

line-corporation/sacpo

Reinforcement Learning • Updated Jun 21 • 15 • 4

PHF08/ppo-LunarLander-v2

Reinforcement Learning • Updated 13 days ago • 7 • 1

gziz/CartPole-v1

Reinforcement Learning • Updated 12 days ago • 1

dude121/rl_course_vizdoom_health_gathering_supreme

Reinforcement Learning • Updated 11 days ago • 1

dogukankartal/ppo-LunarLander-v2

Reinforcement Learning • Updated 11 days ago • 7 • 1

dogukankartal/ql-Taxi_v3

Reinforcement Learning • Updated 10 days ago • 1

dogukankartal/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated 6 days ago • 9 • 1

paulo101977/lular-lander-v2

Reinforcement Learning • Updated 5 days ago • 4 • 1

iKyalo/ppo-LunarLander-v2

Reinforcement Learning • Updated 3 days ago • 3 • 1

dhruvys/ppoLunarLanderv2

Reinforcement Learning • Updated 2 days ago • 3 • 1

dhruvys/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated 2 days ago • 1

dhruvys/Taxi-v3

Reinforcement Learning • Updated 2 days ago • 1

dogukankartal/reinforce_PixelCopter_v1

Reinforcement Learning • Updated 2 days ago • 1

dogukankartal/a2c_PandaReachDense-v3

Reinforcement Learning • Updated 1 day ago • 2 • 1

ThomasSimonini/ML-Agents-SnowballFight-1vs1

Reinforcement Learning • Updated Nov 30, 2021 • 3 • 4

ThomasSimonini/demo-hf-CartPole-v1

Reinforcement Learning • Updated May 3, 2023 • 1

ThomasSimonini/mlagents-snowballfight-1vs1-ppo

Reinforcement Learning • Updated Nov 22, 2021

ThomasSimonini/ppo-AntBulletEnv-v0

Reinforcement Learning • Updated Apr 7, 2022 • 2

ThomasSimonini/ppo-BreakoutNoFrameskip-v4

Reinforcement Learning • Updated Apr 7, 2022 • 21 • 2

ThomasSimonini/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 28, 2023 • 1 • 12

ThomasSimonini/ppo-PongNoFrameskip-v4

Reinforcement Learning • Updated Apr 7, 2022 • 15 • 1