Edit Models filters

deep-reinforcement-learning

Inference Endpoints

Other with no match

AutoTrain Compatible

text-generation-inference

4-bit precision

8-bit precision

Carbon Emissions

Mixture of Experts

Models

28,342

Full-text search

Active filters: deep-reinforcement-learning

Lingrui1/ppo-LunarLander-v2

Reinforcement Learning • Updated May 6

APLunch/poca-SoccerTwos-1

Reinforcement Learning • Updated May 6 • 53

thinh-huynh-re/ppo-LunarLander-v2

Reinforcement Learning • Updated May 6

DavidClark314/ppo-LunarLander-v2

Reinforcement Learning • Updated May 6

rahul1vemula/ppo-LunarLander-v2

Reinforcement Learning • Updated May 6

Max87152/a2c-PandaReachDense-v3

Reinforcement Learning • Updated May 6

davideaguglia/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated May 6

dhajnes/poca-SoccerTwos

Reinforcement Learning • Updated May 6 • 31

Armageddon1337/ppo-Huggy

Reinforcement Learning • Updated May 6 • 9

rwr20/a2c-PandaPickAndPlaceDense-v3

Reinforcement Learning • Updated May 6

Unclad3610/ppo-SnowballTarget

Reinforcement Learning • Updated May 6 • 1

rwr20/SAC-PandaPickAndPlaceDense-v3

Reinforcement Learning • Updated May 6

pietroorlandi/ppo-CartPole-from-scratch

Reinforcement Learning • Updated May 6

elisamammi/ppo-CartPole-v1

Reinforcement Learning • Updated May 6

Unclad3610/ppo-pyramid-training

Reinforcement Learning • Updated May 6 • 12

chainatao/ppo-Huggy

Reinforcement Learning • Updated May 6 • 41

AhmedTarek/a2c-PandaReachDense-v3

Reinforcement Learning • Updated May 6

elisamammi/rl_course_vizdoom_health_gathering_supreme

Reinforcement Learning • Updated May 6

pietroorlandi/rl_course_vizdoom_health_gathering_supreme

Reinforcement Learning • Updated May 6

pietroorlandi/ppo-LunarLander-from-scratch

Reinforcement Learning • Updated May 6

elisamammi/ppo-LunarLander_v2

Reinforcement Learning • Updated May 6

AhmedTarek/a2c-PandaPickAndPlace-v3

Reinforcement Learning • Updated May 6

midodo/ppo-LunarLander-v2

Reinforcement Learning • Updated May 6

llmvetter/ppo-lunarlander-v2

Reinforcement Learning • Updated May 6

mharb/ppo-LunarLander-v2

Reinforcement Learning • Updated May 6

elisamammi/ppo-LunarLander-v2

Reinforcement Learning • Updated May 6

dschulmeist/ppo-LunarLander-v2

Reinforcement Learning • Updated May 6

elisamammi/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated May 6

davideaguglia/dqn-BreakoutNoFrameskip-v4

Reinforcement Learning • Updated May 6

raulgadea/a2c-PandaReachDense-v3

Reinforcement Learning • Updated May 6