Edit Models filters

Inference Endpoints

AutoTrain Compatible

text-generation-inference

reinforcement-learning

Other with no match

4-bit precision

8-bit precision

Carbon Emissions

Mixture of Experts

Models

41,219

new Full-text search

Active filters: reinforcement-learning

yunkimmy/ppo-Huggy

Reinforcement Learning • Updated 13 days ago • 60

binganao/ppo-LunarLander-v2

Reinforcement Learning • Updated 13 days ago • 5

yunkimmy/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated 13 days ago

binganao/ppo-Huggy

Reinforcement Learning • Updated 13 days ago • 60

yunkimmy/taxi

Reinforcement Learning • Updated 13 days ago

fishtoby/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated 13 days ago • 11

lacknerm/a2c-PandaReachDense-v3

Reinforcement Learning • Updated 13 days ago • 4

Edgar404/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated 12 days ago

DaniElAbrazos/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated 12 days ago • 15

Edgar404/q-Taxi-v3

Reinforcement Learning • Updated 12 days ago

pkbiswas/Phi-1_5-Detoxified-PPO-LoRa

Reinforcement Learning • Updated 12 days ago • 6

shabboo96/sesson1

Reinforcement Learning • Updated 12 days ago • 6 • 2

Taha101/poca-SoccerTwos

Reinforcement Learning • Updated 12 days ago • 22

flashus/ppo-LunarLander-v2

Reinforcement Learning • Updated 12 days ago • 4

ahGadji/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated 12 days ago

Frankhuhu/CartPole

Reinforcement Learning • Updated 11 days ago

EdwinWiseOne/ppo-LunarLander-v2-eww

Reinforcement Learning • Updated 12 days ago • 4

FrancescoArno94/ppo-LunarLander-v2

Reinforcement Learning • Updated 12 days ago • 5

HanliChu/rl_course_vizdoom_health_gathering_supreme

Reinforcement Learning • Updated 12 days ago

ProgrammierAdri/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated 12 days ago

ProgrammierAdri/Taxler

Reinforcement Learning • Updated 12 days ago

tarpalsus/Reinforce-Pixelcopter-v2

Reinforcement Learning • Updated 12 days ago

vicha-w/dqn-SpaceInvadersNoFrameSkip-v4

Reinforcement Learning • Updated 12 days ago • 14

amine-01/a2c-PandaReachDense-v3

Reinforcement Learning • Updated 12 days ago • 4

stuvx/ppo-Huggy

Reinforcement Learning • Updated 12 days ago • 51

poojakannanv/ppo-LunarLander-v2

Reinforcement Learning • Updated 11 days ago • 11

EdwinWiseOne/ppo-Huggy

Reinforcement Learning • Updated 12 days ago • 50

PranavBP525/phi-2-storygen-rlGPTf

Reinforcement Learning • Updated 12 days ago • 1

APLunch/Reinforce-CartPole8

Reinforcement Learning • Updated 12 days ago

UXAIR/Cartpolev1

Reinforcement Learning • Updated 12 days ago