Edit Models filters

custom-implementation

Inference Endpoints

Other with no match

AutoTrain Compatible

text-generation-inference

4-bit precision

8-bit precision

Carbon Emissions

Mixture of Experts

Models

16,994

Full-text search

Active filters: custom-implementation

elisamammi/CartPoleReinforce

Reinforcement Learning • Updated 13 days ago

jphyun2019/Reinforce-1

Reinforcement Learning • Updated 13 days ago

pietroorlandi/reinforce-cartpole

Reinforcement Learning • Updated 13 days ago

erikbritto/Reinforce-PixelCopter9

Reinforcement Learning • Updated 13 days ago

RobertoFuentesRisco/q-Taxi-v3

Reinforcement Learning • Updated 13 days ago

jphyun2019/Reinforce-2

Reinforcement Learning • Updated 13 days ago

arsimd/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated 13 days ago

haytamelouarrat/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated 12 days ago

erfan1380/q_learning-Cartpole

Reinforcement Learning • Updated 12 days ago

lujan002/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated 12 days ago

lujan002/taxi-v3

Reinforcement Learning • Updated 12 days ago

suryaanthony/CartPole-v1

Reinforcement Learning • Updated 12 days ago

ricardoams/Reinforce-CartPole-v1

Reinforcement Learning • Updated 12 days ago

APLunch/ppo-LunarLanderV2-cleanRL

Reinforcement Learning • Updated 12 days ago

jaymanvirk/pg_cart_pole_v1

Reinforcement Learning • Updated 12 days ago

hugging-robot/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated 12 days ago

hugging-robot/Taxi-v3

Reinforcement Learning • Updated 12 days ago

williamchenaeo/Reinforce-CartPole-v1

Reinforcement Learning • Updated 12 days ago

Lingrui1/Reinforce-unit4

Reinforcement Learning • Updated 12 days ago

tornado1/Reinforce-Policy-gradient

Reinforcement Learning • Updated 12 days ago

arsimd/Taxi-v3

Reinforcement Learning • Updated 12 days ago

Alvaroooooooo/PPO-CleanRL-LunarLander-v2

Reinforcement Learning • Updated 12 days ago

AAAAZhen/Reinforce-1

Reinforcement Learning • Updated 12 days ago

Jyothishwar/Reinforce-v7

Reinforcement Learning • Updated 11 days ago

SiLamine/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated 12 days ago

SiLamine/TaxiV3DQL

Reinforcement Learning • Updated 12 days ago

AdityaNerpagar/ReinforceCopter-v1

Reinforcement Learning • Updated 12 days ago

ricardoams/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated 11 days ago

Whiskas0663/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated 12 days ago

pdejong/ref3-Pixelcopter-PLE-v0

Reinforcement Learning • Updated 12 days ago