Edit Models filters

custom-implementation

Inference Endpoints

Other with no match

AutoTrain Compatible

text-generation-inference

4-bit precision

text-embeddings-inference

8-bit precision

Carbon Emissions

Mixture of Experts

Models

18,134

Full-text search

Active filters: custom-implementation

tomTs/Taxi-v3

Reinforcement Learning • Updated May 6

suryaanthony/Taxi-v3

Reinforcement Learning • Updated May 6

elisamammi/CartPoleReinforce

Reinforcement Learning • Updated May 6

jphyun2019/Reinforce-1

Reinforcement Learning • Updated May 6

pietroorlandi/reinforce-cartpole

Reinforcement Learning • Updated May 6

erikbritto/Reinforce-PixelCopter9

Reinforcement Learning • Updated May 6

RobertoFuentesRisco/q-Taxi-v3

Reinforcement Learning • Updated May 6

jphyun2019/Reinforce-2

Reinforcement Learning • Updated May 6

arsimd/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated May 6

haytamelouarrat/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated May 6

erfan1380/q_learning-Cartpole

Reinforcement Learning • Updated May 6

lujan002/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated May 6

lujan002/taxi-v3

Reinforcement Learning • Updated May 6

suryaanthony/CartPole-v1

Reinforcement Learning • Updated May 7

ricardoams/Reinforce-CartPole-v1

Reinforcement Learning • Updated May 7

APLunch/ppo-LunarLanderV2-cleanRL

Reinforcement Learning • Updated May 7

jaymanvirk/pg_cart_pole_v1

Reinforcement Learning • Updated May 7

hugging-robot/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated May 7

hugging-robot/Taxi-v3

Reinforcement Learning • Updated May 7

williamchenaeo/Reinforce-CartPole-v1

Reinforcement Learning • Updated May 7

Lingrui1/Reinforce-unit4

Reinforcement Learning • Updated May 7

tornado1/Reinforce-Policy-gradient

Reinforcement Learning • Updated May 7

arsimd/Taxi-v3

Reinforcement Learning • Updated May 7

Alvaroooooooo/PPO-CleanRL-LunarLander-v2

Reinforcement Learning • Updated May 7

AAAAZhen/Reinforce-1

Reinforcement Learning • Updated May 7

Jyothishwar/Reinforce-v7

Reinforcement Learning • Updated May 8

SiLamine/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated May 7

SiLamine/TaxiV3DQL

Reinforcement Learning • Updated May 7

AdityaNerpagar/ReinforceCopter-v1

Reinforcement Learning • Updated May 7

ricardoams/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated May 7