Edit Models filters

custom-implementation

Inference Endpoints

Other with no match

AutoTrain Compatible

text-generation-inference

4-bit precision

8-bit precision

Carbon Emissions

Mixture of Experts

Models

17,110

Full-text search

Active filters: custom-implementation

TheWalder/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 24

TheWalder/Taxi-v3

Reinforcement Learning • Updated Apr 24

jeliasherrero/LunarLander-v2

Reinforcement Learning • Updated Apr 24

Alvaroooooooo/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 24

Alvaroooooooo/Taxi-v3

Reinforcement Learning • Updated Apr 24

rahil1206/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Apr 24

ikorennoy/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 24

ikorennoy/q-Taxi-v3

Reinforcement Learning • Updated Apr 24

rahil1206/Reinforce-Pixelcopter-PLE-v0-hyp

Reinforcement Learning • Updated Apr 24

lightyip/Reinforce-CartPole-v1

Reinforcement Learning • Updated Apr 25

aw-infoprojekt/Reinforce-v1

Reinforcement Learning • Updated Apr 25

aw-infoprojekt/Reinforce-PixelCopter-v1

Reinforcement Learning • Updated Apr 26

Dejauxvue/Reinforce-cartpole01

Reinforcement Learning • Updated Apr 25

lzacchini/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 25

lzacchini/q-Taxi-v3

Reinforcement Learning • Updated Apr 25

Asubramanian19/q-FrozenLake-v1-4x4-Slippery

Reinforcement Learning • Updated Apr 25

Asubramanian19/Taxi-v3

Reinforcement Learning • Updated Apr 25

Alvaroooooooo/Reinforce-CartPole-v1

Reinforcement Learning • Updated Apr 25

ahforoughi/Reinforce-7B

Reinforcement Learning • Updated Apr 25

tarpalsus/LunarLander-v2

Reinforcement Learning • Updated Apr 25

Dejauxvue/Reinforce-pixelcopter

Reinforcement Learning • Updated Apr 25

FAYSSAL12/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 25

FAYSSAL12/SABRIFAYSSAL_ENV_TAXI_V3

Reinforcement Learning • Updated Apr 25

Alvaroooooooo/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Apr 25

ahforoughi/Reinforce-8B

Reinforcement Learning • Updated Apr 27

tomaszkowalski/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 25

tomaszkowalski/Taxi

Reinforcement Learning • Updated Apr 25

oldguy/Lab9

Reinforcement Learning • Updated Apr 25

Epoching/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 26

AkiraHase/policy

Reinforcement Learning • Updated Apr 26