Edit Models filters

custom-implementation

Inference Endpoints

Other with no match

AutoTrain Compatible

text-generation-inference

4-bit precision

text-embeddings-inference

8-bit precision

Carbon Emissions

Mixture of Experts

Models

18,129

Full-text search

Active filters: custom-implementation

aldjia/Pixelcopter-PLE-v0

Reinforcement Learning • Updated May 18

saousan/Reinforce-cartpool

Reinforcement Learning • Updated May 18

Astowny/Reinforce-cartpool

Reinforcement Learning • Updated May 18

Yann2310/Reinforce

Reinforcement Learning • Updated May 18

konawa/Reinforce

Reinforcement Learning • Updated May 18

SamirLahouar/Reinforce-unit4

Reinforcement Learning • Updated May 18

shapiron/q-taxi-v3

Reinforcement Learning • Updated May 18

shapiron/q-taxi-v3-b

Reinforcement Learning • Updated May 18

katk31/q-Taxi-v3-test

Reinforcement Learning • Updated May 18

shapiron/q-taxi-v3-c

Reinforcement Learning • Updated May 18

Mullerjo/Frozenlakev2

Reinforcement Learning • Updated May 18

Mullerjo/pixelcopterv2

Reinforcement Learning • Updated May 18

amc5/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated May 18

amc5/q-Taxi-v3

Reinforcement Learning • Updated May 18

sddgs/taxi

Reinforcement Learning • Updated May 19

mejdi86/Taxi-v3

Reinforcement Learning • Updated May 19

Mullerjo/ReinforcePixelcopterv2

Reinforcement Learning • Updated May 19

Mullerjo/LunarLanderv2

Reinforcement Learning • Updated May 19

RomBor/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated May 24

mesa44/LunarLander-v2

Reinforcement Learning • Updated May 20

costazd/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated May 20

jonnynd/Taxi-v3

Reinforcement Learning • Updated May 20

elloco123/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated May 20

Danny-Moldovan/ppo-CartPole-v1

Reinforcement Learning • Updated May 20

elloco123/taxi-v3

Reinforcement Learning • Updated May 20

LucaResti/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated May 20

ChikeJ/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated May 20

feysahin/Reinforce-CartPole-v1

Reinforcement Learning • Updated May 20

Fetanos/ppo-LunarLander-v2-2

Reinforcement Learning • Updated May 20

izaznov/ppo_torch_LunarLander-v2

Reinforcement Learning • Updated May 21