Edit Models filters

custom-implementation

Inference Endpoints

Other with no match

AutoTrain Compatible

text-generation-inference

4-bit precision

8-bit precision

Carbon Emissions

Mixture of Experts

Models

17,221

Full-text search

Active filters: custom-implementation

ulasfiliz954/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 21

ulasfiliz954/Taxi-v3

Reinforcement Learning • Updated Apr 21

Frankhuhu/Pixelcopter

Reinforcement Learning • Updated Apr 21

lexkarlo/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 21

lexkarlo/q-Taxi-v3

Reinforcement Learning • Updated Apr 21

EdwinWiseOne/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 21

EdwinWiseOne/Taxi-V3

Reinforcement Learning • Updated Apr 21

cuckookernel/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 21

cuckookernel/hf-drl-unit-2-taxi-v3

Reinforcement Learning • Updated Apr 21

rahil1206/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 21

AishwaryaDixit/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 21

AishwaryaDixit/Taxi-v3

Reinforcement Learning • Updated Apr 21

jeliasherrero/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 21

jeliasherrero/taxi-v3

Reinforcement Learning • Updated Apr 21

APLunch/Reinforce-Pixelcopter

Reinforcement Learning • Updated Apr 21

Saraaaaaaaaa/Reinforce-Unit4

Reinforcement Learning • Updated Apr 22

Saraaaaaaaaa/Reinforce-Unit4-1

Reinforcement Learning • Updated Apr 30

izaznov/Reinforce-policy_Cart_Pole

Reinforcement Learning • Updated Apr 22

stuvx/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 22

stuvx/Taxi-v3

Reinforcement Learning • Updated Apr 22

DNA-55/Taxi-v3

Reinforcement Learning • Updated Apr 22

izaznov/Reinforce-policy_pixel_copter

Reinforcement Learning • Updated Apr 27

lzacchini/ppo-LunarLander-v2

Reinforcement Learning • Updated 25 days ago • 2

bhutchings/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 22

bhutchings/q-Taxi-v3

Reinforcement Learning • Updated Apr 22

filodoxia/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 22

filodoxia/Taxi-v3

Reinforcement Learning • Updated Apr 22

ProrabVasili/Reinforce-CartPole-v1

Reinforcement Learning • Updated Apr 22

conlan/ppo-LunarLander-v3

Reinforcement Learning • Updated Apr 22

phoenixaiden33/Reinforce-00

Reinforcement Learning • Updated Apr 22