Edit Models filters

custom-implementation Eval Results Inference Endpoints Has a Space

Other with no match

AutoTrain Compatible text-generation-inference Merge 4-bit precision custom_code 8-bit precision Carbon Emissions Mixture of Experts

Models

16,603

new Full-text search

Active filters: custom-implementation

gulubao/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated about 1 month ago

gulubao/Taxi-v3

Reinforcement Learning • Updated about 1 month ago

hui168/Reinforce-PixelCopter

Reinforcement Learning • Updated 29 days ago

EchineF/LunarLander-v2_PPO-from-scratch

Reinforcement Learning • Updated about 1 month ago

msneubauer/Reinforce-01

Reinforcement Learning • Updated about 1 month ago

N0de/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated about 1 month ago

CMYang/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated about 1 month ago

CMYang/Taxi-v3

Reinforcement Learning • Updated about 1 month ago

Dema99/Unit2

Reinforcement Learning • Updated 30 days ago

N0de/ppo-LunarLander-v2_1

Reinforcement Learning • Updated 30 days ago

PQH/Reinforce-CartPole-v1

Reinforcement Learning • Updated 30 days ago

cotran2/Pong_test

Reinforcement Learning • Updated 30 days ago

kas22/frozenlake-1

Reinforcement Learning • Updated 30 days ago

scarface247/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated 30 days ago

scarface247/taxi_v3

Reinforcement Learning • Updated 30 days ago

las3r/Reinforce-01

Reinforcement Learning • Updated 30 days ago

kas22/taxi-1

Reinforcement Learning • Updated 30 days ago

Madao-314/Reinforce_PixelCopter

Reinforcement Learning • Updated 29 days ago

Madao-314/Reinforce-CartPole

Reinforcement Learning • Updated 29 days ago

zee0110/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated 29 days ago

zee0110/Taxi-v3

Reinforcement Learning • Updated 29 days ago

gael1130/ppo-CartPole-v1-from-scratch

Reinforcement Learning • Updated 29 days ago

gael1130/ppo-LunarLander-v2-from-scratch-1

Reinforcement Learning • Updated 29 days ago

gael1130/ppo-LunarLander-v2-from-scratch-2

Reinforcement Learning • Updated 29 days ago

wenboliu/Qtable_taxi

Reinforcement Learning • Updated 29 days ago

Dejauxvue/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated 29 days ago

Dejauxvue/Taxi-v3

Reinforcement Learning • Updated 29 days ago

armary12/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated 29 days ago

tlin/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated 29 days ago

tlin/q-Taxi-v3

Reinforcement Learning • Updated 29 days ago