Edit Models filters

Multimodal

Image-Text-to-Text

Visual Question Answering

Document Question Answering

Computer Vision

Depth Estimation

Image Classification

Object Detection

Image Segmentation

Unconditional Image Generation

Video Classification

Zero-Shot Image Classification

Mask Generation

Zero-Shot Object Detection

Image Feature Extraction

Natural Language Processing

Text Classification

Token Classification

Table Question Answering

Question Answering

Zero-Shot Classification

Feature Extraction

Text Generation

Text2Text Generation

Sentence Similarity

Audio

Automatic Speech Recognition

Audio Classification

Voice Activity Detection

Tabular

Tabular Classification

Tabular Regression

Time Series Forecasting

Reinforcement Learning

Reinforcement Learning

Other

Graph Machine Learning

Models

42,972

Full-text search

Active filters: reinforcement-learning

Edgar404/Reinforce-001

Reinforcement Learning • Updated Apr 30

girayo/Reinforce-v1

Reinforcement Learning • Updated Apr 30

ilanasto/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 30

ilanasto/taxi-RL

Reinforcement Learning • Updated Apr 30

David0702/ppo-LunarLander-v2-1

Reinforcement Learning • Updated Apr 30

ArnavModanwal/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 30

pietroorlandi/Reinforce-cartpolev1

Reinforcement Learning • Updated Apr 30

AhmedTarek/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated May 7 • 1

lzacchini/Reinforce_Cartpole-v1

Reinforcement Learning • Updated Apr 30

archbold/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 30

archbold/Taxi-v3

Reinforcement Learning • Updated Apr 30

Ruchikal/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 30

lzacchini/Reinforce-CartPole-v1

Reinforcement Learning • Updated Apr 30

dirkneethling/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 30

lzacchini/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated May 1

Cheekydave/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Apr 30

jchenmath/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 30

raulgadea/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 30

raulgadea/q-Taxi-v3

Reinforcement Learning • Updated Apr 30

Novski/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 30

Ferocious0xide/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 30 • 1

Edgar404/Reinforce-pixel_copter-001

Reinforcement Learning • Updated Apr 30

AlkQ/ppo-LunarLander-v2.1

Reinforcement Learning • Updated 22 days ago

Ferocious0xide/ppo-LunarLander-v2.1

Reinforcement Learning • Updated Apr 30 • 1

Zan135/Reinforce-cartpole-v1

Reinforcement Learning • Updated Apr 30

metta-ai/baseline.v0.1.1

Reinforcement Learning • Updated Apr 30

bendupont/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Apr 30

bendupont/q-FrozenLake-v1-4x4-Slippery

Reinforcement Learning • Updated Apr 30

bendupont/q-Taxi-v3

Reinforcement Learning • Updated Apr 30

Leevroko/ppo-LunarLander-v2

Reinforcement Learning • Updated May 1 • 1