Upload folder using huggingface_hub

Files changed (4) hide show

README.md CHANGED Viewed

@@ -1,67 +1,26 @@
 ---
 tags:
-  - generated_from_trainer
-  - BipedalWalker-v3
-  - deep-reinforcement-learning
-  - reinforcement-learning
-datasets:
-- gym_replay
 model-index:
 - name: DT-BipedalWalker-v3
   results:
-    - task:
-        type: reinforcement-learning
-        name: reinforcement-learning
-      dataset:
-        name: BipedalWalker-v3
-        type: BipedalWalker-v3
-      metrics:
-        - type: mean_reward
-          value: 252.17 +/- 12.79
-          name: mean_reward
-          verified: false
 ---
-<!-- This model card has been generated automatically according to the information the Trainer had access to. You
-should probably proofread and complete it, then remove this comment. -->
-# DT-BipedalWalker-v3
-This model is a fine-tuned version of [](https://huggingface.co/) on the gym_replay dataset.
-## Model description
-More information needed
-## Intended uses & limitations
-More information needed
-## Training and evaluation data
-More information needed
-## Training procedure
-### Training hyperparameters
-The following hyperparameters were used during training:
-- learning_rate: 0.0001
-- train_batch_size: 64
-- eval_batch_size: 8
-- seed: 42
-- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
-- lr_scheduler_type: linear
-- lr_scheduler_warmup_ratio: 0.1
-- num_epochs: 120
-### Training results
-### Framework versions
-- Transformers 4.38.2
-- Pytorch 2.1.2
-- Datasets 2.18.0
-- Tokenizers 0.15.2

 ---
 tags:
+- BipedalWalker-v3
+- reinforce
+- reinforcement-learning
+- custom-implementation
+- deep-rl-class
 model-index:
 - name: DT-BipedalWalker-v3
   results:
+  - task:
+      type: reinforcement-learning
+      name: reinforcement-learning
+    dataset:
+      name: BipedalWalker-v3
+      type: BipedalWalker-v3
+    metrics:
+    - type: mean_reward
+      value: 252.88 +/- 1.38
+      name: mean_reward
+      verified: false
 ---
+  # **Reinforce** Agent playing **BipedalWalker-v3**
+  This is a trained model of a **Reinforce** agent playing **BipedalWalker-v3** .

hyperparameters.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"env_id": "BipedalWalker-v3", "n_evaluation_episodes": 10}

model.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:984b01663c7dd81e9bccf78305843457f00b798eae3433f3ef3f985fddce6ff5
+size 8211677

results.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"env_id": "BipedalWalker-v3", "mean_reward": 252.88336973987106, "n_evaluation_episodes": 10, "eval_datetime": "2024-03-20T13:03:25.909234"}