Spaces:

gsc579
/

joyrl-benckmarks

No application file

gsc579 commited on May 28, 2023

Commit

2a12873

•

1 Parent(s): f7c8dad

add ppo-hopper-v4

Files changed (6) hide show

Train_single_Hopper-v4_PPO_20230526-135633/config.yaml ADDED Viewed

+general_cfg:
+  algo_name: PPO
+  collect_traj: false
+  device: cuda
+  env_name: gym
+  load_checkpoint: false
+  load_model_step: best
+  load_path: Train_single_CartPole-v1_DQN_20230515-211721
+  max_episode: 2000
+  max_step: 1000
+  mode: train
+  model_save_fre: 500
+  mp_backend: single
+  n_learners: 1
+  n_workers: 2
+  online_eval: true
+  online_eval_episode: 10
+  seed: 1
+  share_buffer: true
+algo_cfg:
+  actor_hidden_dim: 256
+  actor_layers:
+  - activation: relu
+    layer_size:
+    - 256
+    layer_type: linear
+  - activation: relu
+    layer_size:
+    - 256
+    layer_type: linear
+  actor_lr: 0.0003
+  batch_size: 256
+  buffer_size: 100000
+  buffer_type: ONPOLICY_QUE
+  continuous: true
+  critic_hidden_dim: 256
+  critic_layers:
+  - activation: relu
+    layer_size:
+    - 256
+    layer_type: linear
+  - activation: relu
+    layer_size:
+    - 256
+    layer_type: linear
+  critic_loss_coef: 0.5
+  critic_lr: 0.001
+  entropy_coef: 0.01
+  eps_clip: 0.2
+  epsilon_decay: 500
+  epsilon_end: 0.01
+  epsilon_start: 0.95
+  gamma: 0.95
+  independ_actor: true
+  k_epochs: 8
+  kl_alpha: 2
+  kl_beta: 1.5
+  kl_lambda: 0.5
+  kl_target: 0.1
+  lr: 0.0001
+  min_policy: 0
+  ppo_type: clip
+  sgd_batch_size: 128
+  share_optimizer: false
+  target_update: 4
+env_cfg:
+  id: Hopper-v4
+  ignore_params:
+  - wrapper
+  - ignore_params
+  new_step_api: true
+  render_mode: null
+  wrapper: null

Train_single_Hopper-v4_PPO_20230526-135633/logs/log.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

Train_single_Hopper-v4_PPO_20230526-135633/models/500 ADDED Viewed

Binary file (559 kB). View file

Train_single_Hopper-v4_PPO_20230526-135633/models/best ADDED Viewed

Binary file (559 kB). View file

Train_single_Hopper-v4_PPO_20230526-135633/tb_logs/interact/events.out.tfevents.1685109393.gscaimax.2069774.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:d336f8ce6688cc086c520124c6229dfb70d2c7cb4809fbb4d34c1980b0bce0f7
+size 211780

Train_single_Hopper-v4_PPO_20230526-135633/tb_logs/model/events.out.tfevents.1685109393.gscaimax.2069774.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:92162a641de15d129708d2ca49d12766fcff60b186e93d4cecb59f86b89d2176
+size 129875