ahmad-alismail
/

a2c-PandaReachDense-v2

Reinforcement Learning

stable-baselines3

PandaReachDense-v2

deep-reinforcement-learning

Model card Files Files and versions Community

a2c-PandaReachDense-v2 / README.md

Ahmad Alismail

Update README.md

0ee3a2c over 1 year ago

|

history blame contribute delete

No virus

771 Bytes

	---
	library_name: stable-baselines3
	tags:
	- PandaReachDense-v2
	- deep-reinforcement-learning
	- reinforcement-learning
	- stable-baselines3
	model-index:
	- name: A2C
	results:
	- task:
	type: reinforcement-learning
	name: reinforcement-learning
	dataset:
	name: PandaReachDense-v2
	type: PandaReachDense-v2
	metrics:
	- type: mean_reward
	value: -0.99 +/- 0.20
	name: mean_reward
	verified: false
	---

	# A2C Agent playing PandaReachDense-v2
	This is a trained model of a A2C agent playing PandaReachDense-v2
	using the [stable-baselines3 library](https://github.com/DLR-RM/stable-baselines3).

	## Hyperparameters


	```python
	# 4
	policy = "MultiInputPolicy"
	learning_rate=0.001
	gamma=0.95
	time_steps=100000
	...
	```