policy-gradient-methods
policy-gradient-methods copied to clipboard

zafarali

→

Metadata

Modular PyTorch implementation of policy gradient methods

Reame
Issues

Results 4 policy-gradient-methods issues

Sort by recently updated

entropy not implemented correctly

Using sampled entropy rather than analytic entropy.

zafarali

Add A2C

zafarali

Run roboschool on CC to get VPG performance

According to fig 3 here https://arxiv.org/abs/1707.06347 VPG should be able to do ok after about 0.5M steps

zafarali

Frozen lake (discrete spaces issue?)

Seems like discrete spaces with discrete actions is not doing well at all. Might be a wrapper problem

zafarali

About

Modular PyTorch implementation of policy gradient methods

reinforcement-learning

policy-gradient

25

Stars

6

Forks

Watchers

Owner

zafarali

← Metadata

25

Stars

6

Forks

Watchers

Owner

zafarali

Metadata

Modular PyTorch implementation of policy gradient methods

Back

policy-gradient-methods policy-gradient-methods copied to clipboard

Metadata

entropy not implemented correctly

Add A2C

Run roboschool on CC to get VPG performance

Frozen lake (discrete spaces issue?)

← Metadata

Owner

Metadata

policy-gradient-methods
policy-gradient-methods copied to clipboard