pytorch-policy-gradient-example
pytorch-policy-gradient-example copied to clipboard

→

A toy example of Policy Gradient implemented in Pytorch

pytorch-policy-gradient-example

Train an agent for CartPole-v0 using naive Policy Gradient.

Solved in 500 episodes (Avg Reward):

alt text

A toy example of Policy Gradient implemented in Pytorch

Stars

Forks

Watchers

Stars

Forks

Watchers

A toy example of Policy Gradient implemented in Pytorch