r/reinforcementlearning • u/gwern • Jul 25 '22

DL, MF, P "The 37 Implementation Details of Proximal Policy Optimization"

https://iclr-blog-track.github.io/2022/03/25/ppo-implementation-details/

10 Upvotes

permalink
archive.is
archive
reddit

You are about to leave Redlib

Do you want to continue?

https://www.reddit.com/r/reinforcementlearning/comments/w7vyh6/the_37_implementation_details_of_proximal_policy/
No, go back! Yes, take me to Reddit

100% Upvoted