2020-01-20から1日間の記事一覧

2020-01-20

論文Abstract100本ノック#20

機械学習論文

前回↓ ryosuke-okubo.hatenablog.com 96 PPO（2017）原文： Proximal Policy Optimization Algorithms Abstract： We propose a new family of policy gradient methods for reinforcement learning, which alternate between sampling data through intera…

十の並列した脳

何でも勉強する，毎週月木曜に投稿予定

2020-01-20から1日間の記事一覧

論文Abstract100本ノック#20