强化学习(Reinforcement learning ,RL )是机器学习领域之一,研究如何通过一系列的顺序决策来达成一个特定目标。本次报告从强化学习的基本框架开始,介绍了强化学习的基本思想;介绍了强化学习算法的三种主要类型:基于策略梯度(Policy Based)、基于值函数(Value Based)和基于模型(Model Based)的算法,并对其中基于值函数的一种经典算法Q-Learning的基本原理进行了详细说明;最后,介绍了一种对抗环境强化学习的算法。
2组-学术报告PPT-对抗环境强化学习-王逸洲-2019.12.08原创文章,作者:BFS,如若转载,请注明出处:https://www.isclab.org.cn/2019/12/17/%e5%af%b9%e6%8a%97%e7%8e%af%e5%a2%83%e5%bc%ba%e5%8c%96%e5%ad%a6%e4%b9%a0/