对抗环境强化学习

admin • 2019 年 12 月 17 日 09:27 • 学术报告 • 阅读 578

强化学习（Reinforcement learning ，RL ）是机器学习领域之一，研究如何通过一系列的顺序决策来达成一个特定目标。本次报告从强化学习的基本框架开始，介绍了强化学习的基本思想；介绍了强化学习算法的三种主要类型：基于策略梯度（Policy Based）、基于值函数（Value Based）和基于模型（Model Based）的算法，并对其中基于值函数的一种经典算法Q-Learning的基本原理进行了详细说明；最后，介绍了一种对抗环境强化学习的算法。

2组-学术报告PPT-对抗环境强化学习-王逸洲-2019.12.08

网络安全2组-学术报告PPT-对抗环境强化学习-王逸洲-2019.12.08 下载

原创文章，作者：BFS，如若转载，请注明出处：https://www.isclab.org.cn/2019/12/17/%e5%af%b9%e6%8a%97%e7%8e%af%e5%a2%83%e5%bc%ba%e5%8c%96%e5%ad%a6%e4%b9%a0/

对抗环境强化学习

相关推荐

请登录