学术报告-强化学习原理及概述-烟台大学科技处

首页

学术交流

当前位置: 首页 >> 学术交流 >> 正文

学术报告-强化学习原理及概述

作者：来源：编辑：姜滔时间：2020-11-19 浏览：

讲座主题：强化学习原理及概述

主讲人：刘磊

工作单位：河海大学

活动时间：2020年11月21日 10:10--10:50

讲座地点：腾讯会议会议ID：281 913 245

主办单位：烟台大学数学与信息科学学院

内容摘要：

强化学习（Reinforcement Learning），属于一种机器学习架构，它是通过让智能体（Agent）不断地对所处环境（Environment）进行探索和开发并根据反馈的回报（Reward）进行的一种经验学习。2016年,谷歌旗下DeepMind团队发布的AlphaGo以4：1的战绩击败了世界围棋冠军里李世纪石,引爆了强化学习的发展势头。近年来，不论在科研界还是工业界，强化学习发挥重要的作用。本报告简介强化学习的数学原理，以及动态规划、蒙特卡洛、时序差分等基本算法。在时间允许的情况下，将介绍DQN和Actor-Critic等深度强化学习算法。

主讲人介绍：

刘磊，男，1983年06月，博士，副教授，博士生导师。主持国家自然科学基金面上项目一项，国家博士后基金特别资助项目一项、国家博士后基金面上项目一项、江苏省博士后资助计划一项；完成国家自然科学青年项目一项。入选2018年度江苏省青蓝工程优秀青年骨干教师培养对象，2018年度河海大学首届大禹学者人才计划第三层次。以第一作者或通讯作者在《IEEE Transactions on Automatic Control》、《IEEE Transactions on Neural Networks and Learning Systems》、《IEEE Transactions on Systems, Man, and Cybernetics: Systems》、《Automatica》、《Science China Information Sciences》、《Systems & Control Letters》等SCI期刊上发表论文20篇。

上一条：学术报告-完备性与Baire纲定理及其应用
下一条：学术报告-On the classification of some symmetric graphs