讲座主题:强化学习原理及概述
主讲人: 刘磊
工作单位:河海大学
活动时间:2020年11月21日 10:10--10:50
讲座地点:腾讯会议会议ID:281 913 245
主办单位:烟台大学数学与信息科学学院
内容摘要:
强化学习(Reinforcement Learning),属于一种机器学习架构,它是通过让智能体(Agent)不断地对所处环境(Environment)进行探索和开发并根据反馈的回报(Reward)进行的一种经验学习。2016年,谷歌旗下DeepMind团队发布的AlphaGo以4:1的战绩击败了世界围棋冠军里李世纪石,引爆了强化学习的发展势头。近年来,不论在科研界还是工业界,强化学习发挥重要的作用。本报告简介强化学习的数学原理,以及动态规划、蒙特卡洛、时序差分等基本算法。在时间允许的情况下,将介绍DQN和Actor-Critic等深度强化学习算法。
主讲人介绍:
刘磊,男,1983年06月,博士,副教授,博士生导师。主持国家自然科学基金面上项目一项,国家博士后基金特别资助项目一项、国家博士后基金面上项目一项、江苏省博士后资助计划一项;完成国家自然科学青年项目一项。入选2018年度江苏省青蓝工程优秀青年骨干教师培养对象,2018年度河海大学首届大禹学者人才计划第三层次。以第一作者或通讯作者在《IEEE Transactions on Automatic Control》、《IEEE Transactions on Neural Networks and Learning Systems》、《IEEE Transactions on Systems, Man, and Cybernetics: Systems》、《Automatica》、《Science China Information Sciences》、《Systems & Control Letters》等SCI期刊上发表论文20篇。