学术报告-深度强化学习初探：从Q-Learning到DDPG -烟台大学科技处

首页

学术交流

当前位置: 首页 >> 学术交流 >> 正文

学术报告-深度强化学习初探：从Q-Learning到DDPG

作者：来源：编辑：姜滔时间：2020-12-17 浏览：

讲座主题：深度强化学习初探：从Q-Learning到DDPG

主讲人：刘磊

工作单位：河海大学

活动时间：2020年12月19日 20:30--21:30

讲座地点：腾讯会议，会议ID：154 163 874

主办单位：烟台大学数学与信息科学学院

内容摘要：

深度强化学习最近取得了很多进展，并在机器学习领域得到了很多的关注。传统的强化学习局限于动作空间和样本空间都很小，且一般是离散的情境下。然而比较复杂的、更加接近实际情况的任务则往往有着很大的状态空间和连续的动作空间。实现端到端的控制也是要求能处理高维的，如图像、声音等的数据输入。2013和2015年DeepMind的DQN将深度学习和强化学习成功结合的开端，它用一个深度网络代表价值函数，依据强化学习中的Q-Learning，为深度网络提供目标值，对网络不断更新直至收敛。但DQN可以应对高维输入，而对高维的动作输出则束手无策，随后DeepMind提出的DDPG，则可以解决有着高维或者说连续动作空间的情境。

主讲人介绍：

刘磊，男，1983年06月，博士，副教授，博士生导师。主持国家自然科学基金面上项目一项，国家博士后基金特别资助项目一项、国家博士后基金面上项目一项、江苏省博士后资助计划一项；完成国家自然科学青年项目一项。入选2018年度江苏省青蓝工程优秀青年骨干教师培养对象，2018年度河海大学首届大禹学者人才计划第三层次。以第一作者或通讯作者在《IEEE Transactions on Automatic Control》、《IEEE Transactions on Neural Networks and Learning Systems》、《IEEE Transactions on Systems, Man, and Cybernetics: Systems》、《Automatica》、《Science China Information Sciences》、《Systems & Control Letters》等SCI期刊上发表论文20篇。