强化学习是人工智能中最活跃的研究领域之一。强化学习不同于监督学习,强化学习根据系统的状态作出动作,由环境给出奖惩信号,通过学习获得使累计奖惩最高的动作策略。也就是一种基于数据通过自学习方式获得最优决策和控制的方法。在棋类博弈、智能驾驶、机器人控制等领域都有广泛成功的应用。希望学生掌握强化学习理论与技术的基本思想与基本方法,了解强化学习的最新研究进展,运用强化学习方法解决工程应用中的实际问题。我开讲这门课程,一是希望研究生们能紧跟人工智能研究前沿;二是希望技术能够普及,多一些志同道合的人;三是让大家知道强化学习能做什么不能做什么,不要盲目自信,也不要妄自菲薄。 因为是研究生课程,学生们学习这门课程的主要目的还是怎么应用强化学习到自己导师的科研课题上,具有很强的应用需求导向。因此本课程主要讲两部分,一强化学习的基本概念和经典算法;二如何应用强化学习解决实际问题,即深度强化学习落地方面的经验总结。我们做科研,要知行合一,要脚踏实地,要有理想和激情。