论坛讲座

羿舒文博士做强化学习工作交流报告

发布时间:[2017-12-25] 来源:[学院] 点击量:[238]

20171225日上午,先进网络与智能系统(ANTIS)创新团队的羿舒文博士在201会议室进行了其近期研究工作的介绍交流,实验室负责人江昊教授、实验室项目主管吴静副教授及全体实验室在读研究生参加了此次交流会。这次交流会主题是A brief introduction of reinforcement learning,主要围绕着机器学习领域中的强化学习中的一些基本概念和马尔科夫决策过程,并介绍了其中的部分算法。

交流会中,羿舒文博士讲解了监督学习、无监督学习、强化学习的各自的特点,然后结合对简单的老虎机决策案例和机器人状态行为转移策略案例,详细描述了强化学习中DP算法的原理和过程,通过最近火热的alpha zero,解释了DP算法的局限性和蒙特卡洛算法在决策问题上的思路。

交流会现场交流氛围浓厚,在一片掌声中,此次交流会圆满结束。

版权所有:先进网络与智能系统ANTIS研究团队