题目:合作型多智能体强化学习理论框架概述及应用
报告人:周韬 博士 澳大利亚迪肯大学工程学院
时间:2021年7月14日 星期三 下午4:00-5:30
地点:线下:东九A528
线上:腾讯会议 926 168 949
钉钉群:
摘要:近年来强化学习, 特别是深度强化学习,已经在许多实际决策问题的应用中取得了不错的效果, 比如棋牌类游戏, 机器人控制和自动驾驶。 这些应用往往只对单个智能体的在平稳的马尔可夫决策环境中的训练, 而现实中很多应用涉及到多个智能体的协作或者竞争。相对于单智能体强化学习,多智能体强化学习面临几个挑战:1) 高计算复杂度; 2) 非平稳性环境; 3) 部分可观测性; 4) 信用分配问题。 为了更深入的了解多智能体强化学习, 该报告分享介绍多智能体强化学习的常见理论建模框架, 关于合作型多智能体强化学习的基于价值分解和基于策略评估的算法, 以及其应用。
欢迎广大师生参加!
理学院
2021.07.13