2025年11月12日,为促进学术交流,拓展科研视野,我院特邀东南大学研究员董璐,在腾讯会议线上开展题为“多智能体强化学习控制与决策研究”的学术报告。我院师生积极参与了此次报告,报告会由电气与控制工程学院刘洁老师主持。
董璐于2012年获东南大学学士学位,2017年于东南大学获博士学位,长期从事强化学习、自适应动态规划、多智能体系统协同控制等方面的研究。她主持国家自然科学基金4项,发表SCI论文70余篇,相关成果发表在IEEE Transactions on Neural Networks and Learning Systems等本领域国际顶级期刊和重要学术会议上,入选江苏省333高层次人才培养工程,获2023年吴文俊人工智能科学技术奖优秀青年奖,2024年中国自动化学会科技进步二等奖(排1),2020年中国自动化学会科技进步一等奖(排4)。现任中国自动化学会人工智能与机器人教育专业委员会秘书长。
在报告中,董璐围绕多智能体强化学习控制与决策研究,首先介绍了多智能体研究在当下的重要性,讲述了强化学习的发展历程,阐述了强化学习算法与结构,从单一智能体强化学习过渡到多智能体强化学习。随后针对强化学习所面临的数据浪费严重、样本需求大等挑战,团队开展事件触发强化学习研究,利用时间触发和事件触发单元,相对于时间采样方法,能有效节省计算资源、避免能源浪费。在此基础上,他们进一步拓展研究基于局部-全局注意力机制的多机合作导航,设计了局部和全局注意力模块和集中式Q网络提升系统鲁棒性;针对成员数量递增的多智能体知识迁移问题,构建了“多智能体执行-评价网络结构”,设计了基于成员数量递增的MADDPG算法。最后针对强化学习的黑箱问题,在MARL的可解释性方面做了探索性研究,建立基于统计策略的隐变量多智能体强化学习框架,通过反事实推断衡量隐藏变量对每个智能体的不同影响,推导出内在奖励来激励智能体探索。董璐老师的讲解清晰透彻,让在场师生收获颇丰。

报告结束后,现场师生纷纷表示,此次讲座内容丰富、见解深刻,为大家在相关领域的研究提供了新的思路与启发。