2024年7月17日下午,由中国科学技术大学生命科学与医学部及中国科学技术大学研究生院主办的第40期“贝时璋讲座”在生命科学大楼531会议室成功举办。本次讲座的报告人为西班牙庞培法布拉大学Rubén Moreno Bote教授。生命科学与医学部温泉教授主持报告会。
报告开始前,温泉教授向参会师生介绍了贝时璋先生及贝时璋讲座的由来及背景,并对报告人Rubén教授的科研背景和主要研究方向进行了介绍。
Rubén教授以风趣幽默的语言,带来题为“From reward-based to reward-free behavior: gaze-centered cortical reactivation of offers, and the maximum occupancy principle (MOP) for natural and AI”的学术报告。Rubén教授挑战了传统的以最大化奖赏为目标的强化学习理论,并提出了一个新的行为理论:最大占用原则(Maximum Occupancy Principle, MOP)。即行为的目标是最大化对行动-状态空间的占用,即不断地移动和探索。行动-状态路径熵是唯一符合加法性和其他直观特性的未来行动-状态路径占用的度量标准。通过离散和连续状态的研究,Rubén教授展示了MOP如何在没有任何外在奖励的情况下引导人工智能体进行目标导向行为。MOP智能体可以自发学习生存,并灵活地制定自己的目标。Rubén教授的研究表明,虽然奖励概念在行为理论中很重要,但需要重新思考和定义。这一新理论不仅挑战了传统观点,还为理解复杂行为提供了新的视角。
Rubén教授的报告逻辑清晰、引人入胜,为广大师生带来了一场精彩绝伦而又妙趣横生的学术盛宴。报告结束后,他与参会师生展开热烈讨论,并对大家的提问给予了精彩的解答,为参会者带来了很多启发和收获。
报告会最后,温泉教授向Rubén教授赠送“贝时璋讲座”主讲嘉宾纪念牌,并合影留念。