- 课程回放
研究方向为自动驾驶与机器人的智能决策、行为生成与预测、人机交互、端到端自动驾驶。曾在RSS,CORL,RA-L,ICRA, Neurips,CVPR等机器学习与机器人顶级会议期刊发表多篇论文。曾在自动驾驶社会化行为生成的工作中获得IEEE Robotics and Automation Letters 2021年度Best paper award honorable mention。曾获2022年度CARLA端到端自动驾驶挑战赛冠军。
- 自动驾驶智能决策与行为生成问题与挑战
- 强交互驾驶场景中社会化驾驶行为生成
- 强交互驾驶场景可泛化、个体可适应行为预测
- 强交互高密度场景中强化学习ASAP-RL算法解析
- 自动驾驶智能决策与行为生成未来展望
近年来,自动驾驶汽车(AV)的智能决策模块可以处理的场景复杂度,逐渐成为了衡量和评价自动驾驶能力的核心指标之一。
尤其是在强交互高密度场景中,例如繁忙的城市道路、复杂的十字路口或多车道高速公路真实道路,AV 如何进行智能决策,并生成高效且安全的驾驶行为,仍然存在较大挑战。此类问题包含但不限于如何拟人地与人类交互,提升决策预测算法的泛化能力,有效处理多样驾驶环境中的corner case问题等。
针对上述问题,多伦多大学的在读博士王乐天等研究人员使用(Inverse) reinforcement learning,skill discovery,Bayesian inference等方法,使AV 产生不同风格的拟人化驾驶行为,并在线识别人类的驾驶风格,提升预测算法的场景可迁移性与个体可适应性。这些方法可以大幅提升自动驾驶决策算法的学习效率与性能,智能地解决强交互高密度驾驶场景下的泛化决策问题。相关成果的论文发表于RSS 2023、RA-L 2021(Best Paper)、NeurIPS 2021顶级会议期刊上。
9月1日10点,「自动驾驶新青年讲座」第22讲邀请到论文一作、多伦多大学在读博士王乐天参与,主讲《强交互高密度场景中自动驾驶智能决策与行为生成》。