- 课程回放
自动驾驶智能决策生成算法解析
自动驾驶新青年讲座 2022/11/29 19:00:00
课程讲师
课程提纲
- 基于学习的决策系统框架
- 逆强化学习评估决策
- 结合强化学习与模仿学习的决策生成
- 学习世界模型对人类交互行为建模及决策生成
课程简介
决策是自动驾驶系统中至关重要的一环,是决定自动驾驶汽车大规模部署的前沿问题。相比于传统的基于规则的决策方法,基于学习的决策方法可以大大增强系统的可扩展性,从而加速自动驾驶汽车在现实复杂道路情况下的开发和部署。然而,目前仍缺乏对基于学习的自动驾驶决策过程的系统总结。
来自南洋理工大学的AutoMan实验室的在读博士黄志宇等人专注于自动驾驶决策、预测规划领域的研究。他们在最新的研究中利用逆强化学习(Inverse reinforcement learning)评估决策,结合模仿学习(Imitation learning)和强化学习(Reinforcement learning)直接生成决策,以及学习世界模型(World model)用于决策。
10月27日晚7点,「自动驾驶新青年讲座」第12讲邀请到南洋理工大学在读博士黄志宇,主讲《自动驾驶智能决策生成算法解析》。
本次讲座中,黄博将基于个人的研究工作,全面讲解基于学习的决策系统框架以及其中各模块的学习方法,之后重点将讲解学习世界模型对真实世界交通场景中的人类交互行为进行建模,并以此做出更加智能和拟人化的决策。
精彩问答
提问
提问
