基于深度强化学习的主动目标跟踪研究

课程回放

基于深度强化学习的主动目标跟踪研究

机器学习前沿讲座 2020/12/29 20:00:00

课程讲师

钟方威北京大学在读博士

师从王亦洲教授，主要研究方向是机器人自主学习和多智能体学习，在TPMAI、ICLR、ICML、NeruIPS、CVPR、AAAI等人工智能领域国际顶级期刊和会议发表多篇论文并担任多个国际顶级会议程序委员/审稿人，是开源项目UnrealCV的主要贡献者之一。

钟方威

北京大学在读博士

课程提纲

主动目标跟踪（AOT）的研究背景
基于深度强化学习的AOT端到端模型
AOT融合多智能体对抗训练机制解析
基于位姿辅助的多相机合作跟踪

课程简介

视觉目标跟踪技术大家可能比较熟悉，是计算机视觉领域的一个重要研究课题。其主要是通过对图像序列中的运动目标进行检测、提取、识别和跟踪，获得运动目标的运动参数，如位置、速度、加速度和运动轨迹等，从而进行下一步的处理与分析，实现对运动目标的行为理解，以完成更高一级的检测任务。

那什么是主动目标跟踪呢？主动目标跟踪是指智能体根据视觉观测信息主动地移动相机，从而与目标保持特定距离和角度。主动目标跟踪在很多实际任务中都有需求，如无人机跟拍，无人车编队，智能监控等。

而传统目标跟踪的实现方法是将图像中的目标跟踪和相机控制分成两个独立的任务，这导致系统在进行联调优化时变得繁琐复杂。此外，要单独实现这两个任务的代价也是高昂的，既需要大量人工标注目标位置用于训练跟踪模块，也需要在真实系统中通过试错整定控制器参数。

那如何解决上述问题呢？来自北京大学和腾讯AI LAB的研究者们提出了一种基于强化学习的端到端主动目标跟踪方法，通过自定义奖赏函数和环境增强技术在虚拟环境中训练得到鲁棒的主动跟踪器，并在真实场景中对模型的泛化能力进行了进一步的验证。

为了让大家更好的理解强化学习与主动目标跟踪的研究与结合，12月29日晚8点，智东西公开课邀请到北京大学信息科学与技术学院计算机应用专业博士生钟方威同学参与到「机器学习前沿讲座」第15讲，带来主题为《基于深度强化学习的主动目标跟踪研究》的直播讲解。在本次的讲解中，钟同学将会全面解析他们所提出的基于深度强化学习的端到端模型的解决方案，包括了定义奖赏函数，仿真环境构建，环境增强技术，多智能体对抗训练机制，基于位姿辅助的多相机合作跟踪等。

钟方威是北京大学信息科学与技术学院计算机应用专业在读博士生，导师王亦洲教授。他的主要研究方向是机器人自主学习和多智能体学习。目前，钟博已在TPMAI、ICLR、ICML、NeruIPS、CVPR、AAAI等人工智能领域顶级国际期刊和会议发表多篇论文，论文被北京市科协评为北京地区广受关注学术成果，是开源项目UnrealCV的主要贡献者之一。同时，他还担任多个顶级国际会议程序委员/审稿人，包括NeurIPS、ICML、ICLR、CVPR、ICCV、ECCV、AAAI等。

精彩问答

提问

目前还没有问题，可以点击右侧的“提问按钮”提问

{{item.name}}
{{item.createdDate}}

{{item.answerOmit}} 阅读全文〉

更多问题...