绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
基于深度强化学习的主动目标跟踪研究
机器学习前沿讲座 2020/12/29 20:00:00
课程讲师
钟方威 北京大学在读博士

师从王亦洲教授,主要研究方向是机器人自主学习和多智能体学习,在TPMAI、ICLR、ICML、NeruIPS、CVPR、AAAI等人工智能领域国际顶级期刊和会议发表多篇论文并担任多个国际顶级会议程序委员/审稿人,是开源项目UnrealCV的主要贡献者之一。

钟方威
北京大学在读博士

师从王亦洲教授,主要研究方向是机器人自主学习和多智能体学习,在TPMAI、ICLR、ICML、NeruIPS、CVPR、AAAI等人工智能领域国际顶级期刊和会议发表多篇论文并担任多个国际顶级会议程序委员/审稿人,是开源项目UnrealCV的主要贡献者之一。

课程提纲
  • 主动目标跟踪(AOT)的研究背景
  • 基于深度强化学习的AOT端到端模型
  • AOT融合多智能体对抗训练机制解析
  • 基于位姿辅助的多相机合作跟踪
课程简介

视觉目标跟踪技术大家可能比较熟悉,是计算机视觉领域的一个重要研究课题。其主要是通过对图像序列中的运动目标进行检测、提取、识别和跟踪,获得运动目标的运动参数,如位置、速度、加速度和运动轨迹等,从而进行下一步的处理与分析,实现对运动目标的行为理解,以完成更高一级的检测任务。

那什么是主动目标跟踪呢?主动目标跟踪是指智能体根据视觉观测信息主动地移动相机,从而与目标保持特定距离和角度。主动目标跟踪在很多实际任务中都有需求,如无人机跟拍,无人车编队,智能监控等。

而传统目标跟踪的实现方法是将图像中的目标跟踪和相机控制分成两个独立的任务,这导致系统在进行联调优化时变得繁琐复杂。此外,要单独实现这两个任务的代价也是高昂的,既需要大量人工标注目标位置用于训练跟踪模块,也需要在真实系统中通过试错整定控制器参数。

那如何解决上述问题呢?来自北京大学和腾讯AI LAB的研究者们提出了一种基于强化学习的端到端主动目标跟踪方法,通过自定义奖赏函数和环境增强技术在虚拟环境中训练得到鲁棒的主动跟踪器,并在真实场景中对模型的泛化能力进行了进一步的验证。

为了让大家更好的理解强化学习与主动目标跟踪的研究与结合,12月29日晚8点,智东西公开课邀请到北京大学信息科学与技术学院计算机应用专业博士生钟方威同学参与到「机器学习前沿讲座」第15讲,带来主题为《基于深度强化学习的主动目标跟踪研究》的直播讲解。在本次的讲解中,钟同学将会全面解析他们所提出的基于深度强化学习的端到端模型的解决方案,包括了定义奖赏函数,仿真环境构建,环境增强技术,多智能体对抗训练机制,基于位姿辅助的多相机合作跟踪等。

钟方威是北京大学信息科学与技术学院计算机应用专业在读博士生,导师王亦洲教授。他的主要研究方向是机器人自主学习和多智能体学习。目前,钟博已在TPMAI、ICLR、ICML、NeruIPS、CVPR、AAAI等人工智能领域顶级国际期刊和会议发表多篇论文,论文被北京市科协评为北京地区广受关注学术成果,是开源项目UnrealCV的主要贡献者之一。同时,他还担任多个顶级国际会议程序委员/审稿人,包括NeurIPS、ICML、ICLR、CVPR、ICCV、ECCV、AAAI等。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...