绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
机器人智能控制的 AIGC 范式——自进化扩散模型规划器
智猩猩AI新青年讲座 2023/06/27 19:00:00
课程讲师
穆尧 香港大学 在读博士

师从罗平教授,共在NeurIPS, ICML, ICLR, CVPR, IJCAI,IEEE TNNLS等顶会顶刊发表论文14篇, 累计发表文章20余篇, 曾获 ICCAS2020 大会最优学生论文奖,IEEE  IV2021 最优学生论文提名奖等多项学术奖励, 于2021年在清华大学取得硕士学位,荣获香港博士政府奖学金,香港大学校长奖学金,国家奖学金,清华大学优秀硕士毕业生,清华大学优秀硕士论文奖等荣誉称号。研究方向: 具身智能、强化学习、机器人控制和自动驾驶。个人主页:yaomarkmu.github.io

穆尧
香港大学 在读博士

师从罗平教授,共在NeurIPS, ICML, ICLR, CVPR, IJCAI,IEEE TNNLS等顶会顶刊发表论文14篇, 累计发表文章20余篇, 曾获 ICCAS2020 大会最优学生论文奖,IEEE  IV2021 最优学生论文提名奖等多项学术奖励, 于2021年在清华大学取得硕士学位,荣获香港博士政府奖学金,香港大学校长奖学金,国家奖学金,清华大学优秀硕士毕业生,清华大学优秀硕士论文奖等荣誉称号。研究方向: 具身智能、强化学习、机器人控制和自动驾驶。个人主页:yaomarkmu.github.io

课程提纲
  • 机器人智能控制的AIGC范式
  • 离线强化学习的瓶颈
  • 基于扩散模型的机器人规划生成方法 AdaptDiffuser
  • 在机械臂、迷宫导航等任务的测试及未来应用探讨
课程简介

Diffusion Model 在 AIGC 领域已经取得了卓越的成就,那么 Diffusion Model 能否用来为 Robotics Learning 服务呢?答案是肯定的,其精髓在于将 long-term planning 问题转化为 Trajectory Generation 问题,将控制问题转化为 AIGC 的范式。

来自香港大学的穆尧等人,在 ICML 2023 的最新工作上,利用 AIGC 强大的生成能力赋能 offline RL 和 Robotics Learning。Offline RL 最大的瓶颈在于专家数据的获得,而 AdaptDiffuser 通过 Reward Guidance 的引导可以生成 diverse tasks 的 synthetic expert data, 经过 Discriminator 的筛选,高质量的数据被用来微调 diffusion model,从而使 diffusion model 能够通过不断的自我进化来适应更多的任务和更多的场景。

基于上述机制,Diffusion model for planning 的 AIGC 模式可以像 Reinforment Learning 一样具备自我进化的能力,而不需要任何初始数据集以外的其他与环境交互的数据,从而很大程度上促进了 AIGC 在Robotics Learning 的应用。该成果已被评选为 Oral Presentation。

6月27日晚7点,「AI新青年讲座」第215讲邀请到 AdaptDiffuser 一作、香港大学在读博士穆尧参与,主讲《机器人智能控制的 AIGC 范式——自进化扩散模型规划器》。

提问