绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
利用技能学习的扩散策略实现层次化机器人轨迹生成
智猩猩AI新青年讲座 2024/07/02 14:00:00
课程讲师
梁志烜 香港大学 计算机系HKU-MMLAB二年级博士生

导师为罗平教授,研究兴趣为生成式模型,具身智能,以及表征学习,在基于扩散模型的规划器方向发表多篇论文在顶级会议、期刊上,如ICML、CVPR等。

梁志烜
香港大学 计算机系HKU-MMLAB二年级博士生

导师为罗平教授,研究兴趣为生成式模型,具身智能,以及表征学习,在基于扩散模型的规划器方向发表多篇论文在顶级会议、期刊上,如ICML、CVPR等。

课程提纲
  • 扩散模型在轨迹规划的应用潜力与问题
  • 端到端的机器人轨迹层次化规划框架SkillDiffuser
  • 使用技能抽象模块从视觉和语言指令中学习表征信息
  • 条件扩散模型生成与技能对齐的定制化潜在轨迹
  • 实验效果可视化分析与总结
课程简介

扩散模型虽然在轨迹规划方面展示了巨大潜力,但如何从抽象的人类语言指令生成连贯的轨迹,尤其是在需要多个连续技能组合的长视野任务中,仍然是一个难题。

为了解决以上问题,香港大学计算机系HKU-MMLAB在读博士梁志烜提出了端到端层次化规划框架SkillDiffuser,用于解决机器人轨迹规划中的挑战。相关论文为《SkillDiffuser: Interpretable Hierarchical Planning via Skill Abstractions in Diffusion-Based Task Execution》,已收录于CVPR 2024。

在多任务学习环境中,SkillDiffuser通过集成高层可解释的技能学习与低层条件扩散规划,来解决机器人轨迹规划问题。

在高层,技能抽象模块从视觉观察和语言指令中学习到离散的、人类可理解的技能表征。这些学习到的技能嵌入用于条件化扩散模型,用来生成与技能对齐的定制潜在轨迹,也就是符合可学习技能的多样化状态轨迹。

通过以上整合技能学习与条件轨迹的生成方法,SkillDiffuser能够根据抽象指令在多样化任务中产生连贯的行为。

在多任务机器人操控基准测试集如Meta-World和LOReL上的实验表明,SkillDiffuser展示了业界领先的性能和人类可理解的技能表征。

7月2日10点,智猩猩邀请到论文一作、香港大学计算机系HKU-MMLAB在读博士梁志烜参与「智猩猩AI新青年讲座」242讲,主讲《利用技能学习的扩散策略实现层次化机器人轨迹生成》。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...