- 课程回放

师从罗平教授,共在NeurIPS, ICML, ICLR, CVPR, IJCAI,IEEE TNNLS等顶会顶刊发表论文14篇, 累计发表文章20余篇, 曾获 ICCAS2020 大会最优学生论文奖,IEEE IV2021 最优学生论文提名奖等多项学术奖励, 于2021年在清华大学取得硕士学位,荣获香港博士政府奖学金,香港大学校长奖学金,国家奖学金,清华大学优秀硕士毕业生,清华大学优秀硕士论文奖等荣誉称号。研究方向: 具身智能、强化学习、机器人控制和自动驾驶。个人主页:yaomarkmu.github.io
- 机器人智能控制的AIGC范式
- 离线强化学习的瓶颈
- 基于扩散模型的机器人规划生成方法 AdaptDiffuser
- 在机械臂、迷宫导航等任务的测试及未来应用探讨
Diffusion Model 在 AIGC 领域已经取得了卓越的成就,那么 Diffusion Model 能否用来为 Robotics Learning 服务呢?答案是肯定的,其精髓在于将 long-term planning 问题转化为 Trajectory Generation 问题,将控制问题转化为 AIGC 的范式。
来自香港大学的穆尧等人,在 ICML 2023 的最新工作上,利用 AIGC 强大的生成能力赋能 offline RL 和 Robotics Learning。Offline RL 最大的瓶颈在于专家数据的获得,而 AdaptDiffuser 通过 Reward Guidance 的引导可以生成 diverse tasks 的 synthetic expert data, 经过 Discriminator 的筛选,高质量的数据被用来微调 diffusion model,从而使 diffusion model 能够通过不断的自我进化来适应更多的任务和更多的场景。
基于上述机制,Diffusion model for planning 的 AIGC 模式可以像 Reinforment Learning 一样具备自我进化的能力,而不需要任何初始数据集以外的其他与环境交互的数据,从而很大程度上促进了 AIGC 在Robotics Learning 的应用。该成果已被评选为 Oral Presentation。
6月27日晚7点,「AI新青年讲座」第215讲邀请到 AdaptDiffuser 一作、香港大学在读博士穆尧参与,主讲《机器人智能控制的 AIGC 范式——自进化扩散模型规划器》。

- 这种算法和Mpc算法结合,是否更好?对于我们应用型,是否只要准备自己的数据集,拿来主义用就行了? 2023-12-07 15:26:41对,如果您就是比如说我,你去做这个应用,比如说在这个一个机器人上去做应用,其实 MPC 是一个非常好的工具,就是说你你只要给它写好这个,比如说你有 20 个任务,每一个任务,你它可能对应一个 cost... 阅读全文 〉
- adaptDiffusion这样的模型训练了多久啊?与on-line的算法相比效率更高吗 2023-12-07 15:26:41我先说一下,就是这个我们这个自进化的过程是其实它是没有与这个 simulator 去交互的,它这个它的这个 fine tuning 的这个过程差不多是就是你从 learn from,就是这个 lear... 阅读全文 〉
- 请问如何通过GPT生成数据集 2023-12-07 15:26:41首先这个数据集不是用 GPT 生成的,就是说我们这个 Offline RL,包括我刚刚讲的这个,不管是 KUKA 的机械臂还是这个,比如这个迷宫的任务,包括Mojuco,我们刚刚 show 的那些 M... 阅读全文 〉