绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
开放世界中具身智能的主动感知与推理
智猩猩具身智能机器人系列公开课 2025/12/19 00:00:00
课程讲师

于2024年在德国波恩大学取得博士学位。曾在阿里巴巴达摩研究院,英特尔研究院和高通研究院实习。研究兴趣是自动驾驶以及机器人视觉,在TPAMI、TNNLS、ICCV、ICRA等会议和期刊上发表文章。

李仕杰
新加坡科技研究局 研究科学家

于2024年在德国波恩大学取得博士学位。曾在阿里巴巴达摩研究院,英特尔研究院和高通研究院实习。研究兴趣是自动驾驶以及机器人视觉,在TPAMI、TNNLS、ICCV、ICRA等会议和期刊上发表文章。

课程提纲
  • 2D感知让模型从单纯的识别走向可解释理解
  • 智能体在真实世界中的感知与空间结构推理
  • 多模态大模型与世界模型中前瞻性预测
  • 长时域规划:开放词汇下的3D视觉定位与主动感知
  • 总结与未来展望
课程简介

在开放世界中构建感知、推理并行动的具身智能系统,依然是一项宏大的挑战。这要求系统能够在高度动态、不确定的真实环境下,实现从多模态感知到结构化认知、再到可泛化行动的精准映射与实时协同。

「智猩猩具身智能机器人系列公开课」第1期邀请到新加坡科技研究局研究科学家李仕杰,于12月19日晚7点进行实时视频讲解与答疑互动,主题为《开放世界中具身智能的主动感知与推理》。内容涵盖从统一的2D视觉-语言理解,到结构化的3D推理,再到更高层次的前瞻性预测。

李仕杰博士首先从2D感知出发,重新思考多模态模型中的视觉分词方式与认知推理机制,使模型从单纯的识别走向可解释的理解。其次,会深入探讨在3D领域,智能体如何在真实物理世界中感知并推理空间结构,将语言与几何进行对齐,并通过自主驱动的好奇心不断学习。最后,李仕杰博士将进一步扩展到高层次的想象与前瞻,使模型具备推断未见结构、预测未来事件、以及在动态环境中进行因果推理的能力。

整体来看,这些研究正在打通感知、推理与想象三者之间的鸿沟,为能够理解并与复杂、不断变化的真实世界互动的具身智能体奠定基础。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...