绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智东西公开课服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智东西公开课
V-IRL:根植于真实世界的AI Agents
智猩猩AI新青年讲座 2024/06/06 19:00:00
课程讲师
杨霁晗 香港大学 CVMI Lab 在读博士

师从齐晓娟博士。曾于中山大学获得本科学位,师从林倞、李冠彬教授。研究方向为深度学习,计算机视觉,具身智能和多模态。他曾以一作或共一身份在CVPR,ICCV,ECCV,NeurIPS,T-PAMI等顶级会议和期刊发表多篇文章。

杨霁晗
香港大学 CVMI Lab 在读博士

师从齐晓娟博士。曾于中山大学获得本科学位,师从林倞、李冠彬教授。研究方向为深度学习,计算机视觉,具身智能和多模态。他曾以一作或共一身份在CVPR,ICCV,ECCV,NeurIPS,T-PAMI等顶级会议和期刊发表多篇文章。

课程提纲
  • 1、AI Agent在真实世界中的研究进展
  • 2、将真实世界融入虚拟环境的AI Agent平台
  • 3、全球真实城市中的8个示例AI Agents
  • 4、总结与未来展望
课程简介

目前,基于LLM的AI Agent正处于快速发展的阶段,但许多基于纯文本或游戏引擎设计的AI Agents,在虚拟仿真场景中接触到的世界和人类生活的真实世界有极大差距。为了开发能够在真实世界中灵活、可靠运行的AI Agents,我们必须缩小这一差距,实现AI Agent与真实世界感知与交互。

虽然该问题已在机器人领域得到了一定的研究,使AI Agent在物理世界中得到了具体化的应用。但真实硬件的物理限制和高昂成本,阻碍了其在实验室以外的多种环境中进行测试和规模化应用。

为了解决这个问题,香港大学CVMI Lab联合纽约大学提出了一个将真实世界融入虚拟环境的AI Agent平台V-IRL。该平台将真实世界的地图、街景等各种信息融入AI Agents所在的虚拟世界,让它们在此平台上获取真实世界的视觉数据,并与真实环境进行交互,加速了AI Agent以及具身智能机器人在真实世界的落地。

具体而言,V-IRL引入了一个可扩展的平台,利用地图、地理空间和街景图像等API,将AI Agents嵌入真实城市环境中进行交互,为它们提供了更真实且完整的生活体验。基于V-IRL平台展示了实例化的8个示例AI Agents,能够在城市中执行各种复杂任务,如城市导航、地点推荐、探索目标和互动等真实情况。

此外,通过AI Agents评估改进模型在处理现实世界数据和执行复杂任务方面的能力,也为全球范围内的AI Agent和开放世界中计算机视觉的研究提供了实践场所。

6月6日晚上7点,智猩猩邀请到论文一作、香港大学CVMI Lab在读博士杨霁晗参与「智猩猩AI新青年讲座」第238讲,主讲《V-IRL:根植于真实世界的AI Agents》。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...