绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智东西公开课服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智东西公开课
基于双向投影网络的跨维度场景理解
学术新青年讲座 2021/08/11 19:00:00
课程讲师
胡文博 香港中文大学 在读博士

师从黄田津教授,于2018年从大连理工大学计算机学院取得学士学位;研究兴趣为计算机视觉,图形学, 深度学习,尤其感兴趣于3D视觉;在SIGGRAPH Asia、CVPR、ACMMM等发表多篇论文。

胡文博
香港中文大学 在读博士

师从黄田津教授,于2018年从大连理工大学计算机学院取得学士学位;研究兴趣为计算机视觉,图形学, 深度学习,尤其感兴趣于3D视觉;在SIGGRAPH Asia、CVPR、ACMMM等发表多篇论文。

课程提纲
  • 主流的场景理解研究方法
  • 在2D和3D跨维度场景上联合优化的可行证明
  • BPNet:联合实现2D和3D场景理解的双向投影网络
  • 在2D、3D语义分割中的应用
课程简介

在现实生活中,如何让大脑像人一样观察并解释着周围的环境,场景理解必不可少。它让机器能够精确地认识并理解真实环境中的不同物体,提高机器与现实3D场景交互应用的性能,在机器人、自动驾驶中有广泛应用。

根据输入数据的不同,场景理解可分为2D场景理解和3D场景理解。目前主流的方法大都独立地处理2D和3D场景理解。虽然不同类型的数据各有特点,但它们也有很好的互补性,像2D图像数据可以捕获到大量细粒度的纹理和颜色信息,并且适用于深度卷积神经网络;而3D数据头可以提供场景的重要几何信息。那怎样把2D和3D数据中的优势特性结合起来,联合实现2D/3D场景理解呢?

在CVPR 2021中,来自香港中文大学的胡文博等人提出了一个联合进行2D/3D场景理解的双向投影网络BPNet。BPNet主要包含了2D和3D的子网络,它们是对称的架构,这两个子网络通过双向投影模块BPM连接起来。通过BPM,互补的2D和3D信息能够互相交互,从而使得更好地识别场景。在ScanNet榜单上,BPNet在2D和3D场景理解中取得了顶尖表现,同时BPNet在 2D 和 3D 语义分割中也有不错的性能。想了解更多更多BPNet的内容,下周的课千万不要错过~

8月11日晚7点,智东西公开课特邀香港中文大学在读博士胡文博,带来主题为《基于双向投影网络的跨维度场景理解》的直播讲解。胡文博是香港中文大学在读博士,师从黄田津教授,并于2018年从大连理工大学计算机学院取得学士学位。他的研究兴趣为计算机视觉,图形学,深度学习,尤其感兴趣于3D视觉。同时,他在CVPR、ACMMM、CVM等发表多篇论文。

在本次讲座中,胡博将从主流的场景理解方法及2D和3D跨维度场景上联合优化的可行性讲起,深度解析CVPR 2021 Oral的研究成果:联合实现2D和3D场景理解的双向投影网络BPNet,最后分析其在2D、3D图像分割中的应用。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...