绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
自监督大场景三维重建
智猩猩AI新青年讲座 2022/12/26 19:00:00
课程讲师
张晋之 清华大学 深圳伯克利学院在读博士

导师为清华大学电子系副教授方璐;主要研究方向为从多视角二维图像恢复户外三维大场景的几何与纹理信息,通过三维重建技术恢复历史遗迹与古建筑,以一作发表身份在TPAMI、NIPS、CVPR等发表多篇工作。

张晋之
清华大学 深圳伯克利学院在读博士

导师为清华大学电子系副教授方璐;主要研究方向为从多视角二维图像恢复户外三维大场景的几何与纹理信息,通过三维重建技术恢复历史遗迹与古建筑,以一作发表身份在TPAMI、NIPS、CVPR等发表多篇工作。

课程提纲
  • 多视角三维重建技术研究进展
  • 基于图像语义的三维重建实现难点
  • 语义与重建联合优化学习的三维重建框架
  • 提升完整度与精细度的大场景重建效果
课程简介

自监督多视图立体视觉(MVS)因可以从一组图像中学习密集表面预测且无需真实3D训练数据而引起越来越多的关注。然而现有的方法高度依赖于局部光度一致性,这使得无法在无纹理或反射区域中准确识别密集相关性。

为了解决上述问题,在NIPS 2022上,清华大学在读博士张晋之等人发现图像中隐含的几何邻近度(如表面连通性和遮挡边界)可以为像素级多视图对应估计提供可靠的指导,提出了一种新的弹性零件表示法,用弹性变化的尺度、形状和边界对物理连接的零件分割进行编码。

同时,张晋之博士还提出了一种自监督MVS框架ElasticMVS,来学习每个视图深度的表示和估计,并遵循部分感知传播和评估方案。具体来说,像素级部分表示通过基于对比学习的策略来训练,这增加了几何集中区域中的表示紧凑性,反之增加了对比度。并且基于从几何集中的零件提出一组深度假设,来迭代优化零件级一致性损失和表面平滑度损失。

广泛的实验表明,ElasticMVS在重建完整性和准确性等方面有很大的优势,且对于具有挑战性的大规模重建,ElasticMVS也优于监督和自监督方法,具有非凡的泛化能力。

12月26日晚7点,「AI新青年讲座」第185讲邀请到ElasticMVS一作、清华大学在读博士张晋之参与,主讲《自监督大场景三维重建》。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...