绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
探索图像和场景结构在图像复原与场景重建中的应用
CV前沿讲座 2020/12/09 10:00:00
课程讲师
夏志豪 圣路易斯华盛顿大学在读博士

本科毕业于中科大少年班。在Adobe Research,Google Research等有过研究经历。研究方向主要是设计准确而高效的深度学习算法来预测图像和视频里的物理结构:包括几何结构,灯光和颜色等。在CVPR、WACV、NeurIP等国际顶会发表论文多篇。

夏志豪
圣路易斯华盛顿大学在读博士

本科毕业于中科大少年班。在Adobe Research,Google Research等有过研究经历。研究方向主要是设计准确而高效的深度学习算法来预测图像和视频里的物理结构:包括几何结构,灯光和颜色等。在CVPR、WACV、NeurIP等国际顶会发表论文多篇。

课程提纲
  • 自然场景中图像理解的挑战
  • 基于自相似特性的图像复原方法解析
  • 自然场景几何结构的单目深度重建的局限性
  • 生成与探索包含概率的单目深度估计方法
课程简介

现有的大多数计算机视觉任务都是试图通过图像来理解图像里的场景和推测场景里各个维度的特性:包括准确的颜色、几何结构、反射特性等等。特定的结构以及它们实际的物理意义决定了这样的任务不是简单的优化问题,也意味着一个高效的视觉算法或者模型必须理解和利用这些存在于自然场景中的结构。这既增加了计算机视觉的挑战性,又提供了很多可以探索的机遇。

什么是自然图像的自相似特性呢?在我们见到图片里,经常会见到同样的图案重复出现,比如整片墙有相近的样式,整片草地有类似的纹理,很多个人组成的人群等。这一自相似性是自然图像与随机生成的乱码的重要区别,也为图像复原和重建提供了重要的先验知识。

而自然场景里的几何结构,主要是单目深度重建---利用一张图片的输入来预测场景的深度信息。单目深度重建是一极具挑战性的任务,因为一张二维图片包含的三维几何信息极其有限,这决定了单目深度重建的结果将充满了不确定性。这样的不确定性并不是随机的,因为场景里某一区域的深度往往能帮助确定另一区域的几何信息。

为了让大家更好的理解自然图像的自相似特性和几何结构,12月9日上午10点,智东西公开课邀请到

圣路易斯华盛顿大学在读博士夏志豪参与到CV前沿讲座第25讲,带来主题为《探索图像和场景结构在图像复原与场景重建中的应用》的直播讲解。

在本次的讲座中,夏博将和大家一起探讨自然图像的自然相似特性和几何结构这两种结构,并详解如何利用自形式特性进行图像复原的传统方法和融合机器学习增加图像重建的准确性和效率的方法,最后也会介绍他们在CVPR2020上发表的一篇论文《生成和探索包含概率的单目深度估计》,来讨论如何预测和表示场景中几何结构的依赖性和不确定性,以及如何利用它们。

夏志豪,圣路易斯华盛顿大学在读博士,本科毕业于中科大少年班。他在Adobe Research,Google Research等有过研究经历。夏博的研究方向主要是设计准确而高效的深度学习算法来预测图像和视频里的物理结构:包括几何结构,灯光和颜色等,同时在CVPR、WACV、NeurIP等国际顶会发表论文多篇。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...