绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
基于StyleGAN2的高清3D感知人脸生成与编辑
智猩猩AI新青年讲座 2022/10/11 18:00:00
课程讲师
孙景翔 清华大学 三维视觉实验室在读博士

师从刘烨斌教授,硕士毕业于伊利诺伊大学香槟分校,研究方向为三维视觉,特别是三维场景表征与生成,曾在CVPR、ECCV、SIGGRAPH Asia等会议和期刊发表文章多篇。

孙景翔
清华大学 三维视觉实验室在读博士

师从刘烨斌教授,硕士毕业于伊利诺伊大学香槟分校,研究方向为三维视觉,特别是三维场景表征与生成,曾在CVPR、ECCV、SIGGRAPH Asia等会议和期刊发表文章多篇。

课程提纲
  • 现有3D感知人脸生成与编辑的困境
  • 基于StyleGAN2的3D感知人脸生成模型
  • 利用混合GAN反演实现高保真3D人脸编辑
  • 在人脸生成与编辑任务中的应用
课程简介

人脸生成具有广泛的应用,现有较好的基于StyleGAN的人脸生成方法,然而其仅能生成2D人脸,在3D人脸生成上无能为力。3D感知人脸生成旨在通过语义分割图生成3D人脸,而其目前主要面临两大问题,一是生成的人脸分辨率较低,二是对生成的高清人脸很难进行实时的编辑。

为了解决上述问题,清华大学三维视觉实验室在读博士孙景翔等人提出了三维人脸语义编辑系统IDE-3D,这是一个两全其美的系统,既能生成高清的3D人脸,也能对人脸进行实时地编辑。

IDE-3D主要由三个部分组成:

(1)一个基于StyleGAN2的3D语义感知人脸生成模型,用来生成视角一致的、纹理和几何相互解耦的人脸图像和语义掩码。

(2)一种混合GAN反演方法,通过语义和纹理编码器对单视角图像进行编码,得到初始的隐式编码,并通过进一步的优化策略实现高保真的人脸编辑。

(3)一个高效的正则空间人脸编辑器,将正则视角下编辑的语义掩码转化成隐式编码,从而产生高质量的局部编辑结果。

通过这三个部分,IDE-3D能够支持许多灵活和交互式的人脸任务,例如自由视角人脸生成、编辑和风格迁移,以及真实人脸的反演与实时编辑,并且在照片写实、忠实度和效率方面达到最先进的水平。

10月11日晚6点,「AI新青年讲座」第163讲邀请到清华大学三维视觉实验室在读博士孙景翔参与,主讲《基于StyleGAN2的高清3D感知人脸生成与编辑》。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...