绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智猩猩服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智猩猩
基于二维扩散模型的可控三维人体生成和编辑
智猩猩AI新青年讲座 2023/08/10 19:00:00
课程讲师
操雨康 香港大学在读博士

香港校长奖学金获得者,师从Kenneth Wong教授。博士期间,他有幸与香港大学韩锴博士和腾讯曹炎培博士合作密切。他的研究兴趣主要集中在计算机视觉和深度学习领域,包括三维人体重建、二维 / 三维人体生成等。近几年他以第一作者在CVPR发表多篇论文,并于近期进行了三维人体生成的多个探索。他目前担任CVPR,ICCV,NeurIPS,Siggraph Asia等顶级会议的审稿人。

操雨康
香港大学在读博士

香港校长奖学金获得者,师从Kenneth Wong教授。博士期间,他有幸与香港大学韩锴博士和腾讯曹炎培博士合作密切。他的研究兴趣主要集中在计算机视觉和深度学习领域,包括三维人体重建、二维 / 三维人体生成等。近几年他以第一作者在CVPR发表多篇论文,并于近期进行了三维人体生成的多个探索。他目前担任CVPR,ICCV,NeurIPS,Siggraph Asia等顶级会议的审稿人。

课程提纲
  • 文本到3D生成的研究及难点
  • 可控动作和形态的三维人体生成
  • 精细编辑下的高保真三维人头生成
  • 实验结果展示及未来展望
课程简介

基于文本的图像生成技术近期取得了显著的进展,相比之下,文本到 3D 生成的质量仍难达到相应的高度。现有方法主要依赖于 DreamFusion 提出的由文本引导的分数蒸馏采样方法(SDS),虽然已取得可喜的进展,但仍存在下述问题:

1、缺乏人体三维先验知识,现有方法难以生成可控动作和形态的高保真度三维人体模型;

2、预训练的二维图像扩散模型的限制,现有方法容易出现“多脸”问题,并很难在保持原有特征的情况下完成三维人体的精细编辑;

针对第一个问题,香港大学的研究者提出新框架  DreamAvatar ,利用 SMPL 人体先验知识的方法,从而有效控制生成人体的动作以及形态。他们同时提出双重空间的设计的方法,有效的将在标准空间中学习到的高质量几何和纹理,转移到观察空间中。

针对第二个问题,研究者设计新框架 HeadSculpt ,提出了 Prior-driven Score Distillation 方法,并利用 FLAME 人头先验模型,textual inversion 以及 ControlNet,解决三维生成任务中常见的多脸问题。他们进一步提出 Identity-aware Editing Score Distillation 方法,进而实现高精细度的编辑工作,并同时能够有效的保持原有三维模型的特征。这些方法能够有效的提高三维人体生成和编辑的能力。

8月10日晚7点,「AI新青年讲座」第 222 讲邀请到DreamAvatar、HeadSculpt一作,香港大学在读博士操雨康参与,主讲《基于二维扩散模型的可控三维人体生成和编辑》。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...