- 课程回放

香港校长奖学金获得者,师从Kenneth Wong教授。博士期间,他有幸与香港大学韩锴博士和腾讯曹炎培博士合作密切。他的研究兴趣主要集中在计算机视觉和深度学习领域,包括三维人体重建、二维 / 三维人体生成等。近几年他以第一作者在CVPR发表多篇论文,并于近期进行了三维人体生成的多个探索。他目前担任CVPR,ICCV,NeurIPS,Siggraph Asia等顶级会议的审稿人。

香港校长奖学金获得者,师从Kenneth Wong教授。博士期间,他有幸与香港大学韩锴博士和腾讯曹炎培博士合作密切。他的研究兴趣主要集中在计算机视觉和深度学习领域,包括三维人体重建、二维 / 三维人体生成等。近几年他以第一作者在CVPR发表多篇论文,并于近期进行了三维人体生成的多个探索。他目前担任CVPR,ICCV,NeurIPS,Siggraph Asia等顶级会议的审稿人。
- 文本到3D生成的研究及难点
- 可控动作和形态的三维人体生成
- 精细编辑下的高保真三维人头生成
- 实验结果展示及未来展望
基于文本的图像生成技术近期取得了显著的进展,相比之下,文本到 3D 生成的质量仍难达到相应的高度。现有方法主要依赖于 DreamFusion 提出的由文本引导的分数蒸馏采样方法(SDS),虽然已取得可喜的进展,但仍存在下述问题:
1、缺乏人体三维先验知识,现有方法难以生成可控动作和形态的高保真度三维人体模型;
2、预训练的二维图像扩散模型的限制,现有方法容易出现“多脸”问题,并很难在保持原有特征的情况下完成三维人体的精细编辑;
针对第一个问题,香港大学的研究者提出新框架 DreamAvatar ,利用 SMPL 人体先验知识的方法,从而有效控制生成人体的动作以及形态。他们同时提出双重空间的设计的方法,有效的将在标准空间中学习到的高质量几何和纹理,转移到观察空间中。
针对第二个问题,研究者设计新框架 HeadSculpt ,提出了 Prior-driven Score Distillation 方法,并利用 FLAME 人头先验模型,textual inversion 以及 ControlNet,解决三维生成任务中常见的多脸问题。他们进一步提出 Identity-aware Editing Score Distillation 方法,进而实现高精细度的编辑工作,并同时能够有效的保持原有三维模型的特征。这些方法能够有效的提高三维人体生成和编辑的能力。
8月10日晚7点,「AI新青年讲座」第 222 讲邀请到DreamAvatar、HeadSculpt一作,香港大学在读博士操雨康参与,主讲《基于二维扩散模型的可控三维人体生成和编辑》。
