NVIDIA AI 绘画模型 GauGAN2 核心技术及全景图生成应用

课程回放

2022/09/27 13:00:00

课程讲师

黄勋 NVIDIA 研究科学家

康奈尔大学博士，北京航空航天大学本科；博士期间曾获英伟达（NVIDIA），Adobe，Snap等奖学金。

黄勋

NVIDIA 研究科学家

康奈尔大学博士，北京航空航天大学本科；博士期间曾获英伟达（NVIDIA），Adobe，Snap等奖学金。

课程提纲

主流文本生成图像模型对比
GauGAN2 基于多模态输入生成风景图像
专家乘积模型：GauGAN2 背后核心技术
GauGAN2 的全景图生成应用及未来方向

课程简介

近两年来，AI 绘画逐渐成为人工智能领域大热的方向之一，多模态任务也成为了行业热点。从 Disco Diffusion ，到 OpenAI 的 DALL·E、CLIP、GLIDE、DALL·E 2 (unCLIP) 以及谷歌的 Imagen ，各种图像生成模型层出不穷。这些模型可以将以自然语言形式表达的大量概念转换为合适的图像，效果十分惊艳。

在2019年3月的 GTC 大会上，NVIDIA 推出了一款 AI 绘画工具 GauGAN。GauGAN 使任何人都能够通过涂鸦模式创作出精美绝伦的风景画。同年7月，NVIDIA 研究院首席科学家刘洺堉就主题《如何利用生成式对抗网络 GAN 实现“AI神笔马良” GauGAN 的神奇效果》对 GauGAN 进行了深度讲解。

去年11月，NVIDIA 推出 GauGAN 第二代：GauGAN2，允许用户通过输入文字和简单的绘图就能创建逼真的图像。文本生成匹配图像的模式也是 GauGAN2 主要的创新，生成的图像会根据逐渐输入的文本不断发生变化，最终生成和文本匹配最佳的图像。用户无需绘制想象场景的每个元素，只需输入一个简短的短语即可快速生成图像的关键特征和主题。甚至还可以在用涂鸦绘画等生成图像后，输入文本进行相应的修改。

Demo 地址：http://gaugan.org/gaugan2/

9月27日下午1点，智东西公开课策划推出的「 NVIDIA GauGAN2 技术公开课」将正式开讲。本次公开课邀请到 NVIDIA 研究科学家黄勋进行直播讲解，主题为《 NVIDIA AI 绘画模型 GauGAN2 核心技术及全景图生成应用》。黄勋是 NVIDIA 研究科学家，康奈尔大学博士。在博士期间他曾获得 NVIDIA 、Adobe 和 Snap 等奖学金。

本次公开课中，在对主流文本生成图像模型进行介绍和比较之后，黄勋博士将会重点讲解基于多模态输入生成风景图像的 GauGAN2 ，并对 GauGAN2 背后的核心技术：专家乘积模型，进行深入解读。最后，黄博也会分享他们近期用 GauGAN2 生成全景图的应用（GauGAN 360），并探讨未来的方向。

「NVIDIA GauGAN2 技术公开课」将以视频直播形式进行，包含40分钟主讲和20分钟问答。同时，针对本次公开课，也组建了专属交流群，届时主讲人黄勋博士将加入，欢迎感兴趣的朋友申请。

精彩问答

提问

目前还没有问题，可以点击右侧的“提问按钮”提问

{{item.name}}
{{item.createdDate}}

{{item.answerOmit}} 阅读全文〉

更多问题...