绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智东西公开课服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智东西公开课
NVIDIA AI 绘画模型 GauGAN2 核心技术及全景图生成应用
2022/09/27 13:00:00
课程讲师
黄勋 NVIDIA 研究科学家

康奈尔大学博士,北京航空航天大学本科;博士期间曾获英伟达(NVIDIA),Adobe,Snap等奖学金。

黄勋
NVIDIA 研究科学家

康奈尔大学博士,北京航空航天大学本科;博士期间曾获英伟达(NVIDIA),Adobe,Snap等奖学金。

课程提纲
  • 主流文本生成图像模型对比
  • GauGAN2 基于多模态输入生成风景图像
  • 专家乘积模型:GauGAN2 背后核心技术
  • GauGAN2 的全景图生成应用及未来方向
课程简介

近两年来,AI 绘画逐渐成为人工智能领域大热的方向之一,多模态任务也成为了行业热点。从 Disco Diffusion ,到 OpenAI 的 DALL·E、CLIP、GLIDE、DALL·E 2 (unCLIP) 以及谷歌的 Imagen ,各种图像生成模型层出不穷。这些模型可以将以自然语言形式表达的大量概念转换为合适的图像,效果十分惊艳。

在2019年3月的 GTC 大会上,NVIDIA 推出了一款 AI 绘画工具 GauGAN。GauGAN 使任何人都能够通过涂鸦模式创作出精美绝伦的风景画。同年7月,NVIDIA 研究院首席科学家刘洺堉就主题《如何利用生成式对抗网络 GAN 实现“AI神笔马良” GauGAN 的神奇效果》对 GauGAN 进行了深度讲解。

去年11月,NVIDIA 推出 GauGAN 第二代 :GauGAN2,允许用户通过输入文字和简单的绘图就能创建逼真的图像。文本生成匹配图像的模式也是 GauGAN2 主要的创新,生成的图像会根据逐渐输入的文本不断发生变化,最终生成和文本匹配最佳的图像。用户无需绘制想象场景的每个元素,只需输入一个简短的短语即可快速生成图像的关键特征和主题。甚至还可以在用涂鸦绘画等生成图像后,输入文本进行相应的修改。

Demo 地址:http://gaugan.org/gaugan2/

9月27日下午1点,智东西公开课策划推出的「 NVIDIA GauGAN2 技术公开课」将正式开讲。本次公开课邀请到 NVIDIA 研究科学家黄勋进行直播讲解,主题为《 NVIDIA AI 绘画模型 GauGAN2 核心技术及全景图生成应用》。黄勋是 NVIDIA 研究科学家,康奈尔大学博士。在博士期间他曾获得 NVIDIA 、Adobe 和 Snap 等奖学金。

本次公开课中,在对主流文本生成图像模型进行介绍和比较之后,黄勋博士将会重点讲解基于多模态输入生成风景图像的 GauGAN2 ,并对 GauGAN2 背后的核心技术:专家乘积模型,进行深入解读。最后,黄博也会分享他们近期用 GauGAN2 生成全景图的应用(GauGAN 360),并探讨未来的方向。

「NVIDIA GauGAN2 技术公开课」将以视频直播形式进行,包含40分钟主讲和20分钟问答。同时,针对本次公开课,也组建了专属交流群,届时主讲人黄勋博士将加入,欢迎感兴趣的朋友申请。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...