绑定手机号
确认绑定
对图片灵活而精准的编辑是一个富有挑战性的课题,近期也出现了许多优秀的成果。如 DragGAN,它提出了一个优雅的图片编辑框架:基于关键点拖拽的图片编辑。可以在图像上通过「拖曳」的方式,改变并合成自己想要的图像。比如让一只猫转头、睁眼闭眼,或者竖起耳朵等等。
然而虽然 DragGAN 已经展示出了极为惊艳的结果,但受限于 GAN 的表达能力,其可用范围与场景受到了极大的约束。为尝试解决这一问题,来自新加坡国立大学和字节跳动的几位研究者,在 CVPR 2023 提出了 一个名为 DragDiffusion 算法,将“ Drag ”编辑拓展到扩散模型上。借助大规模预训练的扩散模型,大大提高了这种拖拽编辑框架的实用性,使之能够在多物体,广泛类别,不同风格等复杂真实场景得以运用。
8月28日晚7点,「AI新青年讲座」第223讲邀请到DragDiffusion 一作、新加坡国立大学在读博士施宇钧参与,主讲《DragDiffusion:基于扩散模型的关键点拖拽图片编辑》。