
导师为吴佳俊教授。研究兴趣是如何让AI理解与创造一个可交互的动态三维物理世界。曾获得SIGGRAPH Asia最佳论文奖,Qualcomm奖学金,斯坦福大学SoE奖学金。多次获得中国国家奖学金,两次获得Nvidia奖学金提名,以及Meta奖学金提名。个人主页:https://kovenyu.com/
- 3D世界生成的研究现状
- 使用单张图片生成一系列丰富的3D场景模块化框架
- 实现快速、交互式的3D场景生成模型WonderWorld
- 静态3D对象与场景内的物体进行物理交互的生成方法
- 总结与展望
你是否曾被《爱丽丝梦游仙境》或《哈利波特》等作品所描绘的世界所吸引?我们如何能在数字世界中构造出或是真实或是奇幻的三维世界,并且与之交互?
然而,传统的场景生成工作常局限于单一类型场景,生成结果缺乏连贯性,这显著限制了其在虚拟现实、游戏及创意设计等前沿领域的应用潜力。随着这些领域对实时性与交互式3D场景需求的激增,传统离线处理的方法已难以满足用户对内容实时生成和实时交互的需求。
更进一步,为了创建沉浸式虚拟现实,实现对物理交互(如外部力)做出真实响应,静态3D对象动态生成变得尤为重要。传统的无条件或文本条件动态生成方法无法处理动作条件,且真实物体的物理材料属性测量困难且数据稀缺,这使得传统的物理模拟方法难以准确应用。
针对以上问题,斯坦福大学吴佳俊教授团队在读博士俞洪兴联合Google、MIT等共同提出了使用单张图片生成一系列丰富的3D场景模块化框架WonderJourney,实现快速、交互式的3D场景生成模型WonderWorld,静态3D对象与场景内的物体进行物理交互的生成方法PhysDreamer。相关论文分别为《WonderJourney: Going from Anywhere to Everywhere》,已收录于CVPR 2024、《WonderWorld: Interactive 3D Scene Generation from a Single Image》,《PhysDreamer: Physics-based Interaction with 3D Objects via Video Generation》,已收录于ECCV 2024。
