Hunyuan World

Hunyuan World
软件
软件描述
通过语义分层网格、全景世界代理、网格导出和对象级操作,从文本或图像输入生成可探索、交互式的3D世界,支持模拟、虚拟现实、游戏开发和内容创作等应用。
官方网站
访问软件的官方网站了解更多信息
3d.hunyuan.tencent.com
安全链接HTTPS
什么是 Hunyuan World?
从文本或图像创建沉浸式且可交互的3D世界,仍是计算机视觉与图形学领域的根本性挑战。现有的世界生成方法通常分为两类:一类是基于视频的方法,虽然多样性丰富,但缺乏3D一致性与渲染效率;另一类是基于3D的方法,虽然能保证几何一致性,但受限于训练数据不足以及内存效率低的表示方式。为解决这些局限,我们提出了HunyuanWorld 1.0,这是一种新颖的框架,能够结合两者优势,从文本和图像条件生成沉浸式、可探索且可交互的3D世界。我们的方法具有三大优势:1)通过全景世界代理实现360°沉浸式体验;2)支持网格导出,可无缝兼容现有的计算机图形管线;3)解耦的对象表示,增强了增强的交互性。该框架的核心是一种语义分层的3D网格表示,它利用全景图像作为360°世界的代理,实现语义感知的世界分解与重建,从而生成多样化3D世界。大量实验表明,我们的方法在生成连贯、可探索且可交互的3D世界方面达到当前最先进水平,并在虚拟现实、物理模拟、游戏开发及互动内容创作等众多领域展现出广泛的应用潜力。