BAGEL AI

BAGEL AI
软件描述
我们介绍了 BAGEL,这是一个拥有 70 亿个活跃参数(总计 140 亿个参数)的开源多模态基础模型,其训练数据来自大规模的多模态交错数据。BAGEL 在性能上超越了当前顶级的开源视觉语言模型,如 Qwen2.5-VL 和 InternVL-2。
官方网站
访问软件的官方网站了解更多信息
bagel-ai.org
安全链接HTTPS
什么是 BAGEL AI?
我们提出了BAGEL,这是一个拥有70亿个活跃参数(总计140亿个参数)的开源多模态基础模型,其训练数据来自大规模的多模态交错数据。在标准的多模态理解排行榜上,BAGEL在性能上超越了当前顶尖的开源视觉语言模型(VLMs),如Qwen2.5-VL和InternVL-2.5,并且其文本到图像的生成质量可与SD3等强大的专业生成器相媲美。此外,在经典的图像编辑场景中,BAGEL在定性表现上优于现有的领先开源模型。更重要的是,BAGEL还扩展到了自由形式的视觉操作、多视角合成以及世界导航等能力,这些能力构成了超越以往图像编辑模型范畴的“世界建模”任务。下图展示了BAGEL的定性性能。