BAGEL AI

BAGEL AI
软件描述
我们提出 BAGEL,一个开源的多模态基础模型,拥有 70 亿个活跃参数(总计 140 亿),在大规模交错多模态数据上进行训练。BAGEL 的性能优于当前顶尖的开源视觉语言模型,如 Qwen2.5-VL 和 InternVL-2。
官方网站
访问软件的官方网站了解更多信息
bagel-ai.org
安全链接HTTPS
什么是 BAGEL AI?
我们提出 BAGEL,一个开源的多模态基础模型,拥有 70 亿活跃参数(总计 140 亿),在大规模交错多模态数据上进行训练。BAGEL 在标准多模态理解排行榜上超越了当前顶尖的开源视觉语言模型(如 Qwen2.5-VL 和 InternVL-2.5),并实现了与强大专用生成器(如 SD3)相当的文本到图像质量。此外,BAGEL 在经典图像编辑场景中展现出优于领先开源模型的定性效果。更重要的是,它扩展至自由形式的视觉操作、多视角合成和世界导航,这些能力构成了超越以往图像编辑模型范畴的“世界建模”任务。下图展示了 BAGEL 的定性性能表现。