Instella

Instella
软件描述
由AMD开发的大型语言模型工具Instella,通过开放模型权重和训练数据,实现了卓越的性能,推动了人工智能的发展。它在性能上超越了Llama-3.2-3B等竞争对手,填补了完全开放模型与开放权重模型之间的差距。
官方网站
访问软件的官方网站了解更多信息
rocm.blogs.amd.com
安全链接HTTPS
什么是 Instella?
Instella 是由 AMD GenAI 团队基于 AMD Instinct MI300X GPU 训练的一系列先进的开源语言模型。Instella 模型在与同类规模的现有完全开源语言模型相比时表现显著更优,并在完全开源模型与开源权重模型之间建立了桥梁,其性能可与 Llama-3.2-3B 和 Qwen2.5-3B 模型相媲美。我们提供了模型权重、训练代码和训练数据,以加速开源语言模型的发展。