Open R1
Open R1
软件描述
Open R1 是一个由社区驱动的开源项目,旨在通过透明的方法论复现 DeepSeek-R1 的先进 AI 能力。
官方网站
访问软件的官方网站了解更多信息
huggingface.co
什么是 Open R1?
Open R1 是一个由社区驱动的开源项目,旨在通过透明的方法论复现 DeepSeek-R1 的先进 AI 能力。
该项目提供了 DeepSeek-R1 推理优化训练流程的完整实现,包含 GRPO 训练、SFT 微调和合成数据生成工具,均采用 Apache-2.0 许可证发布。尽管原始训练数据仍为专有,Open R1 为用户提供了完整的工具链,用于开发和微调自有模型。
主要特性:
开源实现:完整复现 DeepSeek-R1 的训练流程,促进透明与协作。
全面工具链:涵盖 GRPO 训练、SFT 微调及合成数据生成工具。
社区协作:鼓励在代码开发、数据集整理、文档编写和模型评估方面的贡献。
透明许可:采用 Apache-2.0 许可证发布,确保开放与可访问性。
🔄 替代方案
82 个选择
Apertus
作为一款完全开源的语言模型,Apertus允许研究人员、专业人士和爱好者基于该模型进行开发,并根据自身需求对其进行调整,同时也可检查训练过程的任何部分。
Khoj
Khoj 是一个开源的AI第二大脑,能够从你的笔记(Obsidian、EMACS)、文档中学习,并可访问互联网。它可以替代搜索引擎,帮助你阅读论文,并提供透明、快速的答案。
Alpaca - Ollama Client
Alpaca 是一个 Ollama 客户端,可用来管理并对话多个模型,它为本地 AI 的交互提供了一种简单且对初学者友好的方式。

Meta Llama
作为Meta致力于开放科学的一部分,今天我们正式发布Llama(大型语言模型Meta AI),这是一个最先进的基础大型语言模型,旨在帮助研究人员推进该人工智能子领域的研究工作。

Qwen
阿里云通用人工智能模型。
Mellum
Mellum-4b-base 是 JetBrains 首个专为代码相关任务优化的开源大型语言模型(LLM)。

Google Gemma
一组轻量级、前沿的开源模型,基于我们打造 Gemini 模型所使用的研究和技术构建而成。
Meta AI
由Meta Meta Llama打造,Meta AI是全球领先的AI助手之一,现已免费上线你的手机,随身携带。它正逐步走向全球,功能日益丰富。你可以在.上使用Meta AI。

