MinimalGPT

MinimalGPT
软件描述
MinimalGPT 是一个简洁、灵活且精简的代码框架,包含了构建、训练、推理和微调 GPT 模型所需的基本组件。
官方网站
访问软件的官方网站了解更多信息
github.com
什么是 MinimalGPT?
尽管开源生成模型(如LLaMa、GPT4all、FreedomGPT等)已为在普通CPU上本地启动GPT铺平了道路,但它们距离“极简”型微型GPT模型的理念仍相去甚远。GPT4可接受最多32k个标记的输入以生成下一个可能的输出标记,其训练耗时数月,使用超算处理能力处理超过600GB的数据集。MinimalGPT则提出了完全相反的问题:训练一个GPT模型所需资源最少是多少?借助MinimalGPT框架,创建GPT模型(包括向量化)、保存数据以及从备份数据中加载以进行再训练/微调或推理,均只需一条命令行即可完成。
主要功能
🔄 替代方案
115 个选择
Farfalle
开源人工智能驱动的答案引擎。

Meta Llama
作为Meta致力于开放科学的一部分,今天我们正式发布Llama(大型语言模型Meta AI),这是一个最先进的基础大型语言模型,旨在帮助研究人员推进该人工智能子领域的研究工作。

Qwen
阿里云通用人工智能模型。

fullmoon
使用私有大模型最简单的方式:无网络时可完全离线且保证隐私。针对Apple芯片优化,在设备上运行模型。

Brave Leo
Leo 是一款内置在浏览器中的AI智能助手,能够回答问题、协助完成任务等。
Open R1
Open R1 是一个由社区驱动的开源项目,旨在通过透明的方法论复现 DeepSeek-R1 的先进 AI 能力。
提供AI驱动的写作工具、图像生成、Genmoji和记忆影片;通过更深入的上下文和操作增强Siri功能;集成ChatGPT以处理复杂任务;优先采用设备端处理以保障隐私;通过私有云计算在Apple设备间统一功能。
codename goose
一个开源平台,用于工程任务的无缝自动化,支持本地执行与控制。可与任意大语言模型定制集成,提升自主性,帮助开发者高效完成从调试到部署的任务,同时保障隐私。


