MinimalGPT

软件描述

MinimalGPT 是一个简洁、灵活且精简的代码框架,包含了构建、训练、推理和微调 GPT 模型所需的基本组件。

官方网站

访问软件的官方网站了解更多信息

官方认证

github.com

安全链接HTTPS
立即访问

什么是 MinimalGPT?

尽管开源生成模型(如LLaMa、GPT4all、FreedomGPT等)已为在普通CPU上本地启动GPT铺平了道路,但它们距离“极简”型微型GPT模型的理念仍相去甚远。GPT4可接受最多32k个标记的输入以生成下一个可能的输出标记,其训练耗时数月,使用超算处理能力处理超过600GB的数据集。MinimalGPT则提出了完全相反的问题:训练一个GPT模型所需资源最少是多少?借助MinimalGPT框架,创建GPT模型(包括向量化)、保存数据以及从备份数据中加载以进行再训练/微调或推理,均只需一条命令行即可完成。

主要功能

🔄 替代方案

115 个选择
5

开源人工智能驱动的答案引擎。

5

作为Meta致力于开放科学的一部分,今天我们正式发布Llama(大型语言模型Meta AI),这是一个最先进的基础大型语言模型,旨在帮助研究人员推进该人工智能子领域的研究工作。

5

阿里云通用人工智能模型。

0

使用私有大模型最简单的方式:无网络时可完全离线且保证隐私。针对Apple芯片优化,在设备上运行模型。

5

Leo 是一款内置在浏览器中的AI智能助手,能够回答问题、协助完成任务等。

0

Open R1 是一个由社区驱动的开源项目,旨在通过透明的方法论复现 DeepSeek-R1 的先进 AI 能力。

0

提供AI驱动的写作工具、图像生成、Genmoji和记忆影片;通过更深入的上下文和操作增强Siri功能;集成ChatGPT以处理复杂任务;优先采用设备端处理以保障隐私;通过私有云计算在Apple设备间统一功能。

codename goose

codename goose

5

一个开源平台,用于工程任务的无缝自动化,支持本地执行与控制。可与任意大语言模型定制集成,提升自主性,帮助开发者高效完成从调试到部署的任务,同时保障隐私。

上一页下一页

下载与相关链接

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。

GitHub