Mellum
Mellum
软件描述
Mellum-4b-base 是 JetBrains 首个专为代码相关任务优化的开源大型语言模型(LLM)。
官方网站
访问软件的官方网站了解更多信息
huggingface.co
什么是 Mellum?
Mellum-4b-base 是 JetBrains 首个专为代码相关任务优化的开源大语言模型(LLM)。 该模型在超过 4 万亿个标记上训练,上下文窗口为 8192 个标记,涵盖多种编程语言,专门针对代码补全任务进行优化。模型采用 LLaMA 风格架构,参数量为 40 亿,适用于云端推理(例如通过 vLLM)和本地部署(例如使用 llama.cpp 或 Ollama)。 Mellum 使用自动混合精度(AMP)技术,以 bf16 精度进行训练。上传至 Hugging Face 的版本保留了 bf16 格式,供公众使用。 该模型专为集成到专业开发工具中而设计,如 IDE 中的智能代码建议、AI 驱动的编码助手,以及代码理解与生成的研究,同时也适用于教育场景和微调实验。 本次发布包含基础模型及 Python SFT 模型,其他语言的模型将陆续发布。请注意,基础模型未经过下游任务的预微调,但完全支持监督微调(SFT)和强化学习(RL),可适配特定应用场景。
主要功能
🔄 替代方案
52 个选择
GeminiDesk
GeminiDesk 不仅是 Google Gemini 的封装工具,更是一个功能丰富的控制中心,其众多功能会让你不禁感叹:过去竟没有它们是如何度过的。

Paperclip by Firecube
由FireCube开发的Paperclip(曾用名Clippy by FireCube)将著名的Clippit助手以大型语言模型AI驱动的形式带回您的桌面,可供聊天使用。该应用完全免费且开源。

Kagi Assistant
Kagi 的助手结合了顶级的大语言模型(LLM)与可选的 Kagi 搜索结果,是创意、研究和编程任务的理想伴侣。

Cody
全面的AI编程助手,通过利用整个代码库和代码图谱,实现代码的编写、修复与维护。支持多种IDE,提供AI聊天、自动补全和内联编辑等功能,提升团队生产力。

Dyad
Dyad.sh 是一款免费、本地化且开源的 AI 应用构建工具,旨在帮助用户无需编程即可创建强大的定制应用,且不受供应商锁定。它完全运行在您的计算机上,确保您对源代码拥有完全控制权,并保障数据隐私。



