Mellum
Mellum
软件描述
Mellum-4b-base 是 JetBrains 首个专为代码相关任务优化的开源大型语言模型(LLM)。
官方网站
访问软件的官方网站了解更多信息
huggingface.co
什么是 Mellum?
Mellum-4b-base 是 JetBrains 首个专为代码相关任务优化的开源大语言模型(LLM)。 该模型在超过 4 万亿个标记上训练,上下文窗口为 8192 个标记,涵盖多种编程语言,专门针对代码补全任务进行优化。模型采用 LLaMA 风格架构,参数量为 40 亿,适用于云端推理(例如通过 vLLM)和本地部署(例如使用 llama.cpp 或 Ollama)。 Mellum 使用自动混合精度(AMP)技术,以 bf16 精度进行训练。上传至 Hugging Face 的版本保留了 bf16 格式,供公众使用。 该模型专为集成到专业开发工具中而设计,如 IDE 中的智能代码建议、AI 驱动的编码助手,以及代码理解与生成的研究,同时也适用于教育场景和微调实验。 本次发布包含基础模型及 Python SFT 模型,其他语言的模型将陆续发布。请注意,基础模型未经过下游任务的预微调,但完全支持监督微调(SFT)和强化学习(RL),可适配特定应用场景。
主要功能
🔄 替代方案
52 个选择
Privy Coding Assistant
一款多平台、由人工智能增强的编码助手,可确保安全开发并自动生成单元测试。

Mistral Code
闪电般的补全速度、深入的代码理解以及代理式软件工程——就在你工作的地方。

TabNine
使用机器学习的任何编程语言自动补全。
Supermaven
Supermaven 是一款利用人工智能帮助您更快编写代码的编程助手。使用 Supermaven 的快速准确建议,轻松完成代码重构。

Twinny
功能最直接的本地托管(或API托管)AI代码补全插件,适用于 Visual Studio Code,如 GitHub Copilot 一般好用,但完全免费且完全私密。

Amazon CodeWhisperer
Amazon CodeWhisperer 是一款通用的、基于机器学习的代码生成工具,可实时为您提供代码建议。在编写代码时,CodeWhisperer 会根据您现有的代码和注释自动生成建议。

Claudia
一个功能强大的GUI应用程序和工具包,用于Claude Code——创建自定义代理、管理交互式Claude Code会话、运行安全的后台代理等。
CodiumAI
CodiumAI 的首个工具是一款 IDE 插件,可与开发者交互,为忙碌的开发者生成有意义的测试用例和代码说明。

