Mellum

软件描述

Mellum-4b-base 是 JetBrains 首个专为代码相关任务优化的开源大型语言模型(LLM)。

官方网站

访问软件的官方网站了解更多信息

官方认证

huggingface.co

安全链接HTTPS
立即访问

什么是 Mellum?

Mellum-4b-base 是 JetBrains 首个专为代码相关任务优化的开源大语言模型(LLM)。 该模型在超过 4 万亿个标记上训练,上下文窗口为 8192 个标记,涵盖多种编程语言,专门针对代码补全任务进行优化。模型采用 LLaMA 风格架构,参数量为 40 亿,适用于云端推理(例如通过 vLLM)和本地部署(例如使用 llama.cpp 或 Ollama)。 Mellum 使用自动混合精度(AMP)技术,以 bf16 精度进行训练。上传至 Hugging Face 的版本保留了 bf16 格式,供公众使用。 该模型专为集成到专业开发工具中而设计,如 IDE 中的智能代码建议、AI 驱动的编码助手,以及代码理解与生成的研究,同时也适用于教育场景和微调实验。 本次发布包含基础模型及 Python SFT 模型,其他语言的模型将陆续发布。请注意,基础模型未经过下游任务的预微调,但完全支持监督微调(SFT)和强化学习(RL),可适配特定应用场景。

🔄 替代方案

52 个选择
Privy Coding Assistant

Privy Coding Assistant

5

一款多平台、由人工智能增强的编码助手,可确保安全开发并自动生成单元测试。

Mistral Code

Mistral Code

0

闪电般的补全速度、深入的代码理解以及代理式软件工程——就在你工作的地方。

4

使用机器学习的任何编程语言自动补全。

Supermaven

Supermaven

4

Supermaven 是一款利用人工智能帮助您更快编写代码的编程助手。使用 Supermaven 的快速准确建议,轻松完成代码重构。

5

功能最直接的本地托管(或API托管)AI代码补全插件,适用于 Visual Studio Code,如 GitHub Copilot 一般好用,但完全免费且完全私密。

Amazon CodeWhisperer

Amazon CodeWhisperer

0

Amazon CodeWhisperer 是一款通用的、基于机器学习的代码生成工具,可实时为您提供代码建议。在编写代码时,CodeWhisperer 会根据您现有的代码和注释自动生成建议。

0

一个功能强大的GUI应用程序和工具包,用于Claude Code——创建自定义代理、管理交互式Claude Code会话、运行安全的后台代理等。

CodiumAI

CodiumAI

0

CodiumAI 的首个工具是一款 IDE 插件,可与开发者交互,为忙碌的开发者生成有意义的测试用例和代码说明。

上一页下一页

支持平台

下载与相关链接

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。