Mellum
Mellum
软件描述
Mellum-4b-base 是 JetBrains 首个专为代码相关任务优化的开源大型语言模型(LLM)。
官方网站
访问软件的官方网站了解更多信息
huggingface.co
什么是 Mellum?
Mellum-4b-base 是 JetBrains 首个专为代码相关任务优化的开源大语言模型(LLM)。 该模型在超过 4 万亿个标记上训练,上下文窗口为 8192 个标记,涵盖多种编程语言,专门针对代码补全任务进行优化。模型采用 LLaMA 风格架构,参数量为 40 亿,适用于云端推理(例如通过 vLLM)和本地部署(例如使用 llama.cpp 或 Ollama)。 Mellum 使用自动混合精度(AMP)技术,以 bf16 精度进行训练。上传至 Hugging Face 的版本保留了 bf16 格式,供公众使用。 该模型专为集成到专业开发工具中而设计,如 IDE 中的智能代码建议、AI 驱动的编码助手,以及代码理解与生成的研究,同时也适用于教育场景和微调实验。 本次发布包含基础模型及 Python SFT 模型,其他语言的模型将陆续发布。请注意,基础模型未经过下游任务的预微调,但完全支持监督微调(SFT)和强化学习(RL),可适配特定应用场景。
主要功能
🔄 替代方案
52 个选择
Aris
Aris 是一款智能百科全书,具备高级家长控制功能,让各个年龄段的用户都能在无干扰和无不当内容的互联网环境中学习与探索。

AI Chat Assistant
AI聊天助手是一款免费的基于网络的工具,允许学生和学习者与人工智能聊天、练习语言、获得即时解释并提高效率。该平台完全在线,同时也提供渐进式网页应用(PWA)版本,因此您可以在移动设备上使用……

BLACKBOX.AI
全面的AI编码助手,支持代码补全、调试和优化,涵盖300多个模型,多平台访问,无缝工作流集成,自动化,上下文感知以及对文本、图像、视频和语音的输入处理。
CRYPTO5
一个由多智能体驱动、基于AI的加密货币研究平台(只读),可在几分钟内将市场、链上数据、新闻、情绪及开发活动整合为可操作的洞察,并附有可验证的引用。

