Mellum
Mellum
软件描述
Mellum-4b-base 是 JetBrains 针对代码相关任务优化的首个开源大型语言模型(LLM)。
官方网站
访问软件的官方网站了解更多信息
huggingface.co
什么是 Mellum?
Mellum-4b-base 是 Jetbrains 首个专为代码相关任务优化的开源大语言模型(LLM)。该模型基于超过 4 万亿个标记,在多种编程语言上训练,上下文窗口为 8192 个标记,专为代码补全任务设计。模型采用类似 LLaMA 的架构,拥有 40 亿参数,适用于云端推理(例如通过 vLLM)和本地部署(例如使用 llama.cpp 或 Ollama)。Mellum 采用自动混合精度(AMP)技术,使用 bf16 精度进行训练,Hugging Face 上发布的版本仍保留 bf16 格式以供公众使用。Mellum 专为集成到专业开发工具中(例如 IDE 中的智能代码建议)、AI 驱动的编程助手以及代码理解与生成研究而设计,同时也适用于教育应用和微调实验。本次发布包含基础模型和 Python SFT 模型,其他语言的模型即将推出。请注意,基础模型本身并未针对下游任务进行预训练微调,但完全支持监督微调(SFT)和强化学习(RL),可用于特定应用场景的适配。
主要功能
🔄 替代方案
48 个选择ChatGPT
人工智能语言模型非常适合生成各种风格的交互式类人文本。其基于支持实时自然语言生成的架构,能够根据大量训练数据覆盖的广泛主题,为需要流畅且相关输出的应用提供理想解决方案。

Google Gemini
人工智能助手可提供写作、规划、学习支持、根据文本生成图像以及文本转语音等功能。它基于大型语言模型,可在不同设备间同步,无需编程技能即可使用。支持深色模式和无广告体验。
Lumo by Proton
以隐私为先的AI助手,采用零访问加密和开源代码,确保不记录数据、不进行用户画像分析、不基于聊天内容进行训练,提供由用户控制的加密对话,符合GDPR规定,并且不向第三方共享信息。
Microsoft Copilot
Microsoft Copilot(此前名为Bing Chat)是微软Bing推出的一项全新聊天机器人功能,旨在通过人工智能技术革新搜索引擎的用户体验。