Mellum

软件描述

Mellum-4b-base 是 JetBrains 针对代码相关任务优化的首个开源大型语言模型(LLM)。

官方网站

访问软件的官方网站了解更多信息

官方认证

huggingface.co

安全链接HTTPS

什么是 Mellum?

Mellum-4b-base 是 Jetbrains 首个专为代码相关任务优化的开源大语言模型(LLM)。该模型基于超过 4 万亿个标记,在多种编程语言上训练,上下文窗口为 8192 个标记,专为代码补全任务设计。模型采用类似 LLaMA 的架构,拥有 40 亿参数,适用于云端推理(例如通过 vLLM)和本地部署(例如使用 llama.cpp 或 Ollama)。Mellum 采用自动混合精度(AMP)技术,使用 bf16 精度进行训练,Hugging Face 上发布的版本仍保留 bf16 格式以供公众使用。Mellum 专为集成到专业开发工具中(例如 IDE 中的智能代码建议)、AI 驱动的编程助手以及代码理解与生成研究而设计,同时也适用于教育应用和微调实验。本次发布包含基础模型和 Python SFT 模型,其他语言的模型即将推出。请注意,基础模型本身并未针对下游任务进行预训练微调,但完全支持监督微调(SFT)和强化学习(RL),可用于特定应用场景的适配。

🔄 替代方案

48 个选择

一个基于大量干净助手数据(包括代码、故事和对话)训练的开源聊天机器人生态系统。

免费 • 开源
查看详情

人工智能语言模型非常适合生成各种风格的交互式类人文本。其基于支持实时自然语言生成的架构,能够根据大量训练数据覆盖的广泛主题,为需要流畅且相关输出的应用提供理想解决方案。

免费增值 • 专有
查看详情

Jan 是一个开源的 ChatGPT 替代品,可在你的电脑上完全离线运行。

免费 • 开源
查看详情

DeepSeek 是一种先进的AI,旨在通过自然、对话式互动来帮助回答问题、解决问题并提供洞察。

免费增值 • 开源
查看详情

通过教育性强、趣味性的互动,探索 Mistral 的对话技术。可定制、无偏见的模型在性能评估中表现卓越,支持灵活部署。

免费个人 • 专有
查看详情

人工智能助手可提供写作、规划、学习支持、根据文本生成图像以及文本转语音等功能。它基于大型语言模型,可在不同设备间同步,无需编程技能即可使用。支持深色模式和无广告体验。

免费增值 • 专有
查看详情
3.2

以隐私为先的AI助手,采用零访问加密和开源代码,确保不记录数据、不进行用户画像分析、不基于聊天内容进行训练,提供由用户控制的加密对话,符合GDPR规定,并且不向第三方共享信息。

免费增值 • 开源
查看详情

Microsoft Copilot(此前名为Bing Chat)是微软Bing推出的一项全新聊天机器人功能,旨在通过人工智能技术革新搜索引擎的用户体验。

免费增值 • 专有
查看详情
上一页
下一页

下载与相关链接

安全提示
⚠️

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。