Mellum
Mellum
软件描述
Mellum-4b-base 是 JetBrains 首个专为代码相关任务优化的开源大型语言模型(LLM)。
官方网站
访问软件的官方网站了解更多信息
huggingface.co
什么是 Mellum?
Mellum-4b-base 是 JetBrains 首个专为代码相关任务优化的开源大语言模型(LLM)。 该模型在超过 4 万亿个标记上训练,上下文窗口为 8192 个标记,涵盖多种编程语言,专门针对代码补全任务进行优化。模型采用 LLaMA 风格架构,参数量为 40 亿,适用于云端推理(例如通过 vLLM)和本地部署(例如使用 llama.cpp 或 Ollama)。 Mellum 使用自动混合精度(AMP)技术,以 bf16 精度进行训练。上传至 Hugging Face 的版本保留了 bf16 格式,供公众使用。 该模型专为集成到专业开发工具中而设计,如 IDE 中的智能代码建议、AI 驱动的编码助手,以及代码理解与生成的研究,同时也适用于教育场景和微调实验。 本次发布包含基础模型及 Python SFT 模型,其他语言的模型将陆续发布。请注意,基础模型未经过下游任务的预微调,但完全支持监督微调(SFT)和强化学习(RL),可适配特定应用场景。
主要功能
🔄 替代方案
52 个选择Shiori AI
Shiori 是最快的 ChatGPT 替代品——支持 15+ 大语言模型、图像与视频生成、文本转语音、YouTube 摘要功能,价格仅为 ChatGPT Plus 的一半。

7 Dollar Chat
提供 Llama、Nova、Mixtral 以及多个版本的 Claude。图像生成支持 SDXL 和 Titan Image。界面优秀,具备文档提交和网页搜索等工具。

Model Diplomat
模型外交官是一款专为模拟联合国(MUN)代表打造的AI助手,助您充分准备、练习并发挥最佳水平。

KamuAI
注重隐私的AI聊天助手,兼容Windows、Mac和Linux系统。完全离线运行或使用欧盟托管模型,从不上传数据,保障聊天安全,支持多标签页、提示词库、对话分类管理以及灵活的按使用量计费模式。

MiniMax
MiniMax-M1 是世界上首个开源的大规模混合注意力推理模型。在复杂、注重生产力的场景中,M1 的能力在开源模型中处于顶尖水平,超越了国内闭源模型,接近国际领先水平……

ExplainBot
ExplainBot 不仅是一个聊天机器人演示,更是一个完整的 SaaS 启动套件,为您提供打造自有 AI 驱动聊天平台所需的一切。
SPORTS-5
这款应用是一款由人工智能驱动的体育博彩助手,结合多智能体研究与实时市场背景,提供可审计的分析、可操作的投注建议及清晰的推理过程。通过聊天界面,可请求对阵分析、资金管理策略以及透明的……

Wizey
是否曾面对化验单感到茫然?Wizey让困惑变清晰。上传任何报告,即可获得个性化、有研究支持的通俗易懂解释。了解哪些指标重要,该看哪位医生,以及如何为就诊做准备。私密、即时、简便。

