发现各种软件替代方案,找到更适合您的选择
Mellum-4b-base 是 JetBrains 首个专为代码相关任务优化的开源大型语言模型(LLM)。
提供 52 个替代方案
性能先进的视频模型,可在消费级GPU上生成480/720p视频,支持文本到视频、图像转换、编辑以及使用强大VAE的双语文本生成等任务。
提供 56 个替代方案
先进的自回归模型,用于统一的多模态理解与生成,具备视觉路径解耦、优化的训练策略以及校正流整合,实现卓越且灵活的任务表现。
提供 63 个替代方案
遵循物理规律,实现逼真的运动效果,精准响应指令以控制角色与动作,生成流畅的人类表情。作为世界模拟器,它可实现合成现实中的探索,无缝融合文本、音频、图像与3D内容。采用Apache 2.0开源协议。
提供 46 个替代方案
Open R1 是一个由社区驱动的开源项目,旨在通过透明的方法论复现 DeepSeek-R1 的先进 AI 能力。
提供 82 个替代方案
MinimalGPT 是一个简洁、灵活且精简的代码框架,包含了构建、训练、推理和微调 GPT 模型所需的基本组件。
提供 115 个替代方案
介绍首个基于扩散和流匹配的生成地理定位方法!我们通过条件性地对图像去噪随机位置,学习视觉内容与位置之间的关系。
完整的LLM聊天机器人实现,提供分词、预训练、微调、评估、推理及简易Web界面。可在单个8xH100节点上运行,具备可修改的代码库、轻量依赖设计,并通过脚本自动化完整工作流。
Dia 是由 Nari Labs 开发的一款 16 亿参数的文本转语音模型,通过 PytorchModelHubMixin 集成推送到 Hub。
一种端到端的多模态大模型,可接受任何形式的指代并作出相应的事物定位。
Axolotl 是一款旨在简化各种 AI 模型微调的工具,支持多种配置和架构。
快速集成, 自动追踪与版本控制 仅需 5 行代码,即可追踪、版本化并可视化 重现任意模型检查点 实时监控 CPU 和 GPU 使用情况 自动追踪机器学习流水线的每个细节。带上下文的可视化结果。拖拽即可。
使用自定义工作流和您偏好的人工智能,加速您的开发周期。
ControlFlow 提供了一个结构化、以开发者为中心的框架,用于定义工作流并将任务委派给大语言模型,同时不牺牲控制力或透明度:
WildGuard 是一个开源、轻量级的 LLM 安全审核工具,旨在实现三个目标:
我们提出 BAGEL,一个开源的多模态基础模型,拥有 70 亿个活跃参数(总计 140 亿),在大规模交错多模态数据上进行训练。BAGEL 的性能优于当前顶尖的开源视觉语言模型,如 Qwen2.5-VL 和 InternVL-2。
VibeVoice 是一种新型框架,可从文本生成富有表现力的长篇多说话人对话音频,例如播客。它解决了传统文本转语音(TTS)系统中的诸多挑战,特别是在可扩展性、说话人一致性等方面……











