Voxtral

软件描述

Voxtral 模型是先进的语音理解模型,提供两种尺寸——适用于生产规模应用的 24B 版本和适用于本地及边缘部署的 3B 版本。两个版本均采用 Apache 2.0 许可证发布。

官方网站

访问软件的官方网站了解更多信息

官方认证

docs.mistral.ai

安全链接HTTPS
立即访问

什么是 Voxtral?

Voxtral 模型是业界领先的语音理解模型,提供两种尺寸:适用于生产规模应用的 240 亿参数版本和适用于本地及边缘部署的 30 亿参数版本。两个版本均采用 Apache 2.0 许可证发布。我们还已将这两个模型上线至我们的 API,并提供了高度优化的仅转录端点,实现无与伦比的成本效益。

Voxtral Small 是 Mistral Small 3 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。

Voxtral Mini 是 Ministral 3B 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。

🔄 替代方案

69 个选择
0

超常是帮助您将会议记录撰写速度提升20倍的人工智能平台。

4

高质量的设备端语音转写。轻松将会议、讲座等的语音转换为文字。

5

Letterly 是一款将任何语音转换为清晰、结构化文本的移动应用。它不仅仅是语音转写工具,借助人工智能技术,您可以将语音轻松转化为结构化笔记、吸引人的社交媒体帖子、易读的会议摘要、正式邮件等更多内容。

0

轻松自如,完美语音输入。

0

Dia 是由 Nari Labs 开发的一款 16 亿参数的文本转语音模型,通过 PytorchModelHubMixin 集成推送到 Hub。

上一页下一页

下载与相关链接

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。