Voxtral

软件描述

Voxtral 模型是先进的语音理解模型,提供两种尺寸——适用于生产规模应用的 24B 版本和适用于本地及边缘部署的 3B 版本。两个版本均采用 Apache 2.0 许可证发布。

官方网站

访问软件的官方网站了解更多信息

官方认证

docs.mistral.ai

安全链接HTTPS
立即访问

什么是 Voxtral?

Voxtral 模型是业界领先的语音理解模型,提供两种尺寸:适用于生产规模应用的 240 亿参数版本和适用于本地及边缘部署的 30 亿参数版本。两个版本均采用 Apache 2.0 许可证发布。我们还已将这两个模型上线至我们的 API,并提供了高度优化的仅转录端点,实现无与伦比的成本效益。

Voxtral Small 是 Mistral Small 3 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。

Voxtral Mini 是 Ministral 3B 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。

🔄 替代方案

69 个选择
5

Txtplay 提供云端和本地部署解决方案,支持按需和实时转录、实时字幕及自动翻译。

Whisper Mate

Whisper Mate

5

批量将音频文件或视频文件转录为文本,使用 OpenAI 的 Whisper AI 模型。配备内嵌字幕编辑器,可逐段预览转录结果。 所有转录操作均在本地计算机上处理,保障您的隐私安全。

Speech to Note

Speech to Note

5

语音转笔记是一款前沿的AI驱动工具,可将您的口头表述无缝转换为简洁而富有信息量的摘要。

AI Audio Kit

AI Audio Kit

0

一个简单的macOS应用程序,允许用户从macOS桌面使用不同的Whisper服务(OpenAI API、Runpod Faster Whisper)。您可以使用自己的API密钥,确保仅为您实际使用的服务付费。

Transcriptor

Transcriptor

0

使用此易于导航的工具,高效地将语音转换为文本。支持20种语言(从英语到越南语)实时转录,并通过iCloud安全存储。

4

将语音转化为简洁、摘要式的文本,去除冗余表达。提供高级付费功能,如写作风格自定义、字数控制及笔记导出,助力日记记录与内容创作。

Buzz Captions

Buzz Captions

5

Buzz Captions 是一款基于 OpenAI Whisper 模型的离线音频转录与翻译工具。它允许用户导入音频和视频文件,生成 CSV、SRT、TXT 和 VTT 格式的字幕。

0

借助世界级的语音识别和领域专用语言模型(DSLM),为您的应用赋能。准确无误,极速响应,支持企业级扩展,价格极具优势。开发者所需的一切,助您自信开发,快速上线。

上一页下一页

下载与相关链接

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。