Voxtral
Voxtral
软件描述
Voxtral 模型是先进的语音理解模型,提供两种尺寸——适用于生产规模应用的 24B 版本和适用于本地及边缘部署的 3B 版本。两个版本均采用 Apache 2.0 许可证发布。
官方网站
访问软件的官方网站了解更多信息
docs.mistral.ai
什么是 Voxtral?
Voxtral 模型是业界领先的语音理解模型,提供两种尺寸:适用于生产规模应用的 240 亿参数版本和适用于本地及边缘部署的 30 亿参数版本。两个版本均采用 Apache 2.0 许可证发布。我们还已将这两个模型上线至我们的 API,并提供了高度优化的仅转录端点,实现无与伦比的成本效益。
Voxtral Small 是 Mistral Small 3 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。
Voxtral Mini 是 Ministral 3B 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。
🔄 替代方案
69 个选择
Whisper Mate
批量将音频文件或视频文件转录为文本,使用 OpenAI 的 Whisper AI 模型。配备内嵌字幕编辑器,可逐段预览转录结果。 所有转录操作均在本地计算机上处理,保障您的隐私安全。

Speech to Note
语音转笔记是一款前沿的AI驱动工具,可将您的口头表述无缝转换为简洁而富有信息量的摘要。

AI Audio Kit
一个简单的macOS应用程序,允许用户从macOS桌面使用不同的Whisper服务(OpenAI API、Runpod Faster Whisper)。您可以使用自己的API密钥,确保仅为您实际使用的服务付费。

Transcriptor
使用此易于导航的工具,高效地将语音转换为文本。支持20种语言(从英语到越南语)实时转录,并通过iCloud安全存储。

AudioPen
将语音转化为简洁、摘要式的文本,去除冗余表达。提供高级付费功能,如写作风格自定义、字数控制及笔记导出,助力日记记录与内容创作。

Buzz Captions
Buzz Captions 是一款基于 OpenAI Whisper 模型的离线音频转录与翻译工具。它允许用户导入音频和视频文件,生成 CSV、SRT、TXT 和 VTT 格式的字幕。

DeepGram
借助世界级的语音识别和领域专用语言模型(DSLM),为您的应用赋能。准确无误,极速响应,支持企业级扩展,价格极具优势。开发者所需的一切,助您自信开发,快速上线。


