Voxtral

音频转录工具

软件描述

Voxtral 模型是先进的语音理解模型，提供两种尺寸——适用于生产规模应用的 24B 版本和适用于本地及边缘部署的 3B 版本。两个版本均采用 Apache 2.0 许可证发布。

官方网站

访问软件的官方网站了解更多信息

官方认证

docs.mistral.ai

安全链接HTTPS

立即访问

什么是 Voxtral?

Voxtral 模型是业界领先的语音理解模型，提供两种尺寸：适用于生产规模应用的 240 亿参数版本和适用于本地及边缘部署的 30 亿参数版本。两个版本均采用 Apache 2.0 许可证发布。我们还已将这两个模型上线至我们的 API，并提供了高度优化的仅转录端点，实现无与伦比的成本效益。

Voxtral Small 是 Mistral Small 3 的增强版，在保留顶级文本性能的同时，引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。

Voxtral Mini 是 Ministral 3B 的增强版，在保留顶级文本性能的同时，引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。

主要功能

✓ 无广告 ✓ 人工智能驱动 ✓ 语音转录 ✓ 语音识别

🔄 替代方案

69 个选择

txtplay.ai

音频转录工具, 视频转录工具

★5

Txtplay 提供云端和本地部署解决方案，支持按需和实时转录、实时字幕及自动翻译。

Whisper Mate

★5

批量将音频文件或视频文件转录为文本，使用 OpenAI 的 Whisper AI 模型。配备内嵌字幕编辑器，可逐段预览转录结果。所有转录操作均在本地计算机上处理，保障您的隐私安全。

Speech to Note

★5

语音转笔记是一款前沿的AI驱动工具，可将您的口头表述无缝转换为简洁而富有信息量的摘要。

AI Audio Kit

音频转录工具

一个简单的macOS应用程序，允许用户从macOS桌面使用不同的Whisper服务（OpenAI API、Runpod Faster Whisper）。您可以使用自己的API密钥，确保仅为您实际使用的服务付费。

Transcriptor

音频转录工具

使用此易于导航的工具，高效地将语音转换为文本。支持20种语言（从英语到越南语）实时转录，并通过iCloud安全存储。

AudioPen

音频转录工具

★4

将语音转化为简洁、摘要式的文本，去除冗余表达。提供高级付费功能，如写作风格自定义、字数控制及笔记导出，助力日记记录与内容创作。

Buzz Captions

音频转录工具

★5

Buzz Captions 是一款基于 OpenAI Whisper 模型的离线音频转录与翻译工具。它允许用户导入音频和视频文件，生成 CSV、SRT、TXT 和 VTT 格式的字幕。

DeepGram

音频转录工具

借助世界级的语音识别和领域专用语言模型（DSLM），为您的应用赋能。准确无误，极速响应，支持企业级扩展，价格极具优势。开发者所需的一切，助您自信开发，快速上线。

许可证免费增值 • 开源

支持平台

Hugging Face 自托管在线

下载与相关链接

安全提醒

点击下方链接将跳转到第三方网站，请确保来源安全，建议优先从官方网站下载。

Source

雷思软件

Voxtral

Voxtral

软件描述

官方网站

什么是 Voxtral?

主要功能

🔄 替代方案

txtplay.ai

Whisper Mate

Speech to Note

AI Audio Kit

Transcriptor

AudioPen

Buzz Captions

DeepGram

支持平台

标签

下载与相关链接