Voxtral

软件描述

Voxtral 模型是前沿的语音理解模型,提供两种尺寸版本:一种是 240 亿参数版本,适用于大规模生产场景;另一种是 30 亿参数版本,适用于本地和边缘设备部署。两种版本均采用 Apache 2.0 开源许可证发布。

官方网站

访问软件的官方网站了解更多信息

官方认证

docs.mistral.ai

安全链接HTTPS

什么是 Voxtral?

Voxtral 模型是前沿的语音理解模型,提供两种规格:一种是 240 亿参数版本,适用于大规模生产场景;另一种是 30 亿参数版本,适用于本地及边缘设备部署。两款模型均采用 Apache 2.0 开源许可协议发布。我们已将这两个模型上线至 API 服务,并提供高度优化的仅转录端点,实现无与伦比的成本效益。

Voxtral Small 是 Mistral Small 3 的增强版本,在保留顶尖文本性能的同时,集成了最先进的音频输入能力,尤其擅长语音转录、翻译和音频理解。

Voxtral Mini 是 Ministral 3B 的增强版本,在保留顶尖文本性能的同时,集成了最先进的音频输入能力,尤其擅长语音转录、翻译和音频理解。

🔄 替代方案

64 个选择

Vibe 是一项自动语音转录服务,利用本地语言学习模型(LLMs)或人工智能技术,为多种语言提供转录服务。该服务注重用户隐私,提供完全离线的转录功能,确保数据永远不会……

免费 • 开源
查看详情
FUTO Voice Input

FUTO Voice Input

音频转写工具

4.8

FUTO语音输入是一款适用于Android的语音转文本应用程序,可与第三方键盘或使用通用语音转文本API的应用程序集成。

免费 • 开源
查看详情
4.5

Whisper 是一个通用的语音识别模型。它在大量多样化的音频数据集上进行训练,同时是一个多任务模型,能够执行多语言语音识别、语音翻译和语言识别。

免费增值 • 开源
查看详情

在您的 Mac 上畅享无缝的语音转文字功能。说出您的想法,让现代人工智能为您完成打字——无需隐藏的数据收集,也无任何干扰。

免费 • 专有
查看详情
Moonshine AI

Moonshine AI

音频转写工具

Moonshine 是一系列为在资源受限设备上实现快速且准确的自动语音识别(ASR)而优化的语音转文本模型,适用于实时、本地化应用,如实时字幕转录和语音指令识别。

免费 • 开源
查看详情
2

TalkNotes利用支持100多种语言的AI语音识别技术,将音频转换为结构化的笔记、待办事项、记忆卡片和字幕。可自动将讲座、会议或任何讲话内容转化为可操作的文本,确保任务不会丢失,并为所有用户提供了易于使用的访问体验。

付费 • 专有
查看详情

专为 macOS 设计的注重隐私的转录工具。免费使用。无广告、无追踪、无数据收集。

免费 • 专有
查看详情

ElevenLabs利用人工智能为播客和视频等多样化应用场景提供自然且富有表现力的语音。它拥有用户友好的界面、可自定义的语调,并提供无缝的API集成。隐私保护、可扩展性以及多语言能力提升了其适应性。

免费增值 • 专有
查看详情
上一页
下一页

下载与相关链接

安全提示
⚠️

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。