Voxtral

软件描述

Voxtral 模型是先进的语音理解模型,提供两种尺寸——适用于生产规模应用的 24B 版本和适用于本地及边缘部署的 3B 版本。两个版本均采用 Apache 2.0 许可证发布。

官方网站

访问软件的官方网站了解更多信息

官方认证

docs.mistral.ai

安全链接HTTPS
立即访问

什么是 Voxtral?

Voxtral 模型是业界领先的语音理解模型,提供两种尺寸:适用于生产规模应用的 240 亿参数版本和适用于本地及边缘部署的 30 亿参数版本。两个版本均采用 Apache 2.0 许可证发布。我们还已将这两个模型上线至我们的 API,并提供了高度优化的仅转录端点,实现无与伦比的成本效益。

Voxtral Small 是 Mistral Small 3 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。

Voxtral Mini 是 Ministral 3B 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。

🔄 替代方案

69 个选择
4

Vibe 是一种自动语音转录服务,利用本地语言学习模型(LLM)或人工智能,为多种语言提供转录服务。该服务优先考虑用户隐私,提供完全离线的转录功能,确保数据永不……

FUTO Voice Input

FUTO Voice Input

5

FUTO语音输入是一款可在Android上实现语音转文字的应用程序,可与支持通用语音转文字API的第三方输入法或应用集成。

4

Whisper 是一个通用的语音识别模型。它在大量多样的音频数据集上进行训练,同时也是一种多任务模型,能够执行多语言语音识别、语音翻译和语言识别。

5

在您的 Mac 上轻松实现语音转文字。说出您的想法,让现代人工智能代为输入——无隐藏数据收集,无干扰。

Moonshine AI

Moonshine AI

0

Moonshine 是一系列针对资源受限设备优化的语音识别模型,能够实现快速且准确的自动语音识别(ASR)。它非常适合用于实时、本地化应用,如实时转录和语音命令识别。

2

TalkNotes 利用 AI 语音转录功能,将音频转换为结构化笔记、待办事项、闪卡和文字稿,支持 100 多种语言。自动捕捉讲座、会议或任何语音内容,转化为可操作的文本,确保任务不会遗漏,且对所有人友好易用。

5

一款免费、开源且可扩展的离线语音转文本应用。

3

ElevenLabs 利用人工智能技术,为播客、视频等多种应用提供自然且富有表现力的语音。其具备用户友好的界面、可自定义的语调,并支持无缝 API 集成。隐私保护、可扩展性及多语言功能进一步提升了其适应性。

下一页

下载与相关链接

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。