Voxtral

软件描述

Voxtral 模型是前沿的语音理解模型,提供两种尺寸版本:一种是 240 亿参数版本,适用于大规模生产场景;另一种是 30 亿参数版本,适用于本地和边缘设备部署。两种版本均采用 Apache 2.0 开源许可证发布。

官方网站

访问软件的官方网站了解更多信息

官方认证

docs.mistral.ai

安全链接HTTPS

什么是 Voxtral?

Voxtral 模型是前沿的语音理解模型,提供两种规格:一种是 240 亿参数版本,适用于大规模生产场景;另一种是 30 亿参数版本,适用于本地及边缘设备部署。两款模型均采用 Apache 2.0 开源许可协议发布。我们已将这两个模型上线至 API 服务,并提供高度优化的仅转录端点,实现无与伦比的成本效益。

Voxtral Small 是 Mistral Small 3 的增强版本,在保留顶尖文本性能的同时,集成了最先进的音频输入能力,尤其擅长语音转录、翻译和音频理解。

Voxtral Mini 是 Ministral 3B 的增强版本,在保留顶尖文本性能的同时,集成了最先进的音频输入能力,尤其擅长语音转录、翻译和音频理解。

🔄 替代方案

64 个选择

利用先进的语音识别技术,将音频和视频内容精确转录为文字,让AI自动创建笔记,快速挖掘您需要的洞察。

免费增值 • 专有
查看详情

Supernormal 是一个AI平台,可帮助你将会议纪要的撰写速度提升20倍。

免费增值 • 专有
查看详情
💻

CMU Sphinx

软件

CMU Sphinx 是一个基于 BSD 风格许可证发布的、无需特定说话人、支持大规模词汇的连续语音识别系统。它也是一组开源工具和资源的集合,使研究人员和开发者能够构建语音识别系统。

免费 • 开源
查看详情

高质量的本地语音转文字。轻松将会议、讲座等语音内容转换为文字。

免费 • 专有
查看详情
1

在 macOS 上的任何应用程序中用你的声音输入。比 ChatGPT、Google 和 OpenAI Whisper 更快、更准确。开始说话,停止打字。

免费 • 专有
查看详情

Letterly 是一款移动应用,可将任意语音转换为清晰且结构良好的文本。它不仅仅是语音转文字。借助人工智能技术,你可以将语音转化为结构化的笔记、吸引人的社交媒体帖子、可读的会议纪要、正式的邮件等。

免费增值 • 专有
查看详情
💻

Windows Speech Recognition

音频转写工具

Windows 语音识别使使用键盘和鼠标成为可选的。你可以通过语音来控制电脑,并用语音输入文字。

免费 • 专有
查看详情

Amphion 是一个用于音频、音乐和语音生成的工具包。其目的是支持可重复的研究,并帮助初级研究人员和工程师进入音频、音乐和语音生成领域的研究与开发。

免费 • 开源
查看详情
上一页下一页

下载与相关链接

安全提示
⚠️

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。