Voxtral

音频转录工具

软件描述

Voxtral 模型是先进的语音理解模型，提供两种尺寸——适用于生产规模应用的 24B 版本和适用于本地及边缘部署的 3B 版本。两个版本均采用 Apache 2.0 许可证发布。

官方网站

访问软件的官方网站了解更多信息

官方认证

docs.mistral.ai

安全链接HTTPS

立即访问

什么是 Voxtral?

Voxtral 模型是业界领先的语音理解模型，提供两种尺寸：适用于生产规模应用的 240 亿参数版本和适用于本地及边缘部署的 30 亿参数版本。两个版本均采用 Apache 2.0 许可证发布。我们还已将这两个模型上线至我们的 API，并提供了高度优化的仅转录端点，实现无与伦比的成本效益。

Voxtral Small 是 Mistral Small 3 的增强版，在保留顶级文本性能的同时，引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。

Voxtral Mini 是 Ministral 3B 的增强版，在保留顶级文本性能的同时，引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。

主要功能

✓ 无广告 ✓ 人工智能驱动 ✓ 语音转录 ✓ 语音识别

🔄 替代方案

69 个选择

Supernormal

视频转录工具

超常是帮助您将会议记录撰写速度提升20倍的人工智能平台。

Aiko

音频转录工具, 视频转录工具

★4

高质量的设备端语音转写。轻松将会议、讲座等的语音转换为文字。

Letterly

音频转录工具, 笔记工具

★5

Letterly 是一款将任何语音转换为清晰、结构化文本的移动应用。它不仅仅是语音转写工具，借助人工智能技术，您可以将语音轻松转化为结构化笔记、吸引人的社交媒体帖子、易读的会议摘要、正式邮件等更多内容。

Monologue

音频转录工具

轻松自如，完美语音输入。

Dia TTS

语音合成服务, 大型语言模型（LLM）工具

Dia 是由 Nari Labs 开发的一款 16 亿参数的文本转语音模型，通过 PytorchModelHubMixin 集成推送到 Hub。

许可证免费增值 • 开源

支持平台

Hugging Face 自托管在线

下载与相关链接

安全提醒

点击下方链接将跳转到第三方网站，请确保来源安全，建议优先从官方网站下载。

Source

雷思软件

Voxtral

Voxtral

软件描述

官方网站

什么是 Voxtral?

主要功能

🔄 替代方案

Supernormal

Aiko

Letterly

Monologue

Dia TTS

支持平台

标签

下载与相关链接