Voxtral

软件描述

Voxtral 模型是先进的语音理解模型,提供两种尺寸——适用于生产规模应用的 24B 版本和适用于本地及边缘部署的 3B 版本。两个版本均采用 Apache 2.0 许可证发布。

官方网站

访问软件的官方网站了解更多信息

官方认证

docs.mistral.ai

安全链接HTTPS
立即访问

什么是 Voxtral?

Voxtral 模型是业界领先的语音理解模型,提供两种尺寸:适用于生产规模应用的 240 亿参数版本和适用于本地及边缘部署的 30 亿参数版本。两个版本均采用 Apache 2.0 许可证发布。我们还已将这两个模型上线至我们的 API,并提供了高度优化的仅转录端点,实现无与伦比的成本效益。

Voxtral Small 是 Mistral Small 3 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。

Voxtral Mini 是 Ministral 3B 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。

🔄 替代方案

69 个选择
0

几秒钟内,通过先进的说话人识别技术,将音频和视频转换为准确的文字,并让AI自动生成笔记,快速发掘您所需的关键洞察。

0

转录并翻译您的音频文件——免费。

AudioNotes: Speech To Text

AudioNotes: Speech To Text

0

AudioNotes 应用程序可让您随时随地使用人工智能轻松录制、转录和增强音频。无论您是在记录想法、访谈、会议或讲座,此应用都能满足您的需求。

5

Vocol 是一款AI语音转录软件,也是一个一站式语音协作平台,旨在通过将语音和数据转化为可执行的洞察,提升工作效率。

1

在 macOS 上的任意应用中用你的声音写作。比 ChatGPT、Google 和 OpenAI Whisper 更快更准确。开始说话,停止打字。

0

Amphion 是一个用于音频、音乐和语音生成的工具包。其目的是支持可复现的研究,并帮助初级研究人员和工程师入门音频、音乐和语音生成领域的研究与开发。

5

AI会议助手,可录制Google Meet、Zoom、Teams、Webex会议;自动生成字幕并即时总结要点、待办事项、会议纪要及智能标题。支持搜索/打标签、跳转至引用内容、导出或分享。

Transcriboar

Transcriboar

0

Transcriboar 是一款轻量级的 Android 语音转文字应用,利用设备内置的 SpeechRecognizer 实时将语音转换为文本。

上一页下一页

下载与相关链接

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。