Voxtral
Voxtral
软件描述
Voxtral 模型是先进的语音理解模型,提供两种尺寸——适用于生产规模应用的 24B 版本和适用于本地及边缘部署的 3B 版本。两个版本均采用 Apache 2.0 许可证发布。
官方网站
访问软件的官方网站了解更多信息
docs.mistral.ai
什么是 Voxtral?
Voxtral 模型是业界领先的语音理解模型,提供两种尺寸:适用于生产规模应用的 240 亿参数版本和适用于本地及边缘部署的 30 亿参数版本。两个版本均采用 Apache 2.0 许可证发布。我们还已将这两个模型上线至我们的 API,并提供了高度优化的仅转录端点,实现无与伦比的成本效益。
Voxtral Small 是 Mistral Small 3 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。
Voxtral Mini 是 Ministral 3B 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。
🔄 替代方案
69 个选择Audiotype 是一款将音频和视频文件转换为可编辑文本稿和字幕的转录软件。超过 10,000 名用户使用 Audiotype 将其媒体文件(视频、播客、录音、MP4、MP3、采访等)转录为可导出的文稿或字幕。

Superwhisper
通过离线语音转文字功能,彻底革新您的写作流程,将口语轻松转化为格式完美的文档、邮件和笔记。该无广告、基于AI的工具支持Mac和iPhone,利用Whisper-AI技术实现无缝转录与高效语音输入。

Whisper-Zero
对Whisper ASR的全面重构,消除了幻觉并显著提升了准确率。基于超过150万小时的音频数据构建,包括电话和嘈杂环境下的数据。

WhisperTyping
WhisperTyping 是一款使用 Whisper 模型的语音输入软件,提供业界领先的语音输入体验。利用其 AI 模式,您只需通过语音即可更高效地写作、解答疑问并执行命令。

AIVocal
AIVocal 是您的一站式AI语音助手,适用于AI播客、语音生成、人声编辑和语音控制。无论是会议转录还是制作高质量音频内容,AIVocal都能让语音工作更智能、更高效。





