Voxtral
Voxtral
软件描述
Voxtral 模型是先进的语音理解模型,提供两种尺寸——适用于生产规模应用的 24B 版本和适用于本地及边缘部署的 3B 版本。两个版本均采用 Apache 2.0 许可证发布。
官方网站
访问软件的官方网站了解更多信息
官方认证
docs.mistral.ai
安全链接HTTPS
什么是 Voxtral?
Voxtral 模型是业界领先的语音理解模型,提供两种尺寸:适用于生产规模应用的 240 亿参数版本和适用于本地及边缘部署的 30 亿参数版本。两个版本均采用 Apache 2.0 许可证发布。我们还已将这两个模型上线至我们的 API,并提供了高度优化的仅转录端点,实现无与伦比的成本效益。
Voxtral Small 是 Mistral Small 3 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。
Voxtral Mini 是 Ministral 3B 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。
🔄 替代方案
69 个选择
QuickEditVideo
一款注重隐私的在线视频编辑器,使用 FFmpeg 和 WebAssembly 在您的浏览器中完全本地处理视频。无需上传,无需注册。

WriteVoice
Writevoice 让您以思维的速度写作。点击录制,自然说话,即可获得干净、准确的文本,适用于文档、工单或您的客户关系管理系统。它快速、精准且注重隐私:我们从不存储您的录音或文字记录。

VibeVoice
VibeVoice 是一种新型框架,可从文本生成富有表现力的长篇多说话人对话音频,例如播客。它解决了传统文本转语音(TTS)系统中的诸多挑战,特别是在可扩展性、说话人一致性等方面……

Voiceslab
创建一个保留你语调和口音的AI语音副本。通过朗读一段简短文字,我们的语音克隆技术可为你生成自然流畅的语音,适用于视频和播客。
许可证免费增值 • 开源


