Voxtral
Voxtral
软件描述
Voxtral 模型是前沿的语音理解模型,提供两种尺寸版本:一种是 240 亿参数版本,适用于大规模生产场景;另一种是 30 亿参数版本,适用于本地和边缘设备部署。两种版本均采用 Apache 2.0 开源许可证发布。
官方网站
访问软件的官方网站了解更多信息
docs.mistral.ai
什么是 Voxtral?
Voxtral 模型是前沿的语音理解模型,提供两种规格:一种是 240 亿参数版本,适用于大规模生产场景;另一种是 30 亿参数版本,适用于本地及边缘设备部署。两款模型均采用 Apache 2.0 开源许可协议发布。我们已将这两个模型上线至 API 服务,并提供高度优化的仅转录端点,实现无与伦比的成本效益。
Voxtral Small 是 Mistral Small 3 的增强版本,在保留顶尖文本性能的同时,集成了最先进的音频输入能力,尤其擅长语音转录、翻译和音频理解。
Voxtral Mini 是 Ministral 3B 的增强版本,在保留顶尖文本性能的同时,集成了最先进的音频输入能力,尤其擅长语音转录、翻译和音频理解。
🔄 替代方案
64 个选择AudioNotes 应用让你能够随时随地使用人工智能轻松录制、转录和优化音频。无论你是在记录想法、创意、访谈、会议还是讲座,这款应用都能满足你的需求。

WriteVoice
软件
Writevoice 让您以思维的速度进行写作。点击“录音”,自然地说话,即可获得清晰准确的文本,用于文档、工单或您的客户关系管理系统。它速度快、精准且注重隐私:我们从不存储您的录音或文字记录。

VibeVoice
VibeVoice 是一种新颖的框架,旨在从文本生成具有表现力的长篇多说话人对话音频,例如播客。它解决了传统文本到语音(TTS)系统中的诸多挑战,特别是在可扩展性、说话人一致性等方面。
下载与相关链接
安全提示安全提醒
点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。