Voxtral

软件描述

Voxtral 模型是先进的语音理解模型,提供两种尺寸——适用于生产规模应用的 24B 版本和适用于本地及边缘部署的 3B 版本。两个版本均采用 Apache 2.0 许可证发布。

官方网站

访问软件的官方网站了解更多信息

官方认证

docs.mistral.ai

安全链接HTTPS
立即访问

什么是 Voxtral?

Voxtral 模型是业界领先的语音理解模型,提供两种尺寸:适用于生产规模应用的 240 亿参数版本和适用于本地及边缘部署的 30 亿参数版本。两个版本均采用 Apache 2.0 许可证发布。我们还已将这两个模型上线至我们的 API,并提供了高度优化的仅转录端点,实现无与伦比的成本效益。

Voxtral Small 是 Mistral Small 3 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。

Voxtral Mini 是 Ministral 3B 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。

🔄 替代方案

69 个选择
QuickEditVideo

QuickEditVideo

0

一款注重隐私的在线视频编辑器,使用 FFmpeg 和 WebAssembly 在您的浏览器中完全本地处理视频。无需上传,无需注册。

WriteVoice

WriteVoice

0

Writevoice 让您以思维的速度写作。点击录制,自然说话,即可获得干净、准确的文本,适用于文档、工单或您的客户关系管理系统。它快速、精准且注重隐私:我们从不存储您的录音或文字记录。

0

VibeVoice 是一种新型框架,可从文本生成富有表现力的长篇多说话人对话音频,例如播客。它解决了传统文本转语音(TTS)系统中的诸多挑战,特别是在可扩展性、说话人一致性等方面……

Voiceslab

Voiceslab

0

创建一个保留你语调和口音的AI语音副本。通过朗读一段简短文字,我们的语音克隆技术可为你生成自然流畅的语音,适用于视频和播客。

0

Scriber Pro 利用人工智能转录技术,可在几秒钟内将您的音频和视频文件转换为准确的文字。无论您需要转录会议、访谈、讲座还是个人录音,Scriber Pro 都能让操作变得轻松便捷。

上一页

下载与相关链接

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。