Voxtral

软件描述

Voxtral 模型是前沿的语音理解模型,提供两种尺寸版本:一种是 240 亿参数版本,适用于大规模生产场景;另一种是 30 亿参数版本,适用于本地和边缘设备部署。两种版本均采用 Apache 2.0 开源许可证发布。

官方网站

访问软件的官方网站了解更多信息

官方认证

docs.mistral.ai

安全链接HTTPS

什么是 Voxtral?

Voxtral 模型是前沿的语音理解模型,提供两种规格:一种是 240 亿参数版本,适用于大规模生产场景;另一种是 30 亿参数版本,适用于本地及边缘设备部署。两款模型均采用 Apache 2.0 开源许可协议发布。我们已将这两个模型上线至 API 服务,并提供高度优化的仅转录端点,实现无与伦比的成本效益。

Voxtral Small 是 Mistral Small 3 的增强版本,在保留顶尖文本性能的同时,集成了最先进的音频输入能力,尤其擅长语音转录、翻译和音频理解。

Voxtral Mini 是 Ministral 3B 的增强版本,在保留顶尖文本性能的同时,集成了最先进的音频输入能力,尤其擅长语音转录、翻译和音频理解。

🔄 替代方案

64 个选择
QuickEditVideo

QuickEditVideo

软件

一款注重隐私的在线视频编辑器,利用 FFmpeg 和 WebAssembly 在您的浏览器中完全处理视频,无需上传,无需注册。

免费 • 开源
查看详情

转录和翻译您的音频文件——免费提供。

免费增值 • 开源
查看详情
AudioNotes: Speech To Text

AudioNotes: Speech To Text

音频转写工具, 视频转录工具

AudioNotes 应用让你能够随时随地使用人工智能轻松录制、转录和优化音频。无论你是在记录想法、创意、访谈、会议还是讲座,这款应用都能满足你的需求。

免费增值 • 专有
查看详情

Vocol 是一款人工智能语音转录软件,也是一个集成了语音协作功能的综合平台,旨在通过将语音和数据转化为可操作的洞察,提升工作效率。

付费 • 专有
查看详情
WriteVoice

WriteVoice

软件

Writevoice 让您以思维的速度进行写作。点击“录音”,自然地说话,即可获得清晰准确的文本,用于文档、工单或您的客户关系管理系统。它速度快、精准且注重隐私:我们从不存储您的录音或文字记录。

付费 • 专有
查看详情

一款免费、开源且可扩展的语音转文本应用,可完全在离线状态下运行。

免费 • 开源
查看详情

VibeVoice 是一种新颖的框架,旨在从文本生成具有表现力的长篇多说话人对话音频,例如播客。它解决了传统文本到语音(TTS)系统中的诸多挑战,特别是在可扩展性、说话人一致性等方面。

免费 • 开源
查看详情
Voiceslab

Voiceslab

软件

制作一个保留您语调和口音的AI语音复制品。我们的语音克隆技术让您只需阅读一段短文本,即可生成自然流畅的语音,用于视频和播客。

免费增值 • 专有
查看详情
上一页
下一页

下载与相关链接

安全提示
⚠️

安全提醒

点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。