Voxtral
Voxtral
软件描述
Voxtral 模型是先进的语音理解模型,提供两种尺寸——适用于生产规模应用的 24B 版本和适用于本地及边缘部署的 3B 版本。两个版本均采用 Apache 2.0 许可证发布。
官方网站
访问软件的官方网站了解更多信息
docs.mistral.ai
什么是 Voxtral?
Voxtral 模型是业界领先的语音理解模型,提供两种尺寸:适用于生产规模应用的 240 亿参数版本和适用于本地及边缘部署的 30 亿参数版本。两个版本均采用 Apache 2.0 许可证发布。我们还已将这两个模型上线至我们的 API,并提供了高度优化的仅转录端点,实现无与伦比的成本效益。
Voxtral Small 是 Mistral Small 3 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。
Voxtral Mini 是 Ministral 3B 的增强版,在保留顶级文本性能的同时,引入了先进的音频输入能力。它在语音转录、翻译和音频理解方面表现出色。
🔄 替代方案
69 个选择该软件可将音频和视频翻译成35种以上的语言,并提供浏览器内编辑器,实现无缝的字幕管理。通过自动字幕、语言转换及媒体播放器共享功能,支持协作,并通过与Zoom和Adobe的集成,确保数据存储安全。

HoldSpeak
HoldSpeak 是一款人工智能应用,可让你的打字速度提升3倍。它支持100多种语言,且完全离线运行。

Speak AI
AI驱动的平台可捕捉、转录和分析音频、视频及文本,通过会议助手和API提供电话、会议及非结构化数据的洞察。支持99种以上语言翻译,能够识别关键词、进行情感分析,并整理定性研究数据。

WhisperTranscribe
使用人工智能,快速准确地转录音频并添加时间戳。通过GPT提示,从转录内容生成摘要、博客文章、社交媒体帖子或自定义内容。无需订阅。
SpeechPulse 是一款适用于 Windows 10/11 和 Apple Silicon Mac 的语音输入软件。它可向任何文本输入框输入文字,包括文本编辑器、网页浏览器和办公应用。SpeechPulse 完全离线运行,无需互联网连接。

OmniDictate
免费、开源、适用于 Windows 的实时语音输入工具。本地运行(无需云端!),采用人工智能技术,通过用户友好的图形界面直接向任意应用程序输入文字。
MacScribe可让您轻松转录电脑上的任何YouTube视频、音频或视频文件,或通过麦克风进行录制。使用MacScribe,您可以为喜爱的视频、讲座、会议等创建字幕。





