Voxtral
Voxtral
软件描述
Voxtral 模型是前沿的语音理解模型,提供两种尺寸版本:一种是 240 亿参数版本,适用于大规模生产场景;另一种是 30 亿参数版本,适用于本地和边缘设备部署。两种版本均采用 Apache 2.0 开源许可证发布。
官方网站
访问软件的官方网站了解更多信息
docs.mistral.ai
什么是 Voxtral?
Voxtral 模型是前沿的语音理解模型,提供两种规格:一种是 240 亿参数版本,适用于大规模生产场景;另一种是 30 亿参数版本,适用于本地及边缘设备部署。两款模型均采用 Apache 2.0 开源许可协议发布。我们已将这两个模型上线至 API 服务,并提供高度优化的仅转录端点,实现无与伦比的成本效益。
Voxtral Small 是 Mistral Small 3 的增强版本,在保留顶尖文本性能的同时,集成了最先进的音频输入能力,尤其擅长语音转录、翻译和音频理解。
Voxtral Mini 是 Ministral 3B 的增强版本,在保留顶尖文本性能的同时,集成了最先进的音频输入能力,尤其擅长语音转录、翻译和音频理解。
🔄 替代方案
64 个选择该软件支持超过35种语言将音频和视频转换为文本,并提供浏览器内的编辑器,实现无缝的字幕管理。通过自动字幕、语言转换和媒体播放器共享功能,支持团队协作,并通过与Zoom和Adobe的集成实现安全的数据存储。

WhisperTranscribe
使用AI转录任何音频,并通过时间戳快速准确地获取转录文本。利用GPT提示从转录内容生成新内容,例如摘要、博客文章、社交媒体帖子或您自定义的内容。无需订阅。
SpeechPulse 是一款适用于 Windows 10/11 和苹果硅芯片 Mac 的语音转文字软件。它可将语音输入转换为文本,适用于各种文本输入场景,包括文本编辑器、网页浏览器和办公软件。SpeechPulse 完全离线运行,无需任何互联网连接。

OmniDictate
适用于 Windows 的免费、开源、实时语音转文字工具。本地运行(无需云端!),采用人工智能技术,通过直观的图形用户界面,可直接将文字输入到任意应用程序中。
MacScribe 可让您轻松在笔记本电脑上转录任何 YouTube 视频、音频或视频文件,或通过麦克风进行录音。使用 MacScribe,您可以为最喜欢的视频、讲座、会议等创建字幕。
TranscribeToText.ai 是一项人工智能语音转文字服务,可将音频和视频文件转换为文本,免除人工操作。该服务提供无限次转录,并每日赠送一次免费转录。平台采用人工智能技术,确保转录准确、可靠,并实现快速处理。
下载与相关链接
安全提示安全提醒
点击下方链接将跳转到第三方网站,请确保来源安全,建议优先从官方网站下载。