Whisper Mate

Whisper Mate
软件
软件描述
使用 OpenAI 的 Whisper AI 模型批量将音频文件或视频文件转录为文本。提供嵌入式字幕编辑器,可逐段预览转录结果。所有转录操作均在本地设备上完成,保障您的隐私安全。
官方网站
访问软件的官方网站了解更多信息
whisper.marksdo.com
什么是 Whisper Mate?
Whisper Mate 可使用 OpenAI 的 Whisper AI 模型将音频文件或视频文件批量转为文本。提供嵌入式字幕编辑器,可逐段预览转录结果。所有转录操作均在本地设备上进行,保障您的隐私安全。
功能特点
转录音频或视频文件
使用 DeepL 免费 API 进行字幕翻译
嵌入式字幕编辑器用于修正转录内容
支持导出为 SRT、VTT、CSV、JSON、SEGMENT 格式
支持为每段字幕指定说话人
大多数操作支持批量选择执行,例如批量任务运行、批量行翻译、批量行设置说话人
支持拖拽文件开始转录
支持在搜索转录内容时直接输入文字
编辑器可同步预览音频或视频文件的播放范围
支持多语言转换
支持自定义常用语言进行转换或翻译
🔄 替代方案
39 个选择
Meeting Recorder
软件
会议记录仪是您的会议个人助手。它能为您监听并转录会议和讲座内容,让您可以在录音中搜索关键词和短语。您可以记录最重要的对话,节省时间,助您更高效地工作……
人工智能驱动的工具可实现快速、准确的视频字幕生成和多语言翻译,具备情境感知字幕、说话人识别、可定制的导出选项、编辑阅读视图、AI重排功能以调整时间轴,以及支持多个行业应用。
Ragnar 是一个使用 Python 和 Streamlit 构建的简单应用,可将您的音频和视频文件在本地计算机或您自己的服务器上进行转录。完全安全,无需调用任何外部服务,仅依赖于您自己的计算机。它使用 Whisper 和 Whisper Stable。
Speakr
Speakr 是一款个人化、自托管的网络应用程序,可用于转录音频记录(如会议)、生成简洁的摘要和标题,并通过聊天界面与内容进行互动。所有会议笔记和见解都将安全地存储在您自己的服务器上。

VibeVoice
VibeVoice 是一种新颖的框架,旨在从文本生成具有表现力的长篇多说话人对话音频,例如播客。它解决了传统文本到语音(TTS)系统中的诸多挑战,特别是在可扩展性、说话人一致性等方面。