雷思软件

← 返回软件列表

VibeVoice

VibeVoice

VibeVoice

文字转语音服务, 大型语言模型（LLM）工具

软件描述

VibeVoice 是一种新颖的框架，旨在从文本生成具有表现力的长篇多说话人对话音频，例如播客。它解决了传统文本到语音（TTS）系统中的诸多挑战，特别是在可扩展性、说话人一致性等方面。

官方网站

访问软件的官方网站了解更多信息

官方认证

microsoft.github.io

安全链接HTTPS

什么是 VibeVoice?

VibeVoice 是一种新颖的框架，旨在从文本生成具有表现力的、长篇的、多说话人对话音频，如播客。该框架解决了传统文本到语音（TTS）系统中的诸多挑战，特别是在可扩展性、说话人一致性以及自然的轮流对话方面。

VibeVoice 的核心创新在于采用连续语音分词器（声学分词器和语义分词器），其运行帧率低至每秒7.5帧。这些分词器在高效保持音频保真度的同时，显著提升了处理长序列的计算效率。VibeVoice 采用“下一个词扩散”框架，利用大型语言模型（LLM）理解文本上下文和对话流程，并通过扩散头生成高保真的音频细节。

该模型可合成长达90分钟、最多包含4个不同说话人的语音，超越了以往多数模型通常仅支持1到2个说话人的限制。

主要功能

✓文字转语音 ✓人工智能驱动的

🔄 替代方案

54 个选择

VoiceInk

VoiceInk

音频转写工具

★5

VoiceInk 利用本地人工智能模型，以近乎完美的准确度即时转录你所说的内容，并完全保障隐私。

付费 • 开源

xcribe

xcribe

音频转写工具

专为 macOS 设计的注重隐私的转录工具。免费使用。无广告、无追踪、无数据收集。

免费 • 专有

MacWhisper

MacWhisper

音频转写工具, 视频转录工具

★4.8

使用 OpenAI 最先进的语音转文字技术 Whisper，快速轻松地将音频文件转换为文字。无论您是在录制会议、讲座还是其他重要音频，MacWhisper 都能迅速且准确地将音频文件转换为文字。

免费增值 • 专有

Aqua Voice

Aqua Voice

音频转写工具

Aqua Voice 是一款语音驱动的文档编辑工具，您只需通过语音即可编辑文档。它不会记录您所说的话，而是根据您的意图进行写作。

免费增值 • 专有

Notes.ai

Notes.ai

音频转写工具, 视频转录工具

再也不要错过任何灵光一闪的点子：轻松将会议记录转录到 Notion 中。Notes.ai + Notion = 你的点子井然有序，你的生产力全面释放。

免费增值 • 专有

Dictanote

Dictanote

音频转写工具, 笔记工具

★3.5

在输入和语音之间切换，轻松记笔记，支持40种语言。实时转录可捕捉段落和表情符号，同时确保标点清晰。Pro版本提供云端存储以及多种笔记管理选项。

免费增值 • 专有

Whisper-Zero

Whisper-Zero

音频转写工具

对Whisper语音识别系统进行彻底重构，消除了幻觉现象，并显著提升了识别准确率。该系统基于超过150万小时的音频数据构建，包括电话通话和嘈杂环境下的语音数据。

免费增值 • 专有

Paraspeech

Paraspeech

音频转写工具

适用于 Mac 的快速、完全离线的语音转文字功能。

付费 • 专有

第 2 页，共 7 页

许可证免费 • 开源

支持平台

Python 自助式托管 Hugging Face

标签

人工智能模型

下载与相关链接

安全提示

⚠️

安全提醒

点击下方链接将跳转到第三方网站，请确保来源安全，建议优先从官方网站下载。