Real-Time AI Voice Chat

软件描述

与AI进行自然的口语对话。

官方网站

访问软件的官方网站了解更多信息

官方认证

github.com

安全链接HTTPS

什么是 Real-Time AI Voice Chat?

与AI进行自然流畅的语音对话！本项目让你仅通过语音与大型语言模型（LLM）聊天，并实时接收语音回复。可将其视为你的专属数字对话伙伴。

背后原理：一套为低延迟交互设计的复杂客户端-服务器系统：

采集：浏览器捕获你的语音。传输：音频片段通过WebSocket快速传送到Python后端。识别：RealtimeSTT迅速将语音转为文本。思考：文本发送至LLM（如Ollama或OpenAI）进行处理。合成：AI的文本回复通过RealtimeTTS转换回语音。返回：生成的音频流式传回浏览器播放。打断：随时插话！系统能优雅处理打断。

核心功能：

流畅对话：像真实聊天一样，边说边听。实时反馈：即时查看部分识别文本和AI回复。低延迟优化：采用音频分块流式传输的优化架构。智能轮次切换：动态静音检测（turndetect.py）自适应对话节奏。灵活AI引擎：支持可插拔的LLM后端（默认Ollama，OpenAI通过llm_module.py支持）。可定制语音：可选不同文本转语音引擎（Kokoro、Coqui、Orpheus，通过audio_module.py配置）。网页界面：使用原生JS与Web Audio API构建的简洁直观UI。 Docker化部署：推荐使用Docker Compose，便于管理依赖。

主要功能

✓AI聊天机器人 ✓人工智能驱动 ✓语音转文字 ✓低延迟

雷思软件