Real-Time AI Voice Chat
💻
Real-Time AI Voice Chat
软件描述
与AI进行自然的口语对话。
官方网站
访问软件的官方网站了解更多信息
github.com
安全链接HTTPS
什么是 Real-Time AI Voice Chat?
与AI进行自然流畅的语音对话! 本项目让你仅通过语音与大型语言模型(LLM)聊天,并实时接收语音回复。可将其视为你的专属数字对话伙伴。
背后原理: 一套为低延迟交互设计的复杂客户端-服务器系统:
采集:浏览器捕获你的语音。 传输:音频片段通过WebSocket快速传送到Python后端。 识别:RealtimeSTT迅速将语音转为文本。 思考:文本发送至LLM(如Ollama或OpenAI)进行处理。 合成:AI的文本回复通过RealtimeTTS转换回语音。 返回:生成的音频流式传回浏览器播放。 打断:随时插话!系统能优雅处理打断。
核心功能:
流畅对话:像真实聊天一样,边说边听。 实时反馈:即时查看部分识别文本和AI回复。 低延迟优化:采用音频分块流式传输的优化架构。 智能轮次切换:动态静音检测(turndetect.py)自适应对话节奏。 灵活AI引擎:支持可插拔的LLM后端(默认Ollama,OpenAI通过llm_module.py支持)。 可定制语音:可选不同文本转语音引擎(Kokoro、Coqui、Orpheus,通过audio_module.py配置)。 网页界面:使用原生JS与Web Audio API构建的简洁直观UI。 Docker化部署:推荐使用Docker Compose,便于管理依赖。
