Claude Skill
wwbin2017/bailing
百聆是一款开源的、类似GPT-4o的语音对话机器人,采用ASR+LLM+TTS技术栈。集成DeepSeek R1模型,接入openClaw,响应延迟低于800毫秒,支持Mac等低配设备运行和语音打断,是一个实用的个人语音助手。
概览
仓库信息
🚀 安装这个 Skill
openclaw install wwbin2017/bailing项目简介
百聆是一款类似GPT-4o的语音对话机器人,采用ASR(自动语音识别)+ LLM(大语言模型)+ TTS(语音合成)技术架构。它集成了DeepSeek R1等优秀大模型,并接入openClaw功能,是一款真正的个人语音助手。其响应延迟低至800毫秒,即使在Mac等低配置设备上也能流畅运行,同时支持语音打断功能。
百聆 是一个类似GPT-4o的语音对话机器人,通过ASR+LLM+TTS实现,集成DeepSeek R1等优秀大模型,接入openClaw,真正的个人语音助手,时延低至800ms,Mac等低配置也可运行,支持打断
要点
- ASR+LLM+TTS语音对话架构
- 集成DeepSeek R1等优秀模型
- 接入openClaw功能
- 响应延迟低至800毫秒
- 支持Mac等低配置设备运行
- 具备语音打断功能
使用场景
- 作为个人语音助手处理日常事务
- 开发低延迟的交互式语音应用
- 在资源受限设备上部署语音界面
- 进行ASR/LLM/TTS集成管道实验
- 通过openClaw实现语音控制自动化
- 提供易用的AI语音交互体验