浏览话题 "asr" 下的 Claude Skill 项目。
百聆是一款类似GPT-4o的语音对话机器人,采用ASR(自动语音识别)+ LLM(大语言模型)+ TTS(语音合成)技术架构,集成了DeepSeek R1等优秀大模型,并接入openClaw功能,是一款真正的个人语音助手。其响应延迟低至800毫秒,即使在Mac等低配置设备上也能流畅运行,同时支持语音打断功能。
系统音频捕获 + 多引擎语音识别 + 本地优先的AI审阅工作区。浮动实时字幕、12种语音识别后端、60+语言支持、AI摘要/聊天/思维导图、开放API、MCP服务器及Agent Skill。