浏览话题 "tts" 下的 Claude Skill 项目。
百聆是一款类似GPT-4o的语音对话机器人,采用ASR(自动语音识别)+ LLM(大语言模型)+ TTS(语音合成)技术架构,集成了DeepSeek R1等优秀大模型,并接入openClaw功能,是一款真正的个人语音助手。其响应延迟低至800毫秒,即使在Mac等低配置设备上也能流畅运行,同时支持语音打断功能。
🚀 AI全自动化视频生成员工 | 你的首位AIGC同事。聊出创意,收获影片。🦞
面向编码代理的AI驱动视频播客创作技能。支持Bilibili和YouTube,多语言(中文简体/美式英语),6种TTS引擎(Edge/Azure/ElevenLabs/OpenAI/Doubao/CosyVoice),4K Remotion渲染。