- 地区
- 国内
- 定价
- 免费
- 是否开源
- 是
- GitHub Stars
- ★ 3.4k
- 收录来源
- GitHub
- 收录于
- 2026-06-11
- 最近确认可用
- 2026-06-11
详细介绍
py-xiaozhi 是一个基于 Python 异步架构的轻量级跨平台多模态 AI 交互框架。它支持实时语音流、视觉-语言任务和物联网设备控制。可以在 Windows、macOS、Linux 桌面以及 ARM 嵌入式平台(如 Raspberry Pi)上部署,无缝连接大型语言模型与物理硬件。该框架具备多种 UI 模式,包括 PySide6 + QML GUI、CLI 和 GPIO,适应桌面、无头服务器和嵌入式环境。此外,它还支持 WebSocket 和 MQTT 双协议通信,并具有插件系统,方便扩展。
核心功能
- ▪实时语音AI,低延迟
- ▪多模态视觉集成
- ▪MCP工具生态系统
- ▪跨平台部署
- ▪多种UI模式
- ▪离线唤醒词
适用场景
智能家居控制机器人控制多模态人机交互嵌入式AI应用
优点
- +低延迟实时语音处理
- +多模态支持
- +跨平台兼容性
- +丰富的插件系统
局限 / 注意
- -需要稳定的网络连接
- -学习成本较高
适合谁
开发者物联网工程师嵌入式系统工程师AI爱好者
以上介绍由 AI 基于公开资料整理,可能存在偏差,以官网为准。
常见问题
是否免费?
是,该项目是开源的,MIT 许可证。
支持中文吗?
支持,项目文档有简体中文版本。
能否商用?
可以,MIT 许可证允许商用。
需要联网吗?
部分功能需要稳定网络连接。
相似智能体
信息有误?欢迎在 关于页 联系我们更正。