p

py-xiaozhi

轻量级跨平台多模态AI交互框架,支持实时语音、视觉任务和物联网设备控制。

🇨🇳 国内免费开源通用智能体开源桌面操作多模态IoT支持
支持平台:桌面端开源自部署
地区
国内
定价
免费
是否开源
GitHub Stars
★ 3.4k
收录来源
GitHub
收录于
2026-06-11
最近确认可用
2026-06-11

详细介绍

py-xiaozhi 是一个基于 Python 异步架构的轻量级跨平台多模态 AI 交互框架。它支持实时语音流、视觉-语言任务和物联网设备控制。可以在 Windows、macOS、Linux 桌面以及 ARM 嵌入式平台(如 Raspberry Pi)上部署,无缝连接大型语言模型与物理硬件。该框架具备多种 UI 模式,包括 PySide6 + QML GUI、CLI 和 GPIO,适应桌面、无头服务器和嵌入式环境。此外,它还支持 WebSocket 和 MQTT 双协议通信,并具有插件系统,方便扩展。

核心功能

  • 实时语音AI,低延迟
  • 多模态视觉集成
  • MCP工具生态系统
  • 跨平台部署
  • 多种UI模式
  • 离线唤醒词

适用场景

智能家居控制机器人控制多模态人机交互嵌入式AI应用

优点

  • 低延迟实时语音处理
  • 多模态支持
  • 跨平台兼容性
  • 丰富的插件系统

局限 / 注意

  • 需要稳定的网络连接
  • 学习成本较高

适合谁

开发者物联网工程师嵌入式系统工程师AI爱好者

以上介绍由 AI 基于公开资料整理,可能存在偏差,以官网为准。

常见问题

是否免费?

是,该项目是开源的,MIT 许可证。

支持中文吗?

支持,项目文档有简体中文版本。

能否商用?

可以,MIT 许可证允许商用。

需要联网吗?

部分功能需要稳定网络连接。

相似智能体

信息有误?欢迎在 关于页 联系我们更正。