Back to catalogPending
py-xiaozhi
A Python-based Xiaozhi AI for users who want the full Xiaozhi experience without owning specialized hardware.
3,159stars
656forks
Python
Added 12/27/2025
MCP Serversesp32esp32-s3mcpmcp-serverpythonxiaozhi-esp32
Installation
# Add to your Claude Code skills
git clone https://github.com/huangjunsen0406/py-xiaozhi<p align="center" class="trendshift">
<a href="https://trendshift.io/repositories/14130" target="_blank">
<img src="https://trendshift.io/api/badge/repositories/14130" alt="Trendshift" style="width: 250px; height: 55px;" width="250" height="55"/>
</a>
</p>
<p align="center">
<a href="https://github.com/huangjunsen0406/py-xiaozhi/releases/latest">
<img src="https://img.shields.io/github/v/release/huangjunsen0406/py-xiaozhi?style=flat-square&logo=github&color=blue" alt="Release"/>
</a>
<a href="https://opensource.org/licenses/MIT">
<img src="https://img.shields.io/badge/License-MIT-green.svg?style=flat-square" alt="License: MIT"/>
</a>
<a href="https://github.com/huangjunsen0406/py-xiaozhi/stargazers">
<img src="https://img.shields.io/github/stars/huangjunsen0406/py-xiaozhi?style=flat-square&logo=github" alt="Stars"/>
</a>
<a href="https://github.com/huangjunsen0406/py-xiaozhi/releases/latest">
<img src="https://img.shields.io/github/downloads/huangjunsen0406/py-xiaozhi/total?style=flat-square&logo=github&color=52c41a1&maxAge=86400" alt="Download"/>
</a>
<a href="https://gitee.com/huang-jun-sen/py-xiaozhi">
<img src="https://img.shields.io/badge/Gitee-FF5722?style=flat-square&logo=gitee" alt="Gitee"/>
</a>
<a href="https://huangjunsen0406.github.io/py-xiaozhi/guide/00_%E6%96%87%E6%A1%A3%E7%9B%AE%E5%BD%95.html">
<img alt="使用文档" src="https://img.shields.io/badge/使用文档-点击查看-blue?labelColor=2d2d2d" />
</a>
</p>
简体中文 | English
项目简介
py-xiaozhi 是一个使用 Python 实现的小智语音客户端,旨在通过代码学习和在没有硬件条件下体验 AI 小智的语音功能。 本仓库是基于xiaozhi-esp32移植
演示

功能特点
🎯 核心AI功能
- AI语音交互:支持语音输入与识别,实现智能人机交互,提供自然流畅的对话体验
- 视觉多模态:支持图像识别和处理,提供多模态交互能力,理解图像内容
- 智能唤醒:支持多种唤醒词激活交互,免去手动操作的烦恼(可配置开启)
- 自动对话模式:实现连续对话体验,提升用户交互流畅度
🔧 MCP工具生态系统
- 系统控制工具:系统状态监控、应用程序管理、音量控制、设备管理等
- 日程管理工具:全功能日程管理,支持创建、查询、更新、删除事件,智能分类和提醒
- 定时任务工具:倒计时器功能,支持延时执行MCP工具,多任务并行管理
- 音乐播放工具:在线音乐搜索播放,支持播放控制、歌词显示、本地缓存管理
- 12306查询工具:12306铁路票务查询,支持车票查询、中转查询、列车路线查询
- 搜索工具:网络搜索和网页内容获取,支持必应搜索和智能内容解析
- 菜谱工具:丰富菜谱库,支持菜谱搜索、分类查询、智能推荐
- 地图工具:高德地图服务,支持地理编码、路径规划、周边搜索、天气查询
- 八字命理工具:传统八字命理分析,支持八字计算、婚姻分析、黄历查询
- 摄像头工具:图像捕获和AI分析,支持拍照识别和智能问答
🏠 IoT设备集成
- 设备管理架构:基于Thing模式的统一设备管理,支持属性和方法的异步调用
- 智能家居控制:支持灯光、音量、温度传感器等设备控制
- 状态同步机制:实时状态监控,支持增量更新和并发状态获取
- 可扩展设计:模块化设备驱动,易于添加新设备类型
🎵 高级音频处理
- 多级音频处理:支持Opus编解码、实时重采样
- 语音活动检测:VAD检测器实现智能打断,支持语音活动实时监控
- 唤醒词检测:基于Sherpa-ONNX的离线语音识别,支持多唤醒词和拼音匹配
- 音频流管理:独立输入输出流,支持流重建和错误恢复
- 音频回声消除:集成WebRTC音频处理模块,提供高质量的回声消除功能
- 系统音频录制:支持系统音频录制,实现音频环回处理
🖥️ 用户界面
- 图形化界面:基于PyQt5的现代GUI,支持小智表情与文本显示,增强视觉体验
- 命令行模式:支持CLI运行,适用于嵌入式设备或无GUI环境
- 系统托盘:后台运行支持,集成系统托盘功能
- 全局快捷键:支持全局快捷键操作,提升使用便捷性
- 设置界面:完整的设置管理界面,支持配置自定义
🔒 安全与稳定
- 加密音频传输:支持WSS协议,保障音频数据的安...