by kellyvv
Mobile-native local AI Agent framework for phones and edge devices, with an iOS runtime, fully offline local path, on-device models, native iOS Skills, and optional Mac Gateway inference
# Add to your Claude Code skills
git clone https://github.com/kellyvv/PhoneClawLast scanned: 7/1/2026
{
"issues": [],
"status": "PASSED",
"scannedAt": "2026-07-01T08:12:32.166Z",
"npmAuditRan": true,
"pipAuditRan": true,
"promptInjectionRan": true
}PhoneClaw is an open-source ai agents skill for AI coding assistants such as Claude Code, Codex CLI, and ChatGPT, built by kellyvv. Mobile-native local AI Agent framework for phones and edge devices, with an iOS runtime, fully offline local path, on-device models, native iOS Skills, and optional Mac Gateway inference. It has 1,119 GitHub stars.
Yes. PhoneClaw passed SkillsLLM's automated security scan — a dependency vulnerability audit plus prompt-injection heuristics — with no high-severity issues. You can read the full report in the Security Report section on this page.
Clone the repository with "git clone https://github.com/kellyvv/PhoneClaw" and add it to your Claude Code skills directory (see the Installation section above).
PhoneClaw is primarily written in Swift. It is open-source under kellyvv on GitHub, so you can review or fork the full source.
Yes. SkillsLLM lists many other AI Agents skills you can browse and compare side by side. Open the AI Agents category from the badge at the top of this page, or use the Related Skills and comparison links further down to weigh PhoneClaw against similar tools.
No comments yet. Be the first to share your thoughts!

面向手机和端侧设备的完全离线优先 AI Agent 框架。
官网 · TestFlight · English · 报告问题 · 功能建议
核心能力 · 内置 Skill · 技术文章 · 快速开始 · Mac 远程 · 自定义 Skill · 常见问题 · 后续计划
PhoneClaw 是面向手机和端侧设备的移动端本地 AI Agent 框架。iOS runtime 内置 Gemma 4 E2B / E4B(LiteRT)和 MiniCPM-V 4.6 多个本地模型,支持完全离线的端侧推理和 Skill 调用,联网搜索、网页读取和 Mac 远程推理由用户显式触发。
PhoneClaw 是面向手机的移动端本地 AI Agent 框架,提供 iOS runtime,基于 Gemma 4 E2B / E4B(LiteRT)和 MiniCPM-V 4.6,在端侧完成推理和 iOS 原生 Skill 调用,支持完全离线使用。
在 PhoneClaw 的本地 runtime 中,聊天、图片和个人数据(日历、提醒事项、通讯录、剪贴板、健康数据)默认留在设备端处理。联网搜索、打开网页和 Mac 远程推理是显式触发能力;配对 Mac 时请求会发到你那台 Mac——选 Ollama 留在本机;选 CLI 或其它上游 provider,则以对应 provider 的数据策略为准。
用自然语言完成:日历(创建事件、查询日程、忙闲分析)、提醒事项、通讯录(查询、保存、更新、删除)、剪贴板、健康数据摘要(步数、距离、卡路里、心率、睡眠、运动)、图片理解、语音与 LIVE 实时对话、灵动岛 LiveLand、翻译,以及明确需要时的联网搜索。
PhoneClaw 是面向手机、移动端和端侧设备设计的 Agent 框架,围绕移动端的真实约束做了端侧优化:本地模型推理、移动端内存预算、模型下载与断点续传、Skill 路由、多轮工具调用、权限边界、Live / LiveLand 交互,以及可选的 Mac 局域网远程推理。它的核心价值是把本地模型、原生移动端能力和手机交互入口组织成一个移动端 Agent 运行时。
2026-06-23
2026-06-08
PhoneClawGateway.app,允许本地网络权限,再到 iPhone 的「Mac 远程推理」里配对;详细步骤见 使用 Mac 客户端远程推理2026-06-05
本地私人 Agent:在设备端完成推理和 Skill 调用。可用自然语言处理日历、提醒事项、通讯录、剪贴板、健康数据等本机任务。
Mac 远程推理:可选配对同一局域网内的 Mac,通过 PhoneClaw Gateway 使用 Mac 上的 Ollama、Codex CLI 或 Antigravity CLI 模型,让手机端保留原生体验,同时把重模型推理放到 Mac 上执行。
图片理解与 LIVE 视觉:拍照或从相册选图后直接提问,也可以在 LIVE 模式下开启摄像头,让模型实时理解当前画面。
个人数据分析:读取日程、健康数据、联系人、提醒事项等本机数据,生成摘要、忙闲分析和下一步建议。数据默认只在设备端处理。
实时信息获取:用户明确要求时,可联网搜索公开网页、读取网页正文,并把实时信息整理成可用回答。
语音交互:支持语音输入和 LIVE 实时对话,适合免打字的日常问答、记录和操作。
基于文件的 Skill 系统:每项能力对应一个 Markdown 文件(SKILL.md),新增或修改能力可通过 Skill 文件完成。Skill 描述语言通用,任何人都可以直接编写和分发。
模型管理与断点续传:Gemma 主模型和 LIVE 语音模型支持手机端下载、取消、继续下载和失败重试,也可以在构建时打包进 App。
完全离线优先与清晰数据流向:推理和本机 Skill 调用默认在设备端完成,聊天内容、图片和个人数据留在 iPhone。联网搜索、读取网页和 Mac 远程推理是用户显式触发的能力;Mac 远程推理会把本轮请求发送到你配对的 Mac,后续是否访问外部服务取决于 Mac 端所选 provider。
移动端内存优化:内置模型切换、System Prompt 编辑、缓存清理和历史裁剪,针对手机端本地推理的内存限制做了优化。
中英文双语体验:配置页可选择自动、中文或 English。切换语言会同步 UI、默认系统提示词、内置 Skill、工具结果和权限文案。
日历:用自然语言创建日历事件,支持指定标题、时间、地点。
"明天下午两点,在高科技园区约了个会,帮我加到日历"
"我今天有哪些日程?"
"帮我分析一下这周忙不忙"
提醒事项:创建定时提醒,到点弹出系统通知。
"提醒我今晚八点发给老板那份文件"
通讯录:查询、保存、更新或删除联系人,支持姓名、手机号、公司、邮箱、备注,按手机号自动去重。
"帮我存一下王总的电话 13812345678,字节跳动的"
"检查下联系人张晓霞的电话多少"
剪贴板:读写系统剪贴板,可作为多步任务的数据中转。
"把刚才那段文字复制到剪贴板"
翻译:任意语种互译,自动识别源语言。
"把刚才那段话翻译成日语"
健康数据:读取 HealthKit 步数、距离、卡路里、心率、睡眠、运动记录。用户授权后在本地处理。
"我今天走了多少步"
"昨晚睡了多久"
"本周步数怎么样"
"我的静息心率是多少"
联网搜索:用户明确要求时搜索公开网页或读取 URL,把实时信息整理成回答。
"联网搜索今天的 AI 新闻"
"读取这个网页并总结: https://example.com"
推荐安装方式:TestFlight。安装后在「模型设置」下载模型,再按需开启 Skill 权限。
源码构建环境要求:macOS + Xcode 16,iOS 17+,CocoaPods,真机 + Apple ID
| 模型 | 适用场景 |
|---|---|
| Gemma 4 E2B | 轻量款,聊天 / 翻译 / 单轮查询,A16 及以上 |
| Gemma 4 E4B | 完整款,多轮工具对话 + 复杂 agent 能力,建议 iPhone 15 Pro 及以上 |
| MiniCPM-V 4.6 | 多模态款,图片问答 / LIVE 摄像头实时识别,建议 A17 Pro 及以上 |
git clone https://github.com/kellyvv/phoneclaw.git
cd phoneclaw
pod install
方案 A(推荐)— 空壳安装,手机端下载
直接用 Xcode 把 App 安装到手机,打开后进入「模型设置」,在手机上直接下载 E2B 或 E4B。默认工程把 Models/ 文件留在包外,安装包更小,安装更快。
方案 B — 打包 E2B 进 App
Gemma 4 现在用 LiteRT-LM 推理,模型是单个 .litertlm 文件(不再是 MLX 权重目录)。
Models/(推荐用 Hugging Face CLI):brew install hf
mkdir -p ./Models
hf download litert-community/gemma-4-E2B-it-litert-lm gemma-4-E2B-it.litertlm --local-dir ./Models
Models/gemma-4-E2B-it.litertlm 拖进工程,确认它作为单个文件资源出现在 Build Phases > Copy Bundle ResourcesLLM/Models/PredefinedModels.swift 里的 allModels,只保留要分发的模型E2B 约 2.4 GB,E4B 约 3.4 GB。国内用户可设
HF_ENDPOINT=https://hf-mirror.com加速,或从 ModelScope 镜像下载同名文件。Models/已列入.gitignore,模型文件保留在本地。
方案 C — 同时打包 E2B + E4B
下载两个模型文件:
brew install hf
mkdir -p ./Models
hf download litert-community/gemma-4-E2B-it-litert-lm gemma-4-E2B-it.litertlm --local-dir ./Models
hf download litert-community/gemma-4-E4B-it-litert-lm gemma-4-E4B-it.litertlm --local-dir ./Models
然后把 gemma-4-E2B-it.litertlm 和 gemma-4-E4B-it.litertlm 两个文件都加入 Xcode 的 Copy Bundle Resources。
LIVE 模式(语音交互)额外模型
如果你需要使用 LIVE 模式的语音识别和语音合成,需要额外下载 ASR 和 TTS 模型:
# ASR — 中文流式语音识别 (zipformer, int8, ~160MB)
hf download csukuangfj/sherpa-onnx-streaming-zipformer-zh-int8-2025-06-30 \
--local-dir ./Models/sherpa-asr-zh \
--exclude "test_wavs/*" "*.md" ".gitattributes"
# TTS — 中文语音合成 (keqing, ~125MB)
hf download csukuangfj/vits-zh-hf-keqing \
--local-dir ./Models/vits-zh-hf-keqing \
--exclude "*.py" "*.sh" ".gitattributes"
下载后在 Xcode 中将 Models/sherpa-asr-zh 和 Models/vits-zh-hf-keqing 以 folder reference 方式添加到 Copy Bundle Resources。不下载也不影响编译和基础聊天功能,LIVE 模式会自动 fallback 到系统语音。
open PhoneClaw.xcworkspace
请始终打开
.xcworkspace,不要打开.xcodeproj
首次安装后如系统提示信任证书:设置 → 通用 → VPN 与设备管理 → 信任
提醒我今晚八点发文件
帮我存一下王总的电话 13812345678
把刚才那段话翻译成英文
Mac 客户端用于把同一局域网内的 Mac 作为 iPhone 的远程推理源。手机端仍然使用 PhoneClaw 的聊天界面和 Skill 系统,模型推理请求会发到你配对的 Mac