Deep dive into Claude Code internals — architecture, agent loop, context engineering, and more. / 深入解析 Claude Code 源码:架构、Agent 循环、上下文工程、工具系统等
# Add to your Claude Code skills
git clone https://github.com/Windy3f3f3f3f/how-claude-code-works深入解读当前最成功的 AI 编程 Agent 的源码架构
🛠️ 想动手造一个? 配套项目 Claude Code From Scratch — 1300 行 TypeScript,8 章分步教程,从零构建你自己的 Claude Code
Claude Code 是目前使用最广泛的 AI 编程 Agent,也是我认为最好用的AI编程工具(我使用Claude Code已经一年了)。它能理解整个代码仓库、自主执行多步编程任务、安全地运行命令——而这一切背后是 50 万行 TypeScript 源码中沉淀的工程智慧。
Anthropic 开源(x)了这份源码。但 50 万行代码,从哪里开始读?
这也是我创建这个项目的初衷,我自己也遇到了没有办法阅读这么长的代码项目的问题,我的解决方案是和Claude Code一起读,让他给我写文档配合我读源代码。在此同时,我想把这个过程文档化,就形成了这个项目。
我和Claude Code加班从源码中提炼出 12 篇专题文档(共33.8w字符),覆盖了从核心循环到安全防护的每一个关键设计决策。不管你是想造自己的 AI Agent,还是想更深入地理解和使用 Claude Code,这里都是最短路径(应该?就算不是最短的,我也会不断更新这个项目)。
graph TB
User[用户输入] --> QE[QueryEngine 会话管理]
QE --> Query[query 主循环]
Query --> API[Claude API 调用]
API --> Parse{解析响应}
Parse -->|文本| Output[流式输出]
Parse -->|工具调用| Tools[工具执行引擎]
Tools --> ReadTool[读文件]
Tools --> EditTool[编辑文件]
Tools --> ShellTool[Shell 执行]
Tools --> SearchTool[搜索工具]
Tools --> MCPTool[MCP 工具]
Tools -->|结果回注| Query
Context[上下文工程] --> Query
Context --> SysPrompt[系统提示词]
Context --> GitStatus[Git 状态]
Context --> ClaudeMD[CLAUDE.md]
Context --> Compact[压缩流水线]
Perm[权限系统] --> Tools
Perm --> Rules[规则层]
Perm --> AST[Bash AST 分析]
Perm --> Confirm[用户确认]
No comments yet. Be the first to share your thoughts!
大多数 AI Agent 框架都是"demo 级别"——跑通一个场景就宣布成功。Claude Code 不同,它是一个日活百万级开发者实际使用的生产系统,需要处理的问题远比 demo 复杂:
rm -rf /,怎么拦住?(安全护栏很重要)这些问题的解法,就藏在源码里。
以下内容均来自对源码的实际分析,不是猜测。
它其实做了三件聪明的事:
普通程序遇到错误会报错给用户。Claude Code 的策略是:能恢复的错误,用户根本看不到。
比如对话太长超出了上下文窗口,它不会弹个错误框让你手动处理,而是悄悄压缩上下文、自动重试。token 输出达到上限?自动从 4K 升级到 64K 再重试。整个 Agent 循环有 7 种不同的"继续"策略,每种对应一种故障恢复路径。
这就是为什么用 Claude Code 的时候很少遇到报错——不是没有错误,而是大部分都被内部消化了。
这是整个系统中最精妙的设计之一。当上下文快要超限时,不是一刀切地压缩,而是分 4 个级别逐步处理:
每一级都可能释放足够的空间,让后面的级别不需要执行。而且压缩后系统会自动恢复最近编辑的 5 个文件内容,防止模型忘记刚刚在干什么。
Claude Code 让 AI 直接在你电脑上跑命令,安全设计必须过硬。它不是靠一个"你确定吗?"对话框,而是搭建了 5 层防御体系:
rm 加上 --dry-run)这五层任何一层拦住就不会执行,纵深防御。
所有工具——读文件、写文件、跑命令、搜索、甚至第三方 MCP 工具——都遵循同一套接口规范。这意味着:
Claude Code 支持三种多 Agent 模式:
为了防止多个 Agent 同时改同一个文件产生冲突,系统用 Git Worktree 给每个 Agent 一份独立的代码副本。
| # | 文档 | 你会了解到 | |---|------|-----------| | 1 | 概述 | 技术选型背后的思考(为什么 Bun/React/Zod)、6 条核心设计原则、9 阶段 235ms 启动流程、数据流全景 | | 2 | 系统主循环 | Agent 循环的双层架构、7 种 Continue Sites 故障恢复、工具预执行、StreamingToolExecutor 并发机制 | | 3 | 上下文工程 | 4 级压缩流水线完整细节、压缩后自动恢复机制(5 文件 + 技能重激活)、提示词缓存策略与缓存断裂检测 | | 4 | 工具系统 | 66 个工具的注册与并发控制、MCP 7 种传输详解、连接状态机、OAuth 2.0 + PKCE 认证流程 | | 5 | 代码编辑策略 | search-and-replace 为什么比整文件重写更好、唯一性约束与抗幻觉设计、编辑前强制读取的代码级实现 | | 6 | Hooks 与可扩展性 | 23+ Hook 事件全景、5 种 Hook 类型、6 阶段执行管道、PermissionRequest 4 种能力、信任模型与安全 | | 7 | 多 Agent 架构 | 子 Agent 4 种执行模式与 Worktree 隔离、协调器纯编排设计、Swarm 3 种执行后端与信箱通信 | | 8 | 记忆系统 | 4 种记忆类型与封闭分类法、Sonnet 语义召回与异步预取、后台记忆提取 Agent、记忆漂移防御、团队记忆 | | 9 | 技能系统 | 6 层技能来源与优先级、懒加载与 Token 预算分配、Inline/Fork 双执行模式、白名单权限模型、压缩后技能保留 | | 10 | 权限与安全 | 5 层纵深防御体系、tree-sitter AST 分析 + 23 项安全检查、竞速确认机制与 200ms 防误触 | | 11 | 用户体验设计 | 自研 Ink 渲染器架构、Yoga Flexbox 布局、虚拟滚动与对象池优化、Vim 模式 | | 12 | 最小必要组件 | 7 个最小必要组件框架、最小实现 vs 生产级实现的逐项对照、从 500 行到 50 万行的演进路线 |
| 你是 | 你能获得 | |------|---------| | 想做 AI Agent 产品的开发者 | 一个经过百万用户验证的架构参考,少走弯路 | | Claude Code 用户 | 理解它为什么这样工作,学会用 Hooks 和 CLAUDE.md 深度定制 | | 对 AI 安全感兴趣的人 | 生产级 AI 系统的安全设计实战,不是论文里的理论 | | 学生或 AI 研究者 | 大规模工程实践的第一手材料,比任何教科书都真实 |
| 指标 | 数值 | |------|------| | 源码总行数 | 512,000+ | | TypeScript 文件 | 1,884 | | 内置工具 | 66+ | | 压缩流水线级数 | 4 级 | | 权限防御层数 | 5 层 |
只有 10 分钟? → 读 快速入门
想自己造一个 AI Agent? → 先读 最小必要组件,然后跟着 claude-code-from-scratch 的 8 章教程动手实现——1300 行代码,每一步都对照源码讲解
想定制 Claude Code? → 读 Hooks 与可扩展性 + 记忆系统 + 技能系统
欢迎提 Issue 和 PR!如果你发现分析有误或有更好的理解角度,非常欢迎讨论。
感谢 LINUX DO 社区的支持与讨论。
| 日期 | 更新内容 | |------|---------| | 2026-04-01 | 拆分记忆与技能为独立章节(11→12 篇),按侧边栏分组重新编号 01-12 | | 2026-04-01 | 全部 12 章大幅扩充(篇幅翻倍),补充源码级实现细节、Mermaid 架构图、代码示例 | | 2026-04-01 | 同步更新 quick-start 总览页、README 文档目录描述,匹配各章节新增内容 | | 2026-03-31 | 新增 3 章:Hooks 与可扩展性、多 Agent 架构、记忆与技能系统 | | 2026-03-31 | 充实原有 8 章内容,补充启动流程、MCP 集成、压缩恢复机制等专题 | | 2026-03-31 | 上线 Docsify 文档站点,支持搜索、Mermaid 渲染、章节导航 | | 2026-03-31 | 初始发布:8 篇核心架构分析文档 |
MIT