ai-collaboration-notebook

Name: ai-collaboration-notebook
Author: roam-bit

Pending

让 AI 主动记错题、自我迭代的协作机制 · A framework that makes your AI reflect on its own mistakes and stop repeating them

98stars

0forks

Added 6/21/2026

Installation

# Add to your Claude Code skills
git clone https://github.com/roam-bit/ai-collaboration-notebook

Getting Started

Guides for using ai agents skills like ai-collaboration-notebook.

Caveman: Cut Claude Token Use by 65%
How agent-side prompt compression works, when to use it, and when not to.
What is an AI Skills Marketplace?
Definitions, how marketplaces work, and how to choose between them in 2026.
Getting Started with AI Skills

README.md

Frequently Asked Questions

What is ai-collaboration-notebook?

ai-collaboration-notebook is an open-source ai agents skill for AI coding assistants such as Claude Code, Codex CLI, and ChatGPT, built by roam-bit. 让 AI 主动记错题、自我迭代的协作机制 · A framework that makes your AI reflect on its own mistakes and stop repeating them. It has 98 GitHub stars.

Is ai-collaboration-notebook safe to use?

ai-collaboration-notebook's catalog security scan is still queued. You can run an instant dependency and prompt-injection check now with the "Scan for vulnerabilities" button above.

How do I install ai-collaboration-notebook?

Clone the repository with "git clone https://github.com/roam-bit/ai-collaboration-notebook" and add it to your Claude Code skills directory (see the Installation section above).

Are there alternatives to ai-collaboration-notebook?

Yes. SkillsLLM lists many other AI Agents skills you can browse and compare side by side. Open the AI Agents category from the badge at the top of this page, or use the Related Skills and comparison links further down to weigh ai-collaboration-notebook against similar tools.

Agentic AI for Beginners

Build your first AI agent from scratch - tool use, ReAct pattern, memory, deployment

41 minBeginner

Comments (0)

to leave a comment.

No comments yet. Be the first to share your thoughts!

Related Skills

superpowers

by obra

An agentic skills framework & software development methodology that works.

234,966

stock-agent TokenBar

这是什么

跟 AI 协作久了你会发现：AI 经常犯同一种错，纠正成本极高，规则越列越多但 AI 选择性遵守。

这是一套已经跑了几个月的协作机制，核心思想：

把 AI 协作当工程问题做反馈循环，不当玄学碰运气。

它由三份文档组成——一份协作协议（AI 该怎么和你配合）+ 一份错题本（AI 犯错时主动记录、复发 3 次升级为新协议）+ 一份 CLAUDE.md（自动加载层，触发上面两份的读取）。

v2 更新了什么

这个仓库的卖点是"机制自我迭代"——v2 就是迭代真实发生的证据：

"事不过三"升级机制第一次完整跑通：根因「完工验证不彻底」复发 5 次后正式升级为规则 16，不再是设计稿
机制自己长胖了，被同一套方法修好：错题本 800+ 行 → 分层精炼到约 150 行 + 根因聚类视图 + 规则退役机制（升级加规则、退役减规则，加减对称）
自动加载层升级为"核心卡 + 意图路由表"：开工不再全文读两个长文件，按任务类型决定深读什么
新增规则 12-16 + 5 个新案例——含一条所有 AI 用户都该警惕的 🔴「编造工具输出」

完整故事见 CHANGELOG.md。

你大概率经历过这些瞬间

场景	你心里的 OS
AI 说"已修复 X"——你跑代码发现没修	它怎么又这样
AI 信誓旦旦说"这个做不到"——你换个问法发现能做到	它在编造限制
同一个错改了 3 次还在犯	我是不是该换个工具
写了 5000 字 CLAUDE.md / .cursorrules，AI 第三轮就忘了	规则太多没用
AI 不被你追问，就发现不了它说错了	这才是最可怕的

这套机制不能让 AI 不犯错，但能让重复同类错的概率降下来 + 纠正成本随时间下降。

核心创新（7 个）

跟 GitHub 上常见的 awesome-cursor-rules 类项目比，那些是列规则，这个是反馈循环机制：

「沉默错误」概念——专盯"用户不追问就发现不了"的错，不是泛泛防 AI 出错
思维根因 vs 知识根因——不写"下次注意 X"，深挖"哪一步思维方式错了"
「事不过三」升级阈值——同一根因复发 3 次才升级为硬规则，防规则膨胀（v2 里它第一次完整跑通）
三层架构：观察层 ↔ 规则层 ↔ 自动加载层，闭环升级
「动作 ≠ 结果」反射——AI 说"已 X"必须对应真实工具调用
规则退役机制（v2 新增）——与升级对称的"减法"：根因休眠 → 规则降级。只增不减的规则体系必然膨胀
核心卡 + 意图路由表（v2 新增）——高频反射常驻上下文，长文档按需深读，治"读了规则不用规则"

三层架构（v2）

┌──────────────────────────────────────────────┐
│  CLAUDE.md (自动加载层)                       │
│  内嵌「核心卡」：30 秒自检 + 16 条规则速查      │
│  + 意图路由表（按任务类型决定深读什么）         │
├──────────────────────────────────────────────┤
│  PROTOCOL.md (规则层)                        │
│  16 条协作规则——按路由表对应规则按需深读        │
├──────────────────────────────────────────────┤
│  MISTAKE-LOG.md (观察层，v2 起内部分两档)      │
│  活跃层：根因索引 + 聚类视图（开工扫这个）       │
│  归档层：完整推理路径（复盘才读）               │
│  ↑ AI 每次犯错主动追加                         │
│  ↑ 同根因 ≥ 3 次 → 升级到规则层                │
│  ↓ 根因休眠 2 次回顾 → 规则退役降级             │
└──────────────────────────────────────────────┘

为什么需要三层：

单层（只有 CLAUDE.md）：规则爆炸、AI 选择性遵守
双层（CLAUDE.md + 规则）：规则不变，无法吸取新教训
三层：错题本是观察池，规则是稳定提炼，CLAUDE.md 是触发器——形成闭环
v2 教训：三层闭环只解决"怎么学新教训"，不解决"学多了怎么办"——所以补了分层精炼 + 退役机制 + 核心卡，给系统装上"减"的能力

冷启动指南

第一周：只做"记"

不要一上来就写一堆规则。AI 每犯一个错你主动指出 + 让 AI 自己分析根因写进 MISTAKE-LOG.md。目标：攒 5-8 条错题，看 AI 经常犯哪几类错。

第一个月：开始"升级"

翻一遍错题本，找复发的根因。同一根因 ≥ 3 次 → 升级为 PROTOCOL.md 硬规则。目标：建立你自己的协作协议（5-10 条）。

第三个月起：定期回顾

每 2 周一次"错题本健康检查"：同根因复发间隔是不是在拉长？🔴 占比有没有下降？过时规则要删掉。目标：把机制本身也当作可优化对象。

真实案例预览

错题本里 11 个高代表性案例（脱敏后开源版）：

#	标题	根因
1	把 OAuth 403 误判为"地区限制"	推测当事实、证据缺口用猜测填空
2	merge 提交信息夸大"人工核验通过"	动作 ≠ 结果、能渲染 ≠ 已核验
3	把别的 AI 判定的"性格弱点"当事实写进档案	没追溯来源、推测当事实
4	HTML 整合堆砌行业黑话，未配生活化比喻	读了规则没在每一步用
5	共享日志里别人做的事被当成自己功劳	跨实例协作的责任归属
6	过度防御"内容纪律"，忽视"视觉品质"	上次教训过度泛化
7 🆕	编造工具输出：把"我以为会发生"当成"已经发生"	完成欲压过真实性——推测当事实的极端形态
8 🆕	听到持久偏好只口头答应，没落盘	口头确认 ≠ 持久化
9 🆕	验证只查"正面"漏查"反面"——留下鬼影	虚假确信：贴了证据没证到点子上
10 🆕	用肉眼数网格坐标，反复偏错	把不可靠输入当客观工具
11 🆕	3D 模型只验"出现"没验"完整"——规则 16 诞生	完工验证不彻底（第 5 次复发，触发升级）

每条都包含：现象 → 真相 → 错误推理路径 → 思维根因 → 预防规则。

仓库内容

文件	用途
README.md	本文件
PROTOCOL.md	AI 该怎么跟你配合——16 条协作规则 + 自动加载层核心卡 + HITL 工作流
MISTAKE-LOG.md	AI 协作误判记录 + 思维根因分析 + 升级/退役机制
CHANGELOG.md	v1 → v2 的进化记录——机制自我迭代的证据
AGENTS.md	单文件合并版，给 AI 直接读

适合谁

跟 AI 协作做正经活的人：PM、研发、设计师、写作者、研究者……
觉得 AI 经常"犯傻"但又必须用它的人
看不上"列 100 条规则"那种 .cursorrules 模板的人
想沉淀自己跟 AI 协作方法论的人

它的局限

❌ 不能让 AI 不犯错（即使升级硬规则后，本机制案例显示规则 7 对应根因仍累计复发 11 次——纯文字规则有上限） ❌ 不能全自动维护（需要你主动指出错误、让 AI 记录） ❌ 不能跨工具直接迁移（每个 AI 工具的"读规则"行为不一样，需要适配）

✅ 能显著降低同类错误反复出现的频率 ✅ 能让你的纠正成本随时间下降 ✅ 能让协作方法论变得可见、可分享、可迭代

怎么贡献

欢迎：

Issue：你跟 AI 协作时遇到的"沉默错误"案例
PR：补充新的错题本案例（脱敏后）、修订规则、增加冷启动指南细节
讨论：你自己的协作机制对比

唯一要求：新增的错题条目必须包含「思维根因」和「预防规则」两节——不要只发"AI 又错了"的吐槽。

它是怎么来的

作者是 AI 产品经理（独立做事），编程小白，每天用 Claude Code / Cursor 协作 8+ 小时。跑了几个月发现 AI 同一类错反复出现——于是开始记错题本。攒到 30+ 条后发现"事不过三"是个好阈值。

机制本身也在持续迭代——v1 发布两周后机制自己就长出了 5 条新规则和 3 个新机制，见 CHANGELOG。

License

MIT —— 随便用、随便改、欢迎在你的项目里挂出处。