by roam-bit
让 AI 主动记错题、自我迭代的协作机制 · A framework that makes your AI reflect on its own mistakes and stop repeating them
# Add to your Claude Code skills
git clone https://github.com/roam-bit/ai-collaboration-notebookGuides for using ai agents skills like ai-collaboration-notebook.
ai-collaboration-notebook is an open-source ai agents skill for AI coding assistants such as Claude Code, Codex CLI, and ChatGPT, built by roam-bit. 让 AI 主动记错题、自我迭代的协作机制 · A framework that makes your AI reflect on its own mistakes and stop repeating them. It has 98 GitHub stars.
ai-collaboration-notebook's catalog security scan is still queued. You can run an instant dependency and prompt-injection check now with the "Scan for vulnerabilities" button above.
Clone the repository with "git clone https://github.com/roam-bit/ai-collaboration-notebook" and add it to your Claude Code skills directory (see the Installation section above).
Yes. SkillsLLM lists many other AI Agents skills you can browse and compare side by side. Open the AI Agents category from the badge at the top of this page, or use the Related Skills and comparison links further down to weigh ai-collaboration-notebook against similar tools.
No comments yet. Be the first to share your thoughts!
Unlocks once the catalog security scan passes (runs nightly).
The deep catalog scan for this skill is still queued. Run an instant dependency check now instead.
跟 AI 协作久了你会发现:AI 经常犯同一种错,纠正成本极高,规则越列越多但 AI 选择性遵守。
这是一套已经跑了几个月的协作机制,核心思想:
把 AI 协作当工程问题做反馈循环,不当玄学碰运气。
它由三份文档组成——一份 协作协议(AI 该怎么和你配合)+ 一份 错题本(AI 犯错时主动记录、复发 3 次升级为新协议)+ 一份 CLAUDE.md(自动加载层,触发上面两份的读取)。
这个仓库的卖点是"机制自我迭代"——v2 就是迭代真实发生的证据:
完整故事见 CHANGELOG.md。
| 场景 | 你心里的 OS |
|---|---|
| AI 说"已修复 X"——你跑代码发现没修 | 它怎么又这样 |
| AI 信誓旦旦说"这个做不到"——你换个问法发现能做到 | 它在编造限制 |
| 同一个错改了 3 次还在犯 | 我是不是该换个工具 |
| 写了 5000 字 CLAUDE.md / .cursorrules,AI 第三轮就忘了 | 规则太多没用 |
| AI 不被你追问,就发现不了它说错了 | 这才是最可怕的 |
这套机制不能让 AI 不犯错,但能让重复同类错的概率降下来 + 纠正成本随时间下降。
跟 GitHub 上常见的 awesome-cursor-rules 类项目比,那些是列规则,这个是反馈循环机制:
┌──────────────────────────────────────────────┐
│ CLAUDE.md (自动加载层) │
│ 内嵌「核心卡」:30 秒自检 + 16 条规则速查 │
│ + 意图路由表(按任务类型决定深读什么) │
├──────────────────────────────────────────────┤
│ PROTOCOL.md (规则层) │
│ 16 条协作规则——按路由表对应规则按需深读 │
├──────────────────────────────────────────────┤
│ MISTAKE-LOG.md (观察层,v2 起内部分两档) │
│ 活跃层:根因索引 + 聚类视图(开工扫这个) │
│ 归档层:完整推理路径(复盘才读) │
│ ↑ AI 每次犯错主动追加 │
│ ↑ 同根因 ≥ 3 次 → 升级到规则层 │
│ ↓ 根因休眠 2 次回顾 → 规则退役降级 │
└──────────────────────────────────────────────┘
为什么需要三层:
不要一上来就写一堆规则。AI 每犯一个错你主动指出 + 让 AI 自己分析根因写进 MISTAKE-LOG.md。目标:攒 5-8 条错题,看 AI 经常犯哪几类错。
翻一遍错题本,找复发的根因。同一根因 ≥ 3 次 → 升级为 PROTOCOL.md 硬规则。目标:建立你自己的协作协议(5-10 条)。
每 2 周一次"错题本健康检查":同根因复发间隔是不是在拉长?🔴 占比有没有下降?过时规则要删掉。目标:把机制本身也当作可优化对象。
错题本里 11 个高代表性案例(脱敏后开源版):
| # | 标题 | 根因 |
|---|---|---|
| 1 | 把 OAuth 403 误判为"地区限制" | 推测当事实、证据缺口用猜测填空 |
| 2 | merge 提交信息夸大"人工核验通过" | 动作 ≠ 结果、能渲染 ≠ 已核验 |
| 3 | 把别的 AI 判定的"性格弱点"当事实写进档案 | 没追溯来源、推测当事实 |
| 4 | HTML 整合堆砌行业黑话,未配生活化比喻 | 读了规则没在每一步用 |
| 5 | 共享日志里别人做的事被当成自己功劳 | 跨实例协作的责任归属 |
| 6 | 过度防御"内容纪律",忽视"视觉品质" | 上次教训过度泛化 |
| 7 🆕 | 编造工具输出:把"我以为会发生"当成"已经发生" | 完成欲压过真实性——推测当事实的极端形态 |
| 8 🆕 | 听到持久偏好只口头答应,没落盘 | 口头确认 ≠ 持久化 |
| 9 🆕 | 验证只查"正面"漏查"反面"——留下鬼影 | 虚假确信:贴了证据没证到点子上 |
| 10 🆕 | 用肉眼数网格坐标,反复偏错 | 把不可靠输入当客观工具 |
| 11 🆕 | 3D 模型只验"出现"没验"完整"——规则 16 诞生 | 完工验证不彻底(第 5 次复发,触发升级) |
每条都包含:现象 → 真相 → 错误推理路径 → 思维根因 → 预防规则。
| 文件 | 用途 |
|---|---|
| README.md | 本文件 |
| PROTOCOL.md | AI 该怎么跟你配合——16 条协作规则 + 自动加载层核心卡 + HITL 工作流 |
| MISTAKE-LOG.md | AI 协作误判记录 + 思维根因分析 + 升级/退役机制 |
| CHANGELOG.md | v1 → v2 的进化记录——机制自我迭代的证据 |
| AGENTS.md | 单文件合并版,给 AI 直接读 |
❌ 不能让 AI 不犯错(即使升级硬规则后,本机制案例显示规则 7 对应根因仍累计复发 11 次——纯文字规则有上限) ❌ 不能全自动维护(需要你主动指出错误、让 AI 记录) ❌ 不能跨工具直接迁移(每个 AI 工具的"读规则"行为不一样,需要适配)
✅ 能显著降低同类错误反复出现的频率 ✅ 能让你的纠正成本随时间下降 ✅ 能让协作方法论变得可见、可分享、可迭代
欢迎:
唯一要求:新增的错题条目必须包含「思维根因」和「预防规则」两节——不要只发"AI 又错了"的吐槽。
作者是 AI 产品经理(独立做事),编程小白,每天用 Claude Code / Cursor 协作 8+ 小时。跑了几个月发现 AI 同一类错反复出现——于是开始记错题本。攒到 30+ 条后发现"事不过三"是个好阈值。
机制本身也在持续迭代——v1 发布两周后机制自己就长出了 5 条新规则和 3 个新机制,见 CHANGELOG。
MIT —— 随便用、随便改、欢迎在你的项目里挂出处。