by opencroc
AI Agent OS with visible workflow, real execution, and a 3D office shell. From one sentence to full task lifecycle — plan, run, review, replay.
# Add to your Claude Code skills
git clone https://github.com/opencroc/cube-pets-officeCube Pets Office 不是一个“多智能体聊天演示页”,而是一个把任务生命周期完整收口到统一界面的 AI Agent 操作系统:
你看到的不只是最终答案,还包括任务怎么被规划、谁在执行、卡在什么地方、系统到底做了什么。
从产品体验上看,Cube Pets Office 正在收敛成一条更清晰的主线:
/ 是默认任务入口,承接发起、澄清、执行追踪和控制/tasks/:taskId 保留为全屏工作台与深链详情页/replay/:missionId 承接任务完成后的回放与证据复盘当前桌面端已经把办公室主壳、任务队列、Scene3D、右侧上下文区、统一发起入口和任务操作区收口到同一屏里,方向上更接近“任务操作系统”,而不是“多页面功能集合”。
下面这张图更适合作为产品蓝图来理解 Cube Pets Office 的整体分层:客户端入口、应用服务层、执行层、数据层、外部能力和部署建议一眼能串起来。
这张图表达的是产品与平台蓝图。当前仓库里已经落地的核心实现可以概括为:
services/lobster-executor,支持 mock、native、real 三种执行模式如果你想看“当前运行时到底怎么落地”,再往下直接看运行模式和补充文档即可。
以一句话任务为例:
制定本季度用户增长策略,并给出可执行分工和落地节奏
系统的主路径大致会经过这些阶段:
| 阶段 | 系统动作 | 你能看到什么 |
| --- | --- | --- |
| 发起 | 接收自然语言任务,创建 mission | 首页右侧发起区、任务队列出现新任务 |
| 计划 | 生成 plan / step / breakdown | 首页中间主线区显示阶段与摘要 |
| 执行 | Worker / executor 开始实际运行 | 日志流、运行状态、当前步骤更新 |
| 决策 | 需要澄清、批准、修改时暂停等待 | 控制区出现 decision / clarification |
| 结果 | 生成产物、截图、报告、输出物 | Artifacts 与结果摘要可查看 |
| 复盘 | 通过回放或详情页追踪全过程 | 与 |
No comments yet. Be the first to share your thoughts!
/tasks/:taskId/replay/:missionId这也是整个项目的关键区别:任务不是停在“模型回复”,而是进入“规划、执行、反馈、收尾”的完整闭环。
Cube Pets Office 当前支持三种执行模式:
| 模式 | 适合场景 | 说明 |
| --- | --- | --- |
| frontend | 在线演示、纯体验 | 浏览器内运行,不依赖本地 Docker |
| native | 本地开发、无 Docker 环境 | 本机进程执行,保留较真实的执行链路 |
| real | 完整开发与验证 | 通过 Docker 容器执行真实任务 |
当前默认策略:
realnative补充文档:
不需要 API Key,直接启动前端:
npm install
npm run dev:frontend
适合先看 3D 办公室、任务壳、演示数据与交互流程。
接入模型、服务端和执行器:
cp .env.example .env
npm run dev:all
最小 .env 参考:
LLM_API_KEY=你的密钥
LLM_BASE_URL=https://api.openai.com/v1
LLM_MODEL=gpt-5.4
LLM_WIRE_API=responses
适合调试执行链路:
# 终端 1
npm run dev:server
# 终端 2
npm run dev:frontend
# 终端 3
LOBSTER_EXECUTION_MODE=mock npx tsx services/lobster-executor/src/index.ts
其他执行模式:
LOBSTER_EXECUTION_MODE=native npx tsx services/lobster-executor/src/index.ts
LOBSTER_EXECUTION_MODE=real npx tsx services/lobster-executor/src/index.ts
PowerShell 下可先执行:
$env:LOBSTER_EXECUTION_MODE='mock'
cube-pets-office/
├── client/ # 前端应用:办公室主壳、任务页、回放、3D 场景
├── server/ # 服务端:任务状态、工作流、接口、回放、审计
├── shared/ # 前后端共享契约与类型
├── services/lobster-executor/ # 执行器:mock / native / real
├── docs/ # 架构图、契约与说明文档
├── data/ # 本地数据、回放、测试数据
├── scripts/ # 本地开发与构建脚本
└── .kiro/ # specs、steering、执行计划
如果你想直接从关键实现开始看,建议先看这些文件:
当前仓库已经具备这些核心能力:
mock / native / real 三种执行模式近期重点则集中在这几条主线:
更细的执行计划与规格文档见:
npm run dev:frontend # 只启动前端
npm run dev:server # 只启动服务端
npm run dev:all # 启动前端 + 服务端 + 执行器
npm run dev:stop # 停止本地开发进程
npm run build # 构建前端 + 服务端
npm run build:pages # 构建 GitHub Pages 产物
npm run preview # 本地预览前端构建结果
npm run check # TypeScript 类型检查
npm run test:client # 前端测试
npm run test:server # 服务端测试
npm run test:executor # 执行器测试
npm run test:release # 发布前总检查
| 层 | 技术 | | --- | --- | | 前端 | React 19、Vite、TypeScript、Zustand、Three.js、shadcn/ui | | 服务端 | Node.js、Express、Socket.IO、TypeScript | | 执行器 | Lobster Executor、Docker、Node.js | | 测试 | Vitest、fast-check | | 存储 | IndexedDB、本地 JSON,以及逐步扩展的数据能力 | | AI 接入 | OpenAI-compatible API、可扩展模型提供商 |
欢迎 PR。
提交前建议至少运行:
npm run check
如果当前分支存在进行中的类型基线问题,请尽量保证不新增错误,并在提交说明中标明影响范围。
MIT