by bilibili
Multi-Agent 的视频制作助手,基于 OpenCode AI SDK 和 Remotion 构建。
# Add to your Claude Code skills
git clone https://github.com/bilibili/carocutLast scanned: 6/5/2026
{
"issues": [
{
"type": "npm-audit",
"message": "next: Next.js: HTTP request smuggling in rewrites",
"severity": "high"
},
{
"type": "npm-audit",
"message": "postcss: PostCSS has XSS via Unescaped </style> in its CSS Stringify Output",
"severity": "medium"
}
],
"status": "WARNING",
"scannedAt": "2026-06-05T08:08:49.927Z",
"npmAuditRan": true,
"pipAuditRan": false
}No comments yet. Be the first to share your thoughts!
AI 驱动的视频制作工作流系统,基于 OpenCode AI SDK 和 Remotion 构建。
CaroCut 是端到端的自动化视频生产平台。通过多 Agent 协作(orchestrator + planner/media/builder/reviewer),将原始素材(PDF、图片、文本)转化为专业视频。

核心特性:
progress.yaml 状态持久化,支持中断恢复和增量修改案例:
┌─────────┐
│ User │
└────┬────┘
│ request / confirm
▼
┌───────────────────┐
│ Orchestrator │
│ │
│ · 读取进度状态 │
│ · 调度 subagent │
│ · 验证产出物 │
│ · 更新 progress │
└──┬────┬────┬───┬──┘
│ │ │ │
dispatch │ │ │ │ callback
┌───────────────┘ │ │ └───────────────┐
│ ┌──────────┘ └──────────┐ │
▼ ▼ ▼ ▼
┌─────────┐ ┌─────────┐ ┌─────────┐ ┌──────────┐
│ Planner │ │ Media │ │ Builder │ │ Reviewer │
│ │ │ │ │ │ │ │
│ step 1 │ │ step 3 │ │ step 6 │ │ step 8 │
│ step 2 │ │ step 4 │ │ step 7 │ │ │
│ │ │ step 5 │ │ │ │ │
└─────────┘ └─────────┘ └─────────┘ └──────────┘
╔═══════════╗ ╔═══════════╗ ╔════════════════╗ ╔══════════╗
║ Planning ║ ║Enhancement║ ║Implementation ║ ║ Delivery ║
╚═══════════╝ ╚═══════════╝ ╚════════════════╝ ╚══════════╝
──────────────────── 数据流向 ────────────────────
Planner ──manifests/──▶ Media ──raws/──▶ Builder ──project/──▶ Reviewer
↑ │
│ revision_request │
└──────────── Orchestrator ◀───────────────┘
git clone <repository-url>
cd carocut/
cp .env_example .env # 配置 API 密钥
# Python 环境(使用 uv 管理)
uv venv
source .venv/bin/activate # macOS/Linux
uv pip install -r requirements.txt
# Node.js 依赖
pnpm install
# OpenCode 配置
cp opencode-template.json opencode.json # 编辑配置 API 密钥和模型
# Bootstrap:全局环境初始化(首次运行)
python .opencode/scripts/bootstrap.py
Bootstrap 会执行:
启动需要两个终端(重要:在 venv 下执行):
# 激活虚拟环境(如未激活)
source .venv/bin/activate # macOS/Linux
# 终端 1:启动 OpenCode 后端(启用 Web 搜索)
OPENCODE_ENABLE_EXA=1 opencode serve --port 4096 --cors http://localhost:3000 --print-logs
# 终端 2:启动前端
pnpm dev # 访问 http://localhost:3000
或者:使用 sh start.sh 快速启动前端 + opencode,
在 OpenCode 界面输入 /carocut,系统自动执行完整视频制作流水线。
用户输入素材 → Orchestrator → Planner / Media / Builder / Reviewer → 最终视频
| 阶段 | 步骤 | Agent | 描述 | |------|------|-------|------| | Planning | step-1, 2 | planner | 素材分析、制作策划 | | Enhancement | step-3, 4, 5 | media | 脚本润色、视觉素材、音频素材 | | Implementation | step-6, 7 | builder | 资产管道、组件实现 | | Delivery | step-8 | reviewer | 预览审查、最终渲染 |
carocut/
├── app/ # Next.js 应用(页面 + API 路由)
├── components/ # React 组件
├── lib/ # 工具函数(studio-manager 等)
├── .opencode/
│ ├── agents/ # 5 个 Agent 定义
│ ├── commands/ # /carocut 命令
│ └── skills/ # 12 个 Skill 定义
├── raws/ # 原始素材(images/ + audio/)
├── workspaces/ # 运行时工作空间
├── server.ts # Next.js + Remotion Studio 代理服务器
├── opencode-template.json # OpenCode 配置模板
└── requirements.txt # Python 依赖
MIT License。详见 LICENSE。
Remotion 许可证:Remotion 为源码可见项目,个人/非营利/≤3 人公司免费,超 3 人公司商用需购买 Remotion License。详见 THIRD-PARTY-NOTICES。
Remotion · OpenCode SDK · Pexels · Pixabay · Freesound