by ningzimu
Codex skill for generating image-based PowerPoint decks with gpt-image-2
# Add to your Claude Code skills
git clone https://github.com/ningzimu/codex-ppt-skillGuides for using ai agents skills like codex-ppt-skill.
一个面向 Codex 的 PPT 生成 skill,也可在 Claude Code、OpenClaw、Hermes Agent 等支持 SKILL.md 的 agent 中使用;在这些非 Codex 环境中通常需要配置 gpt-image-2 或第三方 OpenAI 兼容格式的生图 API。它把文章、报告、论文、课程笔记等内容转换成“整页图片式”的演示文稿:先规划大纲和视觉风格,再生成每页幻灯片图片,最后用本地脚本组装为 .pptx。
gpt-image-2 生图模型slide_01.png、slide_02.png 等图片打包成 PowerPoint下面是一套技术分享 PPT 的生成效果示例。每页都是由 gpt-image-2 生成的完整 16:9 幻灯片图片,再由本地脚本组装为 PPTX。

下面是一套论文答辩风案例,来源于论文 Attention Is All You Need。它展示了如何在指定页中插入论文原始图片作为输入素材,例如模型架构图、attention 模块图和 attention 可视化图,并围绕这些图片生成统一风格的 PPT(见 Issue #14)。

No comments yet. Be the first to share your thoughts!
以下是已生成预览图的风格,示例图均由 gpt-image-2 生成,用于帮助用户在开始制作前选择视觉方向。
| 清爽专业风 | 创意杂志风 |
| --- | --- |
|
|
|
| 电子墨水杂志风 | 数据仪表盘风 |
|
|
|
| 复古扁平插画风 | 手绘技术解释风 |
|
|
|
| 手绘白板风 | 温暖手工风 |
|
|
|
| 科研答辩风 | |
|
| |
每个 PPT 会生成一个独立项目目录:
{基础目录}/{PPT名称}/
├── origin_image/
│ ├── slide_01.png
│ ├── slide_02.png
│ └── ...
├── outline.md
├── speech.md
└── {PPT名称}.pptx
origin_image/ 只放正式页图片,并按 slide_01.png、slide_02.png 这样的顺序命名。样张确认时也直接使用对应页的正式文件名;如果要保留废稿或对比图,放到项目根目录或单独的 drafts/ 目录,不要放进 origin_image/。
speech.md 会在组装时写入 PPT 的每页备注。建议使用 ## Slide 1: 标题、## Slide 2: 标题 这样的标题格式,脚本会按页码匹配。
推荐使用 skills CLI 安装到 Codex 的全局 skills 目录:
npx -y skills@latest add ningzimu/codex-ppt-skill \
--skill codex-ppt \
--agent codex \
--global
安装完成后,重启 Codex 让新 skill 生效。
如果你是在本地开发这个仓库,也可以把 skill 目录链接到 Codex skills 目录,方便实时调试修改:
mkdir -p ~/.codex/skills
ln -s /path/to/codex-ppt-skill/skills/codex-ppt ~/.codex/skills/codex-ppt
推荐通过 ClawHub 安装:
openclaw skills install codex-ppt
ClawHub 页面:clawhub.ai/ningzimu/codex-ppt
如果使用 OpenClaw 的 skill allowlist,需要把 codex-ppt 加入允许列表。
这些 agent 都可以读取 SKILL.md 形式的 skill。推荐同样使用 skills CLI 安装:
# Claude Code
npx -y skills@latest add ningzimu/codex-ppt-skill \
--skill codex-ppt \
--agent claude-code \
--global
# Hermes Agent
npx -y skills@latest add ningzimu/codex-ppt-skill \
--skill codex-ppt \
--agent hermes-agent \
--global
常见目标目录是:Claude Code 使用 ~/.claude/skills/codex-ppt,Hermes Agent 使用 ~/.hermes/skills/codex-ppt。
如果你是在本地开发这个仓库,也可以用软链接替代复制,方便实时调试修改。
只有在需要通过 API/CLI fallback 生图时,才需要配置生图模型。指定图片分辨率、提高质量或要求修改某一页,本身不会触发第三方 API 配置;如果 Codex 内置图片生成工具可用,会继续使用内置工具。典型需要配置的情况包括:
如果你是通过 GPT 会员订阅使用 Codex,并且 Codex 内置图片生成工具可用,则不需要配置 gpt-image-2 生图模型;这种情况下 Codex 已经内置了该图片生成能力。即使你在提示词里明确说“使用 gpt-image-2”,也应优先理解为使用 Codex 内置图片生成工具,而不是切换到本地 API/CLI fallback。
只有在已经明确选择 API/CLI fallback 时,agent 才应该检查 ~/.codex-ppt-skill/.env 并在缺少配置时报 OPENAI_API_KEY。不要在 Codex 内置图片生成工具可用时,因为用户提到 gpt-image-2 就要求配置 API key。base URL 只有使用第三方中转站时才需要配置,模型名缺省为 gpt-image-2,只有中转站要求自定义模型名时才需要修改。配置完成后 Codex、Claude Code、OpenClaw、Hermes Agent 会复用同一套配置。
手动排查时也可以直接运行配置命令:
python3 /path/to/codex-ppt-skill/skills/codex-ppt/scripts/codex_ppt_runtime.py config \
--api-key "your-api-key" \
--model gpt-image-2
其中 --api-key 是你的 API key;--model 是图片模型名,默认可使用 gpt-image-2。配置会写入 ~/.codex-ppt-skill/.env。不要把 API key 写进项目目录或提交到仓库。
如果使用第三方中转站,再加上 --base-url。如果中转站使用自定义模型名,就把 --model 改成中转站提供的名称:
python3 /path/to/codex-ppt-skill/skills/codex-ppt/scripts/codex_ppt_runtime.py config \
--api-key "your-api-key" \
--base-url "https://your-openai-compatible-endpoint/v1" \
--model openai/gpt-image-2
在 Codex、Claude Code、OpenClaw 或 Hermes Agent 中明确指定使用 codex-ppt skill,例如:
请使用 codex-ppt skill 把 /path/to/article.md 做成 10 页左右的 PPT。
skill 会按以下流程执行:
outline.md,并请求你确认页数、标题和每页要点speech.mdassemble_ppt.py 组装 .pptxMIT