GordenSuperPPTSkills: AI PPT赛道终结者,用GPT生成豪华图片PPT并转为可编辑PPTX

GordenSuperPPTSkills 是一套专为 Codex 设计的 AI PPT 技能包,利用 GPT 生成豪华图片格式 PPT,再将其精准还原为完全可编辑的 PPTX 文件。

GordenSuperPPTSkills: AI PPT赛道终结者,用GPT生成豪华图片PPT并转为可编辑PPTX

为什么你需要这个技能?

传统的 AI 生成 PPT 工具往往只能输出简单的文本大纲或模板填充,效果平平。而 GordenSuperPPTSkills 另辟蹊径:先用 GPT 生成视觉上极其豪华的图片格式 PPT,再通过视觉解析将其还原为完全可编辑的 PPTX 文件。这意味着你可以得到既美观又灵活、可以二次修改的演示文稿。

这套技能包专为 Codex 设计,充分利用了 GPT 的图像生成能力和视觉理解能力。如果你经常需要制作高信息密度、排版复杂的 PPT,或者希望将已有的图片 PPT 转换为可编辑格式,这个技能包将大幅提升你的效率。

技能包组成

GordenSuperPPTSkills 拆分为三个独立技能,可以按需单独使用或串联执行:

技能 作用 输入 → 输出
GordenImagePPTGen 生成「图片格式的 PPT」 主题/内容 → 每页 .png + 图片型 .pptx
GordenImage2PPTX 把「图片 PPT / 图片」还原成可编辑 pptx 图片 → 可编辑 .pptx(背景+骨架+图标+文本 四层)
GordenSuperPPTSkill 打包编排前两者,依次执行 主题/内容 → 图片型 PPT + 可编辑 pptx

这种模块化设计让你可以灵活组合:

  • 只做图片版 PPT → 使用 GordenImagePPTGen
  • 只把图片转可编辑 → 使用 GordenImage2PPTX
  • 一键“先出图再转可编辑” → 使用 GordenSuperPPTSkill(A→B 串联)

效果展示

1. GordenImagePPTGen 生成的图片格式 PPT

GordenImagePPTGen 示例

2. GordenImage2PPTX 转换后的可编辑 PPTX

GordenImage2PPTX 示例

如何使用

仅限 Codex 使用。

第1步:安装技能

将 GitHub 仓库地址发给 Codex,让它安装技能。也可以手动复制技能目录:

# Codex(按需选装其一/全部)
cp -R GordenImagePPTGen "${CODEX_HOME:-$HOME/.codex}/skills/GordenImagePPTGen"
cp -R GordenImage2PPTX "${CODEX_HOME:-$HOME/.codex}/skills/GordenImage2PPTX"
cp -R GordenSuperPPTSkill "${CODEX_HOME:-$HOME/.codex}/skills/GordenSuperPPTSkill"

GordenSuperPPTSkill 依赖另外两个技能,请与它们一起安装。最省事的方式是把整个仓库复制过去。

第2步:按需使用

推荐使用 GPT 5.5 模型,推理强度选“中”即可。

如果只生成图片格式 PPT:

使用GordenImagePPTGen技能,生成一个N页的PPT,内容为XXX,要求PPT要求豪华、信息密度高、排版复杂

如果只想把图片 PPT 转换成可编辑的 PPTX 文件:

把当前文件夹里的XXX.png,使用GordenImage2PPTX,还原成可编辑的PPT,必须严格遵循技能步骤

依赖安装

pip3 install python-pptx pillow numpy

图像生成后端按运行时自动解析(Codex 用内置 imagegen),详见各技能 references/runtime-notes.md

原理讲解

核心使用的是 GPT 的生图能力和视觉解析能力。大致步骤是:

  1. 生成图片 PPT:根据主题和内容,GPT 生成每页的 .png 图片,并打包成图片型 .pptx。
  2. 提取元素:依次提取 PPT 图片的:
    • 背景图:整体背景
    • 框架图:布局骨架
    • 图标和装饰图:视觉元素
    • 文本:文字内容
  3. 拼装还原:在 PPT 里按坐标将上述四层拼装起来,生成完全可编辑的 PPTX 文件。

为了实现完美的效果,作者做了很多细节验证和约束规则。使用过程中,你能看到 GPT 生成的过程图片。

背景图

背景图

框架图

框架图

图标和装饰

图标和装饰

注意事项

  • 本技能仅适用于 Codex,因为必须使用 GPT 生成图片和 GPT 的视觉能力。理论上 Opus + GPT 生图接口也可以实现,但本技能没有做专门的适配。
  • 图片转可编辑 PPTX 文件比较费额度,转换1张图片大概耗费 Plus 订阅5小时额度的10%。
  • 框架图默认是整体的一张图,也支持拆分成一个个独立的框架模块图,在提示词里明确告诉 Codex 即可。

目录结构

GordenSuperPPTSkills/
├── README.md               ← 本文件(总入口)
├── GordenImagePPTGen/      ← 功能A:出图片 PPT(自带 scripts/ references/ 参考图/)
├── GordenImage2PPTX/       ← 功能B:图片→可编辑 pptx(自带 scripts/ references/)
└── GordenSuperPPTSkill/    ← 编排 A→B(自带 references/,调用上面两个技能)

每个技能目录均自包含。把整个 GordenSuperPPTSkills/ 复制到目标 Agent 的 skills 目录即可使用。

致谢与版权

  • 可以商用,必须标明 GitHub 出处,或标记出作者 @Gorden Sun。
  • 如果你想加入 PPT Skill 交流群,可以加微信 duge360
  • 感谢 LinuxDO 社区的支持。

Source

GordenSun/GordenSuperPPTSkills: AI PPT赛道终结者,史上最最最强 PPT Skill!!! 使用GPT生成豪华的图片格式PPT,然后转换为完全可编辑的PPTX文件。