Codex 自动生成 PPT 演讲备注

#REPO GitHub Search 2026.06.08

值得看指数 51.0 NO. 008 · 2026.06.08

Stars113创建4 天前Forks1Issues0

为什么值得看

一个基于 Codex 的 Python 项目，能解析 PPT 中的图表、截图、SmartArt 等视觉元素并生成带证据引用的演讲备注，直接注入 PowerPoint 备注栏。解决现有工具只读文本框、遗漏视觉内容的痛点，适合需要频繁做学术或技术演讲的工程师。

Speaker is a Codex skill project for academic presentations: read real.pptx, combine text extraction, PPTX structure parsing, page-by-page rendering, OCR, and visual review to generate page-by-page speaker notes, and write a clean version of the lecture into the PowerPoint comment area.

媒体预览

编辑判断

做技术演讲的人目前要么手写备注，要么用 Gamma、Tome 这类新工具重新做一套幻灯片，迁移成本很高。这个项目的聪明之处在于不替换 PowerPoint，而是作为 Codex skill 直接操作现有 PPT 文件，利用 vision-capable agent 做视觉审查，填补了传统 OCR 工具（如 PyMuPDF、pdfplumber）处理不了复杂幻灯片结构的空白。

它的真正价值在"grounded"这个设计：每句备注都绑定到具体可见元素，避免演讲时嘴上说"左上图"而观众找不到的尴尬。如果你还在用纯文本提取工具（如 python-pptx 的基础 API）处理带图表的幻灯片，这个方案值得作为参考实现。不过目前 stars 刚过百，生产环境的鲁棒性还需要实测，建议先拿自己过往的演讲 PPT 跑一遍看看幻觉率。

Star History

生态分析

Experimental

Codex技能生态中首个专注学术演讲PPT视觉解析的垂直工具

独特价值：唯一支持图表/SmartArt/OCR视觉解析并注入演讲备注的Codex技能

竞品：

AgriciDaniel/claude-seo ★ 8.4k 通用SEO技能套件，非学术演讲场景，规模更大更成熟

oh-my-mermaid/oh-my-mermaid ★ 1.3k 代码架构图生成，同为视觉内容解析但面向代码而非PPT

AgriciDaniel/claude-blog ★ 1.0k 博客写作技能，内容生成方向不同，非演讲辅助

jeecgboot/skills ★ 162 低代码平台技能集，同为Codex技能但面向开发工具链

查看原文 →