Codex 自动生成 PPT 演讲备注
一个基于 Codex 的 Python 项目,能解析 PPT 中的图表、截图、SmartArt 等视觉元素并生成带证据引用的演讲备注,直接注入 PowerPoint 备注栏。解决现有工具只读文本框、遗漏视觉内容的痛点,适合需要频繁做学术或技术演讲的工程师。
Speaker is a Codex skill project for academic presentations: read real.pptx, combine text extraction, PPTX structure parsing, page-by-page rendering, OCR, and visual review to generate page-by-page speaker notes, and write a clean version of the lecture into the PowerPoint comment area.
做技术演讲的人目前要么手写备注,要么用 Gamma、Tome 这类新工具重新做一套幻灯片,迁移成本很高。这个项目的聪明之处在于不替换 PowerPoint,而是作为 Codex skill 直接操作现有 PPT 文件,利用 vision-capable agent 做视觉审查,填补了传统 OCR 工具(如 PyMuPDF、pdfplumber)处理不了复杂幻灯片结构的空白。
它的真正价值在"grounded"这个设计:每句备注都绑定到具体可见元素,避免演讲时嘴上说"左上图"而观众找不到的尴尬。如果你还在用纯文本提取工具(如 python-pptx 的基础 API)处理带图表的幻灯片,这个方案值得作为参考实现。不过目前 stars 刚过百,生产环境的鲁棒性还需要实测,建议先拿自己过往的演讲 PPT 跑一遍看看幻觉率。
Codex技能生态中首个专注学术演讲PPT视觉解析的垂直工具
独特价值:唯一支持图表/SmartArt/OCR视觉解析并注入演讲备注的Codex技能