AMAZINGINDEX.COM 每日 AI 简报
53.0
VOL. 2026.06
2026.06.08
← 返回 2026.06.08 日报
日报快照 · Daily Snapshot
NO. 008

Codex 自动生成 PPT 演讲备注

#REPO GitHub Search 2026.06.08
值得看指数 51.0 NO. 008 · 2026.06.08
Stars113创建4 天前Forks1Issues0

一个基于 Codex 的 Python 项目,能解析 PPT 中的图表、截图、SmartArt 等视觉元素并生成带证据引用的演讲备注,直接注入 PowerPoint 备注栏。解决现有工具只读文本框、遗漏视觉内容的痛点,适合需要频繁做学术或技术演讲的工程师。

Speaker is a Codex skill project for academic presentations: read real.pptx, combine text extraction, PPTX structure parsing, page-by-page rendering, OCR, and visual review to generate page-by-page speaker notes, and write a clean version of the lecture into the PowerPoint comment area.

Codex 自动生成 PPT 演讲备注

做技术演讲的人目前要么手写备注,要么用 Gamma、Tome 这类新工具重新做一套幻灯片,迁移成本很高。这个项目的聪明之处在于不替换 PowerPoint,而是作为 Codex skill 直接操作现有 PPT 文件,利用 vision-capable agent 做视觉审查,填补了传统 OCR 工具(如 PyMuPDF、pdfplumber)处理不了复杂幻灯片结构的空白。

它的真正价值在"grounded"这个设计:每句备注都绑定到具体可见元素,避免演讲时嘴上说"左上图"而观众找不到的尴尬。如果你还在用纯文本提取工具(如 python-pptx 的基础 API)处理带图表的幻灯片,这个方案值得作为参考实现。不过目前 stars 刚过百,生产环境的鲁棒性还需要实测,建议先拿自己过往的演讲 PPT 跑一遍看看幻觉率。

Star History
Experimental

Codex技能生态中首个专注学术演讲PPT视觉解析的垂直工具

独特价值:唯一支持图表/SmartArt/OCR视觉解析并注入演讲备注的Codex技能

竞品:
AgriciDaniel/claude-seo ★ 8.4k 通用SEO技能套件,非学术演讲场景,规模更大更成熟
oh-my-mermaid/oh-my-mermaid ★ 1.3k 代码架构图生成,同为视觉内容解析但面向代码而非PPT
AgriciDaniel/claude-blog ★ 1.0k 博客写作技能,内容生成方向不同,非演讲辅助
jeecgboot/skills ★ 162 低代码平台技能集,同为Codex技能但面向开发工具链
查看原文 →