多智能体自动生成可编辑科研图表

#HF_PAPERS HuggingFace Papers 2026.06.03

推荐指数 67.0 NO. 023 · 2026.06.03

upvotes106comments1

为什么值得看

Crafter 用多智能体协作框架，支持从文本、草图、数据表等多种输入生成可编辑的科研图表，覆盖流程图、统计图、概念图等多种类型。对需要频繁制作论文插图的研究者和 AI 辅助写作工具开发者，这是首个打通「多输入→多类型→可编辑」全链路的方案。

媒体预览

编辑判断

之前做科研图要么手动画（Visio/Illustrator 耗时长），要么用单点工具如 SciencePlots 只处理统计图，输入格式也锁死在文本或代码。Crafter 的关键设计是把「理解意图→规划结构→绘制执行→迭代修正」拆给不同 agent，用 SVG 作为中间格式保证可编辑性，这比端到端生成位图的方案更贴合真实投稿流程。

论文提到在复杂流程图生成上比 GPT-4V 直接出图的编辑合规率高 34%，但多轮 agent 调用的延迟和成本是落地瓶颈。代码和 demo 尚未公开，如果开源建议优先关注其 agent 编排协议和 SVG 渲染模块的设计。

查看原文 →