多智能体自动生成可编辑科研图表
为什么值得看
Crafter 用多智能体协作框架,支持从文本、草图、数据表等多种输入生成可编辑的科研图表,覆盖流程图、统计图、概念图等多种类型。对需要频繁制作论文插图的研究者和 AI 辅助写作工具开发者,这是首个打通「多输入→多类型→可编辑」全链路的方案。
媒体预览
编辑判断
之前做科研图要么手动画(Visio/Illustrator 耗时长),要么用单点工具如 SciencePlots 只处理统计图,输入格式也锁死在文本或代码。Crafter 的关键设计是把「理解意图→规划结构→绘制执行→迭代修正」拆给不同 agent,用 SVG 作为中间格式保证可编辑性,这比端到端生成位图的方案更贴合真实投稿流程。
论文提到在复杂流程图生成上比 GPT-4V 直接出图的编辑合规率高 34%,但多轮 agent 调用的延迟和成本是落地瓶颈。代码和 demo 尚未公开,如果开源建议优先关注其 agent 编排协议和 SVG 渲染模块的设计。