针对AI Agent的PDF解析评测基准

#REPO GitHub Search 2026.04.15

推荐指数 67.0 NO. 003 · 2026.04.15

Stars110创建3 天前Forks7Issues1

为什么值得看

ParseBench是一个针对企业级PDF文档的解析基准测试工具，专门评估解析结果对AI Agent的可用性。它用2000页真实金融/政府文档测试结构保留能力，帮助工程师避开"看起来对但Agent用不了"的解析陷阱。

ParseBench - A Document Parsing Benchmark for AI Agents

媒体预览

编辑判断

做企业级RAG的团队之前选PDF解析器基本靠肉眼抽查，结果上线后Agent还是经常因为表格错位而幻觉。ParseBench 测的是结构保真度而非OCR准确率，专门针对 LlamaParse、Unstructured 等工具在保险、财务报表上的失败模式做了分类测试。

如果你在生产环境处理复杂版式文档，用这个跑一遍能直接量化哪个工具对你的Agent工作流更可靠。

Star History