AMAZINGINDEX.COM 每日 AI 简报
66.2
VOL. 2026.04
2026.04.13
← 返回 2026.04.13 日报
日报快照 · Daily Snapshot
NO. 005

给本地LLM装上搜索引擎和爬虫

#REPO GitHub Search 2026.04.13
值得看指数 66.0 NO. 005 · 2026.04.13
Stars106创建2 天前Forks13Issues0

这是一个MCP服务器,让本地LLM agents通过DuckDuckGo搜索网页,并用Playwright抓取清洗页面内容进行结构化提取。它让完全离线的AI应用获得实时网页能力,无需依赖云端API,适合对数据隐私敏感的企业级RAG和研究助手场景。

A lightweight, prompt-driven MCP web research server for high-quality LLM powered information extraction.

目前多数MCP web工具只提供原始HTML抓取,缺乏搜索集成和结构化提取能力。webmcp把搜索抓取提取整条链路串起,且针对llama.cpp的JSON模式做了优化。

如果你现在用LangChain的WebBaseLoader做网页RAG,会遇到JS渲染页面抓不全的问题。webmcp用Playwright解决这个痛点,同时支持把清洗后的内容直接喂给本地模型做结构化输出,省去写解析逻辑的成本。

适合需要完全离线运行、又必须处理动态网页的AI应用,如内部知识库自动更新或竞品监控。注意它强制依赖llama.cpp特定启动参数,用vLLM或ollama部署需要改造适配。

Star History
查看原文 →