手搓ML知识库，直接喂给Agent

#REPO GitHub Search 2026.05.31

推荐指数 42.0 NO. 008 · 2026.05.31

Stars104创建2 天前Forks10Issues0

为什么值得看

将923份ML课程、论文和博客统一整理成Markdown格式，附带17主题标签和Obsidian图谱配置。AI工程师可以直接把仓库丢给Claude Code或Cursor当知识库用，解决LLM回答ML问题时胡编乱造论文的痛点。

A hand-curated, topic-organized library of the best ML education — 923 docs (391 arXiv papers, 474 Stanford/MIT/Karpathy/fast.ai lectures, 58 explainer articles), normalized to Markdown with full provenance. Open it in Obsidian or point your agent at it. A clean ML corpus for learning, RAG & fine-tuning.

编辑判断

做ML教育或技术写作的团队之前要么自己爬资料做RAG，要么忍受ChatGPT对论文的幻觉回答。这个库的价值不在内容本身——这些课程和论文网上都有——而在"标准化清洗"：统一格式、完整出处、主题标签、token级切分，省去了80%的预处理脏活。

跟arXiv dump或HuggingFace datasets比，它的优势是精选而非海量，适合需要"高质量引用"而非"大规模预训练"的场景。如果你正在做AI助教、论文解读Bot、或者想让Cursor在写ML代码时真正引用斯坦福CS229而不是瞎编，这个库比直接用Perplexity API更可控。

最该试的人：做垂直领域AI产品的技术负责人，以及想给团队内部搭ML知识库但懒得从头整理的工程经理。

Star History

生态分析

Beta

面向AI工程师的ML教育知识库基础设施，连接学术资源与LLM应用工具链

独特价值：唯一将900+ML资源标准化为RAG就绪语料，解决LLM回答ML问题时幻觉痛点

查看原文 →