手搓ML知识库,直接喂给Agent
将923份ML课程、论文和博客统一整理成Markdown格式,附带17主题标签和Obsidian图谱配置。AI工程师可以直接把仓库丢给Claude Code或Cursor当知识库用,解决LLM回答ML问题时胡编乱造论文的痛点。
A hand-curated, topic-organized library of the best ML education — 923 docs (391 arXiv papers, 474 Stanford/MIT/Karpathy/fast.ai lectures, 58 explainer articles), normalized to Markdown with full provenance. Open it in Obsidian or point your agent at it. A clean ML corpus for learning, RAG & fine-tuning.
做ML教育或技术写作的团队之前要么自己爬资料做RAG,要么忍受ChatGPT对论文的幻觉回答。这个库的价值不在内容本身——这些课程和论文网上都有——而在"标准化清洗":统一格式、完整出处、主题标签、token级切分,省去了80%的预处理脏活。
跟arXiv dump或HuggingFace datasets比,它的优势是精选而非海量,适合需要"高质量引用"而非"大规模预训练"的场景。如果你正在做AI助教、论文解读Bot、或者想让Cursor在写ML代码时真正引用斯坦福CS229而不是瞎编,这个库比直接用Perplexity API更可控。
最该试的人:做垂直领域AI产品的技术负责人,以及想给团队内部搭ML知识库但懒得从头整理的工程经理。
面向AI工程师的ML教育知识库基础设施,连接学术资源与LLM应用工具链
独特价值:唯一将900+ML资源标准化为RAG就绪语料,解决LLM回答ML问题时幻觉痛点