从Tokenizer到Attention的LLM原理课

#REPO GitHub Search 2026.04.14

推荐指数 45.0 NO. 011 · 2026.04.14

Stars205创建1 天前Forks18Issues0

为什么值得看

由Outcome School创始人维护的LLM内部机制学习系列，当前深入解析BPE分词算法的逐步推导与实现细节。适合已掌握模型调用但想补齐底层原理的工程师，直接填补'会训模型'与'懂内部机制'之间的知识断层。

Learn LLM internals step by step - from tokenization to attention to inference optimization.

媒体预览

编辑判断

目前大多数LLM学习资源要么停留在API调用层面，要么直接跳到论文实现，缺乏从tokenization到attention的系统性拆解。这个项目用BPE作为切入点，把'文本如何变成数字'这个黑盒打开了。

相比Karpathy的知名教程偏向代码实现，这个系列更注重算法原理的逐步推导，适合数学基础一般但想理解底层机制的工程师。

如果你已经会用Hugging Face transformers但说不清vocab映射和embedding的关系，花一小时跟着走一遍能填上很多知识漏洞。

Star History