AMAZINGINDEX.COM 每日 AI 简报
60.4
VOL. 2026.04
2026.04.14
← 返回 2026.04.14 日报
日报快照 · Daily Snapshot
NO. 011

从Tokenizer到Attention的LLM原理课

#REPO GitHub Search 2026.04.14
值得看指数 45.0 NO. 011 · 2026.04.14
Stars205创建1 天前Forks18Issues0

由Outcome School创始人维护的LLM内部机制学习系列,当前深入解析BPE分词算法的逐步推导与实现细节。适合已掌握模型调用但想补齐底层原理的工程师,直接填补'会训模型'与'懂内部机制'之间的知识断层。

Learn LLM internals step by step - from tokenization to attention to inference optimization.

从Tokenizer到Attention的LLM原理课

目前大多数LLM学习资源要么停留在API调用层面,要么直接跳到论文实现,缺乏从tokenization到attention的系统性拆解。这个项目用BPE作为切入点,把'文本如何变成数字'这个黑盒打开了。

相比Karpathy的知名教程偏向代码实现,这个系列更注重算法原理的逐步推导,适合数学基础一般但想理解底层机制的工程师。

如果你已经会用Hugging Face transformers但说不清vocab映射和embedding的关系,花一小时跟着走一遍能填上很多知识漏洞。

Star History
查看原文 →