从零构建 AI 工程能力：这个开源项目把 435 节课做成了一条硬核路线

这两年，AI 学习资料多到让人焦虑。

今天有人推荐一篇 Transformer 论文精读。
明天有人发一个 RAG 实战教程。
后天又冒出来一个 Agent 框架、一个 MCP 示例、一个多模态 demo。

你跟着学了一圈，可能确实会搭出几个东西：一个聊天机器人，一个简单 RAG，一个工具调用 agent，或者一个能跑起来的微调脚本。

但问题也很明显：

这些知识经常是散的。

你会调用 API，但说不清 loss curve 为什么这样变化。
你会接一个工具给 agent，但说不清模型里的 attention 到底做了什么。
你会跑 PyTorch 代码，但反向传播、tokenizer、优化器、评估指标，只是“知道有这么回事”。
你会用框架，却不确定框架底层到底替你做了什么。

最近看到一个很适合系统学习者收藏的开源项目：

AI Engineering from Scratch

GitHub 地址：
https://github.com/rohitg00/ai-engineering-from-scratch

项目官网：
https://aiengineeringfromscratch.com

它的目标很直接：
不是教你“怎么调 API”，而是带你从数学基础开始，一路手写到 LLM、Agent、多智能体、生产部署和 capstone 项目。

项目 README 里写得很清楚：

435 lessons
20 phases
约 320 小时
覆盖 Python、TypeScript、Rust、Julia
每节课都产出一个可复用资产：prompt、skill、agent 或 MCP server
免费、开源、MIT License

这不是一个“看完就算学过”的教程，而更像是一条 AI 工程训练路线。

它的核心观点可以概括成一句话：

你不只是学习 AI，你要从头把它构建出来。

图 1：这不是零散教程，而是一条 AI 工程路线

AI Engineering from Scratch 课程路线图

这个项目最有价值的地方，不只是内容多，而是它有一条比较清楚的“脊柱”。

它把 AI 工程能力拆成 20 个阶段，从底层到上层依次堆叠：

Phase 0：环境与工具
Phase 1：数学基础
Phase 2：机器学习基础
Phase 3：深度学习核心
Phase 4：视觉
Phase 5：自然语言处理
Phase 6：语音与音频
Phase 7：Transformer
Phase 8：生成式 AI
Phase 9：强化学习
Phase 10：从零构建 LLM
Phase 11：LLM 工程
Phase 12：多模态
Phase 13：工具与协议
Phase 14：Agent 工程
Phase 15：自治系统
Phase 16：多智能体与群体系统
Phase 17：基础设施与生产部署
Phase 18：伦理与对齐
Phase 19：综合项目

它的结构很像盖楼。

数学是地基。
机器学习和深度学习是主体结构。
Transformer、LLM、多模态是关键楼层。
Agent、MCP、生产部署、多智能体是上层应用。
最终的 capstone 项目，是把前面所有能力组合起来。

这和很多碎片化 AI 教程不一样。

很多教程的问题是：你今天学一个 RAG，明天学一个 agent，后天学一个 fine-tuning，但中间缺少连接。你知道某个 demo 怎么跑，却不知道它在整张 AI 工程地图里处于什么位置。

AI Engineering from Scratch 的价值，就是把这些点串成线。

它适合什么样的人？

这个项目不太像“零基础轻松入门”。

README 里对前置条件说得很直接：

你需要会写代码。
Python 会有帮助。
你想理解 AI 到底如何工作，而不只是调用 API。

所以它适合三类人。

第一类，是已经用过 AI 工具，但感觉底层不够扎实的人。

你可能会写 prompt，会调 OpenAI/Claude/Gemini API，会搭一个 LangChain 或 LlamaIndex demo，但你总觉得自己是在“拼装”，不是在真正理解。

第二类，是想从传统软件工程转向 AI 工程的人。

你有工程能力，知道怎么写代码、跑测试、做部署，但 AI 里的数学、模型、训练、评估、agent loop、工具协议还没有形成体系。

第三类，是想长期建立 AI 工程作品集的人。

这个项目的一个设计很有意思：每节课不只是学完一个知识点，还要留下一个可复用的资产。到最后，你手里不是一堆笔记，而是 435 个 prompts、skills、agents、MCP servers 或代码实现。

这会更接近真实工作流。

一节课不是看完就结束

AI Engineering from Scratch 的课程结构也很值得借鉴。

每节课都放在独立目录里，结构统一：

phases/<NN>-<phase-name>/<NN>-<lesson-name>/
├── code/      可运行实现
├── docs/
│   └── en.md  课程叙述
└── outputs/   本课产出的 prompt、skill、agent 或 MCP server

这说明它不是“文章合集”，而是把每节课都当作一个小工程单元。

README 里把一节课拆成六个步骤：

MOTTO：一句话核心思想
PROBLEM：具体问题
CONCEPT：概念和直觉
BUILD IT：从原始数学和代码手写
USE IT：用生产级框架复现
SHIP IT：交付 prompt、skill、agent 或 MCP

这个结构很关键。

很多人学习 AI 时跳过了中间最硬的部分：从零实现。

他们直接进入 pip install、复制示例、调用框架。这样当然能快速跑通 demo，但问题是，一旦结果异常，就不知道该看哪里。

loss 不降，是数据问题、模型问题、优化器问题，还是评估方式问题？
agent 调错工具，是 prompt 问题、工具 schema 问题、上下文问题，还是 loop 设计问题？
RAG 答非所问，是切分问题、召回问题、重排问题，还是生成端没有约束？

如果你从来没有手写过小版本，就很难判断大框架出了什么问题。

图 2：一节课的学习闭环

一节课的学习闭环

这张图可以概括项目的学习方式：

先遇到一个真实问题。
再理解概念和数学。
然后从零写一个小实现。
接着用框架复现同一个思路。
最后测试、验证，并交付一个可以复用的工具。

这比“看视频 + 复制代码”更慢。

但它有一个好处：你不会只停留在会用层面。

你会知道框架在替你做什么，也知道什么时候应该相信框架，什么时候应该怀疑输入、指标或实现。

Build It / Use It：先手写，再调用框架

AI Engineering from Scratch 里有一个很重要的学习原则：

Build It / Use It

先手写，再使用。

比如讲反向传播，就先从数学推导和手写代码开始。
讲 tokenizer，就先自己实现一个小版本。
讲 attention，就先把核心计算拆开写。
讲 agent loop，就先用一百多行 Python 写一个最小循环。
等你知道底层怎么回事，再用 PyTorch、sklearn 或其他生产库去复现。

这个顺序和很多速成教程相反。

速成教程通常是：

先给你框架代码。
告诉你参数怎么填。
跑通之后再解释一点原理。

这种方法适合快速体验，但不适合建立长期能力。

真正进入工程场景后，你会遇到很多框架无法直接回答的问题：

为什么这个模型不收敛？
为什么这个 embedding 搜索召回了一堆相似但没用的内容？
为什么 agent 在第 5 步开始偏题？
为什么 prompt 改了一点，工具调用行为就变了？
为什么同样的架构换一批数据效果明显下降？

这些问题不能只靠查文档解决。
你需要知道底层机制。

图 3：从原理到工程

Build It / Use It 学习方式

左边是 Build It：手写数学、算法、tokenizer、attention、backprop、agent loop。
右边是 Use It：使用框架、管线、评估和部署。

中间的桥梁是这个项目真正强调的能力：

理解底层，才能放心调用框架。

这对 AI 工程师尤其重要。

因为 AI 工程不是“会调包”就结束了。
你要能解释结果、定位问题、控制成本、评估质量、设计系统边界。

每节课都要留下可复用资产

这个项目还有一个很有意思的设计：

每节课都不只是结束于“你学会了 X”，而是要产出一个可以放进工作流里的资产。

项目 README 里列了四类：

Prompt
Skill
Agent
MCP Server

这点非常符合今天的 AI 工程趋势。

以前我们学习编程，可能最后留下的是代码片段、笔记、demo 项目。

但 AI 工程里，真正可复用的资产形态更多：

一个高质量 prompt，可以变成某类任务的专家助手。
一个 skill，可以放进 Claude、Cursor、Codex、OpenClaw、Hermes 这类 agent 环境。
一个 agent，可以作为自动化 worker 执行某类任务。
一个 MCP server，可以把外部工具、数据源、系统能力接入任意兼容客户端。

这意味着学完之后，你得到的不只是知识，还得到一套可以迁移到实际工作的工具箱。

图 4：每节课留下一个可复用资产

可复用 AI 工程资产

这也是我觉得这个项目很适合“工程型学习者”的原因。

它不是把你训练成只会背概念的人，也不是让你只会跑 demo。
它要求你每学一个知识点，就把它沉淀成可以复用的东西。

这种输出导向，会逼着你回答几个问题：

这个知识点解决什么问题？
输入是什么？输出是什么？
怎么测试它是否有效？
它能不能被别人复用？
它能不能放进日常开发工作流？

这比单纯写学习笔记更接近真实工程。

项目里还有内置的学习技能

README 里还提到两个内置 agent skills：

/find-your-level

这是一个十题定位测试，用来判断你应该从哪个 phase 开始，并给出个性化学习路径和时间估计。

/check-understanding <phase>

这是阶段测验。每个 phase 会给出八个问题，并根据回答给反馈，告诉你应该回顾哪些 lesson。

这两个设计也很实用。

因为 435 节课、约 320 小时，不是每个人都需要从 Phase 0 一路学到 Phase 19。

如果你已经有数学基础，可以跳过一部分。
如果你已经熟悉深度学习，可以从 Transformer 或 LLM 工程开始。
如果你已经会写 agent，可以直接补工具协议、生产部署、多智能体。

一个好的课程不应该只告诉你“从头学”，也应该告诉你“从哪里开始最合适”。

它和普通 AI 教程最大的区别

如果用一句话总结：

普通教程教你跑起来，这个项目想让你解释得清、改得动、交付得出。

普通教程经常围绕一个 demo 展开。
比如 30 分钟搭一个 RAG，10 分钟写一个 agent，5 分钟接一个工具。

这种内容有价值，但它解决的是“体验问题”。

AI Engineering from Scratch 解决的是“能力结构问题”：

数学是否扎实
模型是否理解
算法是否能手写
框架是否知道底层
工具是否能复用
agent 是否能调试
协议是否能接入
系统是否能部署
伦理和对齐是否纳入工程判断

它更像一本开源的 AI 工程训练手册，而不是一个教程合集。

它的不足也很明显

这个项目很强，但不一定适合所有人。

第一，它很长。
435 节课、约 320 小时，这不是周末速成项目。

第二，它不轻松。
项目强调从 raw math 开始手写实现，这意味着你不能只靠复制代码过关。

第三，它目前更像一条路线和知识工程项目。
如果你期待的是“马上帮我上线一个产品”，它可能不是最快路径。

所以更准确地说，它适合把 AI 工程当成长期能力来建设的人。

如果你只是想快速搭一个 chatbot，那它可能太重。
如果你想补齐从数学、模型、LLM 到 agent、MCP、生产部署的完整链条，它就很值得收藏。

怎么开始？

项目 README 给了三种方式。

第一种，直接阅读官网：

https://aiengineeringfromscratch.com

第二种，clone 仓库运行代码：

git clone https://github.com/rohitg00/ai-engineering-from-scratch.git
cd ai-engineering-from-scratch
python phases/01-math-foundations/01-linear-algebra-intuition/code/vectors.py

第三种，也是项目推荐的方式：先找自己的起点。

如果你在 Claude、Cursor、Codex、OpenClaw、Hermes 或其他支持技能的 agent 环境里，可以使用：

/find-your-level

完成十个问题之后，它会根据你的基础映射到合适的起始 phase，并给出带时间估计的学习路径。

学完某个阶段后，可以用：

/check-understanding 3

来检查自己是否真正理解 Phase 3。

我的看法

现在很多人学 AI，最大的问题不是资料不够，而是资料太多。

论文、博客、视频、框架、课程、demo、开源项目，每天都在更新。
如果没有一条结构化路线，很容易陷入“什么都看过一点，但什么都不扎实”的状态。

AI Engineering from Scratch 的价值在于，它给了一条很硬的路径：

从数学开始。
从零实现。
再用框架复现。
最后交付工具。

这条路不快，但很稳。

尤其是在 AI 工程越来越复杂的今天，只会调 API 的门槛会越来越低。真正稀缺的能力，是能把底层原理、工程系统、工具协议、agent 工作流和生产部署连接起来。

这个项目正好对准了这件事。

它不是让你成为“AI 工具使用者”，而是训练你成为“AI 系统构建者”。

如果你正在系统学习 AI 工程，或者想从软件工程转向 AI 工程，这个仓库值得收藏。

项目地址：
https://github.com/rohitg00/ai-engineering-from-scratch

项目官网：
https://aiengineeringfromscratch.com

参考资料：
项目 GitHub README、课程目录、官网公开说明。