Skip to content
Stack Ashes
Go back

从零构建 AI 工程能力:这个开源项目把 435 节课做成了一条硬核路线

从零构建 AI 工程能力:这个开源项目把 435 节课做成了一条硬核路线

这两年,AI 学习资料多到让人焦虑。

今天有人推荐一篇 Transformer 论文精读。
明天有人发一个 RAG 实战教程。
后天又冒出来一个 Agent 框架、一个 MCP 示例、一个多模态 demo。

你跟着学了一圈,可能确实会搭出几个东西:一个聊天机器人,一个简单 RAG,一个工具调用 agent,或者一个能跑起来的微调脚本。

但问题也很明显:

这些知识经常是散的。

你会调用 API,但说不清 loss curve 为什么这样变化。
你会接一个工具给 agent,但说不清模型里的 attention 到底做了什么。
你会跑 PyTorch 代码,但反向传播、tokenizer、优化器、评估指标,只是“知道有这么回事”。
你会用框架,却不确定框架底层到底替你做了什么。

最近看到一个很适合系统学习者收藏的开源项目:

AI Engineering from Scratch

GitHub 地址:
https://github.com/rohitg00/ai-engineering-from-scratch

项目官网:
https://aiengineeringfromscratch.com

它的目标很直接:
不是教你“怎么调 API”,而是带你从数学基础开始,一路手写到 LLM、Agent、多智能体、生产部署和 capstone 项目。

项目 README 里写得很清楚:

这不是一个“看完就算学过”的教程,而更像是一条 AI 工程训练路线。

它的核心观点可以概括成一句话:

你不只是学习 AI,你要从头把它构建出来。

图 1:这不是零散教程,而是一条 AI 工程路线

AI Engineering from Scratch 课程路线图

这个项目最有价值的地方,不只是内容多,而是它有一条比较清楚的“脊柱”。

它把 AI 工程能力拆成 20 个阶段,从底层到上层依次堆叠:

它的结构很像盖楼。

数学是地基。
机器学习和深度学习是主体结构。
Transformer、LLM、多模态是关键楼层。
Agent、MCP、生产部署、多智能体是上层应用。
最终的 capstone 项目,是把前面所有能力组合起来。

这和很多碎片化 AI 教程不一样。

很多教程的问题是:你今天学一个 RAG,明天学一个 agent,后天学一个 fine-tuning,但中间缺少连接。你知道某个 demo 怎么跑,却不知道它在整张 AI 工程地图里处于什么位置。

AI Engineering from Scratch 的价值,就是把这些点串成线。

它适合什么样的人?

这个项目不太像“零基础轻松入门”。

README 里对前置条件说得很直接:

你需要会写代码。
Python 会有帮助。
你想理解 AI 到底如何工作,而不只是调用 API。

所以它适合三类人。

第一类,是已经用过 AI 工具,但感觉底层不够扎实的人。

你可能会写 prompt,会调 OpenAI/Claude/Gemini API,会搭一个 LangChain 或 LlamaIndex demo,但你总觉得自己是在“拼装”,不是在真正理解。

第二类,是想从传统软件工程转向 AI 工程的人。

你有工程能力,知道怎么写代码、跑测试、做部署,但 AI 里的数学、模型、训练、评估、agent loop、工具协议还没有形成体系。

第三类,是想长期建立 AI 工程作品集的人。

这个项目的一个设计很有意思:每节课不只是学完一个知识点,还要留下一个可复用的资产。到最后,你手里不是一堆笔记,而是 435 个 prompts、skills、agents、MCP servers 或代码实现。

这会更接近真实工作流。

一节课不是看完就结束

AI Engineering from Scratch 的课程结构也很值得借鉴。

每节课都放在独立目录里,结构统一:

phases/<NN>-<phase-name>/<NN>-<lesson-name>/
├── code/      可运行实现
├── docs/
│   └── en.md  课程叙述
└── outputs/   本课产出的 prompt、skill、agent 或 MCP server

这说明它不是“文章合集”,而是把每节课都当作一个小工程单元。

README 里把一节课拆成六个步骤:

这个结构很关键。

很多人学习 AI 时跳过了中间最硬的部分:从零实现。

他们直接进入 pip install、复制示例、调用框架。这样当然能快速跑通 demo,但问题是,一旦结果异常,就不知道该看哪里。

loss 不降,是数据问题、模型问题、优化器问题,还是评估方式问题?
agent 调错工具,是 prompt 问题、工具 schema 问题、上下文问题,还是 loop 设计问题?
RAG 答非所问,是切分问题、召回问题、重排问题,还是生成端没有约束?

如果你从来没有手写过小版本,就很难判断大框架出了什么问题。

图 2:一节课的学习闭环

一节课的学习闭环

这张图可以概括项目的学习方式:

先遇到一个真实问题。
再理解概念和数学。
然后从零写一个小实现。
接着用框架复现同一个思路。
最后测试、验证,并交付一个可以复用的工具。

这比“看视频 + 复制代码”更慢。

但它有一个好处:你不会只停留在会用层面。

你会知道框架在替你做什么,也知道什么时候应该相信框架,什么时候应该怀疑输入、指标或实现。

Build It / Use It:先手写,再调用框架

AI Engineering from Scratch 里有一个很重要的学习原则:

Build It / Use It

先手写,再使用。

比如讲反向传播,就先从数学推导和手写代码开始。
讲 tokenizer,就先自己实现一个小版本。
讲 attention,就先把核心计算拆开写。
讲 agent loop,就先用一百多行 Python 写一个最小循环。
等你知道底层怎么回事,再用 PyTorch、sklearn 或其他生产库去复现。

这个顺序和很多速成教程相反。

速成教程通常是:

先给你框架代码。
告诉你参数怎么填。
跑通之后再解释一点原理。

这种方法适合快速体验,但不适合建立长期能力。

真正进入工程场景后,你会遇到很多框架无法直接回答的问题:

这些问题不能只靠查文档解决。
你需要知道底层机制。

图 3:从原理到工程

Build It / Use It 学习方式

左边是 Build It:手写数学、算法、tokenizer、attention、backprop、agent loop。
右边是 Use It:使用框架、管线、评估和部署。

中间的桥梁是这个项目真正强调的能力:

理解底层,才能放心调用框架。

这对 AI 工程师尤其重要。

因为 AI 工程不是“会调包”就结束了。
你要能解释结果、定位问题、控制成本、评估质量、设计系统边界。

每节课都要留下可复用资产

这个项目还有一个很有意思的设计:

每节课都不只是结束于“你学会了 X”,而是要产出一个可以放进工作流里的资产。

项目 README 里列了四类:

这点非常符合今天的 AI 工程趋势。

以前我们学习编程,可能最后留下的是代码片段、笔记、demo 项目。

但 AI 工程里,真正可复用的资产形态更多:

一个高质量 prompt,可以变成某类任务的专家助手。
一个 skill,可以放进 Claude、Cursor、Codex、OpenClaw、Hermes 这类 agent 环境。
一个 agent,可以作为自动化 worker 执行某类任务。
一个 MCP server,可以把外部工具、数据源、系统能力接入任意兼容客户端。

这意味着学完之后,你得到的不只是知识,还得到一套可以迁移到实际工作的工具箱。

图 4:每节课留下一个可复用资产

可复用 AI 工程资产

这也是我觉得这个项目很适合“工程型学习者”的原因。

它不是把你训练成只会背概念的人,也不是让你只会跑 demo。
它要求你每学一个知识点,就把它沉淀成可以复用的东西。

这种输出导向,会逼着你回答几个问题:

这个知识点解决什么问题?
输入是什么?输出是什么?
怎么测试它是否有效?
它能不能被别人复用?
它能不能放进日常开发工作流?

这比单纯写学习笔记更接近真实工程。

项目里还有内置的学习技能

README 里还提到两个内置 agent skills:

/find-your-level

这是一个十题定位测试,用来判断你应该从哪个 phase 开始,并给出个性化学习路径和时间估计。

/check-understanding <phase>

这是阶段测验。每个 phase 会给出八个问题,并根据回答给反馈,告诉你应该回顾哪些 lesson。

这两个设计也很实用。

因为 435 节课、约 320 小时,不是每个人都需要从 Phase 0 一路学到 Phase 19。

如果你已经有数学基础,可以跳过一部分。
如果你已经熟悉深度学习,可以从 Transformer 或 LLM 工程开始。
如果你已经会写 agent,可以直接补工具协议、生产部署、多智能体。

一个好的课程不应该只告诉你“从头学”,也应该告诉你“从哪里开始最合适”。

它和普通 AI 教程最大的区别

如果用一句话总结:

普通教程教你跑起来,这个项目想让你解释得清、改得动、交付得出。

普通教程经常围绕一个 demo 展开。
比如 30 分钟搭一个 RAG,10 分钟写一个 agent,5 分钟接一个工具。

这种内容有价值,但它解决的是“体验问题”。

AI Engineering from Scratch 解决的是“能力结构问题”:

它更像一本开源的 AI 工程训练手册,而不是一个教程合集。

它的不足也很明显

这个项目很强,但不一定适合所有人。

第一,它很长。
435 节课、约 320 小时,这不是周末速成项目。

第二,它不轻松。
项目强调从 raw math 开始手写实现,这意味着你不能只靠复制代码过关。

第三,它目前更像一条路线和知识工程项目。
如果你期待的是“马上帮我上线一个产品”,它可能不是最快路径。

所以更准确地说,它适合把 AI 工程当成长期能力来建设的人。

如果你只是想快速搭一个 chatbot,那它可能太重。
如果你想补齐从数学、模型、LLM 到 agent、MCP、生产部署的完整链条,它就很值得收藏。

怎么开始?

项目 README 给了三种方式。

第一种,直接阅读官网:

https://aiengineeringfromscratch.com

第二种,clone 仓库运行代码:

git clone https://github.com/rohitg00/ai-engineering-from-scratch.git
cd ai-engineering-from-scratch
python phases/01-math-foundations/01-linear-algebra-intuition/code/vectors.py

第三种,也是项目推荐的方式:先找自己的起点。

如果你在 Claude、Cursor、Codex、OpenClaw、Hermes 或其他支持技能的 agent 环境里,可以使用:

/find-your-level

完成十个问题之后,它会根据你的基础映射到合适的起始 phase,并给出带时间估计的学习路径。

学完某个阶段后,可以用:

/check-understanding 3

来检查自己是否真正理解 Phase 3。

我的看法

现在很多人学 AI,最大的问题不是资料不够,而是资料太多。

论文、博客、视频、框架、课程、demo、开源项目,每天都在更新。
如果没有一条结构化路线,很容易陷入“什么都看过一点,但什么都不扎实”的状态。

AI Engineering from Scratch 的价值在于,它给了一条很硬的路径:

从数学开始。
从零实现。
再用框架复现。
最后交付工具。

这条路不快,但很稳。

尤其是在 AI 工程越来越复杂的今天,只会调 API 的门槛会越来越低。真正稀缺的能力,是能把底层原理、工程系统、工具协议、agent 工作流和生产部署连接起来。

这个项目正好对准了这件事。

它不是让你成为“AI 工具使用者”,而是训练你成为“AI 系统构建者”。

如果你正在系统学习 AI 工程,或者想从软件工程转向 AI 工程,这个仓库值得收藏。

项目地址:
https://github.com/rohitg00/ai-engineering-from-scratch

项目官网:
https://aiengineeringfromscratch.com

参考资料:
项目 GitHub README、课程目录、官网公开说明。


Share this post on:

Previous Post
别再盲读代码了:这个开源项目能把代码库变成交互式知识图谱
Next Post
AI 编程工具不该只是聊天框:这个开源项目把 IDE、调试器和浏览器都接进来了