Notes, articles, and project updates.
Read the latest posts or subscribe with RSS.
用一条训练流水线解释大模型从原始数据、预训练、指令微调、偏好训练、评测奖励到部署蒸馏的完整过程。
深入解析大语言模型的工具调用机制:从 prompt 注入工具描述,到模型输出结构化调用指令,再到运行时执行并回填结果的完整闭环。
前几天在 Reddit 上看到一个帖子,有点好笑,也有点吓人。
记录我学习 RAG 时对 cosine similarity 的理解:它不是一个很神秘的公式,本质是在比较两个向量的方向。
一份面向未来 2-5 年的职业发展规划:主线走 AI 安全,副线用独立产品做收入实验,AI 应用开发作为底层技能。
AI 把产出第一版的成本降得很低,但也把人的判断力、主动性、验证耐心、表达能力和责任感推到了更前面。