说实话,我一开始对AI的感觉,就是四个字:又酷又乱。
大模型、RAG、Agent、知识蒸馏、Diffusion、Transformer……信息像雨点一样往身上砸,你要么被砸兴奋,要么被砸懵。直到有一天,我发现自己学了一大堆零碎的东西,却说不清楚:
“我到底会什么?如果现在要做一个AI应用,我从哪下手?”
那一刻有点慌。我决定停下来,给自己画一张属于自己的——《AI技术知识图谱》。
下面这篇,就是我这半年一点点踩坑、删改、重画、再删的结果。不是教科书,更像一个普通打工人,试着用比较彻底、也比较真实的方式,把这件事说清楚。
一、为什么一定要有一张自己的《AI技术知识图谱》?
先讲个很具体的感受。
我刚接触大模型那阵子,看到什么“提示工程”“人格注入”“多模态能力”就想试,一会儿写个聊天机器人,一会儿又去玩图片生成。那种碎片化的爽感,就像逛商场不停试衣服,但从来不买一整套能穿出门的搭配。
直到有一天,老板说:
“能不能做个内部的知识问答助手,把公司文档接进去,大家可以直接问问题那种?”
我脑子里闪过无数词:向量数据库、嵌入、RAG、权限控制、API调用、Prompt设计…… 然后我发现:我知道这些词,但它们在我脑子里是“散装的”。
那天晚上回去,我特别清晰地意识到一件事:
没有自己的知识图谱,就好像在脑子里开了几百个浏览器标签页,但没有一个“收藏夹”。
于是我开始搭自己的《AI技术知识图谱》,目标只有一个:
- 以后再遇到一个需求,我能快速定位:这是哪一块的事,我需要动用哪几个“模块”。
那种“我知道自己在干嘛”的确定感,真的能明显降低焦虑感。
二、我心里的 AI 技术大地图:四个大块
很多人一上来就被各种花哨名词绕晕,其实我最后推倒重来之后,只保留了四个核心板块:
- 基础功:数学 + 编程 + 工具链
- 模型本体:从传统机器学习到大模型
- 工程能力:把模型变成产品
- 场景与业务:AI 解决的是真问题,不是玩概念
你可以脑补一张图:
- 最底层是基础功,像地基;
- 上面是各种模型与算法,是砖块;
- 再上是工程化能力,像水电、装修;
- 最上层是具体场景,是你真正住进去的那套房子。
很多人一上来就说要学“AI应用开发”“做AI Agent”。可以,但如果你心里没有这张大图,很容易学着学着就变成:哪里火,往哪跟风。
三、基础功:别神化,但也别绕过
我不想装“学术大神”。我本人就是典型的:高数勉强过关、线代回想起来只剩“矩阵乘法”。所以我对数学基础的态度很简单:
不用追求完美掌握,但要做到:看到公式不发怵,知道大概在干什么。
在我的《AI技术知识图谱》里,基础这一块我只放了三个关键词:
- 线性代数:向量、矩阵、张量运算、特征值这些,至少要知道它们为什么会出现在模型里。
- 概率与统计:分布、期望、方差、最大似然、贝叶斯,这些是理解“模型为什么不确定”的关键。
- 优化基础:梯度下降、学习率、局部最优,理解训练过程在干嘛。
另外一条是编程与工具链:
- Python + 必要的工程习惯:虚拟环境、包管理、日志、配置文件这些,不性感,但谁做项目谁知道有多重要。
- 至少一个深度学习框架:我自己的图谱上写的是:
PyTorch(主力)+TensorFlow/Keras(只够看懂)。 - Linux + Git + 容器(Docker):这几个一旦熟,就会明显感觉:你不再是“跑个demo”,而是在做一个可能上线的东西。
但我想强调一点:
不要为了“补基础”而无限拖延实战。
我自己是用“项目倒逼学习”,先上手做一个小应用,遇到看不懂的数学和工具,再回头补。那种“学完再干”的完美主义,挺耗时间,还容易把热情磨没。
四、模型本体:从“会调API”到“敢看论文图”
老实说,有了大模型 API 之后,很多人只停在了“会调接口”这个层级。但如果你想让自己的《AI技术知识图谱》有点深度,模型这一块就不能空着。
我自己是这么分层的:
- 传统机器学习:打个底
- 线性回归 / 逻辑回归 / 决策树 / Random Forest / XGBoost
- 你不需要会推导所有公式,但最好做过几个完整的小项目:房价预测、分类、简单推荐。
-
这样你会更清楚:不是所有问题都要上深度学习,更不是所有东西都要上大模型。
-
深度学习:理解“神经网络”到底在干嘛
-
前馈网络、卷积网络、循环网络这些我只要求自己做到三件事:
- 能画出大致结构图;
- 知道它们擅长处理什么类型的数据(图像、序列、文本);
- 知道为什么后来很多任务被 Transformer 接管了。
-
Transformer 与大模型:图谱里的“C位”
我的图谱里,这一块被我用荧光笔圈了好几圈: - Attention 机制:不是要背公式,而是要能用自己的话解释:
- 它让模型在处理序列的时候,可以“有选择地看重点”;
- 为什么这东西对长文本、对话这么关键。
- 预训练 + 微调:
- 预训练在干嘛(在海量数据上学“通用能力”);
- 微调 / LoRA / Prompt Tuning 在干嘛(教模型适应具体任务);
- 知道“参数量、上下文长度、多模态”这些指标意味着什么。
-
主流模型家族:GPT 系、Llama 系、国内的一些开源模型,至少知道它们大概适合干嘛。
-
生成式模型扩展:文本之外的世界
- Diffusion(扩散模型):图像生成的主角。你不需要推导噪声公式,但要知道:
- 为什么它比早期 GAN 更稳;
- 文生图、图生图、ControlNet 这些是怎样拼起来的。
- 多模态模型:能看图、能听音频、能理解视频的模型,背后其实还是在做“统一表征”。
说句心里话:
当你第一次能把一篇简单论文里的模型结构图看懂,那种“原来我真的能理解这一堆复杂东西”的成就感,会把你后面的学习推得很远。
五、工程能力:让模型真的跑在现实世界里
有段时间,我特别排斥“工程化”这三个字,总觉得听起来有点无聊。后来我真正参与了一个内部 AI 工具的落地,才意识到:
大部分模型死在 demo 到产品的这一步。
在我的《AI技术知识图谱》里,工程这一块是这样拆的:
- 数据工程:
- 数据采集、清洗、标注、脱敏,这些一个都跑不了;
- 做 RAG 的时候,数据切分策略、向量化、索引结构,这些都会直接影响效果。
- 接口与服务化:
- 把模型封装成 API,让前端、其他服务能方便调用;
- 熟悉一个基础的 Web 框架(比如 FastAPI、Flask);
- 理解并发、超时、重试、熔断这些看着枯燥但能救命的机制。
- RAG 与知识增强:现在特别火,但我觉得很多实现都很粗糙。
- 在我的图谱上,这块被拆成:
文本预处理→切分策略→Embedding + 向量库→检索策略→重写 Prompt; - 每一环都有坑,比如:切得太碎上下文全没了,切得太大又经常检索不到重点。
- Agent / 工具调用:
- 让大模型调用搜索、数据库、第三方API;
- 真正难的不是“调用工具”,而是任务分解、状态管理、错误恢复。
- 图谱里我会标注:自己目前更多停留在“轻量级 Agent 试验阶段”,这样反而会提醒我别轻易吹嘘。
工程这块很现实:
它决定了你是“玩 AI”还是“用 AI 吃饭”。
而且很公平:你做过一个完整项目,你的知识图谱就会多一层非常具体的“伤疤记忆”。那些踩过的坑,是书本给不了的。
六、场景与业务:AI 不在真问题里,就只是一场炫技
如果说前面三块是“机器视角”,那这一块就是彻底的人间烟火气。
我后来慢慢意识到:《AI技术知识图谱》真正的灵魂,是你把哪些“问题”写上去。
我的图谱上有这么几类场景,被我用不同颜色标出来:
- 内容效率:文案生成、长文总结、报告初稿、PPT架构。
- 知识问答:公司知识库、产品说明书、技术文档问答。
- 决策辅助:数据分析助手、运营策略建议、用户反馈聚类和洞察。
- 工作流自动化:把邮件、表格、文档、IM消息串在一起,做“半自动助理”。
我会在每一类场景下面写:
- 哪些已经试过,效果不错;
- 哪些还停留在想法阶段;
- 哪些暂时被证明“不值得做”(比如投入产出比太低)。
这样做有一个变化:
你开始不再盯着“我还不会什么技术”,而是慢慢转成——“我已经能用手头的技术解决哪些具体的问题”。
这会给人一种非常实在的安全感:哪怕你没有追上每一波最前沿的论文,你依然能在自己的工作和生活里,安安稳稳地用 AI 做出点成果。
七、怎么一步步画出你自己的《AI技术知识图谱》?
如果你看到这里,可能会想:“听着挺有道理,但我该从哪开始画?”
我自己的做法很简单,也有点粗糙,但好用:
- 先在纸上画四个圈:基础 / 模型 / 工程 / 场景。
- 每个圈里写下你“已经接触过”的东西,哪怕只是听过名字。
- 用不同颜色标注:
- 会做项目的 → 一种颜色;
- 只看过 / 玩过 demo 的 → 另一种;
- 完全陌生但感兴趣的 → 再一种。
- 然后挑一个你最近真能用得上的场景,比如:“做一个团队内部文档问答助手”。
- 顺着这个场景,把你需要的知识点,从图谱上圈出来,然后开始补缺。
这时你会发现一个挺有意思的事:
有些你以为“很重要”的东西,其实在你当前的场景里压根用不到;
而有些你忽略的基础技能,反而成了你迈不过去的坎。
知识图谱最大的意义,不是把你拉进知识焦虑,而是帮你排优先级。
八、写在最后:知识图谱不是挂在墙上的海报,而是会被翻旧的笔记
回头看这半年的折腾,我对《AI技术知识图谱》这四个字,已经没有最初那种“高大上”的感觉了。
在我这儿,它更像是:
- 一张被涂得乱七八糟的思维导图;
- 一堆写满删改痕迹的笔记;
- 一份会不断被推翻、重画,但又越来越贴合真实自我的“能力地图”。
AI 这东西变化太快了,没人能保证自己不会被时代抛下。但至少,当你手里有一张不断更新的《AI技术知识图谱》时,你不会完全迷路。
你可以清楚地知道:
- 我现在站在什么位置;
- 我接下来该往哪一个方向多迈半步;
- 哪些是对我此刻的生活和工作最有价值的升级,而不是为了“跟风”而学。
如果你愿意,今天就可以拿一张纸,写上这几个字:《AI技术知识图谱》,然后把你脑子里那些散乱的概念,哪怕写得很丑、很乱,也先丢上去。
等你过几个月再回头看那张纸,你大概率会有一点点惊讶——
原来自己,真的走了这么远。