关于AI Coding的现状 | Zoy的博客之家

大致发展史：

前前后后已经深入使用AI不造多久了，最早使用AI写代码是2023年gpt4刚出来的时候，没有codex app，没有claude code，没有千问没有deepseek

AI coding当时就已经非常惊艳了，原因是早期的ai coding只具备补足一些常规代码，比如if else之类的简单代码。而gpt4却做到了通过自然语言就能生成代码，比如：帮我做一个个人介绍页。它哐哧哐哧就给你写好了。但是只是在gpt聊天框，需要你一块一块的复制粘贴然后进行组装。但是已经很牛批了。

当然局限也很多，最大的问题就是无法本地化。

GPT-4 让 AI Coding 从“补全代码”进入“自然语言生成代码”阶段，真正让终端式 Agentic Coding 出圈的，是 2025 年的 claude code（简称cc），到处开始讨论cc。确实，cc在刚出圈的时候，最厉害最圈粉的地方是它带活了很多生态。早期ai coding初见端倪的时候，rag、skill、agent的概念就从未断绝过，这agent，那skill，怎么怎么rag的能降本增效。于是cc的出现，给这些概念留足了发展的空间，于是github出现了一批又一批xxxxagent，xxxxskill，xxxxprompt，首次把ai概念全部给盘活了。

Codex app是2026年2月发布，GPT-5.5是2026年4月发布，codex几乎3天一小更，5天一大更，从简单的native ai到computer use，再到agent+skill集成，直接把以前所有的概念全部按在地上摩擦。此时，作为一个非圈内人，你就开始好奇了：为什么以前的那些agent都不发光了？为什么codex生态有这么多乱七八糟花里胡哨还贼厉害的插件？

而且，很不明显的一个情况就是，以前的那些rag操作、skill、agent成为了众矢之的，食之无味，弃之可惜？

Why？

一些可能再也用不上的名词：

1、RAG

首先说RAG。RAG全称Retrieval-Augmented Generation，即：检索增强生成。它是基于一个现状而提出的半AI化解决方案。长期依赖，大模型非常欠缺的能力就是上下文处理能力，当你的上下文太大时，AI无法处理，或者处理会有丢失。于是开发者们便把大量的数据，分类加索引并转成机器可识别的向量存下来，在对话的时候大模型会针对性的去检索关联性较高的索引进而搜索内容。

于是便出现了如下情况：

（1）套路死板。聊天内容相似时，检索的内容是差不多的，输出也是差不多的。

（2）检索不准确。偶尔会“扯远了”

（3）不具备深度思考的可行性。因为向量是固定的！

传统向量 RAG 的问题，把复杂语义压缩成了一次相似度匹配。它擅长找相似材料，但不擅长理解任务目标、重组知识、跨文档推理和动态更新认知。所以其实多上论坛你会发现，很多人都在讨论弃用rag的情况，提出各种rag无法满足的简单需求，尤其体现在交互大的情况下。最近的大佬发言提出了一个很有意思的观点并得到验证：RAG的过程交给AI，并且不是真正意义上的vector，而是让ai自己总结自己设置目录自己决定内容的含义。也就是说，不做向量了，让ai自己总结文章如何归纳、哪些文章可以分类在一起，哪些该匹配哪些输出内容。这样的设计思路更符合AI决策。因为向量一但确定，则其代表的含义已定死。而内容随时可以转换成可变向量。这是最终要的点。

2、SKILL + AGENT

首先，skill是什么？简单理解就是一个具有垂直功能的程序。比如能把视频转换成gif，可以说是一个skill；把png转成jpeg，是一个skill；复杂一点，获取每天最新的新闻并对自己感兴趣的新闻单独提取做分析后提交到自己的邮箱。这些都算是skill。

那什么是agent？agent就是整合了一系列同领域用途的skill集。比如剪映，他就是一个做视频的agent，拥有提取音频、截取视频、增加动效、美颜等skill；再比如微信就是一个聊天Agent，拥有发语音、发视频、发文字、发朋友圈、发红包转账等skill。

所以，不管是skill还是agent，本质都是代码（这么说好像容易被打）。说到底，Skill 和 Agent 最终都会落到代码、数据、权限、工具和执行环境上。概念可以玄学，但落地一定是工程。

3、LangChain、n8n、coze

都是早期技术匮乏时为了方便开发设计出来的方便完整且快捷开发用的框架或者工具，模型弱的时候，它们负责“补模型能力”；模型强以后，它们似乎开始淡出需求视野。

现状：

就说Codex。其实codex更像是个超大型的Agent。

自gpt5.5出来以后，codex生态一日不见，如隔三秋。在gpt5.5的加持下，一大批agent集体入驻，什么skill，什么agent，什么mcp，不需要！概念没有消失，只是抽象层变了。以前开发者要自己拼 RAG、Skill、Agent；现在这些能力被 Codex、Claude Code 这类原生 Agent 平台吸收，变成底层能力。现在的情况是，让codex给你造skill，给你集成agent，都比你自己去写一个agent写一个skill要强一万倍！甚至，因为cc的封号+基础大模型能力上的稍逊，基本上可以淘汰cc了。如果一个岗位还停留在“会 LangChain / 会 MCP / 会 RAG”这种关键词堆砌，而没有真实业务场景、评测体系、工具权限、执行闭环，那大概率还停留在上一代 AI 应用开发思路里。如果都不知道什么是codex的，基本上已经需要打回清朝了。

大致发展史：

前前后后已经深入使用AI不造多久了，最早使用AI写代码是2023年gpt4刚出来的时候，没有codex app，没有claude code，没有千问没有deepseek

AI coding当时就已经非常惊艳了，原因是早期的ai coding只具备补足一些常规代码，比如if&nbsp; else之类的简单代码。而gpt4却做到了通过自然语言就能生成代码，比如：帮我做一个个人介绍页。它哐哧哐哧就给你写好了。但是只是在gpt聊天框，需要你一块一块的复制粘贴然后进行组装。但是已经很牛批了。

当然局限也很多，最大的问题就是无法本地化。

GPT-4 让 AI Coding 从&ldquo;补全代码&rdquo;进入&ldquo;自然语言生成代码&rdquo;阶段，真正让终端式 Agentic Coding 出圈的，是 2025 年的 claude code（简称cc），到处开始讨论cc。确实，cc在刚出圈的时候，最厉害最圈粉的地方是它带活了很多生态。早期ai coding初见端倪的时候，rag、skill、agent的概念就从未断绝过，这agent，那skill，怎么怎么rag的能降本增效。于是cc的出现，给这些概念留足了发展的空间，于是github出现了一批又一批xxxxagent，xxxxskill，xxxxprompt，首次把ai概念全部给盘活了。

Codex app是2026年2月发布，GPT-5.5是2026年4月发布，codex几乎3天一小更，5天一大更，从简单的native ai到computer use，再到agent+skill集成，直接把以前所有的概念全部按在地上摩擦。此时，作为一个非圈内人，你就开始好奇了：为什么以前的那些agent都不发光了？为什么codex生态有这么多乱七八糟花里胡哨还贼厉害的插件？

而且，很不明显的一个情况就是，以前的那些rag操作、skill、agent成为了众矢之的，食之无味，弃之可惜？

Why？

&nbsp;

一些可能再也用不上的名词：

1、RAG

首先说RAG。RAG全称Retrieval-Augmented Generation，即：检索增强生成。它是基于一个现状而提出的半AI化解决方案。长期依赖，大模型非常欠缺的能力就是上下文处理能力，当你的上下文太大时，AI无法处理，或者处理会有丢失。于是开发者们便把大量的数据，分类加索引并转成机器可识别的向量存下来，在对话的时候大模型会针对性的去检索关联性较高的索引进而搜索内容。

于是便出现了如下情况：

（1）套路死板。聊天内容相似时，检索的内容是差不多的，输出也是差不多的。

（2）检索不准确。偶尔会&ldquo;扯远了&rdquo;

（3）不具备深度思考的可行性。因为向量是固定的！

传统向量 RAG 的问题，把复杂语义压缩成了一次相似度匹配。它擅长找相似材料，但不擅长理解任务目标、重组知识、跨文档推理和动态更新认知。所以其实多上论坛你会发现，很多人都在讨论弃用rag的情况，提出各种rag无法满足的简单需求，尤其体现在交互大的情况下。最近的大佬发言提出了一个很有意思的观点并得到验证：RAG的过程交给AI，并且不是真正意义上的vector，而是让ai自己总结自己设置目录自己决定内容的含义。也就是说，不做向量了，让ai自己总结文章如何归纳、哪些文章可以分类在一起，哪些该匹配哪些输出内容。这样的设计思路更符合AI决策。因为向量一但确定，则其代表的含义已定死。而内容随时可以转换成可变向量。这是最终要的点。

&nbsp;

2、SKILL + AGENT

首先，skill是什么？简单理解就是一个具有垂直功能的程序。比如能把视频转换成gif，可以说是一个skill；把png转成jpeg，是一个skill；复杂一点，获取每天最新的新闻并对自己感兴趣的新闻单独提取做分析后提交到自己的邮箱。这些都算是skill。

那什么是agent？agent就是整合了一系列同领域用途的skill集。比如剪映，他就是一个做视频的agent，拥有提取音频、截取视频、增加动效、美颜等skill；再比如微信就是一个聊天Agent，拥有发语音、发视频、发文字、发朋友圈、发红包转账等skill。

所以，不管是skill还是agent，本质都是代码（这么说好像容易被打）。说到底，Skill 和 Agent 最终都会落到代码、数据、权限、工具和执行环境上。概念可以玄学，但落地一定是工程。

&nbsp;

3、LangChain、n8n、coze

都是早期技术匮乏时为了方便开发设计出来的方便完整且快捷开发用的框架或者工具，模型弱的时候，它们负责&ldquo;补模型能力&rdquo;；模型强以后，它们似乎开始淡出需求视野。

&nbsp;

现状：

就说Codex。其实codex更像是个超大型的Agent。

自gpt5.5出来以后，codex生态一日不见，如隔三秋。在gpt5.5的加持下，一大批agent集体入驻，什么skill，什么agent，什么mcp，不需要！概念没有消失，只是抽象层变了。以前开发者要自己拼 RAG、Skill、Agent；现在这些能力被 Codex、Claude Code 这类原生 Agent 平台吸收，变成底层能力。现在的情况是，让codex给你造skill，给你集成agent，都比你自己去写一个agent写一个skill要强一万倍！甚至，因为cc的封号+基础大模型能力上的稍逊，基本上可以淘汰cc了。如果一个岗位还停留在&ldquo;会 LangChain / 会 MCP / 会 RAG&rdquo;这种关键词堆砌，而没有真实业务场景、评测体系、工具权限、执行闭环，那大概率还停留在上一代 AI 应用开发思路里。如果都不知道什么是codex的，基本上已经需要打回清朝了。

&nbsp;