linux.do

闲聊一下，说说自己最近对codex skills manus等一系列2025年下半年已经发生2026年将要发生的推断

主要是涉及到目前AI代理中出现的一个新特性，名为skills，该特性翻译为“技能”，主要是把一串规范和工具包装成可复用功能，让模型调用。但是就是基于这个特性，我突然发现这可能和今年下半年市场对agent产品热情熄灭、Manus被Meta收购（Manus自己也急着出售）有关。不知道我的推测是否合理，佬友可以听我讲述一番。

skills这项功能绝对是颠覆性的，在Claude推出它时大伙都低估了它的能力。第一是工具调用，Claude code等支持skills的AI代理本身就可以使用，Window、Linux终端持有的命令，执行的代码脚本例如.py、.sh脚本，而skills内部则是编写触发后内部的流程规划。而2025年下半年的模型基座能力提升，终于是触摸到长链路任务的复杂规划能力，skills本质就是规划任务能力的体现。skills中包含的各类情景，例如出现错误应该如何操作、获得响应应该如何返回、等待时长通过什么得知，这都是写在skills内部的。而且模型还会基于情景进行纠错，继续任务task的流程直至交付完善。

Manus急着卖大概率是发现市面上的确模型基座已经快具备长链路任务规划能力和情景纠错能力了，他们的工具本质上是个多Agent交互系统，基于上下文工程+文件系统+沙箱组成了一整套自循环场景，而skills也是一种自循环场景，两者在功能性上实际上是相同的。甚至skills在交付能力上更大于Manus，因为内部不需要那么多Agent反复迭代，导致长链路任务的幻觉，所以Manus这类产品已经被技术迭代了。大厂都不复刻Manus大概也是清晰地知道这类产品只是玩具，市场并不需要那么不稳定的工具。

另外就是我自己的感知，2026年开始模型厂商都会开始卷长链路的自动化流程任务，完全自动循环实现的落地交付，这种情形是最接近我们未来设想的AGI的愿景。只要通过想要的落地交付物，AI就能通过链路规划的任务自动实现结果的交付，通过基座强大的纠错机制，人类就可以放弃理解黑盒中的实际业务，只要知道开头和结尾就行。所以说Manus急着卖自己，2025年的下半年Manus的技术就已经属于落后的了。在Codex中的GPT5.2基座就已经有长链路规划和自动纠错能力，他们测试后恐慌的急着找出路，通用agent的这条路，终究是被模型厂商轻松超越了。

目前最大的恐慌就是下半年语言没啥优势了，2026年我推测真正富有架构能力且有认知结果推断能力的工程师才能活下去，再比较语言能力的强弱估计都没啥意义了。属于程序员的失业潮应该快了。我不敢想，只要自己想要，通过skills、流程分析、自动规划，加分支纠错，场景测试，最终落地，就能实现一个商业化的产品。我调试代码写代码干嘛呢？跳过中间直接落地，就像炼金术一样。

因为我推测skills的能力后，突然发现AI离操作现实应用也不远了。AI通过curl就可以触发接口，而现代互联网都是各种REST风格的API接口，只要得知这些接口内容就可以组合成一套链路复杂的任务流，去实现以前想都不敢想的能力，例如航空分析、商业化的调研。抓取一些被设有爬虫保护的网站，就算不知道这些接口，也可以通过chrome devtools、MCP浏览器工具去获取，甚至写playwright抓取页面元素。还有像数据库操作、Docker操作、SSH远程的服务器操作，这些只要能获得细节内容再编制成skills，就能实现自动化分析，产生实际想要的页面结果、实际的产品。

我现在愈发觉得skills就是一个产品，只是他们包裹在现在的Claude code、Codex等各类AI代理中。不在意中间流程只想知道交付，把skills包装成一个绘图工具，内部编写使用OpenAI格式或者Google格式，去访问对应的能实现功能的小香蕉api端点，剩下等待就是出图，把他包裹在一个Web页面上，它就是一个出图网站。业务流程的具体实现需要用到哪些代码，无非是工具链路需要给它一些实际情景：等待响应、获取返回、得到结果如何包装，以及一些编辑好的工具，这不都是写在skills里的吗？与其说是技能包，不如说就是打包的一整套交付流程。

如此强大的功能，都得益于GPT5.2那夸张的执行能力。在Codex里面GPT5.2甚至能工作22个小时不被阻断，持续性到交付。例如n8n之流，我看在2026年上半年就会迎来死亡。

7 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: ShiroEirin)

Invalid media: image

30 views19:01