我把 SPEC-AGENTS 升到 v3 了。
核心变化:不再让 AI 每次读一堆 spec / plan / task / change log。过去这种纯 SPEC 推动方式,在模型能力弱的时候有用,但现在模型能力变强了许多,不需要过多的硬性约束,也可以规划得很好。因此,如果严格的遵守 SPEC 开发范式,我觉得会更快烧掉上下文和 token。
现在 SPEC-AGENTS 升级到 v3,改成我称之为 EDPP 的开发方式:「证据驱动阶段规划」。
它的不同之处是,先告诉 AI 边界、当前 phase、验收标准,但不些具体的实现方式。一轮开发后,用测试和 evidence 证明结果,通过之后,再基于当前阶段的实现,直接制作下一个的计划。然后在按照计划执行,如此循环。 有点像渐进式开发的感觉。
我做了一个小对比测试:同一个需求下,v2 默认读取约 601 tokens,v3 约 290 tokens,少了 51.7%;需要维护的写入面从 5 个降到 2 个。
EDPP 让大模型“少写文档”,将宝贵的上下文留给真正长期有价值的东西。
https://github.com/yibie/SPEC-AGENTS.md
核心变化:不再让 AI 每次读一堆 spec / plan / task / change log。过去这种纯 SPEC 推动方式,在模型能力弱的时候有用,但现在模型能力变强了许多,不需要过多的硬性约束,也可以规划得很好。因此,如果严格的遵守 SPEC 开发范式,我觉得会更快烧掉上下文和 token。
现在 SPEC-AGENTS 升级到 v3,改成我称之为 EDPP 的开发方式:「证据驱动阶段规划」。
它的不同之处是,先告诉 AI 边界、当前 phase、验收标准,但不些具体的实现方式。一轮开发后,用测试和 evidence 证明结果,通过之后,再基于当前阶段的实现,直接制作下一个的计划。然后在按照计划执行,如此循环。 有点像渐进式开发的感觉。
我做了一个小对比测试:同一个需求下,v2 默认读取约 601 tokens,v3 约 290 tokens,少了 51.7%;需要维护的写入面从 5 个降到 2 个。
EDPP 让大模型“少写文档”,将宝贵的上下文留给真正长期有价值的东西。
https://github.com/yibie/SPEC-AGENTS.md
不知不觉2.1万粉丝了, 感谢友友们的支持。
从第一次工作2005年开始, 今年是工作的第20年。
第一份工作是图书管理员, 第二份是J2ME手机游戏开发, 第三份是自己创建了服装厂, 第四份工作是花了8年时间创建了 Deepin Linux 干到国内第一, 第五份工作是创建了武汉锂钠氪锶做了懒猫微服。
过去的20年是我快速成长, 学习Linux、Emacs和商业的20年, 当年的辛酸现在看起来都是美好的回忆和经历, 感谢过去的困难造就了如今勇敢的我。
大家有啥感兴趣的, 我能分享的东西, 我无偿分享给大家, 欢迎大家访问我的开源博客 https://manateelazycat.github.io/ 距今已经写了10年, 写了421 篇博客 116 万字。
互联网充电|优质资源
优质内容|内幕消息
从第一次工作2005年开始, 今年是工作的第20年。
第一份工作是图书管理员, 第二份是J2ME手机游戏开发, 第三份是自己创建了服装厂, 第四份工作是花了8年时间创建了 Deepin Linux 干到国内第一, 第五份工作是创建了武汉锂钠氪锶做了懒猫微服。
过去的20年是我快速成长, 学习Linux、Emacs和商业的20年, 当年的辛酸现在看起来都是美好的回忆和经历, 感谢过去的困难造就了如今勇敢的我。
大家有啥感兴趣的, 我能分享的东西, 我无偿分享给大家, 欢迎大家访问我的开源博客 https://manateelazycat.github.io/ 距今已经写了10年, 写了421 篇博客 116 万字。
互联网充电|优质资源
优质内容|内幕消息
如果只看美国大模型「御三家」的话,最近一年确实有种你方唱罢我登场、各领风骚几个月的感觉:
去年的这个时候,ChatGPT的文生图引爆市场,「吉卜力画风」创造了史诗级刷屏,直接把本就断崖领先的周活用户打翻倍了;
然后到了下半年的「谷歌主场」,Nano Banana在多模态能力上还以颜色,Gemini 3一举奠定SOTA地位,谷歌的翻盘被媒体大书特书;
再就是从去年年底到今年年初的Claude血洗软件行业,完全专注于B端的Anthropic纯靠模型能力实现了ARR极速涨到全球第一的奇迹;
现在呢,好像OpenAI又醒过来了,GPT-Image-2在文生图领域再次上演王者归来,GPT-5.5 Instant也没翻车,而Codex的口碑和数据甚至隐隐压过Claude Code;
王权永不稳啊。
去年的这个时候,ChatGPT的文生图引爆市场,「吉卜力画风」创造了史诗级刷屏,直接把本就断崖领先的周活用户打翻倍了;
然后到了下半年的「谷歌主场」,Nano Banana在多模态能力上还以颜色,Gemini 3一举奠定SOTA地位,谷歌的翻盘被媒体大书特书;
再就是从去年年底到今年年初的Claude血洗软件行业,完全专注于B端的Anthropic纯靠模型能力实现了ARR极速涨到全球第一的奇迹;
现在呢,好像OpenAI又醒过来了,GPT-Image-2在文生图领域再次上演王者归来,GPT-5.5 Instant也没翻车,而Codex的口碑和数据甚至隐隐压过Claude Code;
王权永不稳啊。