0openai 古法注册 过不去了
最近注册 openai 为什么总也不成功,好不容易过了邮箱验证码,后面有显示
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: jwctsc)
最近注册 openai 为什么总也不成功,好不容易过了邮箱验证码,后面有显示
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: jwctsc)
小小暴论 为什么我觉得大多编程框架 都是过度设计且效果存疑的
大道至简的胜利, 一个神级skill推荐, 忘掉brainstorming吧 - 开发调优 - LINUX DO
之前在这个帖子末尾留了个坑,现在来填上
先叠甲, 这篇文章我主要指的是 superpowers 和 GSD 这两个框架, 我知道站里的佬友们也做了一些很优秀的框架, 我对此非常的respect. 本文的核心不是为了批判, 主要是为了分享一些观点, 希望和大家一起探讨。
1. 现有框架的一个巨大的bug
这些十几万star的编程框架竟然没有一个有做过benchmark上的实际对比, 注意这可是以提升编程效率和质量为目标的框架, 却没有任何证据能证明这些框架比简单的提示词有更好的效果, 我之前在网上翻了半天, 真的没找到有人做个严谨的实验对比, 来证明框架的效果. 有佬们如果有看过具体的评测文章, 可以贴出来我们一起学习一下
正面例子如 PI 这个coding agent 在他的博客末尾所述, 一个最简单的coding agent也能在benchmark上取得不错的效果.
想要证明一个东西的效果, 我感觉我们还是需要一些严谨的对照实验吧。很多框架带来的只是虚假的热闹, 具体落到实际项目上能否产生正向的影响,还需要更多的证据。
2. 为什么这些框架大多是过度设计的
核心出发点:AI的上下文非常宝贵, 所以:
不应该让太多和代码无关的东西占据上下文. 之前深度使用了GSD, 刚上手时觉得很厉害, 流程一大堆,文档一大堆,调研一大堆, 随便问个小问题, context都被用掉了一半. 一个下午用掉了平常10天的token量, 最后产出东西会发现不一定能完全符合你的需求, 因为他在对需求这最重要的一步做的不够深入.
另外这些框架的skill很多一看就是AI生成的,长篇大论,一大堆废话,看着就头大,这些skill有没有经过人工的review都很难说,仔细看都有很多可以精简的地方。
比方说如果你想让模型按照TDD来开发, 你并不需要搞个上千字的skill给模型讲一遍什么是TDD, 什么红绿灯, 你只需要告诉模型"按照TDD来开发", 这就足够了, TDD是一个很经典的概念, 在他的知识库里,他是知道什么是TDD的, 不需要再浪费prompt去解释它。
之前在 grill-me 的帖子中,我就实际验证了, 简单的prompt反而能实现更好的效果。
3. 模型需要复杂的约束吗?
● 好的模型不需要过多的约束, 这就像如果你是老板,你底下有一个非常非常牛逼的程序员, 那你就不需要给他太多的指导, 不然就变成内行指导外行了
● 差的模型也不需要过多的约束, 因为模型本来就笨, 注意力本来就不集中, 再给他脑子里塞一大堆上下文, 只会让他的小脑瓜转不过来,丢三落四, 对于差的模型,更需要精简而清晰的指令. 就像你让一个小孩帮你做事, 肯定是一次只给他一个清晰的指令, 让他做一件小事, 效果是最好的
4. 复杂的框架并不一定适合你
AI发展到现在, 一切软件都趋向于定制化, 学习框架的成本可能高过让AI给你定制一套简单解决方案的成本. 看看GSD,没个半天时间都看不明白怎么用
5. 复杂的框架,长期来看大概率会成为绊脚石
随着模型更新,模型的长程执行能力也在持续增强,不用任何框架,一句话让模型跑几个小时早已不稀奇(可以参考GLM5.1上线时的报告)
从长期发展来看,随着AI能力变强,我们给他约束应该是越来越少的,这是AI软件发展的大势所趋,越来越多的能力会内化进模型,上层只需要薄薄的封装即可。回到编程上,也许我们提供最少的原则性的约束(如TDD)和适应项目的规范,可能就足够了
总结
“simple but work” 是一个非常值得追求的事情。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: UltraEvolution咻搭小程序)
大道至简的胜利, 一个神级skill推荐, 忘掉brainstorming吧 - 开发调优 - LINUX DO
之前在这个帖子末尾留了个坑,现在来填上
先叠甲, 这篇文章我主要指的是 superpowers 和 GSD 这两个框架, 我知道站里的佬友们也做了一些很优秀的框架, 我对此非常的respect. 本文的核心不是为了批判, 主要是为了分享一些观点, 希望和大家一起探讨。
1. 现有框架的一个巨大的bug
这些十几万star的编程框架竟然没有一个有做过benchmark上的实际对比, 注意这可是以提升编程效率和质量为目标的框架, 却没有任何证据能证明这些框架比简单的提示词有更好的效果, 我之前在网上翻了半天, 真的没找到有人做个严谨的实验对比, 来证明框架的效果. 有佬们如果有看过具体的评测文章, 可以贴出来我们一起学习一下
正面例子如 PI 这个coding agent 在他的博客末尾所述, 一个最简单的coding agent也能在benchmark上取得不错的效果.
想要证明一个东西的效果, 我感觉我们还是需要一些严谨的对照实验吧。很多框架带来的只是虚假的热闹, 具体落到实际项目上能否产生正向的影响,还需要更多的证据。
2. 为什么这些框架大多是过度设计的
核心出发点:AI的上下文非常宝贵, 所以:
不应该让太多和代码无关的东西占据上下文. 之前深度使用了GSD, 刚上手时觉得很厉害, 流程一大堆,文档一大堆,调研一大堆, 随便问个小问题, context都被用掉了一半. 一个下午用掉了平常10天的token量, 最后产出东西会发现不一定能完全符合你的需求, 因为他在对需求这最重要的一步做的不够深入.
另外这些框架的skill很多一看就是AI生成的,长篇大论,一大堆废话,看着就头大,这些skill有没有经过人工的review都很难说,仔细看都有很多可以精简的地方。
比方说如果你想让模型按照TDD来开发, 你并不需要搞个上千字的skill给模型讲一遍什么是TDD, 什么红绿灯, 你只需要告诉模型"按照TDD来开发", 这就足够了, TDD是一个很经典的概念, 在他的知识库里,他是知道什么是TDD的, 不需要再浪费prompt去解释它。
之前在 grill-me 的帖子中,我就实际验证了, 简单的prompt反而能实现更好的效果。
3. 模型需要复杂的约束吗?
● 好的模型不需要过多的约束, 这就像如果你是老板,你底下有一个非常非常牛逼的程序员, 那你就不需要给他太多的指导, 不然就变成内行指导外行了
● 差的模型也不需要过多的约束, 因为模型本来就笨, 注意力本来就不集中, 再给他脑子里塞一大堆上下文, 只会让他的小脑瓜转不过来,丢三落四, 对于差的模型,更需要精简而清晰的指令. 就像你让一个小孩帮你做事, 肯定是一次只给他一个清晰的指令, 让他做一件小事, 效果是最好的
4. 复杂的框架并不一定适合你
AI发展到现在, 一切软件都趋向于定制化, 学习框架的成本可能高过让AI给你定制一套简单解决方案的成本. 看看GSD,没个半天时间都看不明白怎么用
5. 复杂的框架,长期来看大概率会成为绊脚石
随着模型更新,模型的长程执行能力也在持续增强,不用任何框架,一句话让模型跑几个小时早已不稀奇(可以参考GLM5.1上线时的报告)
从长期发展来看,随着AI能力变强,我们给他约束应该是越来越少的,这是AI软件发展的大势所趋,越来越多的能力会内化进模型,上层只需要薄薄的封装即可。回到编程上,也许我们提供最少的原则性的约束(如TDD)和适应项目的规范,可能就足够了
总结
“simple but work” 是一个非常值得追求的事情。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: UltraEvolution咻搭小程序)
想问下cursor是不是过期后会自动变成api收费?
之前我的cursor是次数的这次学生优惠过期后查看变成了api收费了
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: wuliaosile)
之前我的cursor是次数的这次学生优惠过期后查看变成了api收费了
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: wuliaosile)
似乎终于理解了Codex真正的用法
前些天偶然间看到推上有人说GPT和Claude的性格差异,大概意思是,GPT能更好的遵守指令,越细化的指令执行的结果就越好;Claude则对指令容忍度较高。
我让GPT检索了一下来源,应该是从Cursor的这篇文章里来的。
这篇文章给我个启发,为什么不让Agent自己给自己写提示词或者指令?之前我试过让ChatGPT写出prompt给Codex运行,效果有很大提升,但是因为ChatGPT没有开发环境,只能泛泛的给出一个结论,有时候这个结论反而和现实项目相悖,而指令很长又导致可能发现不了这些问题。(比如项目是Vue写的,但是我让GPT描述了功能它让Codex用React写。)
目前我才用的方法是直接让Codex自己读项目,自己写prompt,优化1~2次,然后新建一个session把prompt丢进去让它做,效果提升显著。
最后,我能想到很多大佬可能早就知道这种方法了,只是作为新手的我这两天才悟过来,也算是给其他Vibe Coding的朋友分享一些我的见解吧。
哦对了,我的Coding组合是问过佬们之后采用的3个Plus扔进Sub2Api调度方案,额度基本用不完了 :tieba_025:
6 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Gork)
前些天偶然间看到推上有人说GPT和Claude的性格差异,大概意思是,GPT能更好的遵守指令,越细化的指令执行的结果就越好;Claude则对指令容忍度较高。
我让GPT检索了一下来源,应该是从Cursor的这篇文章里来的。
OpenAI’s models tend to be more literal and precise in their instruction following, whereas Claude is a bit more intuitive and more tolerant to imprecise instructions.我之前不管是用Codex还是Claude Code,都是想着功能实现然后口语化的描述给Agent让它来做,这样虽然基本都可以达到想要的效果,但是往往与想象中的状态还有很多差异,比如细节上的问题、Agent工作中遗留或未考虑到的BUG,这些都需要后续多遍甚至多个Model来Review解决,甚至可能发现不了。
这篇文章给我个启发,为什么不让Agent自己给自己写提示词或者指令?之前我试过让ChatGPT写出prompt给Codex运行,效果有很大提升,但是因为ChatGPT没有开发环境,只能泛泛的给出一个结论,有时候这个结论反而和现实项目相悖,而指令很长又导致可能发现不了这些问题。(比如项目是Vue写的,但是我让GPT描述了功能它让Codex用React写。)
目前我才用的方法是直接让Codex自己读项目,自己写prompt,优化1~2次,然后新建一个session把prompt丢进去让它做,效果提升显著。
最后,我能想到很多大佬可能早就知道这种方法了,只是作为新手的我这两天才悟过来,也算是给其他Vibe Coding的朋友分享一些我的见解吧。
哦对了,我的Coding组合是问过佬们之后采用的3个Plus扔进Sub2Api调度方案,额度基本用不完了 :tieba_025:
6 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Gork)
【纯水】GPT-image2.0 提示词分享
红圈中的这几个特征都是对的 🤣。
提示词:
创作一张图片为《极限竞速 地平线 8》的游戏实机截图,游戏背景设为中国,背景城市为宁波,时间设定为 2028 年。画面需要体现真实次世代开放世界赛车游戏的实机演出效果,包含具有深圳辨识度的城市天际线、现代高楼、道路环境、灯光氛围与速度感。构图中在合适位置放置《极限竞速 地平线 8》的 logo 及宣传文案,整体像官方概念宣传截图而不是普通海报。要求 8K 超高清,电影级光影,真实车辆材质、反射、路面细节与空气透视,画面高级、震撼、写实。
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: platform)
红圈中的这几个特征都是对的 🤣。
提示词:
创作一张图片为《极限竞速 地平线 8》的游戏实机截图,游戏背景设为中国,背景城市为宁波,时间设定为 2028 年。画面需要体现真实次世代开放世界赛车游戏的实机演出效果,包含具有深圳辨识度的城市天际线、现代高楼、道路环境、灯光氛围与速度感。构图中在合适位置放置《极限竞速 地平线 8》的 logo 及宣传文案,整体像官方概念宣传截图而不是普通海报。要求 8K 超高清,电影级光影,真实车辆材质、反射、路面细节与空气透视,画面高级、震撼、写实。
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: platform)
爬虫小白vibecoding求助
本人是个烟斗爱好者嘛,最近ai能力大爆发,连带我自己也膨胀起来了:搞一个斗草监控和抢草的应用。谁知道被codex直接卡在卡在坎上了。先说一下我的问题:
1、codex基本帮我实现了框架,采集的网站是这个:
image
但是到网站库存实时更新这里,直接被拒绝了:
佬佬们,救救草友,指点指点
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: LIUshang)
本人是个烟斗爱好者嘛,最近ai能力大爆发,连带我自己也膨胀起来了:搞一个斗草监控和抢草的应用。谁知道被codex直接卡在卡在坎上了。先说一下我的问题:
1、codex基本帮我实现了框架,采集的网站是这个:
image
但是到网站库存实时更新这里,直接被拒绝了:
佬佬们,救救草友,指点指点
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: LIUshang)
请教一下关于ai coding
能请教一下各位佬们如何提升ai coding能力吗?比如harness应该怎么写之类
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Jay_D)
能请教一下各位佬们如何提升ai coding能力吗?比如harness应该怎么写之类
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Jay_D)
夜深了那就分享点黑,晚安💤
没拍照的日子里,翻起了照片,翻着翻着夜已经深了,在一堆照片中正好选中了它们与今夜一般黑(我在叽里呱啦说什么,晚安😴
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 2332)
没拍照的日子里,翻起了照片,翻着翻着夜已经深了,在一堆照片中正好选中了它们与今夜一般黑(我在叽里呱啦说什么,晚安😴
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 2332)
即将肉身前往德国、瑞典十天,有什么可以薅的羊毛
咨询一下广大佬友们,有没有什么羊毛,比如长期低成本保号的esim、国外的信用卡之类的,或者其他方面的线下不可错过的羊毛,毕竟难得去一趟,想办点能用得上的,比如能用来充claude或者gpt :lark_033:
4 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: zane.zhu)
咨询一下广大佬友们,有没有什么羊毛,比如长期低成本保号的esim、国外的信用卡之类的,或者其他方面的线下不可错过的羊毛,毕竟难得去一趟,想办点能用得上的,比如能用来充claude或者gpt :lark_033:
4 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: zane.zhu)
Pi Mono 仓库已迁移到 earendil-works
如图,Pi Mono Github 仓库所属以及其子包的 npm scope 已迁移到 earendil-works
使用 Pi Coding Agent 的用户请执行
扩展/SDK开发者请及时更新包导入
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 方生无归)
如图,Pi Mono Github 仓库所属以及其子包的 npm scope 已迁移到 earendil-works
使用 Pi Coding Agent 的用户请执行
pi update扩展/SDK开发者请及时更新包导入
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 方生无归)
部署了半个月的CPA一直在裸奔...
起因是半个月前一时兴起在服务器上部署了个CPA,顺便挂了几个free号,测试了一下就一直没管了。
上周突然想起调用了一下发现限额了,想着设置的弱密码被刷了也正常。随手改了下密码也没管。
今天想着该有额度刷新了看了一下日志还有人在蹬,一顿排查发现是api-keys在一开始就没设置。应该是在管理面板删除默认key的时候框框一顿全删完了,结果就是根本没有鉴权。。。
啊,被自己蠢哭了。。。
5 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: yunm)
起因是半个月前一时兴起在服务器上部署了个CPA,顺便挂了几个free号,测试了一下就一直没管了。
上周突然想起调用了一下发现限额了,想着设置的弱密码被刷了也正常。随手改了下密码也没管。
今天想着该有额度刷新了看了一下日志还有人在蹬,一顿排查发现是api-keys在一开始就没设置。应该是在管理面板删除默认key的时候框框一顿全删完了,结果就是根本没有鉴权。。。
啊,被自己蠢哭了。。。
5 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: yunm)