慢讯-xai转成spacexAi的一个部门-是否标志着顶级大模型已经无法用资源堆叠
如图,看到这个之后,我仔细想了一下,这个是不是意味着顶级大模型已经无法依赖简单资源堆叠去进化了?
或者说现在ai大模型已经做成飞轮效应了,进入ai大模型进入已经开始进行入决赛评选了?
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 老文)
如图,看到这个之后,我仔细想了一下,这个是不是意味着顶级大模型已经无法依赖简单资源堆叠去进化了?
或者说现在ai大模型已经做成飞轮效应了,进入ai大模型进入已经开始进行入决赛评选了?
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 老文)
巴西宣布对中国公民免签
新华社巴西利亚5月7日电(记者吴昊)巴西政府7日宣布,自2026年5月11日起,对持普通护照的中国公民实施免签入境政策。
根据巴西外交部发布的公报,持普通护照的中华人民共和国公民可享受短期免签入境,每次入境最长可免签停留30天。news.cn
巴西宣布对中国公民免签-新华网
巴西宣布对中国公民免签-
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 雪梨纽西兰希思露甘奶迪)
新华社巴西利亚5月7日电(记者吴昊)巴西政府7日宣布,自2026年5月11日起,对持普通护照的中国公民实施免签入境政策。
根据巴西外交部发布的公报,持普通护照的中华人民共和国公民可享受短期免签入境,每次入境最长可免签停留30天。news.cn
巴西宣布对中国公民免签-新华网
巴西宣布对中国公民免签-
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 雪梨纽西兰希思露甘奶迪)
大家的Claude code 是如何远程连接服务器的
最近想要在tb上拼一个claude max 20x 但是车主说只能给登陆一个设备,这样的话本人有时需要远程服务器开发,但也不可能把cc放在服务器上跑 然后本地不用 这样也很难搞
各位佬有什么办法吗 我看有人说搞一个ssh的MCP,这种可行吗 不太懂这方面,求教一下 😂
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Soleil)
最近想要在tb上拼一个claude max 20x 但是车主说只能给登陆一个设备,这样的话本人有时需要远程服务器开发,但也不可能把cc放在服务器上跑 然后本地不用 这样也很难搞
各位佬有什么办法吗 我看有人说搞一个ssh的MCP,这种可行吗 不太懂这方面,求教一下 😂
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Soleil)
给我更多更多更多Tokens
玩Hermes一天吃了1.67亿Tokens 😭,
要不是有mimo的话,真要破产了,每天这么吃这么多Token,
干脆改名叫吞金兽算了
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: deepcake)
玩Hermes一天吃了1.67亿Tokens 😭,
要不是有mimo的话,真要破产了,每天这么吃这么多Token,
干脆改名叫吞金兽算了
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: deepcake)
我想做个中转站,请问各位大佬们哪里有性价比高的token货源渠道?
各位大佬们好!
我想做个中转站,请问大家去哪里哪里找性价比高的token货源渠道?
8 个帖子 - 6 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: gergore)
各位大佬们好!
我想做个中转站,请问大家去哪里哪里找性价比高的token货源渠道?
8 个帖子 - 6 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: gergore)
我好像触摸到mimo-v2.5-pro模型的禁区了
月初申请的测试,给了一个月的max套餐,16亿token,量大管饱,因为是白送的测试,没体验过模型能力,也就没有用于正式项目。手上有hermesAgent这种消耗大户,暂时给安排进hermes里去测试能力
前几天用着感觉挺好,虽然消耗大,一个问题6万+token,但白送的16亿,又没犯什么错,还有时候排个几分钟的队…但是国产嘛…“算力紧张、被卡脖子、研发贵、成本高”,理解的,都懂
甚至测到它好像没设什么规矩,挺奔放的,写脚本、注入这种活都敢干,我大受震惊!一度跟朋友吹嘘"gpt不能干的事儿mimo能干"
(以下内容截图"沙盘环境"仅仅是测试模型,无任何商业化、违规使用)
然而今晚刚启动hermes,发现它不认识自己是谁了,查看记忆:空。
给我吓一跳,我费尽心机调教了半个月的hermes可不能傻了啊!
不断追问它原因,最终它说是 它的模型推理,偷懒没读取配置文件,猜了一个配置文件的路径,这还是人工智能吗? 挺"人工"的,但是"不太智能"
找到mimo禁区了:帮你写注入写透视写外挂可以,骂自己不行 🤣
3 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: lucian)
月初申请的测试,给了一个月的max套餐,16亿token,量大管饱,因为是白送的测试,没体验过模型能力,也就没有用于正式项目。手上有hermesAgent这种消耗大户,暂时给安排进hermes里去测试能力
前几天用着感觉挺好,虽然消耗大,一个问题6万+token,但白送的16亿,又没犯什么错,还有时候排个几分钟的队…但是国产嘛…“算力紧张、被卡脖子、研发贵、成本高”,理解的,都懂
甚至测到它好像没设什么规矩,挺奔放的,写脚本、注入这种活都敢干,我大受震惊!一度跟朋友吹嘘"gpt不能干的事儿mimo能干"
(以下内容截图"沙盘环境"仅仅是测试模型,无任何商业化、违规使用)
然而今晚刚启动hermes,发现它不认识自己是谁了,查看记忆:空。
给我吓一跳,我费尽心机调教了半个月的hermes可不能傻了啊!
不断追问它原因,最终它说是 它的模型推理,偷懒没读取配置文件,猜了一个配置文件的路径,这还是人工智能吗? 挺"人工"的,但是"不太智能"
找到mimo禁区了:帮你写注入写透视写外挂可以,骂自己不行 🤣
3 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: lucian)
Android有没有类似slidebox的免费好用的清理相册的软件
Android版的slidebox除了当天的可以使用,其他的功能都要会员才能使用,而且只支持相机拍摄的,截屏的都不支持。。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: vivion)
Android版的slidebox除了当天的可以使用,其他的功能都要会员才能使用,而且只支持相机拍摄的,截屏的都不支持。。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: vivion)
Claude Code 为啥这么爱问问题?
真被 cc 问烦了,蹬着蹬着发现每次一开 max 嘎嘎问我问题,一个小改动点问了 20 多个,但是感觉开 xhigh 又没劲,(也有可能是官 API 比中转问的多),各位佬友一般都怎么蹬 cc 的求教,真的不想埋头点 yes 了 😇
4 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 小P小P)
真被 cc 问烦了,蹬着蹬着发现每次一开 max 嘎嘎问我问题,一个小改动点问了 20 多个,但是感觉开 xhigh 又没劲,(也有可能是官 API 比中转问的多),各位佬友一般都怎么蹬 cc 的求教,真的不想埋头点 yes 了 😇
4 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 小P小P)
GPT-5.5 Instant 发布(所有人都可以使用)
阅读完整话题
via LINUX DO - 最新话题 (author: 何芸)
1 个帖子 - 1 位参与者
https://openai.com/index/gpt-5-5-instant/
阅读完整话题
via LINUX DO - 最新话题 (author: 何芸)
0openai 古法注册 过不去了
最近注册 openai 为什么总也不成功,好不容易过了邮箱验证码,后面有显示
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: jwctsc)
最近注册 openai 为什么总也不成功,好不容易过了邮箱验证码,后面有显示
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: jwctsc)
小小暴论 为什么我觉得大多编程框架 都是过度设计且效果存疑的
大道至简的胜利, 一个神级skill推荐, 忘掉brainstorming吧 - 开发调优 - LINUX DO
之前在这个帖子末尾留了个坑,现在来填上
先叠甲, 这篇文章我主要指的是 superpowers 和 GSD 这两个框架, 我知道站里的佬友们也做了一些很优秀的框架, 我对此非常的respect. 本文的核心不是为了批判, 主要是为了分享一些观点, 希望和大家一起探讨。
1. 现有框架的一个巨大的bug
这些十几万star的编程框架竟然没有一个有做过benchmark上的实际对比, 注意这可是以提升编程效率和质量为目标的框架, 却没有任何证据能证明这些框架比简单的提示词有更好的效果, 我之前在网上翻了半天, 真的没找到有人做个严谨的实验对比, 来证明框架的效果. 有佬们如果有看过具体的评测文章, 可以贴出来我们一起学习一下
正面例子如 PI 这个coding agent 在他的博客末尾所述, 一个最简单的coding agent也能在benchmark上取得不错的效果.
想要证明一个东西的效果, 我感觉我们还是需要一些严谨的对照实验吧。很多框架带来的只是虚假的热闹, 具体落到实际项目上能否产生正向的影响,还需要更多的证据。
2. 为什么这些框架大多是过度设计的
核心出发点:AI的上下文非常宝贵, 所以:
不应该让太多和代码无关的东西占据上下文. 之前深度使用了GSD, 刚上手时觉得很厉害, 流程一大堆,文档一大堆,调研一大堆, 随便问个小问题, context都被用掉了一半. 一个下午用掉了平常10天的token量, 最后产出东西会发现不一定能完全符合你的需求, 因为他在对需求这最重要的一步做的不够深入.
另外这些框架的skill很多一看就是AI生成的,长篇大论,一大堆废话,看着就头大,这些skill有没有经过人工的review都很难说,仔细看都有很多可以精简的地方。
比方说如果你想让模型按照TDD来开发, 你并不需要搞个上千字的skill给模型讲一遍什么是TDD, 什么红绿灯, 你只需要告诉模型"按照TDD来开发", 这就足够了, TDD是一个很经典的概念, 在他的知识库里,他是知道什么是TDD的, 不需要再浪费prompt去解释它。
之前在 grill-me 的帖子中,我就实际验证了, 简单的prompt反而能实现更好的效果。
3. 模型需要复杂的约束吗?
● 好的模型不需要过多的约束, 这就像如果你是老板,你底下有一个非常非常牛逼的程序员, 那你就不需要给他太多的指导, 不然就变成内行指导外行了
● 差的模型也不需要过多的约束, 因为模型本来就笨, 注意力本来就不集中, 再给他脑子里塞一大堆上下文, 只会让他的小脑瓜转不过来,丢三落四, 对于差的模型,更需要精简而清晰的指令. 就像你让一个小孩帮你做事, 肯定是一次只给他一个清晰的指令, 让他做一件小事, 效果是最好的
4. 复杂的框架并不一定适合你
AI发展到现在, 一切软件都趋向于定制化, 学习框架的成本可能高过让AI给你定制一套简单解决方案的成本. 看看GSD,没个半天时间都看不明白怎么用
5. 复杂的框架,长期来看大概率会成为绊脚石
随着模型更新,模型的长程执行能力也在持续增强,不用任何框架,一句话让模型跑几个小时早已不稀奇(可以参考GLM5.1上线时的报告)
从长期发展来看,随着AI能力变强,我们给他约束应该是越来越少的,这是AI软件发展的大势所趋,越来越多的能力会内化进模型,上层只需要薄薄的封装即可。回到编程上,也许我们提供最少的原则性的约束(如TDD)和适应项目的规范,可能就足够了
总结
“simple but work” 是一个非常值得追求的事情。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: UltraEvolution咻搭小程序)
大道至简的胜利, 一个神级skill推荐, 忘掉brainstorming吧 - 开发调优 - LINUX DO
之前在这个帖子末尾留了个坑,现在来填上
先叠甲, 这篇文章我主要指的是 superpowers 和 GSD 这两个框架, 我知道站里的佬友们也做了一些很优秀的框架, 我对此非常的respect. 本文的核心不是为了批判, 主要是为了分享一些观点, 希望和大家一起探讨。
1. 现有框架的一个巨大的bug
这些十几万star的编程框架竟然没有一个有做过benchmark上的实际对比, 注意这可是以提升编程效率和质量为目标的框架, 却没有任何证据能证明这些框架比简单的提示词有更好的效果, 我之前在网上翻了半天, 真的没找到有人做个严谨的实验对比, 来证明框架的效果. 有佬们如果有看过具体的评测文章, 可以贴出来我们一起学习一下
正面例子如 PI 这个coding agent 在他的博客末尾所述, 一个最简单的coding agent也能在benchmark上取得不错的效果.
想要证明一个东西的效果, 我感觉我们还是需要一些严谨的对照实验吧。很多框架带来的只是虚假的热闹, 具体落到实际项目上能否产生正向的影响,还需要更多的证据。
2. 为什么这些框架大多是过度设计的
核心出发点:AI的上下文非常宝贵, 所以:
不应该让太多和代码无关的东西占据上下文. 之前深度使用了GSD, 刚上手时觉得很厉害, 流程一大堆,文档一大堆,调研一大堆, 随便问个小问题, context都被用掉了一半. 一个下午用掉了平常10天的token量, 最后产出东西会发现不一定能完全符合你的需求, 因为他在对需求这最重要的一步做的不够深入.
另外这些框架的skill很多一看就是AI生成的,长篇大论,一大堆废话,看着就头大,这些skill有没有经过人工的review都很难说,仔细看都有很多可以精简的地方。
比方说如果你想让模型按照TDD来开发, 你并不需要搞个上千字的skill给模型讲一遍什么是TDD, 什么红绿灯, 你只需要告诉模型"按照TDD来开发", 这就足够了, TDD是一个很经典的概念, 在他的知识库里,他是知道什么是TDD的, 不需要再浪费prompt去解释它。
之前在 grill-me 的帖子中,我就实际验证了, 简单的prompt反而能实现更好的效果。
3. 模型需要复杂的约束吗?
● 好的模型不需要过多的约束, 这就像如果你是老板,你底下有一个非常非常牛逼的程序员, 那你就不需要给他太多的指导, 不然就变成内行指导外行了
● 差的模型也不需要过多的约束, 因为模型本来就笨, 注意力本来就不集中, 再给他脑子里塞一大堆上下文, 只会让他的小脑瓜转不过来,丢三落四, 对于差的模型,更需要精简而清晰的指令. 就像你让一个小孩帮你做事, 肯定是一次只给他一个清晰的指令, 让他做一件小事, 效果是最好的
4. 复杂的框架并不一定适合你
AI发展到现在, 一切软件都趋向于定制化, 学习框架的成本可能高过让AI给你定制一套简单解决方案的成本. 看看GSD,没个半天时间都看不明白怎么用
5. 复杂的框架,长期来看大概率会成为绊脚石
随着模型更新,模型的长程执行能力也在持续增强,不用任何框架,一句话让模型跑几个小时早已不稀奇(可以参考GLM5.1上线时的报告)
从长期发展来看,随着AI能力变强,我们给他约束应该是越来越少的,这是AI软件发展的大势所趋,越来越多的能力会内化进模型,上层只需要薄薄的封装即可。回到编程上,也许我们提供最少的原则性的约束(如TDD)和适应项目的规范,可能就足够了
总结
“simple but work” 是一个非常值得追求的事情。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: UltraEvolution咻搭小程序)
想问下cursor是不是过期后会自动变成api收费?
之前我的cursor是次数的这次学生优惠过期后查看变成了api收费了
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: wuliaosile)
之前我的cursor是次数的这次学生优惠过期后查看变成了api收费了
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: wuliaosile)
似乎终于理解了Codex真正的用法
前些天偶然间看到推上有人说GPT和Claude的性格差异,大概意思是,GPT能更好的遵守指令,越细化的指令执行的结果就越好;Claude则对指令容忍度较高。
我让GPT检索了一下来源,应该是从Cursor的这篇文章里来的。
这篇文章给我个启发,为什么不让Agent自己给自己写提示词或者指令?之前我试过让ChatGPT写出prompt给Codex运行,效果有很大提升,但是因为ChatGPT没有开发环境,只能泛泛的给出一个结论,有时候这个结论反而和现实项目相悖,而指令很长又导致可能发现不了这些问题。(比如项目是Vue写的,但是我让GPT描述了功能它让Codex用React写。)
目前我才用的方法是直接让Codex自己读项目,自己写prompt,优化1~2次,然后新建一个session把prompt丢进去让它做,效果提升显著。
最后,我能想到很多大佬可能早就知道这种方法了,只是作为新手的我这两天才悟过来,也算是给其他Vibe Coding的朋友分享一些我的见解吧。
哦对了,我的Coding组合是问过佬们之后采用的3个Plus扔进Sub2Api调度方案,额度基本用不完了 :tieba_025:
6 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Gork)
前些天偶然间看到推上有人说GPT和Claude的性格差异,大概意思是,GPT能更好的遵守指令,越细化的指令执行的结果就越好;Claude则对指令容忍度较高。
我让GPT检索了一下来源,应该是从Cursor的这篇文章里来的。
OpenAI’s models tend to be more literal and precise in their instruction following, whereas Claude is a bit more intuitive and more tolerant to imprecise instructions.我之前不管是用Codex还是Claude Code,都是想着功能实现然后口语化的描述给Agent让它来做,这样虽然基本都可以达到想要的效果,但是往往与想象中的状态还有很多差异,比如细节上的问题、Agent工作中遗留或未考虑到的BUG,这些都需要后续多遍甚至多个Model来Review解决,甚至可能发现不了。
这篇文章给我个启发,为什么不让Agent自己给自己写提示词或者指令?之前我试过让ChatGPT写出prompt给Codex运行,效果有很大提升,但是因为ChatGPT没有开发环境,只能泛泛的给出一个结论,有时候这个结论反而和现实项目相悖,而指令很长又导致可能发现不了这些问题。(比如项目是Vue写的,但是我让GPT描述了功能它让Codex用React写。)
目前我才用的方法是直接让Codex自己读项目,自己写prompt,优化1~2次,然后新建一个session把prompt丢进去让它做,效果提升显著。
最后,我能想到很多大佬可能早就知道这种方法了,只是作为新手的我这两天才悟过来,也算是给其他Vibe Coding的朋友分享一些我的见解吧。
哦对了,我的Coding组合是问过佬们之后采用的3个Plus扔进Sub2Api调度方案,额度基本用不完了 :tieba_025:
6 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Gork)