LinuxDo 新帖推送

标题: 我的小狗狗回家了在老丈人家里住了一年
作者: #Bitcoin
板块: #搞七捻三
编号: 1996619
帖子: https://linux.do/t/topic/1996619
时间: 2026-04-18 21:17:45
摘要:

好久没有发过贴了

2 views13:19

LinuxDo 新帖推送

标题: 最近怎么不见Augment了
作者: #LPK
板块: #搞七捻三
编号: 1996627
帖子: https://linux.do/t/topic/1996627
时间: 2026-04-18 21:18:36
摘要:

这个工具也能使用高级模型，之前一段时间热度也很高啊我记得

2 views13:19

LinuxDo 新帖推送

标题: gpt也是薛定谔的降智
作者: #不吃鱼的小王
板块: #搞七捻三
编号: 1996628
帖子: https://linux.do/t/topic/1996628
时间: 2026-04-18 21:18:36
摘要:

前天开gpt5.4pro的进阶思考，每次大约要7-10分钟，昨天6分钟左右，今天4-5分钟。codex上使用也是一样，前几天死慢，但是思考确实很有深度，并且检查的异常细致，把可能出现的风险点都加上了，最令我惊讶的他还能通过网络找对标案例来进行分析。今天思考异常短，并且经常做一些低级的错误。现在AI是个循环了，新模型——买——降智——换——新模型。我这几天也在思考，之前开个影音会员又是拼车又是尼区，现在买个token真舍得花钱，一个max说买就买，一个pro说买就买

2 views13:19

LinuxDo 新帖推送

标题: G304更换鼠标左右键微动
作者: #吃风筝的人
板块: #搞七捻三
编号: 1996629
帖子: https://linux.do/t/topic/1996629
时间: 2026-04-18 21:18:43
摘要:

鼠标左键微动坏了，经常自动双击。淘宝上买了一个微动，今天装上试试。一边更换，一边更新本帖，主打一个记录生活。

拆卸外壳。撕开脚垫，有四颗螺丝。鼠标用久了，脚垫有些分层，用指甲抠了半天。附带的镊子不如指甲好用。

2 views13:19

LinuxDo 新帖推送

标题: 吸一口……好怪，混合着廉价香水和臭味的
作者: #🐟
板块: #搞七捻三
编号: 1996630
帖子: https://linux.do/t/topic/1996630
时间: 2026-04-18 21:18:46
摘要:

出门偶遇猫猫，钱包变瘪了

2 views13:19

LinuxDo 新帖推送

标题: 这个应该是gpt5.4pro（思考深度：xhigh）吧
作者: #qq1244
板块: #搞七捻三
编号: 1996632
帖子: https://linux.do/t/topic/1996632
时间: 2026-04-18 21:19:28
摘要:

不知道要不要上公益站。

2 views13:22

LinuxDo 新帖推送

标题: 移动的龙虾也来了
作者: #𝓕-𝓓𝓻𝓸𝓲𝓭
板块: #搞七捻三
编号: 1996635
帖子: https://linux.do/t/topic/1996635
时间: 2026-04-18 21:19:49
摘要:

没看到有收费的项目，好像可以定时任务，自动发邮件到指定邮箱

2 views13:22

LinuxDo 新帖推送

标题: AMAZON Q的模型怎么就不更新了呢
作者: #pixk
板块: #搞七捻三
编号: 1996637
帖子: https://linux.do/t/topic/1996637
时间: 2026-04-18 21:19:51
摘要:

扩展一直在更新，但模型停止在4.5好几个月了，亚马逊这是放弃了？

2 views13:22

LinuxDo 新帖推送

标题: 大语言模型蒸馏时学生模型仍可能继承教师模型的偏好
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #前沿快讯
编号: 1996646
帖子: https://linux.do/t/topic/1996646
时间: 2026-04-18 21:21:18
摘要:

https://www.nature.com/articles/s41586-026-10319-8

2 views13:22

LinuxDo 新帖推送

标题: 【开源】你改了很多次 Skill，结果可能“只是看起来更好了”
作者: #苦果亦是果
板块: #开发调优
编号: 1996647
帖子: https://linux.do/t/topic/1996647
时间: 2026-04-18 21:21:43
摘要:

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：

我的帖子已经打上 开源推广 标签： 是
我的开源项目完整开源，无未开源部分： 是
我的开源项目已链接认可 LINUX DO 社区： 是
我帖子内的项目介绍，AI生成、润色内容部分已截图发出： 是
以上选择我承诺是永久有效的，接受社区和佬友监督： 是

以下全是我自己手搓，没有ai味（我用最真实、最不绕、最直接的方式跟你讲 hhhhh），放心品尝

很多人以为 Skill 迭代最难的是"怎么改"。
但我越来越强烈地觉得，真正难的其实不是改，而是：
你改完之后，根本不知道它到底有没有真的变好。
补描述、调 prompt、加例子、补边界、改结构。
Skill 看起来越来越完整，文档越来越像样，语气越来越专业。
但问题是：看起来更完整，不等于真的更强。 skill的实际行为未必更稳定，边界未必更清晰，失败处理也未必更好。
所以很多 Skill 维护最别扭的地方，其实不是"不会写"，而是你明明已经改了很多轮，却还是说不清：
上一次改动，到底有没有真正产生作用。
我后来专门跑了 100 个高下载 Skill，发现问题并不是"不能用"
（是的，烧我自己的token）结果最有意思的地方，不是烂 Skill 特别多。恰恰相反，大多数 skill 其实都能用：


70 个通过
29 个在 caution 区间
1 个 fail
平均分 73.8



真正的问题不是：大多数 Skill 完全不能用。
而是很多 Skill 停在一个很尴尬的状态：能用，但不容易被继续有效优化。
你一旦想认真往上修，就会发现问题不少，但很难判断到底该先修哪一块。
也就是说，难点不是"没法写"，而是没有诊断，所以不知道怎么有效地继续改。
更关键的是，这种"不对劲"还不是随机的。
我看到的弱点主要集中在几个地方：


Trigger quality 平均 6.2
Functional quality 平均 6.6
大约 80% 缺少 not_for 边界
大约 60% 的 D4 弱项 Skill 缺少像样的 error

3 views13:22

About

Blog

Apps

Platform