LinuxDo 新帖推送
179 subscribers
249K photos
310K links
Download Telegram
标题: 我的小狗狗回家了 在老丈人家里住了一年
作者: #Bitcoin
板块: #搞七捻三
编号: 1996619
帖子: https://linux.do/t/topic/1996619
时间: 2026-04-18 21:17:45
摘要:
好久没有发过贴了
标题: 最近怎么不见Augment了
作者: #LPK
板块: #搞七捻三
编号: 1996627
帖子: https://linux.do/t/topic/1996627
时间: 2026-04-18 21:18:36
摘要:
这个工具也能使用高级模型,之前一段时间热度也很高啊我记得
标题: gpt也是薛定谔的降智
作者: #不吃鱼的小王
板块: #搞七捻三
编号: 1996628
帖子: https://linux.do/t/topic/1996628
时间: 2026-04-18 21:18:36
摘要:
前天开gpt5.4pro的进阶思考,每次大约要7-10分钟,昨天6分钟左右,今天4-5分钟。codex上使用也是一样,前几天死慢,但是思考确实很有深度,并且检查的异常细致,把可能出现的风险点都加上了,最令我惊讶的他还能通过网络找对标案例来进行分析。今天思考异常短,并且经常做一些低级的错误。现在AI是个循环了,新模型——买——降智——换——新模型。我这几天也在思考,之前开个影音会员又是拼车又是尼区,现在买个token真舍得花钱,一个max说买就买,一个pro说买就买
标题: G304更换鼠标左右键微动
作者: #吃风筝的人
板块: #搞七捻三
编号: 1996629
帖子: https://linux.do/t/topic/1996629
时间: 2026-04-18 21:18:43
摘要:
鼠标左键微动坏了,经常自动双击。淘宝上买了一个微动,今天装上试试。一边更换,一边更新本帖,主打一个记录生活。

拆卸外壳。撕开脚垫,有四颗螺丝。鼠标用久了,脚垫有些分层,用指甲抠了半天。附带的镊子不如指甲好用。
标题: 吸一口……好怪,混合着廉价香水和臭味的
作者: #🐟
板块: #搞七捻三
编号: 1996630
帖子: https://linux.do/t/topic/1996630
时间: 2026-04-18 21:18:46
摘要:
出门偶遇猫猫,钱包变瘪了
标题: 这个应该是gpt5.4pro(思考深度:xhigh)吧
作者: #qq1244
板块: #搞七捻三
编号: 1996632
帖子: https://linux.do/t/topic/1996632
时间: 2026-04-18 21:19:28
摘要:
不知道要不要上公益站。
标题: 移动的龙虾也来了
作者: #𝓕-𝓓𝓻𝓸𝓲𝓭
板块: #搞七捻三
编号: 1996635
帖子: https://linux.do/t/topic/1996635
时间: 2026-04-18 21:19:49
摘要:
没看到有收费的项目,好像可以定时任务,自动发邮件到指定邮箱
标题: AMAZON Q的模型怎么就不更新了呢
作者: #pixk
板块: #搞七捻三
编号: 1996637
帖子: https://linux.do/t/topic/1996637
时间: 2026-04-18 21:19:51
摘要:
扩展一直在更新,但模型停止在4.5好几个月了,亚马逊这是放弃了?
标题: 大语言模型蒸馏时 学生模型仍可能继承教师模型的偏好
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #前沿快讯
编号: 1996646
帖子: https://linux.do/t/topic/1996646
时间: 2026-04-18 21:21:18
摘要:
https://www.nature.com/articles/s41586-026-10319-8
标题: 【开源】你改了很多次 Skill,结果可能“只是看起来更好了”
作者: #苦果亦是果
板块: #开发调优
编号: 1996647
帖子: https://linux.do/t/topic/1996647
时间: 2026-04-18 21:21:43
摘要:
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

我的帖子已经打上 开源推广 标签: 是
我的开源项目完整开源,无未开源部分: 是
我的开源项目已链接认可 LINUX DO 社区: 是
我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
以上选择我承诺是永久有效的,接受社区和佬友监督: 是

以下全是我自己手搓,没有ai味(我用最真实、最不绕、最直接的方式跟你讲 hhhhh),放心品尝

很多人以为 Skill 迭代最难的是"怎么改"。
但我越来越强烈地觉得,真正难的其实不是改,而是:
你改完之后,根本不知道它到底有没有真的变好。
补描述、调 prompt、加例子、补边界、改结构。
Skill 看起来越来越完整,文档越来越像样,语气越来越专业。
但问题是:看起来更完整,不等于真的更强。 skill的实际行为未必更稳定,边界未必更清晰,失败处理也未必更好。
所以很多 Skill 维护最别扭的地方,其实不是"不会写",而是你明明已经改了很多轮,却还是说不清:
上一次改动,到底有没有真正产生作用。
我后来专门跑了 100 个高下载 Skill,发现问题并不是"不能用"
(是的,烧我自己的token)结果最有意思的地方,不是烂 Skill 特别多。恰恰相反,大多数 skill 其实都能用:


70 个通过
29 个在 caution 区间
1 个 fail
平均分 73.8



真正的问题不是:大多数 Skill 完全不能用。
而是很多 Skill 停在一个很尴尬的状态:能用,但不容易被继续有效优化。
你一旦想认真往上修,就会发现问题不少,但很难判断到底该先修哪一块。
也就是说,难点不是"没法写",而是没有诊断,所以不知道怎么有效地继续改。
更关键的是,这种"不对劲"还不是随机的。
我看到的弱点主要集中在几个地方:


Trigger quality 平均 6.2
Functional quality 平均 6.6
大约 80% 缺少 not_for 边界
大约 60% 的 D4 弱项 Skill 缺少像样的 error