Claude4.6Opus确认被降智了
CLAUDE OPUS 4.6被NERFED。
BridgeBench刚刚证明了这一点。
上周,Claude Opus 4.6在幻觉基准上排名第二,准确率为83.3%。
今天,Claude Opus 4.6进行了重新测试,它在排行榜上跌至第10位,准确率仅为68.3%。
幻觉增加了98%。
bridgebench.ai剛剛證實,Claude Opus 4.6降低了推理水準並被削弱了。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 星野)
CLAUDE OPUS 4.6被NERFED。
BridgeBench刚刚证明了这一点。
上周,Claude Opus 4.6在幻觉基准上排名第二,准确率为83.3%。
今天,Claude Opus 4.6进行了重新测试,它在排行榜上跌至第10位,准确率仅为68.3%。
幻觉增加了98%。
bridgebench.ai剛剛證實,Claude Opus 4.6降低了推理水準並被削弱了。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 星野)
新版本clash verge为什么系统代理开启后会自动关闭?
就那个系统代理按钮 我点开后 自己就关闭了
这是怎么回事?有佬友知道吗?
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 一只不会飞的猪)
就那个系统代理按钮 我点开后 自己就关闭了
这是怎么回事?有佬友知道吗?
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 一只不会飞的猪)
Sam昨日家中被开枪袭击,大家怎么看待AI末日轮
我个人是持积极的态度。Sam在自己的文章里说的很好,AGI就像那个魔戒(《指环王》(Lord of the Rings)的比喻)
在托尔金的故事里,魔戒的可怕之处不在于戒指本身的物理形态,而在于它激发出每个人心中"我来掌控这股力量,我能用它做好事"的欲望。甘道夫拒绝接受魔戒,不是因为他不想做好事,而是因为他知道"由我来掌控这股绝对力量"这个念头本身就是毁灭的开始。连出发点最纯粹的人,一旦握住了戒指,也会被腐蚀。
感觉,Sam 其实是在暗示整个AI行业的各路玩家——包括Elon、包括其他公司的创始人、甚至可能也包括他自己——都在某种程度上被这个执念影响过。不是因为谁是坏人,而是因为这个"魔戒"的诱惑太大了,大到让所有人都变得不太正常…
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Underthemoon)
我个人是持积极的态度。Sam在自己的文章里说的很好,AGI就像那个魔戒(《指环王》(Lord of the Rings)的比喻)
在托尔金的故事里,魔戒的可怕之处不在于戒指本身的物理形态,而在于它激发出每个人心中"我来掌控这股力量,我能用它做好事"的欲望。甘道夫拒绝接受魔戒,不是因为他不想做好事,而是因为他知道"由我来掌控这股绝对力量"这个念头本身就是毁灭的开始。连出发点最纯粹的人,一旦握住了戒指,也会被腐蚀。
感觉,Sam 其实是在暗示整个AI行业的各路玩家——包括Elon、包括其他公司的创始人、甚至可能也包括他自己——都在某种程度上被这个执念影响过。不是因为谁是坏人,而是因为这个"魔戒"的诱惑太大了,大到让所有人都变得不太正常…
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Underthemoon)
请问各位佬们,应该啥时候买电脑
家人们,去年六月份的时候就想买电脑,想着攒到多少钱就开始买,但是没想到价格越来越贵,等到现在的时候,去年朋友买的7k的机子,现在已经1w2了,不知道应该618买电脑还是现在入手得了。
17 个帖子 - 10 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 不拿nt)
家人们,去年六月份的时候就想买电脑,想着攒到多少钱就开始买,但是没想到价格越来越贵,等到现在的时候,去年朋友买的7k的机子,现在已经1w2了,不知道应该618买电脑还是现在入手得了。
17 个帖子 - 10 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 不拿nt)
claudecode codex配置软件
有没有对claudecode和codex添加多个api环境配置可以一键切换的可视化软件推荐,最好还有添加提示词和skill功能的
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: NHT)
有没有对claudecode和codex添加多个api环境配置可以一键切换的可视化软件推荐,最好还有添加提示词和skill功能的
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: NHT)
想问一下各位佬在使用codex中的问题
就是在cli中使用codex的过程中我复制并粘贴之前codex的话的时候他就直接执行了,这是不能够粘贴嘛
3 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 醒醒啊)
就是在cli中使用codex的过程中我复制并粘贴之前codex的话的时候他就直接执行了,这是不能够粘贴嘛
3 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 醒醒啊)
纳瓦尔宝典作者新作:The Book of Elon 一本国外很火的马斯克原版书
这是美国作家Eric Jorgenson编纂的马斯克思想语录集。Eric前几年还编纂过另一本很有名的书The Almanack of Naval Ravikant(纳瓦尔宝典)。
现在网上关于马斯克的报道铺天盖地,但多数停留在名人八卦和财富密码等低级层次。而对于马斯克如何思考,以及他如何在克服无数挫折后重塑行业等深度内容却很少被提及。
The Book of Elon正是为此而生。作者花了数千小时,从马斯克过去二十多年的访谈、推文和演讲中提炼出最实用的思想,并按主题编排,形成了这本书。
作者编写这本书的目的并不是让我们膜拜马斯克,而是复制他的方法。无论你是创业者、打工人,还是仅仅想提升自己的普通人,都可以从书中找到实用的思维工具。
我用夸克网盘给你分享了「The Book of Elon A Guide to Purpose and Success (Eric Jorgenson) .pdf」,点击链接或复制整段内容,打开「夸克APP」即可获取。
/~87cb3Y7RG4~😕
链接:夸克网盘分享
提取码:BXNC
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 长亭旧雪)
这是美国作家Eric Jorgenson编纂的马斯克思想语录集。Eric前几年还编纂过另一本很有名的书The Almanack of Naval Ravikant(纳瓦尔宝典)。
现在网上关于马斯克的报道铺天盖地,但多数停留在名人八卦和财富密码等低级层次。而对于马斯克如何思考,以及他如何在克服无数挫折后重塑行业等深度内容却很少被提及。
The Book of Elon正是为此而生。作者花了数千小时,从马斯克过去二十多年的访谈、推文和演讲中提炼出最实用的思想,并按主题编排,形成了这本书。
作者编写这本书的目的并不是让我们膜拜马斯克,而是复制他的方法。无论你是创业者、打工人,还是仅仅想提升自己的普通人,都可以从书中找到实用的思维工具。
我用夸克网盘给你分享了「The Book of Elon A Guide to Purpose and Success (Eric Jorgenson) .pdf」,点击链接或复制整段内容,打开「夸克APP」即可获取。
/~87cb3Y7RG4~😕
链接:夸克网盘分享
提取码:BXNC
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 长亭旧雪)
gemini有没有哪个公益站能用?
实在是受不了gpt的非人话了,openclaw里面试了grok,太蠢太笨,gpt不说人话,干活还可以,不遵循soul设定,换了openrouter的gemini一下就对味了,设定的灰原哀,但是一看额度,对话了几次掉了2credit,扛不住啊
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 背着你聪明)
实在是受不了gpt的非人话了,openclaw里面试了grok,太蠢太笨,gpt不说人话,干活还可以,不遵循soul设定,换了openrouter的gemini一下就对味了,设定的灰原哀,但是一看额度,对话了几次掉了2credit,扛不住啊
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 背着你聪明)
佬们用各种Ai工具,是在主机里用的,还是在虚拟机里用的啊(claude code,cc-switch,cpa等等等等等)
重装了次系统,真是麻烦,在考虑这些东西到底是在主机里用,还是以后都在虚拟机里用(hyper-v之类的)
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Yuntianming)
重装了次系统,真是麻烦,在考虑这些东西到底是在主机里用,还是以后都在虚拟机里用(hyper-v之类的)
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Yuntianming)
MiniMax M2.7 现已加入魔搭 ModelScope API 体验
现在可以在modelscope api上体验minimax m2.7了!
说起来明明glm5.1更早开源的,但是minimax m2.7先用上了。期待后续能体验到glm5.1
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 啊)
现在可以在modelscope api上体验minimax m2.7了!
说起来明明glm5.1更早开源的,但是minimax m2.7先用上了。期待后续能体验到glm5.1
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 啊)
【求助】GGBoom公益站新建密钥无法选择分组
问题已解决,未关注公益站状态,请忽略问题 😅
分组为空,无法新建密钥😱(如图👇️)
创建就会报错:「请先选择分组」
5 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 一只小於菟)
问题已解决,未关注公益站状态,请忽略问题 😅
分组为空,无法新建密钥😱(如图👇️)
创建就会报错:「请先选择分组」
5 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 一只小於菟)
openai奥特曼再次被袭击
热乎的新闻,前后不到48小时,奥特曼两次遭袭。看来美国人对他的怨念也很大,不知道是不是因为被砍FREE额度,才会报复他 😏😏😏
之前好像还看到报道,同事说他人品不行。
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: another)
热乎的新闻,前后不到48小时,奥特曼两次遭袭。看来美国人对他的怨念也很大,不知道是不是因为被砍FREE额度,才会报复他 😏😏😏
之前好像还看到报道,同事说他人品不行。
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: another)
🗳中奖一千万,你会辞职吗?
羡慕了!网传科大讯飞员工中1500万彩票火速离职!!! 搞七捻三
● 会
● 不会
● 不确定
点击以查看投票。
5 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 𝓕-𝓓𝓻𝓸𝓲𝓭)
羡慕了!网传科大讯飞员工中1500万彩票火速离职!!! 搞七捻三
[image][image] 有评论补充道,“是真的,不过是1500万,我老公就是讯飞的,内部群已经传遍了。中奖人连公司奖金都不要了,立马辞职走人了。” 有网友粗略估计,扣除税务后,中奖人还能领取1200万元左右的奖金,照样能一辈子躺平。 对此,包括科大在内的众多打工牛马,没错说的是我这个牛马狠狠投来羡慕眼光,一夜暴富,潇洒告别职场,简直是所有打工人的终极梦想。 那么问题来了,如果是…
● 会
● 不会
● 不确定
点击以查看投票。
5 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 𝓕-𝓓𝓻𝓸𝓲𝓭)
哦吼,Oracle cloud成功了
这几天一直刷到佬友注册成功的话题,就自己没事点击试一下,第三天成功创建了。
我也来分享一下注册过程吧。
使用safari浏览器无痕模式手机注册的,
地区选择中国,邮箱是QQ邮箱。
信用卡使用的民生Visa信用卡,地址使用的百度翻译的信用卡账单地址,城市和省份都是拼音,首字母大写。
还有就是接下来直接升级付费账户吗?
祝大家都能顺利开到自己想要的~
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: fandd)
这几天一直刷到佬友注册成功的话题,就自己没事点击试一下,第三天成功创建了。
我也来分享一下注册过程吧。
使用safari浏览器无痕模式手机注册的,
地区选择中国,邮箱是QQ邮箱。
信用卡使用的民生Visa信用卡,地址使用的百度翻译的信用卡账单地址,城市和省份都是拼音,首字母大写。
还有就是接下来直接升级付费账户吗?
祝大家都能顺利开到自己想要的~
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: fandd)
Bedrock 模型弃用重要更新
1. Anthropic 将弃用 Sonnet 4 和 Sonnet 4.5 的 1M context length,终止日期为 2026/4/30。之后只是 Sonnet 4.6 支持 1M 上下文(无需调用experiment的header)。如果还在使用这两个模型 1M 上下文请尽快迁移至 Sonnet 4.6,Opus目前没有影响
2. Sonnet 3.7 将于 4月28日起停止响应。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 亚瑟王)
1. Anthropic 将弃用 Sonnet 4 和 Sonnet 4.5 的 1M context length,终止日期为 2026/4/30。之后只是 Sonnet 4.6 支持 1M 上下文(无需调用experiment的header)。如果还在使用这两个模型 1M 上下文请尽快迁移至 Sonnet 4.6,Opus目前没有影响
2. Sonnet 3.7 将于 4月28日起停止响应。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 亚瑟王)
百炼Coding plan,食之无味弃之可惜
40块钱一个月,我能接受。200块钱没有必要。
qwen用来干活还是差点意思,如果是200块,不如我多开一个cursor了
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: lamwing)
40块钱一个月,我能接受。200块钱没有必要。
qwen用来干活还是差点意思,如果是200块,不如我多开一个cursor了
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: lamwing)
Azure 学生订阅问题求助
通过学生认证后,显示有两个订阅是啥情况,是两个都可以免费使用么
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: crossccg)
通过学生认证后,显示有两个订阅是啥情况,是两个都可以免费使用么
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: crossccg)
豆包这是演都不演了?
我想问问豆包怎么改css代码把网页颜色换成香槟色,结果她直接问grok···
grok是对的
还在蒸!!!她已经输出十几分钟了,看样子烧了不少token
最终不知道是豆包token不够了还怎么回事,燃尽了
(逆向思维一下,这是不是一种免费、无翻墙使用grok的邪修方法?)
50 个帖子 - 45 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 猫猫团子)
我想问问豆包怎么改css代码把网页颜色换成香槟色,结果她直接问grok···
grok是对的
还在蒸!!!她已经输出十几分钟了,看样子烧了不少token
最终不知道是豆包token不够了还怎么回事,燃尽了
(逆向思维一下,这是不是一种免费、无翻墙使用grok的邪修方法?)
50 个帖子 - 45 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 猫猫团子)