linux.do
21.1K subscribers
118K photos
195 videos
116 files
251K links
linux.do最新话题和热议话题
Download Telegram
GLM 5.1测评:第一梯队的敲门砖

先放bench

赶超了四个月前的模型opus 4.5(不过当时使用反重力测试的,可能会有一些差别)
但是和4.5系列一个梯队是没问题的
代码水平中等偏上

一些实现的想法很好,但会被小bug绊住

bench内题目需要被返修的也显著减少

iframe (codepen.io)

但是问题也很显著,GLM 5.1会在思维链中大量打草稿,导致经常爆思考。如果是出字了爆还能继续,在思维链里把token耗尽就只能reroll了

如果开源的话可以夸一夸智谱,如果闭源还涨价我要骂了()

现在有点试探市场反应的意味呢
21 个帖子 - 9 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: HCPTangHY)
后知后觉,昨天不小心用了佬d的2api翻了黄,没想到竟然能翻,而且号还在

6 个帖子 - 6 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Myallure)
有佬能帮我看看这个是不是官转吗?

最近any实在用不上就在L站里找了个拼车,加上vx后他发支付宝的码,我不放心我就说走闲鱼,第一次没什么经验,发货后能正常对话就直接确认收货了,然后就开始不断遇见问题。先是报
502 {“error”:{“message”:“Upstream request failed”,“type”:“upstream_error”},“type”:“error”}
他解释是他在做轮询,切换账号,之后就好了。后面一直502,他说是Claude官方炸了,我当时也蛮信的,因为昨天好像确实在论坛里看见了官方炸了的消息。

报完502之后正常用了一小段时间开始报
Request too large (max 20MB)
这个似乎是Nginx的默认上传限制配置,然后我希望他可以改大一点,他说晚上会修。但是似乎一直都没有修,哪怕/compact后也属于完全用不了的状态,说几句话就会直接中断。最后不得不新开对话,但是各种指令服从也都有问题,会莫名起码的开始总结然后不继续干活,几乎一次工作只能进行3分钟,5分钟。到这里我也是没办法正常工作了。因为以前any用的很多,any是很纯的,觉得这个和any的感觉有一点不一样,就开始测是不是掺假了。

首先是引号测试没过:

然后是禾维AI检测没过:

然后是糖果问题没过:

樱花虽然被修复过,但感觉它的回答完全不像是opus:

问juice(这个似乎又很高):

问他什么模型:

我第一次见这种回答格式,我之前用any的时候都是一句话,而且能强调自己是[1m],还会说“请问有什么可以帮你?”
总结来讲,在进行大型项目的时候有非常明显的降智(工作两三分钟停下),各种检验的结果让我感到困惑。现在那个人是联系不上的状态,但我闲鱼已经确认收货了,鉴于我现在好像没办法捶死它掺假,我也不知道该怎么办了。拼的三人车,说是。为什么我总是遇上这种事情呢…真的好悲伤

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 都林之马)
CODEX又炸,奥特曼又大开杀戒了吗?

今天是露头就秒啊,太狠了

9 个帖子 - 9 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: rickyl)
gpt绑卡全面拉闸

以前的卡商基本都死了,虚拟卡很难过,昨天晚上半夜过了一个,今天早上同样的卡商死活过不了,佬友们有什么渠道和解决办法?不会免费的午餐真的断了吧?

5 个帖子 - 3 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: hulala888)
gcp300的赠金能买域名吗

我could domain那里的配额是0,好像也改不了,是不是就是买不了了各位佬

3 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Charles)
警惕某鱼某音上的各种cursor无限额度的宣传

之前用过一次无限额度的cursor(在cursor里安装插件那种),结果发现降智的厉害,然后就自己搞ultra账号,发现虽然能正常登录,但是一直提示Reconnecting(不是梯子原因,而且插件也卸载了)
最后解决方法是用geek彻底删除后再正常登录cursor账号才正常了。。
佬友们千万别上当 🫣

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: mike8861)
还差两位女主集齐七龙珠

佬友们有没有有意思的男女人设,提供人设或者剧情

将添加进游戏中🌟聊天模拟器,看看你能不能攻略所有结局

规则是不能有特殊癖好(NTR),不能辱骂贬低对方,不能有违法违规行为和敏感词

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: mark)
哪位佬有github注册机

想搞几个好的github靓号库存,哪位佬有的话推荐下呗

3 个帖子 - 3 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: AAAI)
甲骨文水了,一发入魂

早上看了 看佬友说甲骨文松了,果然过了!(我这里过的人这么多么) - 搞七捻三 - LINUX DO防水贴,去注册一发入魂过了。参考的看佬友说甲骨文松了,果然过了!(我这里过的人这么多么) - #9,来自 cydione
1.无痕chrome
2.中国ip+当前真实地址+qq邮箱+国内手机号+农行visa卡。
1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 木槿霸霸)
反重力是不是宕机了

给他发消息 没反应
3 个帖子 - 3 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: wanshe)
最近一直在用aws的claude 虽然感觉有点降智 但好像只要提示词给好 他也能做的好
比如我会让他自己写一个文档 把每次排查出来的问题记录下来 后面就可以避开反复执行以及想到其他的解决方案
所以想看看大佬们有没有什么推荐的提示词或者skill分享

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: lamb)