GLM 5.1测评:第一梯队的敲门砖
先放bench
赶超了四个月前的模型opus 4.5(不过当时使用反重力测试的,可能会有一些差别)
但是和4.5系列一个梯队是没问题的
代码水平中等偏上
一些实现的想法很好,但会被小bug绊住
bench内题目需要被返修的也显著减少
iframe (codepen.io)
但是问题也很显著,GLM 5.1会在思维链中大量打草稿,导致经常爆思考。如果是出字了爆还能继续,在思维链里把token耗尽就只能reroll了
如果开源的话可以夸一夸智谱,如果闭源还涨价我要骂了()
现在有点试探市场反应的意味呢
21 个帖子 - 9 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: HCPTangHY)
先放bench
赶超了四个月前的模型opus 4.5(不过当时使用反重力测试的,可能会有一些差别)
但是和4.5系列一个梯队是没问题的
代码水平中等偏上
一些实现的想法很好,但会被小bug绊住
bench内题目需要被返修的也显著减少
iframe (codepen.io)
但是问题也很显著,GLM 5.1会在思维链中大量打草稿,导致经常爆思考。如果是出字了爆还能继续,在思维链里把token耗尽就只能reroll了
如果开源的话可以夸一夸智谱,如果闭源还涨价我要骂了()
现在有点试探市场反应的意味呢
21 个帖子 - 9 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: HCPTangHY)
有佬能帮我看看这个是不是官转吗?
最近any实在用不上就在L站里找了个拼车,加上vx后他发支付宝的码,我不放心我就说走闲鱼,第一次没什么经验,发货后能正常对话就直接确认收货了,然后就开始不断遇见问题。先是报
报完502之后正常用了一小段时间开始报
首先是引号测试没过:
然后是禾维AI检测没过:
然后是糖果问题没过:
樱花虽然被修复过,但感觉它的回答完全不像是opus:
问juice(这个似乎又很高):
问他什么模型:
我第一次见这种回答格式,我之前用any的时候都是一句话,而且能强调自己是[1m],还会说“请问有什么可以帮你?”
总结来讲,在进行大型项目的时候有非常明显的降智(工作两三分钟停下),各种检验的结果让我感到困惑。现在那个人是联系不上的状态,但我闲鱼已经确认收货了,鉴于我现在好像没办法捶死它掺假,我也不知道该怎么办了。拼的三人车,说是。为什么我总是遇上这种事情呢…真的好悲伤
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 都林之马)
最近any实在用不上就在L站里找了个拼车,加上vx后他发支付宝的码,我不放心我就说走闲鱼,第一次没什么经验,发货后能正常对话就直接确认收货了,然后就开始不断遇见问题。先是报
502 {“error”:{“message”:“Upstream request failed”,“type”:“upstream_error”},“type”:“error”}他解释是他在做轮询,切换账号,之后就好了。后面一直502,他说是Claude官方炸了,我当时也蛮信的,因为昨天好像确实在论坛里看见了官方炸了的消息。
报完502之后正常用了一小段时间开始报
Request too large (max 20MB)这个似乎是Nginx的默认上传限制配置,然后我希望他可以改大一点,他说晚上会修。但是似乎一直都没有修,哪怕/compact后也属于完全用不了的状态,说几句话就会直接中断。最后不得不新开对话,但是各种指令服从也都有问题,会莫名起码的开始总结然后不继续干活,几乎一次工作只能进行3分钟,5分钟。到这里我也是没办法正常工作了。因为以前any用的很多,any是很纯的,觉得这个和any的感觉有一点不一样,就开始测是不是掺假了。
首先是引号测试没过:
然后是禾维AI检测没过:
然后是糖果问题没过:
樱花虽然被修复过,但感觉它的回答完全不像是opus:
问juice(这个似乎又很高):
问他什么模型:
我第一次见这种回答格式,我之前用any的时候都是一句话,而且能强调自己是[1m],还会说“请问有什么可以帮你?”
总结来讲,在进行大型项目的时候有非常明显的降智(工作两三分钟停下),各种检验的结果让我感到困惑。现在那个人是联系不上的状态,但我闲鱼已经确认收货了,鉴于我现在好像没办法捶死它掺假,我也不知道该怎么办了。拼的三人车,说是。为什么我总是遇上这种事情呢…真的好悲伤
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 都林之马)
gpt绑卡全面拉闸
以前的卡商基本都死了,虚拟卡很难过,昨天晚上半夜过了一个,今天早上同样的卡商死活过不了,佬友们有什么渠道和解决办法?不会免费的午餐真的断了吧?
5 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: hulala888)
以前的卡商基本都死了,虚拟卡很难过,昨天晚上半夜过了一个,今天早上同样的卡商死活过不了,佬友们有什么渠道和解决办法?不会免费的午餐真的断了吧?
5 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: hulala888)
gcp300的赠金能买域名吗
我could domain那里的配额是0,好像也改不了,是不是就是买不了了各位佬
3 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Charles)
我could domain那里的配额是0,好像也改不了,是不是就是买不了了各位佬
3 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Charles)
警惕某鱼某音上的各种cursor无限额度的宣传
之前用过一次无限额度的cursor(在cursor里安装插件那种),结果发现降智的厉害,然后就自己搞ultra账号,发现虽然能正常登录,但是一直提示Reconnecting(不是梯子原因,而且插件也卸载了)
最后解决方法是用geek彻底删除后再正常登录cursor账号才正常了。。
佬友们千万别上当 🫣
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: mike8861)
之前用过一次无限额度的cursor(在cursor里安装插件那种),结果发现降智的厉害,然后就自己搞ultra账号,发现虽然能正常登录,但是一直提示Reconnecting(不是梯子原因,而且插件也卸载了)
最后解决方法是用geek彻底删除后再正常登录cursor账号才正常了。。
佬友们千万别上当 🫣
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: mike8861)
还差两位女主集齐七龙珠⭐
佬友们有没有有意思的男女人设,提供人设或者剧情
将添加进游戏中🌟聊天模拟器,看看你能不能攻略所有结局
规则是不能有特殊癖好(NTR),不能辱骂贬低对方,不能有违法违规行为和敏感词
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: mark)
佬友们有没有有意思的男女人设,提供人设或者剧情
将添加进游戏中🌟聊天模拟器,看看你能不能攻略所有结局
规则是不能有特殊癖好(NTR),不能辱骂贬低对方,不能有违法违规行为和敏感词
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: mark)
甲骨文水了,一发入魂
早上看了 看佬友说甲骨文松了,果然过了!(我这里过的人这么多么) - 搞七捻三 - LINUX DO防水贴,去注册一发入魂过了。参考的看佬友说甲骨文松了,果然过了!(我这里过的人这么多么) - #9,来自 cydione
1.无痕chrome
2.中国ip+当前真实地址+qq邮箱+国内手机号+农行visa卡。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 木槿霸霸)
早上看了 看佬友说甲骨文松了,果然过了!(我这里过的人这么多么) - 搞七捻三 - LINUX DO防水贴,去注册一发入魂过了。参考的看佬友说甲骨文松了,果然过了!(我这里过的人这么多么) - #9,来自 cydione
1.无痕chrome
2.中国ip+当前真实地址+qq邮箱+国内手机号+农行visa卡。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 木槿霸霸)
最近一直在用aws的claude 虽然感觉有点降智 但好像只要提示词给好 他也能做的好
比如我会让他自己写一个文档 把每次排查出来的问题记录下来 后面就可以避开反复执行以及想到其他的解决方案
所以想看看大佬们有没有什么推荐的提示词或者skill分享
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: lamb)
比如我会让他自己写一个文档 把每次排查出来的问题记录下来 后面就可以避开反复执行以及想到其他的解决方案
所以想看看大佬们有没有什么推荐的提示词或者skill分享
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: lamb)