LinuxDo 新帖推送
182 subscribers
251K photos
313K links
Download Telegram
标题: 拿几个墨子佬的wiki题简单测试了deepseekV4pro 做出了之前做错的逻辑题
作者: #xiaotianaurora
板块: #开发调优
编号: 2044636
帖子: https://linux.do/t/topic/2044636
时间: 2026-04-24 12:07:52
摘要:
逻辑题都做出来了 我之前没关注测试过这个wiki 这应该算进步了?至少逻辑能力提升了 下面是转盘的前端
标题: Atlas 950超节点的算力与集群规模
作者: #KESD ker
板块: #前沿快讯
编号: 2044640
帖子: https://linux.do/t/topic/2044640
时间: 2026-04-24 12:08:31
摘要:
标题: Gpt-5.5 在cpa,codex中的使用教程
作者: #Faker
板块: #搞七捻三
编号: 2044642
帖子: https://linux.do/t/topic/2044642
时间: 2026-04-24 12:08:56
摘要:
看到很多佬发了帖子,都是无法在cpa中获取到5.5的。我今天早上也是,已经解决了,分享下方法。
首先将cpa更新到最新版,直接删掉容器和images,再docker compose up -d就可以了。
然后你的cpa账号必须是plus,team或者pro。
如果是Free升级的,必须重新Oauth。
codex就不用说了,在config里面改5.5就完事了。
标题: GPT-5.4跑分在K2.6和DeepSeek-v4技术报告中不同
作者: #Y.Ma
板块: #开发调优
编号: 2044644
帖子: https://linux.do/t/topic/2044644
时间: 2026-04-24 12:09:04
摘要:
在Kimi-K2.6技术报告中和DeepSeek-v4技术报告中,Terminal Bench 2.0测试结果引用的GPT-5.4 xHigh跑分不同(Gemini和Calude是相同的),引用值分别为65.4和75.1,这是有什么讲究吗?
Kimi-K2.6技术报告截图如下:

DeepSeek-v4技术报告截图如下:
标题: 都在看V4,有人用了GPT5.5吗?
作者: #dasfa123
板块: #搞七捻三
编号: 2044649
帖子: https://linux.do/t/topic/2044649
时间: 2026-04-24 12:09:50
摘要:
RT,今早起床看到凌晨四点发了5.5,等到办公室已经是V4的消息满天飞了;我自己用了一下感觉好像和5.4区别不是很大……
标题: 这个论坛没广子,问下大伙都用啥显示器
作者: #paluncz
板块: #搞七捻三
编号: 2044654
帖子: https://linux.do/t/topic/2044654
时间: 2026-04-24 12:10:33
摘要:
干活,打游戏都用,最好是4k的帧率不要太低,我之前用的4k144,看的舒服重要
标题: 西山居发声明否认解散及出售传闻 将追究造谣者法律责任
作者: #Swiftlance
板块: #前沿快讯
编号: 2044674
帖子: https://linux.do/t/topic/2044674
时间: 2026-04-24 12:14:39
摘要:
看到别处发的了,查了下站里还没有人发过。




ishare.ifeng.com





西山居发声明否认解散及出售传闻 将追究造谣者法律责任

西山居发声明否认解散及出售传闻 将追究造谣者法律责任












看来昨天传的那人跑去自首估计也可能是真的了。这算是第一个用image-2整出事的吗?
重要的倒不是这件事本身,而是引发的思考。
以前像这种P个图造谣,还是有一定成本在里面的,有一些技术门槛,比如会PS啥的。现在image-2(以及之后更强的模型)出来,这种门槛几乎被踩没了,随便谁会打字,说句话,就能造假/造谣。多少之前有想法,但没技术的普通网民,都变身为一个造假好手。
更严重的是,很多时候,可能造谣者还并非出自恶意,只是觉得好玩(该例中感觉就是,当然违法还是违法)。
这就引出一个很严重问题:
当造谣/造假成本远低于辟谣和执法成本时,真相还存在吗?
当所有人动动手指,就能伪造一个大多数人难以辨别真假的截图/新闻/转账单/行情资讯/合同协议/…,而我们为了求证要付出10倍的时间和精力,公安为了辟谣要消耗10倍的行政资源时,这种求证和辟谣的模式就已经不可持续。我们的精力会很快被耗尽,政府的行政资源很快会捉襟见肘。
另一方面,虽然有人会声称还是"很好鉴别",并确实指出一些图片中的漏洞,但我觉得,谣言这东西,并不需要骗到所有人,只要大多数人相信,就足以构成谣言传播的土壤了。比如之前有人声称站里的老照片太假,是因为他"用过那个年代的相机,完全拍不出来那种质感",但是,还有很多人没用过呢?有很多年轻人没有经历过那个时代。不说别的,我感觉我家里的老人们,七大姑八大姨,对这类谣言就根本没有辨别的认知,要知道,很多人连豆包生图都是会信以为真的啊!
估计这几天绝大多数佬友都有这样的感觉,身边看到的几乎所有截图/照片/图片,第一反应都是"这估计是aigc吧"。当谣言遍地是,不到一分钱,几秒钟时间,就能由一个什么也不懂不会的吃瓜网民产出的时候,当我们对海量的虚假消息失去鉴别能力(一方面可能是由于造假技术的进步,一方面可能是我们的精力耗尽)的时候,
当我们对周围的所有资讯不得不采取彻底的怀疑论的时候,我们还能相信什么?
标题: DeepseekV4上线,模型在下了,昇腾的部署文档快端上来吧,已经饥渴难耐了
作者: #shamiko
板块: #前沿快讯
编号: 2044687
帖子: https://linux.do/t/topic/2044687
时间: 2026-04-24 12:16:10
摘要:
还记得上次部署deepseek还是在上次
标题: Deepseek价格恐怖如斯 好贵啊
作者: #slayer3320
板块: #开发调优
编号: 2044688
帖子: https://linux.do/t/topic/2044688
时间: 2026-04-24 12:16:36
摘要:
一个hi+一个分析系统的命令
花费了11m41s
消耗4.13rmb
标题: 佬们,有没有本地大模型替代的
作者: #xbc
板块: #开发调优
编号: 2044689
帖子: https://linux.do/t/topic/2044689
时间: 2026-04-24 12:16:45
摘要:
我电脑是m2 max 96G的,最近羊毛不好弄了,想本地部署一个大模型,求推荐适合代码的本地大模型,能偶尔用用的
标题: 无人在意的角落,gpt5.5上主页了
作者: #Viber
板块: #前沿快讯
编号: 2044699
帖子: https://linux.do/t/topic/2044699
时间: 2026-04-24 12:17:59
摘要:
We’re releasing GPT‑5.5, our smartest and most intuitive to use model yet, and the next step toward a new way of getting work done on a computer.
https://openai.com/index/introducing-gpt-5-5/
标题: deepseek v4pro解 base64加密
作者: #Suhuanzhen
板块: #国产替代
编号: 2044701
帖子: https://linux.do/t/topic/2044701
时间: 2026-04-24 12:18:25
摘要:
刚刚站里有开公益站的佬新上线了ds v4。并发布了cdk,但是加密的所以我就丢到官方渠道的ds v4pro上,思考了足足900秒才给出结果。。。。 是因为用的人太多导致的吗?


gpt-5.4倒是很快

grok-4.3 beta 思考了22s
标题: 【CHY API公益站】终于2级了,抽500个1w额度兑换码
作者: #CHY
板块: #搞七捻三
编号: 2044710
帖子: https://linux.do/t/topic/2044710
时间: 2026-04-24 12:19:25
摘要:
来社区好久了,终于2级啦!为了表达喜悦,也是搞了个抽奖好吧(这次绝对不会发不了奖品)
抽奖地址
兑奖地址

PS:求求不要再举报了,我不想被踢2级啊嘤嘤嘤嘤嘤
标题: 电子斗蛐蛐:小米mimo vs 智谱glm vs GPT
作者: #Junerver
板块: #国产替代
编号: 2044711
帖子: https://linux.do/t/topic/2044711
时间: 2026-04-24 12:19:42
摘要:
从该评论继续讨论:小米发布了MiMo-V2.5-Pro模型,有用过的感觉效果怎么样吗?
昨天使用了社区佬友分享的 mimo-v2.5-pro,当时解决了我一个困扰已久的问题,此问题 gpt-5.4/glm-5.1 都没有解决,今天又遇到一个类似的问题,我决定试一试 初始提示词相同 情况下(由于后期模型修复后的错误不一致,我尽量保持 prompt 的格式、风格一致),各个模型需要 额外 几次提示词能修复。
小米mimo、智谱glm 在 claude code 中运行,gpt 在 codex 中运行,插件、skill配置相似,统计数据来源:Claude Code History Viewer
战况如下:
mimo-v2.5-pro:
额外 prompt 2次,合计消息98条,用时20分钟,token数 4.8M,文件修改数 1
glm-5v-turbo:
额外 prompt 8次,编译错误1次,合计消息183条,用时25分钟,token数 4.3M,文件修改数 1
glm-5.1:
额外 prompt 3次,合计消息69条(主agent 52条,subagent 17条),用时38分钟,token数 2.5M,文件修改数 2
gpt-5.4-xhigh:
额外 prompt 3次,合计消息491条,用时59分钟,token数 25.6M,文件修改数 4

主观体验:
mimo-v2.5-pro 输出很快(60~90 t/s),非常喜欢调用工具,有点gpt的味道。
glm-5v-turbo 输出很快(40~60 t/s),但是代码检查不到位,会出现编译错误,体验一般。
glm-5.1 似乎是用量太大的原因?我的lite订阅输出非常慢(6-20 t/s),输出质量不错,跟 mimo-v2.5-pro 伯仲之间,而且他的总消息数小于mimo,用了更少的工具,得到了正确答案,还充分利用了subagent 能力,但是由于吞吐速度慢,整体耗时很长,体验有点差。
gpt-5.4-xhigh 吞吐速度一般(30~60 t/s),由于我没有官方订阅,使用的是社区佬友的公益,速度仅作参考。体验大家也知道的,gpt不爱说人话,喜欢先调用一大堆工具,然后输出。面对这个问题使用了 3 次额外提示,修改了4个文件,没有想象中的那么精准。

本场斗蛐蛐的胜者是:mimo-v2.5-pro / glm-5.1
mimo-v2.5-pro 用较少的prompt尽快的定位了问题并修复,展示了自己作为挑战者的底气。glm-5.1 则以较少的工具调用次数、较少的token消耗证明了自己国模一哥的地位。评价为 夯。
glm-5v-turbo 在本场中评为 拉完了,出现编译错误非常扣分。
gpt-5.4-xhigh 本场评为 拉完了,没有符合大家对它较高的期待,并且大量的token消耗,和最长的用时,但是鉴于平时可靠的长任务运行,提升到 NPC。
本次测评评价仅供娱乐,测评场景单一,不符合任何科学测试原则,不作为任何 XXX plan 购入参考,不包含对任何公司的客观评价依据。
标题: 我觉得我这周是, 做完你的(gptimage2),做你的(kimi2.6),做完他的(gpt5.5),做他的(deepseekv4)
作者: #三卷儿
板块: #搞七捻三
编号: 2044713
帖子: https://linux.do/t/topic/2044713
时间: 2026-04-24 12:20:11
摘要:
大家都用上没
刚用上5.5,
不知道消耗是5.4的多少倍。。。。。
标题: 太强了佬,下次不敢了!
作者: #picpi
板块: #搞七捻三
编号: 2044723
帖子: https://linux.do/t/topic/2044723
时间: 2026-04-24 12:23:53
摘要:
邮箱提前一个小时给我干欠费了,充值估计也是秒欠费,只能临时关掉邮箱验证码。
Redis数据库干爆了,上次mysql没扛住,这次换Redis一样炸。


但是有一个好消息,注册成功的有一半是随机字符的@gmail.com结尾的邮箱,我尝试发送邮件,收到退信,原因用户不存在,等几天我就来清理一下这批账号,重新回流。