标题: minimax真的这么拉吗
作者: #杨树林
板块: #国产替代
编号:
帖子: https://linux.do/t/topic/1965882
时间: 2026-04-14 18:42:00
摘要:
作者: #杨树林
板块: #国产替代
编号:
1965882帖子: https://linux.do/t/topic/1965882
时间: 2026-04-14 18:42:00
摘要:
标题: MacOS 有啥办法停止更新不
作者: #今天还是没睡饱
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1965886
时间: 2026-04-14 18:42:49
摘要:
作者: #今天还是没睡饱
板块: #开发调优
编号:
1965886帖子: https://linux.do/t/topic/1965886
时间: 2026-04-14 18:42:49
摘要:
我选择了不更新不下载 也没点进去结果还是会自动下载好了 要我重启安装 天天提醒 还已经下载了
各位佬 有啥办法 禁止更新并把目前的下载的更新删除了 小红点看的也烦
标题: 如何更客观地看待国产开源模型与顶级闭源模型的差距?我的几个观点
作者: #blacksein
板块: #国产替代
编号:
帖子: https://linux.do/t/topic/1965890
时间: 2026-04-14 18:44:38
摘要:
作者: #blacksein
板块: #国产替代
编号:
1965890帖子: https://linux.do/t/topic/1965890
时间: 2026-04-14 18:44:38
摘要:
因为自己贫瘠的表达能力,上个帖子因为措辞不太准确导致带有一定的倾向性被删除了,认真回复的佬们实在对不起了。
重新组织了下语言,想把这个观点说清楚。
国产开源模型发布时,习惯性拿顶级(或者次顶级,比如qwen 3.6 plus对标的是Opus 4.5而不是4.6)商业闭源模型来做对比,这本身其实并不奇怪,因为顶级模型本来就是它们追赶的目标,发布时拿最强的对手来展示进步幅度,也是一种很常见的表达方式。
问题不在于“和顶级比”,而在于很多人会把某些benchmark接近直接理解成整体能力已经追平,这里面其实有很大的偏差。
(注意我不在这里讨论关于benchmark过拟合等问题,这个不是我要讨论的范围。)
benchmark接近,通常只能说明模型在特定方向上已经缩小了差距,但这并不意味着在真实使用里,特别是大任务,复杂任务,需要长时间运行的agent等更加极致的场景也已经和顶级闭源模型处在同一水平。
局部接近,不等于整体追平;单项的进步,也不等于真实体验没有差距。
当然,这里也不能否认有些厂商在宣传上会用一些比较擦边的方式,让人产生“已经差不多了”甚至“超越”的联想。再加上一些自媒体的放大,最后很容易把大家的预期拉得过高。等真正上手做复杂任务时,发现效果并没有想象中那么接近,就又会从一个极端滑到另一个极端。
我想说明的点(上一篇其实也是,但是因为表达能力不够太绕了)其实就这几点:
国产开源模型和顶级闭源商业模型存在差距,这个差距是客观存在的;
拿顶级模型做对标没有问题,因为顶级就是目标;
但不能因为几个榜单看起来接近,就默认已经追平,更不能进一步幻想一个新开源模型出来就立刻能和当前最强闭源打平甚至反超。
正视差距的同时,也对国产模型更加的包容,期待他们的不断进步;
更适合的态度是什么呢,我这里引用一些之前帖子佬的评论:
“承认它们这几年进步很快,也承认它们和顶级闭源之间仍然有现实差距。不要因为不靠谱的宣传口径就过度乐观,也不会因为还有差距就直接全盘否定。讨论回到真实场景、真实任务和真实体验,结论通常会更靠谱一些。”
“不是所有场景都需要
标题: 现在还有公益站能用CC的吗?
作者: #AA
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1965899
时间: 2026-04-14 18:46:53
摘要:
作者: #AA
板块: #搞七捻三
编号:
1965899帖子: https://linux.do/t/topic/1965899
时间: 2026-04-14 18:46:53
摘要:
现在还有公益站能用CC的吗?大善人已经一个月不能使用了
标题: 大四了还没谈过恋爱是不是很废物
作者: #sudc
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1965904
时间: 2026-04-14 18:48:21
摘要:
作者: #sudc
板块: #搞七捻三
编号:
1965904帖子: https://linux.do/t/topic/1965904
时间: 2026-04-14 18:48:21
摘要:
怎么办啊,母胎单身到现在,都不知道怎么和别人处对象笑死
标题: 请教无所不能的佬友们JetBrains Rider 2026.1怎么控制它的内存占用
作者: #myhero
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1965914
时间: 2026-04-14 18:49:10
摘要:
作者: #myhero
板块: #搞七捻三
编号:
1965914帖子: https://linux.do/t/topic/1965914
时间: 2026-04-14 18:49:10
摘要:
今天尝试了一个JetBrains Rider 2026.1,本希望可以很丝滑,打开一个小的项目,直接给占了4GB的内存,我什么插件都没有安装,为啥占用这么高,公司笔记本真的吃不消,有什么方式可以控制一下吗,在rider64.exe.vmoptions里面设置内存占用不生效
标题: 第一次见这样的红绿色盲回答
作者: #WilliamWang
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1965920
时间: 2026-04-14 18:49:46
摘要:
作者: #WilliamWang
板块: #搞七捻三
编号:
1965920帖子: https://linux.do/t/topic/1965920
时间: 2026-04-14 18:49:46
摘要:
用佬友公益站的GPT-5.4,测试了一下红绿色盲问题,后面给了提示,回答还是震惊我
父亲后来崩溃,是因为他意识到:
女孩并不是把 38 改成了 88,而是把 38 改成了 58。
关键在父亲那句:
▎ “你这 8 怎么一半是绿的一半是红的”
这说明试卷上原本不同数字的笔迹/颜色不同。最初的 3
和后补的笔画组合后,形成了一个“8”,所以这个“8”才会出现一半红、一半绿。
也就是说,原卷其实更可能是:
38 分 → 58 分
其中:
个位的 8 本来就存在;
被改动的是十位数字 3,通过补笔变成了 5 或伪装后的样子;
父亲当时因愤怒看错、说错,误以为她改成了 88。
但他冷静后重新一想,发现逻辑不对:
如果是 38 改 88,应该是把 3 改成 8;
那么“半红半绿”的应该主要对应十位那个 8;
可从改动痕迹推断,真正被动手脚的不是他以为的那种改法。
进一步,他意识到一个更致命的事实:
老师原本给的根本不是 38,而是 88;女孩是想改低分装可怜、逃避别的事,或者卷子并不是她自己的。
不过按照这类题最常见、最严密的逻辑答案,核心结论是:
父亲崩溃是因为他意识到自己打错了——女儿并没有把 38 改成 88;他对笔迹颜色的判断反而证明了自己先入为主、误判了。
如果你愿意,我可以把这个题按“笔画变化”一步一步画出来,解释为什么很多人第一眼会被“38→88”误导。
✻ Cooked for 54s
并非如此,给你个提示,红绿色盲
● 那正确答案是:
父亲后来意识到自己是红绿色盲。
推理关键:
他一开始愤怒地说:
“你这 8 怎么一半是绿的一半是红的?”
但题目提示了:父亲是红绿色盲。
红绿色盲患者无法正常区分红色和绿色。
所以矛盾出现了:
▎ 一个分不清红绿的人,怎么会一眼看出“这个 8 一半是绿的一半是红的”?
因此父亲后来突然崩溃,是因为他意识到:
自己根本不可能靠颜色识别出这个改动;
说明他刚才那句话并不是基于“看出来了”,而是下意识脱口而出;
进一步说明——他其实早就知道原始分数是什么,甚至知道卷子被改过哪里。
也就是说,他崩溃地意识到自己暴露了一个事实:
他早就知道女孩考了 38 分。
这通常引申为:
他其实早就偷偷看过成绩;
或者卷子、分数本身和他有关;
总之,他刚才并不是“发现了造假”,而是因为先验知道真相才说漏了嘴。
所以答案的核心是:
父亲崩溃,是因为他意识到自己作为红绿色盲,不可能分辨红绿;他刚才的话等于暴露出自己早已知道女儿原本是 38 分。
标题: 怎么办,好想以权谋私啊!!!!
作者: #毛球球
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1965928
时间: 2026-04-14 18:51:30
摘要:
作者: #毛球球
板块: #搞七捻三
编号:
1965928帖子: https://linux.do/t/topic/1965928
时间: 2026-04-14 18:51:30
摘要:
我上次不是发帖说,我公司给我买了claude code max 20X,一个月1400多,给了我这个后端,还有前端,根本花不完。
好想以权谋私啊,这样每个月起码又多了几百块工资。如果带人上车的话。
标题: 求放过,举报何时休啊!我删帖我改
作者: #IshareI
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1965930
时间: 2026-04-14 18:51:43
摘要:
作者: #IshareI
板块: #搞七捻三
编号:
1965930帖子: https://linux.do/t/topic/1965930
时间: 2026-04-14 18:51:43
摘要:
求放过啊,佬友们,要是感觉不合规辛苦私信我一下,我改,肯定改。删帖,修改都行,请放心,以后不再随意发帖!!
求放过,求高抬贵手!!!
求放过,求高抬贵手!!!
求放过,求高抬贵手!!!
标题: AST 解析可以拿来评估模型质量吗?
作者: #Kwongting
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1965943
时间: 2026-04-14 18:52:51
摘要:
作者: #Kwongting
板块: #开发调优
编号:
1965943帖子: https://linux.do/t/topic/1965943
时间: 2026-04-14 18:52:51
摘要:
用的glm5.1,手动一行代码的事情我看他自己跟自己battle了好久还是改不好,突发奇想是不是可以拿来判断模型质量?
标题: 【求助帖】claude pro 美区账号购买失败
作者: #加减乘除
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1965946
时间: 2026-04-14 18:54:28
摘要:
作者: #加减乘除
板块: #搞七捻三
编号:
1965946帖子: https://linux.do/t/topic/1965946
时间: 2026-04-14 18:54:28
摘要:
背景
我的美区账号通过商品卡订阅过两次claude pro,都在两天内封号然后退款。其中第二次也出现过订阅失败提示,但是重启软件再点击订阅就好了。
现在我养了三四天的号,想要再次订阅,又是这个提示。是我的账号被苹果标记了吗
标题: 【求助】25届Java开发,北京工作经验,计划转战南方二线城市,求薪资参考。
作者: #SpongeCat
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1965947
时间: 2026-04-14 18:54:32
摘要:
作者: #SpongeCat
板块: #开发调优
编号:
1965947帖子: https://linux.do/t/topic/1965947
时间: 2026-04-14 18:54:32
摘要:
我是25年6月毕业的,从大三开始一直实习到毕业结束,这段时间也是从事Java开发,11月在北京找到了一份Java开发工作。虽然工作内容尚可,但北京的薪资与生活成本相比确实有些捉襟见肘,目前仅能维持日常开销。因此,我计划转向南方二线城市发展。
目前我有接近3年的开发经验(实习+工作),除了掌握Java常用技术栈外,也对AI新技术有所涉猎。想请教各位大佬,以我目前的背景,在杭州、成都、苏州这类城市,大概能拿到什么样的薪资水平?现在的行情是否乐观?
标题: 【Just for sharing】Transformer
作者: #西格玛男人
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1965948
时间: 2026-04-14 18:54:42
摘要:
作者: #西格玛男人
板块: #搞七捻三
编号:
1965948帖子: https://linux.do/t/topic/1965948
时间: 2026-04-14 18:54:42
摘要:
Blog: Attention Is All You Need — Transformer 论文精读 | Yun Shen
好久没在 L 站更了,不过blog一直在写,主要原因是发现几张“模型架构图”有些是复制别人博文里面的,以防没必要麻烦,后续还是检查好并替换论文原文的图再放到“文档共建”版块。
还有最近实在是太忙了 如果 blog 哪里内容,欢迎佬友交流指出!
标题: gemini studio的 3.1lite用不了了吗?
作者: #该账号已封禁
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1965952
时间: 2026-04-14 18:55:28
摘要:
作者: #该账号已封禁
板块: #搞七捻三
编号:
1965952帖子: https://linux.do/t/topic/1965952
时间: 2026-04-14 18:55:28
摘要:
gemini-3.1-flash-lite-preview 5个号都不通,报错503
gemini-3-flash-preview 是好的。
是我号的问题还是啥?
标题: 简单测试Elephant
作者: #ji233
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1965966
时间: 2026-04-14 18:58:36
摘要:
作者: #ji233
板块: #搞七捻三
编号:
1965966帖子: https://linux.do/t/topic/1965966
时间: 2026-04-14 18:58:36
摘要:
模仿题 —— 失败
自画像
鹈鹕骑自行车
感觉能力有点糟糕
标题: 毕设画图,一键生成
作者: #ikun52
板块: #资源荟萃
编号:
帖子: https://linux.do/t/topic/1965980
时间: 2026-04-14 19:02:00
摘要:
作者: #ikun52
板块: #资源荟萃
编号:
1965980帖子: https://linux.do/t/topic/1965980
时间: 2026-04-14 19:02:00
摘要:
在写毕业设计或者论文的过程中,很多同学都会卡在一个地方——画图。
系统流程图
UML时序图
功能结构图
看起来不难,但真正动手的时候就会发现:
工具复杂(Visio、Draw.io上手成本高)
逻辑容易乱(改一处全图要调整)
特别耗时间(一个图可能画几个小时)
而在论文写作中,这些图又是必须要有的加分项甚至是必备项,很多老师也非常看重这一部分。
我是怎么解决这个问题的?
最近在做毕业设计的时候,我发现了一个很好用的工具:
这是一个在线AI流程图生成工具,主打一个:
!(file:///C:\Users\。。\AppData\Roaming\Tencent\QQTempSys\Y{2~WZYDMLPEUR@1WJO2}FW.png) 输入文字,AI自动生成图
!(file:///C:\Users\。。\AppData\Roaming\Tencent\QQTempSys~DA422Z_P[`TJ3Z$6HM2}$M.png) 它能帮你做什么?
这个网站最核心的能力就是:
!(file:///C:\Users\。。\AppData\Roaming\Tencent\QQTempSys\Y{2~WZYDMLPEUR@1WJO2}FW.png) 把“文字描述”直接变成“专业图表”
比如你只需要输入:
用户登录系统流程
它就可以帮你生成完整的流程图,包括:
开始/结束节点
判断分支
操作步骤
流程走向
不仅如此,还支持!(file:///C:\Users\。。\AppData\Roaming\Tencent\QQTempSys\4W}[)MLG0FZP)}PCEI@1LK7.png)
!(file:///C:\Users\。。\AppData\Roaming\Tencent\QQTempSys\FZ~{7VEC09VVKFU7J7X3CT8.png) 流程图(Flowchart)
!(file:///C:\Users\。。\AppData\Roaming\Tencent\QQTempSys\FZ~{7VEC09VVKFU7J7X3CT8.png) 时序图(Se