linux.do
21K subscribers
116K photos
195 videos
115 files
249K links
linux.do最新话题和热议话题
Download Telegram
Boost 截断部分拼音输入法

因为一些拼音输入法会预先把输入的字母打入输入框,导致编写 Boost 时,容易撞上字数上限导致无法输入,必须复制粘贴。

如图,选择输入项(如按下空格键)后输入框内仍是字母:

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: PJ568)
minimax真的这么拉吗

3 个帖子 - 3 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 杨树林)
MacOS 有啥办法停止更新不

我选择了不更新不下载 也没点进去结果还是会自动下载好了 要我重启安装 天天提醒 还已经下载了
各位佬 有啥办法 禁止更新并把目前的下载的更新删除了 小红点看的也烦

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 今天还是没睡饱)
如何更客观地看待国产开源模型与顶级闭源模型的差距?我的几个观点

因为自己贫瘠的表达能力,上个帖子因为措辞不太准确导致带有一定的倾向性被删除了,认真回复的佬们实在对不起了。 🙂‍↕️ 🙂‍↕️

重新组织了下语言,想把这个观点说清楚。

----------------------

国产开源模型发布时,习惯性拿顶级(或者次顶级,比如qwen 3.6 plus对标的是Opus 4.5而不是4.6)商业闭源模型来做对比,这本身其实并不奇怪,因为顶级模型本来就是它们追赶的目标,发布时拿最强的对手来展示进步幅度,也是一种很常见的表达方式。
问题不在于“和顶级比”,而在于很多人会把某些benchmark接近直接理解成整体能力已经追平,这里面其实有很大的偏差。
(注意我不在这里讨论关于benchmark过拟合等问题,这个不是我要讨论的范围。)

benchmark接近,通常只能说明模型在特定方向上已经缩小了差距,但这并不意味着在真实使用里,特别是大任务,复杂任务,需要长时间运行的agent等更加极致的场景也已经和顶级闭源模型处在同一水平。
局部接近,不等于整体追平;单项的进步,也不等于真实体验没有差距。

当然,这里也不能否认有些厂商在宣传上会用一些比较擦边的方式,让人产生“已经差不多了”甚至“超越”的联想。再加上一些自媒体的放大,最后很容易把大家的预期拉得过高。等真正上手做复杂任务时,发现效果并没有想象中那么接近,就又会从一个极端滑到另一个极端。

----------------------

我想说明的点(上一篇其实也是,但是因为表达能力不够太绕了)其实就这几点:

1. 国产开源模型和顶级闭源商业模型存在差距,这个差距是客观存在的;
2. 拿顶级模型做对标没有问题,因为顶级就是目标;
3. 但不能因为几个榜单看起来接近,就默认已经追平,更不能进一步幻想一个新开源模型出来就立刻能和当前最强闭源打平甚至反超
4. 正视差距的同时,也对国产模型更加的包容,期待他们的不断进步;

更适合的态度是什么呢,我这里引用一些之前帖子佬的评论:
“承认它们这几年进步很快,也承认它们和顶级闭源之间仍然有现实差距。不要因为不靠谱的宣传口径就过度乐观,也不会因为还有差距就直接全盘否定。讨论回到真实场景、真实任务和真实体验,结论通常会更靠谱一些。”
“不是所有场景都需要顶级模型,一些场景用国产模型更经济”
总之,就是不要指望一口气登天,但是希望不断缩小差距。

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: blacksein)
佬友们,求个 Audiences PT 邀请

有 Nas,有 160TB 存储,运行了5年,存储池因为故障,刚重建完。

为 PT 相关开源项目 MoviePilot 提交过代码。

低隐:kp.m-team.cc

M-Team

M-Team
hdfans.org

HDFans :: 登录 - Powered by NexusPHP

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: ilvsx)
现在还有公益站能用CC的吗?大善人已经一个月不能使用了

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: AA)
大四了还没谈过恋爱是不是很废物

怎么办啊,母胎单身到现在,都不知道怎么和别人处对象笑死🤣

9 个帖子 - 9 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: sudc)
请教无所不能的佬友们JetBrains Rider 2026.1怎么控制它的内存占用

今天尝试了一个JetBrains Rider 2026.1,本希望可以很丝滑,打开一个小的项目,直接给占了4GB的内存,我什么插件都没有安装,为啥占用这么高,公司笔记本真的吃不消,有什么方式可以控制一下吗,在rider64.exe.vmoptions里面设置内存占用不生效

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: myhero)
第一次见这样的红绿色盲回答

用佬友公益站的GPT-5.4,测试了一下红绿色盲问题,后面给了提示,回答还是震惊我

4 个帖子 - 3 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: WilliamWang)
怎么办,好想以权谋私啊!!!!

我上次不是发帖说,我公司给我买了claude code max 20X,一个月1400多,给了我这个后端,还有前端,根本花不完。
好想以权谋私啊,这样每个月起码又多了几百块工资。如果带人上车的话。

11 个帖子 - 8 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 毛球球)
AST 解析可以拿来评估模型质量吗?

用的glm5.1,手动一行代码的事情我看他自己跟自己battle了好久还是改不好,突发奇想是不是可以拿来判断模型质量?
3 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Kwongting)
【求助帖】claude pro 美区账号购买失败

背景

我的美区账号通过商品卡订阅过两次claude pro,都在两天内封号然后退款。其中第二次也出现过订阅失败提示,但是重启软件再点击订阅就好了。

现在我养了三四天的号,想要再次订阅,又是这个提示。是我的账号被苹果标记了吗😭

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 加减乘除)
【求助】25届Java开发,北京工作经验,计划转战南方二线城市,求薪资参考。

我是25年6月毕业的,从大三开始一直实习到毕业结束,这段时间也是从事Java开发,11月在北京找到了一份Java开发工作。虽然工作内容尚可,但北京的薪资与生活成本相比确实有些捉襟见肘,目前仅能维持日常开销。因此,我计划转向南方二线城市发展。

目前我有接近3年的开发经验(实习+工作),除了掌握Java常用技术栈外,也对AI新技术有所涉猎。想请教各位大佬,以我目前的背景,在杭州、成都、苏州这类城市,大概能拿到什么样的薪资水平?现在的行情是否乐观?

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: SpongeCat)
【Just for sharing】Transformer

Blog: Attention Is All You Need — Transformer 论文精读 | Yun Shen

好久没在 L 站更了,不过blog一直在写,主要原因是发现几张“模型架构图”有些是复制别人博文里面的,以防没必要麻烦,后续还是检查好并替换论文原文的图再放到“文档共建”版块。

还有最近实在是太忙了 🥲 如果 blog 哪里内容,欢迎佬友交流指出!

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 西格玛男人)
gemini studio的 3.1lite用不了了吗?

gemini-3.1-flash-lite-preview 5个号都不通,报错503

gemini-3-flash-preview 是好的。

是我号的问题还是啥?

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 该账号已封禁)
Telegram必备的搜索引擎,极搜JISOU帮你精准找到,想要的群组、频道、视频、音乐

👉 t.me/jisou?start=a_7387292324
简单测试Elephant

1. 模仿题 —— 失败
2. 自画像
3. 鹈鹕骑自行车

感觉能力有点糟糕

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: ji233)