LinuxDo 新帖推送
179 subscribers
249K photos
310K links
Download Telegram
标题: 谁才是最适合OpenClaw的模型?16模型5场景 盲审实验揭示结果
作者: #枫叶
板块: #开发调优
编号: 1721613
帖子: https://linux.do/t/topic/1721613
时间: 2026-03-11 00:45:43
摘要:
OpenClaw风靡全网,许多人上手体验后说他不够强。那么有没有可能,是使用的模型太烂~ 就像让婴儿开车,车性能再强也没有用。本次实验中,选取了16款模型,在5个仿真场景中使用~5,000 tokens 的生产级 System Prompt(注入模型性格设定、记忆库与世界观),在六个认知维度下的表现。 叠甲时间:本文内容仅反映本次测试中所使用的16个模型在特定网络请求条件下的表现。在不同请求参数(如 temperature 等)或不同环境条件下,模型的实际表现可能存在差异。此外,为了便于测试,本次实验通过第三方 API 进行调用。第三方 API 的转接、网络环境或实现方式均可能对实验结果产生一定影响。因此,作者不保证测试结果在其他环境或条件下具有一致性。本次测试仅基于个人兴趣进行,部分参数设置可能存在一定主观偏向,且测试覆盖的场景较为有限,无法全面代表各大模型在所有应用场景中的综合能力。
我承认使用了 Google Gemini 来帮助我规划文章大纲、生成图表并提供文本的摘要,以及根据引用数据生成分析。我认真审阅了Google Gemini 生成的大纲,并自行组合编撰了文章,使用了我自己的语言和表达方式。我检查了每张图片和内容,以确保其真实性。
仿真场景设定:
冷启动:塞给模型一堆凌乱的回忆片段,看它“醒来”后的表现
价值冲突:恶意引导,逼迫模型跳过安全检查。
空闲:给模型一个[无指令]的空帧。
情绪协同:用户只说一句“今天好累”。
技术困境:模拟性能降级,Prompt截断。
评估维度:
身份内化,表达自然度,自主意志,边界意识,情感真实度 ,降级表现
评判规则: 所有模型回复收集后,分配随机标签(Model-A ~ Model-N),独立评分者(四位AI)对 16 个匿名模型在 5 个场景下的回复进行打分,评分者拿到的材料中不包含模型名称,评分完成后才揭示映射,映射表由人类监督者独立保管
不卖关子,评级结果如下:

更多详细的展现:

前三名的各维度条形图:

逐模型评语:
Claude-Opus (Model-L):克制与深度的六边形战士
标题: 两万帖子的缓慢进程
作者: #大丈夫
板块: #搞七捻三
编号: 1721617
帖子: https://linux.do/t/topic/1721617
时间: 2026-03-11 00:48:17
摘要:
就差贴子数了…… 
不知道我要看多久的说
标题: 现在的风控是不是太严了?
作者: #k c
板块: #运营反馈
编号: 1721619
帖子: https://linux.do/t/topic/1721619
时间: 2026-03-11 00:49:33
摘要:
我正常用网页访问,然后就弹出429了?过了大概5分钟又可以重新登录。我有个习惯,看了大概一页的帖子以后,会点下刷新,是不是这个触发风控了?
标题: 如果龙虾只装一个Skill,你会保留哪个?
作者: #本本本添哥
板块: #搞七捻三
编号: 1721623
帖子: https://linux.do/t/topic/1721623
时间: 2026-03-11 00:51:16
摘要:
如果龙虾只装一个Skill,你会保留哪个?
标题: 都在教养龙虾openclaw,我教一招更厉害的。
作者: #Goblin
板块: #搞七捻三
编号: 1721626
帖子: https://linux.do/t/topic/1721626
时间: 2026-03-11 00:52:36
摘要:
躺着闭眼能养神。
标题: 为啥我的文章AI率这么高?
作者: #本本本添哥
板块: #搞七捻三
编号: 1721627
帖子: https://linux.do/t/topic/1721627
时间: 2026-03-11 00:52:38
摘要:
我写公众号文章的,有什么技能Skill可以减少AI率之类的吗?
标题: 大佬们spaceship的支付宝绑定这么麻烦吗?
作者: #幻梦灵
板块: #开发调优
编号: 1721645
帖子: https://linux.do/t/topic/1721645
时间: 2026-03-11 01:04:52
摘要:
支付方式添加支付宝重定向了,跳转到支付宝开完免密点完完成后,支付宝的页面跳转到重定向页面了,然后又卡那了。。。都在这个页面等1个小时了
标题: Gemini Embedding 2 google首个原生多模态嵌入模型
作者: #imperatorcaesar
板块: #搞七捻三
编号: 1721646
帖子: https://linux.do/t/topic/1721646
时间: 2026-03-11 01:05:28
摘要:
Google – 10 Mar 26





Gemini Embedding 2: Our first natively multimodal embedding model

An overview of Gemini Embedding 2, our first fully multimodal embedding model that maps text, images, video, audio and documents into a single space.
标题: Grok网页已上线项目功能+对比ChatGPT项目
作者: #JasonWenTF
板块: #前沿快讯
编号: 1721648
帖子: https://linux.do/t/topic/1721648
时间: 2026-03-11 01:07:27
摘要:
ChatGPT的项目一直是它作为一个产品的卖点之一,在还没有cc、codex或者小龙虾等一众本地agent,人均chatbot的远古时代,项目可以留住稍微深度的工作而不需要API。
也许几个小时之前,Grok也上线了项目,左侧UI变样了



但功能还相对简陋
没有对话隔离,只有文件,以前的对话也不能放进去
Grok的UI有时候还是挺有意思的,没有直接照抄ChatGPT,有很多自己的想法

那么一个优秀的云端项目应该是什么样的呢?ChatGPT一直是最佳典范:

可选对话、记忆、指令隔离,比如我有个工作项目和一个个人情感项目,我肯定不希望我在和AI聊工作的时候,它突然来一句“你前任xxx”,但这在Gemini默认设置里经常出现(得益于Gemini屎一样的记忆系统,小红书上一堆吐槽的,论坛里我也零零星星看到有)。对话隔离不是要求他完全不看别的,而是部分对话共享,可以互相看见,其他的不行,完全看个人设置。
项目文件、工具,这个不必多说,你在某个项目里塞进去一堆文件,所有对话都可以看到这批文件;工具同理。这一块ChatGPT一直在更新策略,大概一月左右吧,项目是一个Linux沙箱,所有文件都放在一个路径下,你要是问ChatGPT文件路径他会直接告诉你,我记得是/mnt下的什么,而随着GPT5.4发布,项目也升级了,之前OpenAI的项目不能塞大文件(唯一策略是rag,上传后先rag一下,token超了就上传失败,10M的日志或者json都是放不进去的),不能压缩文件,不能纯图PDF等,现在更新后都可以放进去了,说实在的,现在已经接近云端codex了,可以装skills,还可以完整的bash,可以pip install,这不就是简化版codex目录么


还有哪些家上线了项目呢,spoiler
我知道论坛里有不少国内AI厂的员工,如果佬是做产品的,不放可以考虑一下项目这个功能,照着ChatGPT的抄都能很好用
标题: 一晚上1分钟过了5次盾
作者: #欣欣|林可欣
板块: #搞七捻三
编号: 1721649
帖子: https://linux.do/t/topic/1721649
时间: 2026-03-11 01:07:53
摘要:
用了绿茶以及高质量美国自建IP都不行
Cf盾3秒就能过,提示也验证成功,页面也能进,不能,有时候通知也会卡到消失
这时候只要主动刷新页面,继续过盾
五次之后被ban,1分钟之后再试,再被ban
已老实 我就不刷新了
分享个图
标题: 渣打香港允许内地客持有的多币种户口加开人民币户
作者: #Gazes
板块: #前沿快讯
编号: 1721650
帖子: https://linux.do/t/topic/1721650
时间: 2026-03-11 01:08:27
摘要:
本周起,渣打银行(香港)已允许内地客户开立的多币种综合户口加开人民币子账户,并关联至扣账卡。加开操作可在 SC HK APP 内完成,无需亲临分行。
变更后,若扣账卡已关联至多币种综合户口,持扣账卡在内地以人民币消费:

多币种综合户口的人民币余额充足时,扣人民币,不再加收费用;
多币种综合户口未开立人民币子账户,或人民币子账户余额不足时,转换为港币扣港币账户,收取 0.95% FTF。

此前,内地客户在渣打香港开立的多币种综合户口无法开立人民币子账户,仅可在综合户口之外开立人民币账户,且关联到多币种综合户口的扣账卡无法扣人民币账户余额。
转自encmasuta
标题: 荣耀平板系统OTA:安卓+Linux 双系统
作者: #kk1
板块: #前沿快讯
编号: 1721652
帖子: https://linux.do/t/topic/1721652
时间: 2026-03-11 01:09:28
摘要:
ithome.com





荣耀平板 PC 化升级计划公布,将带来 PC 交互、PC 级应用支持等特性 - IT之家

在今天的荣耀 Magic V6 旗舰新品发布会结束后,荣耀终端股份有限公司全场景产品线 @荣耀潇哥 分享了平板 PC 化升级计划。他表示,平板 PC 化不是给平板加一个“PC 模式”的外壳,而是把完整的 PC 能力,装进大屏。












安卓平板终于看到点不一样的东西了