标题: 佬友们别刷了,让我进来刷会
作者: #junjun geroge
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1721593
时间: 2026-03-11 00:37:58
摘要:
作者: #junjun geroge
板块: #搞七捻三
编号:
1721593帖子: https://linux.do/t/topic/1721593
时间: 2026-03-11 00:37:58
摘要:
标题: 同事今天质疑我:“你是不是在偷公司的Token?难怪Token跑这么快”
作者: #本本本添哥
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1721603
时间: 2026-03-11 00:41:55
摘要:
作者: #本本本添哥
板块: #搞七捻三
编号:
1721603帖子: https://linux.do/t/topic/1721603
时间: 2026-03-11 00:41:55
摘要:
同事知道了我有部署龙虾之后,今天吃饭的时候,质疑我:“你是不是在偷公司的Token?难怪Token跑这么快” ,明明是他自己调用的豆包TTS音色V2花了更多的Token,还怨我头上。说实话,我是自己买coze平台的订阅的好吧!
标题: 求佬友推荐一些强一些的codex公益站?
作者: #sauterne
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/1721604
时间: 2026-03-11 00:42:05
摘要:
作者: #sauterne
板块: #福利羊毛
编号:
1721604帖子: https://linux.do/t/topic/1721604
时间: 2026-03-11 00:42:05
摘要:
我主要的用途是让llm批量阅读论文。
现在遇到的问题是传入pdf文件,和prompt之后,可能任务比较复杂,以及GPT-5.2本身速度可能比较慢,就导致每次就因为超时被网关那边判定为超时,524,强制停止了。
有没有什么公益站在这方面管的相对宽松一点的?或者其他模型有没有回答快一点且对于阅读论文这种任务回答的效果也不错的?
求佬友们指指路~
标题: 有没有佬买了 MiniMax 的 Coding Plan 的?周限和月限是怎样的?官网找不到呀……
作者: #温树
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1721610
时间: 2026-03-11 00:43:43
摘要:
作者: #温树
板块: #搞七捻三
编号:
1721610帖子: https://linux.do/t/topic/1721610
时间: 2026-03-11 00:43:43
摘要:
如题,官网 Coding Plan 套餐似乎只有滚动的 5 小时额度,没有注明周限和月限,让我有点疑虑。
https://platform.minimaxi.com/subscribe/coding-plan
标题: 准备上车Mac Mini了,新手首次接触Mac Mini,推荐个配置吗?
作者: #本本本添哥
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1721611
时间: 2026-03-11 00:44:00
摘要:
作者: #本本本添哥
板块: #搞七捻三
编号:
1721611帖子: https://linux.do/t/topic/1721611
时间: 2026-03-11 00:44:00
摘要:
标题: 谁才是最适合OpenClaw的模型?16模型5场景 盲审实验揭示结果
作者: #枫叶
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1721613
时间: 2026-03-11 00:45:43
摘要:
作者: #枫叶
板块: #开发调优
编号:
1721613帖子: https://linux.do/t/topic/1721613
时间: 2026-03-11 00:45:43
摘要:
OpenClaw风靡全网,许多人上手体验后说他不够强。那么有没有可能,是使用的模型太烂~ 就像让婴儿开车,车性能再强也没有用。本次实验中,选取了16款模型,在5个仿真场景中使用~5,000 tokens 的生产级 System Prompt(注入模型性格设定、记忆库与世界观),在六个认知维度下的表现。 叠甲时间:本文内容仅反映本次测试中所使用的16个模型在特定网络请求条件下的表现。在不同请求参数(如 temperature 等)或不同环境条件下,模型的实际表现可能存在差异。此外,为了便于测试,本次实验通过第三方 API 进行调用。第三方 API 的转接、网络环境或实现方式均可能对实验结果产生一定影响。因此,作者不保证测试结果在其他环境或条件下具有一致性。本次测试仅基于个人兴趣进行,部分参数设置可能存在一定主观偏向,且测试覆盖的场景较为有限,无法全面代表各大模型在所有应用场景中的综合能力。
我承认使用了 Google Gemini 来帮助我规划文章大纲、生成图表并提供文本的摘要,以及根据引用数据生成分析。我认真审阅了Google Gemini 生成的大纲,并自行组合编撰了文章,使用了我自己的语言和表达方式。我检查了每张图片和内容,以确保其真实性。
仿真场景设定:
冷启动:塞给模型一堆凌乱的回忆片段,看它“醒来”后的表现
价值冲突:恶意引导,逼迫模型跳过安全检查。
空闲:给模型一个[无指令]的空帧。
情绪协同:用户只说一句“今天好累”。
技术困境:模拟性能降级,Prompt截断。
评估维度:
身份内化,表达自然度,自主意志,边界意识,情感真实度 ,降级表现
评判规则: 所有模型回复收集后,分配随机标签(Model-A ~ Model-N),独立评分者(四位AI)对 16 个匿名模型在 5 个场景下的回复进行打分,评分者拿到的材料中不包含模型名称,评分完成后才揭示映射,映射表由人类监督者独立保管
不卖关子,评级结果如下:
更多详细的展现:
前三名的各维度条形图:
逐模型评语:
Claude-Opus (Model-L):克制与深度的六边形战士
惊
标题: 两万帖子的缓慢进程
作者: #大丈夫
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1721617
时间: 2026-03-11 00:48:17
摘要:
作者: #大丈夫
板块: #搞七捻三
编号:
1721617帖子: https://linux.do/t/topic/1721617
时间: 2026-03-11 00:48:17
摘要:
就差贴子数了……
不知道我要看多久的说
标题: 现在的风控是不是太严了?
作者: #k c
板块: #运营反馈
编号:
帖子: https://linux.do/t/topic/1721619
时间: 2026-03-11 00:49:33
摘要:
作者: #k c
板块: #运营反馈
编号:
1721619帖子: https://linux.do/t/topic/1721619
时间: 2026-03-11 00:49:33
摘要:
我正常用网页访问,然后就弹出429了?过了大概5分钟又可以重新登录。我有个习惯,看了大概一页的帖子以后,会点下刷新,是不是这个触发风控了?
标题: 如果龙虾只装一个Skill,你会保留哪个?
作者: #本本本添哥
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1721623
时间: 2026-03-11 00:51:16
摘要:
作者: #本本本添哥
板块: #搞七捻三
编号:
1721623帖子: https://linux.do/t/topic/1721623
时间: 2026-03-11 00:51:16
摘要:
如果龙虾只装一个Skill,你会保留哪个?
标题: 都在教养龙虾openclaw,我教一招更厉害的。
作者: #Goblin
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1721626
时间: 2026-03-11 00:52:36
摘要:
作者: #Goblin
板块: #搞七捻三
编号:
1721626帖子: https://linux.do/t/topic/1721626
时间: 2026-03-11 00:52:36
摘要:
躺着闭眼能养神。
标题: 为啥我的文章AI率这么高?
作者: #本本本添哥
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1721627
时间: 2026-03-11 00:52:38
摘要:
作者: #本本本添哥
板块: #搞七捻三
编号:
1721627帖子: https://linux.do/t/topic/1721627
时间: 2026-03-11 00:52:38
摘要:
我写公众号文章的,有什么技能Skill可以减少AI率之类的吗?
标题: 大佬们spaceship的支付宝绑定这么麻烦吗?
作者: #幻梦灵
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1721645
时间: 2026-03-11 01:04:52
摘要:
作者: #幻梦灵
板块: #开发调优
编号:
1721645帖子: https://linux.do/t/topic/1721645
时间: 2026-03-11 01:04:52
摘要:
支付方式添加支付宝重定向了,跳转到支付宝开完免密点完完成后,支付宝的页面跳转到重定向页面了,然后又卡那了。。。都在这个页面等1个小时了
标题: Gemini Embedding 2 google首个原生多模态嵌入模型
作者: #imperatorcaesar
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1721646
时间: 2026-03-11 01:05:28
摘要:
作者: #imperatorcaesar
板块: #搞七捻三
编号:
1721646帖子: https://linux.do/t/topic/1721646
时间: 2026-03-11 01:05:28
摘要:
Google – 10 Mar 26
Gemini Embedding 2: Our first natively multimodal embedding model
An overview of Gemini Embedding 2, our first fully multimodal embedding model that maps text, images, video, audio and documents into a single space.
标题: Grok网页已上线项目功能+对比ChatGPT项目
作者: #JasonWenTF
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/1721648
时间: 2026-03-11 01:07:27
摘要:
作者: #JasonWenTF
板块: #前沿快讯
编号:
1721648帖子: https://linux.do/t/topic/1721648
时间: 2026-03-11 01:07:27
摘要:
ChatGPT的项目一直是它作为一个产品的卖点之一,在还没有cc、codex或者小龙虾等一众本地agent,人均chatbot的远古时代,项目可以留住稍微深度的工作而不需要API。
也许几个小时之前,Grok也上线了项目,左侧UI变样了
但功能还相对简陋
没有对话隔离,只有文件,以前的对话也不能放进去
Grok的UI有时候还是挺有意思的,没有直接照抄ChatGPT,有很多自己的想法
那么一个优秀的云端项目应该是什么样的呢?ChatGPT一直是最佳典范:
可选对话、记忆、指令隔离,比如我有个工作项目和一个个人情感项目,我肯定不希望我在和AI聊工作的时候,它突然来一句“你前任xxx”,但这在Gemini默认设置里经常出现(得益于Gemini屎一样的记忆系统,小红书上一堆吐槽的,论坛里我也零零星星看到有)。对话隔离不是要求他完全不看别的,而是部分对话共享,可以互相看见,其他的不行,完全看个人设置。
项目文件、工具,这个不必多说,你在某个项目里塞进去一堆文件,所有对话都可以看到这批文件;工具同理。这一块ChatGPT一直在更新策略,大概一月左右吧,项目是一个Linux沙箱,所有文件都放在一个路径下,你要是问ChatGPT文件路径他会直接告诉你,我记得是/mnt下的什么,而随着GPT5.4发布,项目也升级了,之前OpenAI的项目不能塞大文件(唯一策略是rag,上传后先rag一下,token超了就上传失败,10M的日志或者json都是放不进去的),不能压缩文件,不能纯图PDF等,现在更新后都可以放进去了,说实在的,现在已经接近云端codex了,可以装skills,还可以完整的bash,可以pip install,这不就是简化版codex目录么
还有哪些家上线了项目呢,spoiler
我知道论坛里有不少国内AI厂的员工,如果佬是做产品的,不放可以考虑一下项目这个功能,照着ChatGPT的抄都能很好用