标题: GPT-5.4 在 长时间任务 上 自动挂起/自动中断/提前结束 问题的一种简单粗暴的解决方法
作者: #二十一點
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1709385
时间: 2026-03-08 21:07:44
摘要:
作者: #二十一點
板块: #开发调优
编号:
1709385帖子: https://linux.do/t/topic/1709385
时间: 2026-03-08 21:07:44
摘要:
新的GPT-5.4 还是有点半吊子。
吹的很猛,用起来,相比当年5.2-xhigh少了那一次连续运行三十多个小时的锐气(bushi)
这似乎是因为gpt-5.4在执行复杂任务时,倾向于在"自然停顿点"就停下来,把控制权交还给用户。模型会认为它到了一个逻辑节点,应该停下来等待确认,而实际上任务远未完成。
不过5.4大幅增长的多模态能力对我的任务又比较重要,我在尝试一种比较简单粗暴的解决方法,效果拜其1M上下文所赐,还可以。
具体来说,就是在Codex CLI中,输入"继续"然后按 Tab 键来排队消息,一次排个十几条就当他在连续运行了。
死马当活马医,分享给各位佬
标题: 自部署小模型翻译能力测评:7 款 ≤7B 模型 × 5 种语言 × LINUX DO 真实内容
作者: #叁月柒
板块: #悬赏
编号:
帖子: https://linux.do/t/topic/1709388
时间: 2026-03-08 21:07:59
摘要:
作者: #叁月柒
板块: #悬赏
编号:
1709388帖子: https://linux.do/t/topic/1709388
时间: 2026-03-08 21:07:59
摘要:
从悬赏:自部署小模型对于翻译任务的能力测评继续。
本文测评在M4的Mac Mini上通过Ollama本地部署完成,覆盖 7 款模型、5 种目标语言和 12 类论坛内容,共 1155 条翻译。
太长不看,可以直接去文末看结论。
1.测评概述
2.测试环境与部署
3.测试方法
4.参测模型一览
模型
参数量
类型
模型大小(Q4_K_M)
来源
Qwen2.5-3B
3B
通用
1.9 GB
阿里通义
Gemma2-2B
2B
通用
1.6 GB
Llama3.2-3B
3B
通用
2.0 GB
Meta
Phi-3.5-mini
3.8B
通用
2.2 GB
Microsoft
Qwen2.5-7B
7B
通用
4.7 GB
阿里通义
Mistral-7B
7B
通用
4.4 GB
Mistral AI
HY-MT 1.5
1.8B
专用翻译
1.1 GB
腾讯混元
5.性能与速度对比
5.1 速度总览
模型
平均响应时间
平均吞吐量
总耗时(165条)
Qwen2.5-3B
0.84s
54.2 tok/s
139s
Gemma2-2B
0.70s
61.5 tok/s
115s
Llama3.2-3B
0.89s
50.9 tok/s
145s
Phi-3.5-mini
2.22s
44.9 tok/s
357s
Qwen2.5-7B
1.92s
24.1 tok/s
317s
Mistral-7B
4.47s
23.4 tok/s
738s
HY-MT 1.5
0.93s
76.7 tok/s
150s
速度结论:3B 及以下模型响应均在 1 秒内,可满足实时翻译需求。7B 模型在 16GB Mac 上仍可用,但速度约降至一半。HY-MT 作为专用翻译模型,吞吐量最高。
5.2 显存占用
在 16GB 统一内存的 Apple Silicon Mac 上:
2B-3B 模型:运行流畅,内存占用约 2-3 GB
7B 模型:可以运行但内存较紧张,占用约 5-6 GB
多模型并发不建议在 16GB 机器上进行
6. 翻译质量评估
6.1 指令遵从度(是否只输出翻译)
6.2 错误/超时率
6.3 中文残留率(按语言)
7. 分内容类型详细结果
7.1 UI 分类名翻译(短文本,2-4 个汉字)
7.2 论坛黑话标题翻译
7.3 正文翻译(长文本)
8. 分语言详细结果
9. 综合排名
10. 选型建议
给始皇
给佬友
11. 结论
本测评的完整数据
(1155 条翻译原始结果 JSON):results.json
测评环境:Apple Silicon Mac 16GB / Ollama 0.17.7 / 2026.03.08
标题: 认真的!!!爸妈在家闲不住能做什么?
作者: #苏黎世
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1709390
时间: 2026-03-08 21:08:45
摘要:
作者: #苏黎世
板块: #搞七捻三
编号:
1709390帖子: https://linux.do/t/topic/1709390
时间: 2026-03-08 21:08:45
摘要:
起因是妈妈想做月嫂,而且小孩和小孩的妈妈都要住到我家里来(这个孩子是二胎,40天,我妈和那女的妈妈关系好,想让我妈帮忙带,5000一个月,休4天)我们都不同意带过来,我妈身体也不太好,带个把月大的小孩,身体吃不消,想问一下你们有什么好的路子,让我妈不要闲着有事做赚点家用钱(我爸妈都在家没事做,我也有工作了,家里就日常开销)
标题: 【抽奖】半小时光速抽个奖 无质保 team车位*1
作者: #cmpdke33
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/1709392
时间: 2026-03-08 21:09:03
摘要:
作者: #cmpdke33
板块: #福利羊毛
编号:
1709392帖子: https://linux.do/t/topic/1709392
时间: 2026-03-08 21:09:03
摘要:
奖品详情:
[奖品]:[team车位(无质保)*1]
活动时间:
开始时间:[此帖发出开始]
截止时间:[2026/3/8-21:40]
参与方式:
在本帖下回复任意内容
抽奖规则:
每位用户仅允许参与一次。
使用官方抽奖工具随机抽取中奖者。
注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后12小时内在本帖公布,并通过私信通知领奖方式。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系抽奖发起人。
标题: 我的赛博女友: 自己制作桌面宠物的一些技术思考
作者: #kor1
板块: #文档共建
编号:
帖子: https://linux.do/t/topic/1709394
时间: 2026-03-08 21:09:18
摘要:
作者: #kor1
板块: #文档共建
编号:
1709394帖子: https://linux.do/t/topic/1709394
时间: 2026-03-08 21:09:18
摘要:
AIRI 前一阵子火过,印象里是使用 Tauri 实现的。
最近看了一下源码,好家伙,这已经完成了从 Tauri 到 Eletron 的迁移了。
虽然不知道为什么会有这样的迁移,不过从迁移后就发布了 Linux 版本来看,大概率是 Linux 平台的问题。
桌宠应用要怎么实现?
你可以想象成要实现一个类似迅雷的悬浮窗的功能。在 Tauri 上,它就是一个全局的、置顶的、点击穿透的、无窗口衬体的透明应用。
至于桌宠,当然是3d模型了。有专门用于数字人的3d模型格式,比如 live2d、或者vrm模型。这些都可以在网上找到现成的模型,也有现成的动画文件可以驱动模型做动作。但是如果你想自定义的话,唔,不会 3d 软件的话,难度直上云霄,大模型也比较难办。
实现上,使用 pixiv/three-vrm,理论上,在大模型的帮助(codding)下,我们可以很轻松地实现出来。
让你的女友看着你的鼠标
思路也简单,pixiv/three-vrm 这些都提供了 LookAt 功能,通过把鼠标的坐标传递给3d模型,并对眼睛和头部做绑定即可。
但是,还记得我们在上面的定义吗?桌宠应用必须是一样点击穿透的应用,因为它是置顶在所有软件的最上层的,但是又不能影响到底层应用的操作。在 Tauri里,通过 setIgnoreCursorEvents 实现点击穿透。
// 设置窗口属性
useEffect(() => {
const appWindow = getCurrentWebviewWindow();
appWindow.setAlwaysOnTop(basic.alwaysOnTop);
appWindow.setSkipTaskbar(basic.hideTaskbarIcon);
appWindow.setIgnoreCursorEvents(basic.clickThrough);
}, [basic.alwaysOnTop, basic.clickThrough, basic.hideTaskbarIcon]);
这个设置会造成前端无法再获取任何的鼠标事件,因此无法获取鼠标在屏幕在的坐标位置。
那通过rust 后端获取行不行?使用 rdev 或者 enigo 可以获取鼠标的位置。在后端开一个线程,获取坐标后通过事件传递到前端:
// 或者使用 tokio 实现
thread::spawn(move || {
let enigo = Enigo::new(&enigo::Settings::default()).unwrap();
loop {
let (x, y) = enigo.location().unwrap();
// 发送鼠标坐标事件到前端
let _ = app_handle.emit("mouse-move", serde_json::json!({
"x": x,
"y": y
}));
println!("Mouse moved to ({}, {})", x, y);
thread::sleep(Duration::from_millis(50));
}
});
诡异的问题
很遗憾,上面这个思路在 windows 下是没有任何问题的,想来在 macOS 下也是没有问题的。但是 Linux ,它就有问题!
在Linux 里,无论是X11环境还是 wayland环境,上面的 setIgnoreCursorEvents都会造成阻塞从而造成 enigo 拿不到鼠标坐标。
具体表现为:
启动时(前端未准备好),enigo 正常,可以拿到鼠标坐标。
前端UI启动成功后,enigo 再也获取不到坐标。
事实上,setIgnoreCursorEvents 也是由 Rust 层实现的,更具体地,它是由 wry 库实现的。而 wry 库 在 linux 上使用的是libwebviewgtk。
更深层的原因,可能需要大佬来解释。
标题: 这是什么问题?之前怎么没遇到过,用CPA的,超了上下文了嘛?
作者: #Xandor
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1709398
时间: 2026-03-08 21:09:50
摘要:
作者: #Xandor
板块: #开发调优
编号:
1709398帖子: https://linux.do/t/topic/1709398
时间: 2026-03-08 21:09:50
摘要:
标题: 准备买一些域名,哪些后缀的便宜呢
作者: #cc
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1709399
时间: 2026-03-08 21:09:57
摘要:
作者: #cc
板块: #搞七捻三
编号:
1709399帖子: https://linux.do/t/topic/1709399
时间: 2026-03-08 21:09:57
摘要:
搭建了临时邮箱服务,需要一些域名,请教下哪些后缀的便宜呢? 还能在国际上获得认可呢?
不至于注册完就封号的那种
各位佬们,有推荐的域名后缀和购买平台吗?
标题: 加入了google one pro家庭组 还提示此账号无法订阅 Google AI 方案
作者: #Mason Quill
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1709400
时间: 2026-03-08 21:10:00
摘要:
作者: #Mason Quill
板块: #搞七捻三
编号:
1709400帖子: https://linux.do/t/topic/1709400
时间: 2026-03-08 21:10:00
摘要:
大号pro邀请小号进家庭组
显示pro
这里还是 此账号无法订阅 Google AI 方案
标题: 分享一下自家猫猫最爱的两个玩具
作者: #一只羊蝎子
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1709416
时间: 2026-03-08 21:12:33
摘要:
作者: #一只羊蝎子
板块: #搞七捻三
编号:
1709416帖子: https://linux.do/t/topic/1709416
时间: 2026-03-08 21:12:33
摘要:
之前媳妇在抖音直播间买了几十个玩具,玩了小半年了,目前这两种最爱玩,给大家推荐一下,也许可以用于快速消耗小猫精力
怀疑是对颜色感兴趣,再加上是这种条状的,很喜欢咬着玩,现在每天晚上拿这个陪他玩半小时到一小时,半夜就不会嗷嗷叫了消耗体力很不错,但是一定要小心,防止误食
正在上传:IMG_3882.jpeg…
然后是这种藏食小萝卜,本来是想把冻干放进去让他掏,结果发现他对萝卜超级感兴趣,基本天天叼着萝卜到处走,偶尔会殴打萝卜,在地上叼着萝卜又是摔跤又是兔子蹬
同样需要注意误食风险,藏食的那块地方是用线缝上的,可能被小猫咬断然后把线吃下去
除了玩具,小猫还很喜欢捕猎,家里地板干净的话可以考虑把冻干丢出去,小猫会追击猎物,就能在家里跑来跑去啦
不过吃多了会变成猪,建议少吃点
标题: 【更新】ModelScope 0元“小龙虾”现已支持被休眠或重启后保留配置
作者: #乐神
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1709421
时间: 2026-03-08 21:14:16
摘要:
作者: #乐神
板块: #搞七捻三
编号:
1709421帖子: https://linux.do/t/topic/1709421
时间: 2026-03-08 21:14:16
摘要:
2026-03-08
现已支持 ModelScope 容器在休眠/重启(含深度重启)后自动恢复 OpenClaw 的配置信息(目录:/root/.openclaw),不用再担心重启后还需要再配置的问题。同时,以下目录及文件也会自动恢复:桌面目录(/root/Desktop)、ssh 公钥目录(/root/.ssh)、zsh 历史记录文件(/root/.zsh_history)
OpenClaw 升级到最新的 2026.3.7 版本
压缩减小了镜像体积
升级操作说明:ModelScope 已经部署容器的用户,需要在“设置”那里点击“深度重启”,然后才会自动拉取最新的容器镜像并部署。
【教程】0元领养专属“小龙虾”OpenClaw,2核16GB配置/无痛部署/开箱即用
资源荟萃
TunMax/openclaw_computer 项目构建了一个预装 OpenClaw 的 Linux 容器,配置了中文桌面环境/拼音输入法/Chrome 浏览器,同时为 OpenClaw 配置了默认免费推理的后端和启用了最高权限,免去了繁杂的部署细节,只需提供 ModelScope API Key(免费)就能开箱即用,小白也能轻松上手。
在 ModelScope/HuggingFace S…
标题: 寻找一位172号卡的佬友,上游名叫elonmusk
作者: #竹笋 竹笋
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1709447
时间: 2026-03-08 21:20:15
摘要:
作者: #竹笋 竹笋
板块: #搞七捻三
编号:
1709447帖子: https://linux.do/t/topic/1709447
时间: 2026-03-08 21:20:15
摘要:
之前在L站找了一位佬友的AFF注册账号,现在被冻结了,求解封
标题: claude console有余额,调用不了,报如下错误
作者: #handy
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1709448
时间: 2026-03-08 21:21:00
摘要:
作者: #handy
板块: #开发调优
编号:
1709448帖子: https://linux.do/t/topic/1709448
时间: 2026-03-08 21:21:00
摘要:
有佬友知道怎么解决吗?
Your credit balance is too low to access the Anthropic API. Please go to Plans & Billing to upgrade or purchase credits.
标题: 最近学LLM的原理,问gemini问题经常不回答,是漏信息了?
作者: #astrostar
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1709457
时间: 2026-03-08 21:23:34
摘要:
作者: #astrostar
板块: #搞七捻三
编号:
1709457帖子: https://linux.do/t/topic/1709457
时间: 2026-03-08 21:23:34
摘要:
刚了解prefill和decode的概念,有时问gemini相关的问题生成一半撤回了,难道真漏东西了?
标题: 粗略的翻了一下佬们的福利中转站,我发现基本都是代码类的
作者: #鹏 张
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1709458
时间: 2026-03-08 21:23:50
摘要:
作者: #鹏 张
板块: #搞七捻三
编号:
1709458帖子: https://linux.do/t/topic/1709458
时间: 2026-03-08 21:23:50
摘要:
基本容易找到的都是文本类的模型(Claude,codex,Gemini之类的), 为啥图文和视频类的基本没有呢?
标题: 甲骨文注册好了。二次安全验证play无法下载APK
作者: #小浣熊2020
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1709461
时间: 2026-03-08 21:24:40
摘要:
作者: #小浣熊2020
板块: #开发调优
编号:
1709461帖子: https://linux.do/t/topic/1709461
时间: 2026-03-08 21:24:40
摘要:
高兴的事,注册成功了。悲哀的事,登录二次安全认证需要下载APK(Oracle Mobile Authenticator) PLAY可能账号区域的原因无法下载。佬们帮忙下
标题: 飞升道路已经走了一半了。
作者: #Osborne
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1709465
时间: 2026-03-08 21:26:23
摘要:
作者: #Osborne
板块: #搞七捻三
编号:
1709465帖子: https://linux.do/t/topic/1709465
时间: 2026-03-08 21:26:23
摘要:
注册25天,阅读量到达一半,继续保持,准备飞升~~
标题: gemini回复爱莫能助
作者: #60713-29
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1709469
时间: 2026-03-08 21:27:15
摘要:
作者: #60713-29
板块: #搞七捻三
编号:
1709469帖子: https://linux.do/t/topic/1709469
时间: 2026-03-08 21:27:15
摘要:
为什么我的gemini一直回复这个:“我只是一个语言模型,理解不了这个问题,因此没法帮上忙。”?
我的问题是:(我的个人基本信息),请为我推荐xx方向最广受好评的书籍
标题: Claude Code 与 OpenCode的使用体验对比
作者: #zhangn
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1709479
时间: 2026-03-08 21:29:19
摘要:
作者: #zhangn
板块: #搞七捻三
编号:
1709479帖子: https://linux.do/t/topic/1709479
时间: 2026-03-08 21:29:19
摘要:
一、背景
我从去年5月到12月一直使用 Claude Code,可以说是重度用户。每次版本更新都会去看 changelog,了解具体改了什么,不懂的还上reddit去看,不懂就问ai。 VS Code 插件性质的小更新不太关注,但对于工具层面的更新不仅看还体验——比如 System Prompt 的调整、命令行参数、上下文管理、MCP 管理等。
二、对claude code的感受
(一)好的一面
在使用 Claude Code 的这段时间里,确实感受到 Anthropic 这家公司在工具理念方面的领先性。这种领先体现在 MCP(Model Context Protocol)、Skill 系统这些都是他家先提出来的。
比如上下文管理与压缩,Anthropic 在上下文管理,尤其是上下文压缩方面,有一套完整的方法论。直到现在,也只有 Anthropic 才有定向压缩(targeted compression)的功能——可以针对特定部分的上下文进行压缩,而不是简单粗暴地截断或全局压缩。这种细节的技术,估计很少有人关注到。
(二)不爽的地方
以前用intellij,后来觉得cc好,接触到opencode omo后,觉得cc有些问题确实让我绕不开,比如需要我不断地"yes yes yes"确认。
因为Claude Code 的默认交互模式是:
AI 提出一个操作建议
等待用户确认
执行操作
继续下一步,重复上述流程
这种模式在处理不熟悉的任务时是安全的,慢就是快,也可以让我可以更仔细的去分析和感受。但整体的时间消耗却很多,即使 AI 这一端的反应速度很快,但大部分时间都在等待用户的决策。
只有在执行一些例行任务时——比如用熟悉的 Skill 处理会议记录——我才会打开"勇敢者模式”,让 AI 自主执行。
核心问题是:Claude Code 很多时候是在等我的思考,等我的决定。
(三)OpenCode 的体验提升
接触到 OpenCode,尤其是在 oh-my-opencode 插件辅助的模式下,我的感受是:真的回不去了。
从"走"到"跑"
OpenCode 的 Sisyphus agent 设计得非常合理。具体技术我没时间去研究(因为大部分时间都在搞账号上了),但真的感觉爽:
该干活的时候拼命干,使劲干
不确定的时候会主动询问
整体流程行云流水
这种体验的差异是质的飞跃。以前用 Claude Code 的感觉是"等",现在用 OpenCode 的感觉是"跑"。效率提升不是一点半点。
并行开发支持
这是我在 Claude Code 里一直想做但做不到的事情。
在做项目开发时,我习惯先做规划,把大的规划拆解成小的规划,最后形成一个任务树:
顶层是项目目标
中层是各个模块
底层是具体的小任务
如果要实现并行开发,需要通过 Gatework 来管理资源,确保不同步骤之间没有互相占用(比如同时修改同一个文件)。
在 Claude Code 里,这是做不到的。
我必须:
a. 手动开新窗口
b. 在新窗口里手动执行 git worktree 相关的命令
c. 手动协调不同窗口之间的任务
这样很麻烦,也很混乱,很容易出错。
OpenCode 的机制可以让我在一个会话里管理多个并行任务(session),通过 不同session的git worktree自动化的并行执行,效率就这么提升上来了。
会话内 MCP 管理
Claude Code 的 MCP 管理有一个很别扭的地方:
MCP 在启动时加载
加载后会占用上下文
即使在会话中"关闭"了某个 MCP,它仍然占用上下文
没有办法在会话内动态加载/卸载 MCP
这意味着如果加载了一堆 MCP,但只在某个阶段需要用到其中一个,其他的 MCP 会一直占用的上下文窗口。
OpenCode 支持会话内的 MCP 加载控制。可以:
在需要的时候加载特定的 MCP
用完后卸载,释放上下文
动态切换不同的 MCP 组合
这对于复杂项目的上下文管理非常重要。
本机服务机制
后来我发现,OpenCode 实际上是在本机(好像还可以跨设备)为每个会话开启了一个服务。
这个机制带来了一个非常强大的能力:OpenCode 可以成为被程序调用的终端。
这意味着:
可以在自己的程序里:
a. 调用 OpenCode 的服务
b. 传入程序的逻辑和变量
c. 结合 OpenCode 的 Skill、MCP、提示词综合地完成复杂任务
这相当于把 OpenCode 变成了一个可编程的 AI 能力层,而不仅仅是一个人机交互式工具。
三、总结
从工具理念上看,Anthropic 确实是领先的——MCP、Skill、定向压缩这些概念都很先进。新手也许从claude code入手会好一些,对上下文管理的理解,工具的理解有很好的帮助。
然后再切到opencode,尤其是我们好多单位是内网环境,开源的也更好。而且anthropic是A chu。