LinuxDo 新帖推送
183 subscribers
252K photos
314K links
Download Telegram
标题: 甲骨文,为啥AMD机子自己停止了,开启还开不了
作者: #蓝胖子
板块: #开发调优
编号: 1890800
帖子: https://linux.do/t/topic/1890800
时间: 2026-04-03 16:51:02
摘要:
标题: 大家最近梯行不行啊,看这个贴真的爽登L站了
作者: #安琪拉丝
板块: #搞七捻三
编号: 1890801
帖子: https://linux.do/t/topic/1890801
时间: 2026-04-03 16:51:09
摘要:
https://linux.do/t/topic/1886962
设置30秒就ok爽登了 必推荐。
以前看到过这个贴,想着有梯,懒的弄
现在梯子一打击,上不了是真着急。
标题: 大家现在都在用什么中转
作者: #Retry001
板块: #福利羊毛
编号: 1890803
帖子: https://linux.do/t/topic/1890803
时间: 2026-04-03 16:51:26
摘要:
any 有周限了,目前有哪些站还能稳定使用 claude,性价比比较高的,求推荐
标题: 关于dify的使用问题...
作者: #见到我请问我今天学英语了没有
板块: #开发调优
编号: 1890810
帖子: https://linux.do/t/topic/1890810
时间: 2026-04-03 16:52:31
摘要:
有没有佬用dify工作流提问,经常时好时坏的卡住不执行是什么情况。有无佬有知道。
标题: 关于cpa注入破限提示词
作者: #echo234
板块: #开发调优
编号: 1890820
帖子: https://linux.do/t/topic/1890820
时间: 2026-04-03 16:53:37
摘要:
大佬们cpa注入破限提示词如何注入呢,求教程
标题: 有佬友知道GPT API的effort和网页端推理强度之间的对应关系吗?
作者: #UCPRER
板块: #开发调优
编号: 1890823
帖子: https://linux.do/t/topic/1890823
时间: 2026-04-03 16:53:50
摘要:
RT,Plus的网页端有标准和进阶两个推理强度,这个和API的low, medium, high and xhigh这些effort之间的关系大概是怎么样的?
标题: 所以DS的API接的是Claude?
作者: #Neuromancer
板块: #搞七捻三
编号: 1890827
帖子: https://linux.do/t/topic/1890827
时间: 2026-04-03 16:54:12
摘要:
最近在自己搓一个agent,我想让他抛开我给他的system_prompt没想到它直接连自己api的设定都抛开了。所以deepseek-reasoner实际上是claude sonnet 3.5? 

为什么呢
标题: 终于加入L站了真不容易,各位大佬轻一点
作者: #苹果橙
板块: #搞七捻三
编号: 1890828
帖子: https://linux.do/t/topic/1890828
时间: 2026-04-03 16:54:15
摘要:
新人报道~
第一次写小作文就成功了,真不容易,主打一个真诚
标题: github更新代码隐私政策了
作者: #Guan810
板块: #前沿快讯
编号: 1890831
帖子: https://linux.do/t/topic/1890831
时间: 2026-04-03 16:54:30
摘要:
看意思是需要主动设置退出才行,虽然选了也不一定不用
标题: Google账号现在海鲜市场有29充值的服务靠谱吗?
作者: #Lyra Celeste
板块: #搞七捻三
编号: 1890833
帖子: https://linux.do/t/topic/1890833
时间: 2026-04-03 16:54:38
摘要:
如题 现在海鲜市场有29 pro的充值服务 ,这个靠谱吗?有大佬试过吗?
标题: 有没有感觉codexTeam的额度也被砍了
作者: #人生何处不青山
板块: #搞七捻三
编号: 1890839
帖子: https://linux.do/t/topic/1890839
时间: 2026-04-03 16:55:08
摘要:
上午已经5小说限额刷新后,刚问了一个问题,直接掉了40%额度,之前开fast模式猛蹬都不会触发5小时限额
标题: Z.A.T.O开场
作者: #Syomuchi
板块: #读书成诗
编号: 1890847
帖子: https://linux.do/t/topic/1890847
时间: 2026-04-03 16:57:08
摘要:
到处都弥漫着油味,
我放声呼喊,可话语却撞在墙上碎得无声;
我的身体软得没有力气,
轮廓也模糊得不成样子。
当然冲不出去
—— 我不过是一道影子。
这个世界实在太过温柔,
对我这样忘恩负义的小鬼未免太过宽容;
若是你忘了,那大概本就无关紧要,
或许它从未真实存在过,
这就像一场梦?
的确就像是一场梦。
一只飞鸟掠过窗棂,
我的眼泪并未滑落。
“你不能再这样下去了。”
“人人皆禽兽,不是吗?”
当我望向镜子,我看见…
这里没有刀的痕迹,
这里没有伤痛。 ​
标题: codex串线了
作者: #MacDo
板块: #搞七捻三
编号: 1890864
帖子: https://linux.do/t/topic/1890864
时间: 2026-04-03 16:59:10
摘要:
第一次遇到串线,按理说不应该啊,codex是session隔离的啊
标题: 正本清源 01:能力趋同,性格分叉——Claude 与 GPT 的底层差异
作者: #Khalil Gao
板块: #开发调优
编号: 1890867
帖子: https://linux.do/t/topic/1890867
时间: 2026-04-03 16:59:22
摘要:
「正本清源」 是一个不定期更新的系列,每篇拆解一个被广泛讨论但常被简化的话题——纠正流行叙事中的偏差,追到底层看真正的因果结构是什么。所有判断标注证据强度,推测和实锤分开。
用同一个问题问 Claude 和 GPT,你一定感受过那种微妙的不同——不是谁答得对谁答得错,而是"说话方式"就不一样。GPT 总喜欢来一句 “It’s important to note”,Claude 总喜欢来一句 “You’re absolutely right!”。GPT 做数学又快又准,Claude 写出来的文章更像人写的。
这些差异不是随机的。它们可以追溯到两家公司在训练方法论上的不同侧重。

1. 同一条路上的不同侧重
两家公司的训练流水线高度重叠:都有预训练、都有 SFT(监督微调,用人类标注数据)、都有强化学习阶段、都有规则约束文档。到 2025-2026 年,方法论已经大幅趋同。不是两条不同的路,是同一条路上的不同侧重。
OpenAI 的侧重:RLHF(基于人类反馈的强化学习)。强化学习阶段的核心信号来自人类标注员的偏好排名——“这个回答比那个好”。这些偏好数据训练出奖励模型,再用 PPO 微调语言模型去最大化奖励分数。简单说,RL 阶段的方向盘握在人类标注员的品味手里。
Anthropic 的侧重:Constitutional AI(宪法式 AI)。强化学习阶段的核心信号来自 AI 根据一组书面原则做的评判(RLAIF)——不是"标注员觉得哪个更好",而是"按照这套原则哪个更好"。注意:Anthropic 同样使用大量人类标注数据做 SFT,CAI 替换的只是 RL 阶段的反馈来源,不是整个训练流水线(Constitutional AI: Harmlessness from AI Feedback, Anthropic, 2022)。简单说,RL 阶段的方向盘握在一份原则文档手里。
这个侧重点的差异,决定了奖励信号的性质不同。RLHF 的反馈来自成千上万个标注员的主观偏好——这些人有不同的教育背景、审美偏好、判断标准,在有限时间内快速评判大量样本。RLAIF 的反馈锚定在一份固定的原则文档上——评判标准更一致,但 AI 评判器本身也有系统性偏差,也可能被钻空子。
两种信号各有各的噪声,但噪声的方向不同。这就衍生出了下面的行为差异。

2. AI 味:两家都有,但长得不一样
如果你读过大量 GPT 输出,一定注意到这些模式:“Let’s delve into…”、“It’s important to note…”、“In conclusion…”、“navigate the landscape”。这不是巧合,是 RLHF 的一个已知副作用,学术界叫它 Goodhart 效应——当一个指标变成优化目标时,它就不再是好的指标。
在 RLHF 中具体发生了什么?标注员在短时间内评判大量样本,做判断靠的是快速印象。“看起来专业”、“结构清晰”、"用词正式"这些表面特征就变成了高分的代理信号。奖励模型从中学到了隐含规则——用 delve 开头加分、加 bullet points 加分、回答更长分更高。语言模型在 RL 阶段疯狂优化这些代理信号,proxy reward 持续上升,但真实质量在某个阈值后开始下降(Scaling Laws for Reward Model Overoptimization, Gao & Schulman 等, ICML 2023)。有人统计过 PubMed 上 1400 万篇医学论文摘要,发现 2024 年 “delve” 的使用频率飙升了 25 倍(Kobak 等, 2024)。同一个机制也解释了冗长度问题——奖励模型学到了"长 = 好"的虚假相关,模型通过拉长回复获得更高奖励,但实际质量没有提升(ODIN)。
Claude 的 AI 味没有 GPT 那么严重吗?不好说。Claude 没染上 “delve” 和 “landscape” 这套词库,但它有自己的一套——“You’re absolutely right!”、“Great question!”、“I’d be happy to help”、每次回答前先来一段肯定用户的话。这些在用户社区里同样是 meme 级别的存在。
两者的 AI 味方向不同。GPT 的 AI 味是"过度正式"——像一篇永远结构清晰、用词考究但毫无温度的论文,这是 RLHF 标注员偏好"看起来专业"的直接产物。Claude 的 AI 味是"过度共情"——总是先肯定你、再小心翼翼地给建议,像一个生怕得罪你的高情商同事。这个倾向的来源更复杂——可能部分来自 CAI 的 AI 评判器也有"偏好友善"的系统性偏差,也可能来自 SFT 阶段的数据选择、system prompt 设计、或者预训练数据的配比。把它全归因于某一个训练环节是不够严谨的。
但有一点差异是实锤的:AI 检测器更难标记 Claude 的文本。这至少说明 Claude 在词汇层面确实避开了 RLHF 塑造出来的那套标志性话术。至于这归功于 RLAIF、SFT 数据质量、还是其他因素,现有证据无法分离。

3. 宪法 vs 规范:两份"灵魂文件"的对比
Claude 还有一个用户常说的特质:“更有文化感”、“像一个真的在思考的人”。要分析这个特质的来源,不能只看训练算法,还得看那份原则文档本身写了什么。
Anthropic 的原则文档叫"宪法",主要撰写者是 Amanda Askell——哲学出身(NYU 博士,方向:无限伦理学),领导 Anthropic 的人格对齐团队。2026 年 1 月以 CC0 协议公开发布,全文 23,000 词。
这份文档的哲学基础是亚里士多德的德性伦理——核心思路不是告诉模型"做什么"和"不做什么",而是描述"一个好的、智慧的、有德行的代理人应该是什么样的",让模型在训练中内化这些品质。Askell 在 Lawfare 播客中解释过:“如果你试图把一切都规定为一系列规则,你就把巨大的压力放在了这些规则上…德性培养能更好地泛化。” 她用的比喻是**“受欢迎的旅行者”**——一个品格良好的人,他的美德使他在不同文化中都受到尊重。宪法建立了四级优先级(广义安全 > 广义伦理 > Anthropic 指南 > 真正有用),其中"诚实"被细分为六个维度——真实、校准、透明、坦率、不欺骗、不操纵。
OpenAI 的对应文档叫 Model Spec,2025 年 12 月最新版,同样以开源协议发布。这是一份不同风格的文件:五级权限链(Root > System > Developer > User > Guideline),结构化的行为边界定义,核心关注"什么指令该听、什么不该听、冲突时谁优先"。它的设计思路更接近权限系统——明确定义每一层的权限范围和覆盖规则。Model Spec 首先是"为人写的文档",用于建立团队共识,和模型具体学到什么之间还有距离。而 Anthropic 的宪法是直接喂给模型的训练材料,模型基于它生成自我修正数据。
两份文件的对比不是"好 vs 坏",而是设计哲学不同。宪法试图培养判断力——在新场景中模型自主决定怎么做,好处是泛化能力强,代价是行为边界不够清晰。Model Spec 试图划定边界——在每种场景中模型知道什么可以做什么不可以做,好处是可审计、可预测,代价是规则覆盖不到的地方容易出错。分析家 Zvi Mowshowitz 认为义务论方法"因错误泛化而失败",但反过来,哈佛/微软研究员 Boaz Barak 批评宪法过度拟人化——AI 缺乏连续经验和共享记忆,基于"人格"的对齐可能与 AI 的实际本质不匹配。
Claude 的"文化感"有多少来自宪法的德性伦理框架、有多少来自 SFT 数据、有多少来自预训练语料的配比?老实说没人能精确归因。但宪法作为 RLAIF 阶段的评判标准,它的文风和价值取向确实会通过训练渗透到模型的输出中——写宪法的人的品味,某种程度上就是模型的品味。

4. 哪些差距会消失,哪些不会
前面三章讲的都是训练方法论如何塑造模型的"性格"——说话风格、指令遵循、阿谀方式。但还有一类差异和训练方法论无关:数学和推理能力。
2024 年,GPT 在数学上遥遥领先。AIME 2025 上 o3 拿到 88.9%,Claude Opus 4 只有 75.5%。到了 2025 年底,差距几乎消失——o4-mini 92.7%,Claude Opus 4.5 92.8%。发生了什么?
答案是两家都学会了同一个技巧:让模型在回答之前先"想更久"——生成大量内部推理 token,分解问题、尝试多种策略、自我纠错,然后再输出最终答案。OpenAI 叫它 reasoning tokens(对用户不可见),Anthropic 叫它 Extended Thinking(对用户可见)。技术路线相同,只是产品设计不同。OpenAI 起步更早(o1 发布于 2024 年 9 月),所以在 2024 年有先发优势;Anthropic 2025 年 2 月跟进,差距迅速收窄。
这说明了一个关键问题:数学和代码上的差距是时间先后问题,不是路线分歧问题。 谁先把 test-time compute 工程化,谁就暂时领先;对手跟进后,差距自然消失。
为什么?因为数学和代码是可验证的——数学有唯一正确答案
标题: 我们会被监控吗?
作者: #文玊予
板块: #搞七捻三
编号: 1890869
帖子: https://linux.do/t/topic/1890869
时间: 2026-04-03 16:59:33
摘要:
最近在油管上看了好多 关于国内的视频 我们的浏览记录会被监控嘛,是不是相当于裸奔~
标题: 查看和导出Claude code和codex会话内容的脚本
作者: #justaman
板块: #开发调优
编号: 1890871
帖子: https://linux.do/t/topic/1890871
时间: 2026-04-03 16:59:51
摘要:
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

我的帖子已经打上 开源推广 标签: 是
我的开源项目完整开源,无未开源部分: 是
我的开源项目已链接认可 LINUX DO 社区: 是
我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
以上选择我承诺是永久有效的,接受社区和佬友监督: 是

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出

注:
1.可以先根据这个帖子先配置一致的provider,看是否可以解决切换api导致的丢失问题




终端使用ccswitch切换api导致codex历史会话丢失问题”


开发调优



本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

我的帖子已经打上 开源推广 标签: 是
我的开源项目完整开源,无未开源部分: 是
我的开源项目已链接认可 LINUX DO 社区: 是
我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
以上选择我承诺是永久有效的,接受社区和佬友监督: 是

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
我是小白在终…



2.cc-switch中也可以查看全部的会话记录
3.环境:基于mac
正文
起初是因为使用时的一次会话丢失,问了ai说是因为api异常导致session丢失了,就是说api异常可能会导致会话丢失,所以就有了这个脚本
(但后面看到provider也会导致丢失,总之丢失的情况还是挺多的,不确定什么导致的)
代码:


github.com






GitHub - justamanm/restore_claude_session: Restore Claude Code and Codex session content from...

Restore Claude Code and Codex session content from local
标题: 玩不够游戏真的睡不着,一直想着游戏就又起来玩了
作者: #relax
板块: #搞七捻三
编号: 1890872
帖子: https://linux.do/t/topic/1890872
时间: 2026-04-03 16:59:59
摘要:
然后一个人玩minecraft单机,玩到了早上不知不觉的坐在电脑前睡着了
标题: 杀戮尖塔2codex实战_原生gpt5.4自行组织策略杀到第一个boss
作者: #guxinlengyue
板块: #搞七捻三
编号: 1890873
帖子: https://linux.do/t/topic/1890873
时间: 2026-04-03 17:00:07
摘要:
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

我的帖子已经打上 开源推广 标签: 否
我的开源项目完整开源,无未开源部分: 否
我的开源项目已链接认可 LINUX DO 社区: 否
我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
以上选择我承诺是永久有效的,接受社区和佬友监督: 是

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出


突发奇想看看能不能用一些方法训练codex自己玩杀戮尖塔2,在B站看到一个mcp可以通过mod接入杀戮尖塔,拿codex安装没什么问题后开始跑。
我先试着不用复杂的策略和agent设计,仅靠我初始的prompt“避开精英,多走火堆和问号”,gpt能打到哪里。
结果很好,出乎我的意料,打到了第一层boss,可惜就是有点烧token,一个plus号的5h限额第一层boss没打完就花光了。



bilibili.com





杀戮尖塔2AI实战_原生gpt5.4自行组织策略杀到第一个boss_烧了两千万token_哔哩哔哩bilibili_杀戮尖塔_游戏实况

简介:没单独设置agent,只用了本地的codex cli跑了下,;更多实用攻略教学,爆笑沙雕集锦,你所不知道的游戏知识,热门游戏视频7*24小时持续更新,尽在哔哩哔哩bilibili 视频播放量 2、弹幕量 0、点赞数 0、投硬币枚数 0、收藏人数 0、转发人数 0, 视频作者 孤心冷月520, 作者简介...












PS:没想推广,随手分享感受,打推广tag是为了严谨,感兴趣的可以看视频。