标题: 有没有感觉codexTeam的额度也被砍了
作者: #人生何处不青山
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1890839
时间: 2026-04-03 16:55:08
摘要:
作者: #人生何处不青山
板块: #搞七捻三
编号:
1890839帖子: https://linux.do/t/topic/1890839
时间: 2026-04-03 16:55:08
摘要:
上午已经5小说限额刷新后,刚问了一个问题,直接掉了40%额度,之前开fast模式猛蹬都不会触发5小时限额
标题: Z.A.T.O开场
作者: #Syomuchi
板块: #读书成诗
编号:
帖子: https://linux.do/t/topic/1890847
时间: 2026-04-03 16:57:08
摘要:
作者: #Syomuchi
板块: #读书成诗
编号:
1890847帖子: https://linux.do/t/topic/1890847
时间: 2026-04-03 16:57:08
摘要:
到处都弥漫着油味,
我放声呼喊,可话语却撞在墙上碎得无声;
我的身体软得没有力气,
轮廓也模糊得不成样子。
当然冲不出去
—— 我不过是一道影子。
这个世界实在太过温柔,
对我这样忘恩负义的小鬼未免太过宽容;
若是你忘了,那大概本就无关紧要,
或许它从未真实存在过,
这就像一场梦?
的确就像是一场梦。
一只飞鸟掠过窗棂,
我的眼泪并未滑落。
“你不能再这样下去了。”
“人人皆禽兽,不是吗?”
当我望向镜子,我看见…
这里没有刀的痕迹,
这里没有伤痛。
标题: codex串线了
作者: #MacDo
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1890864
时间: 2026-04-03 16:59:10
摘要:
作者: #MacDo
板块: #搞七捻三
编号:
1890864帖子: https://linux.do/t/topic/1890864
时间: 2026-04-03 16:59:10
摘要:
第一次遇到串线,按理说不应该啊,codex是session隔离的啊
标题: 正本清源 01:能力趋同,性格分叉——Claude 与 GPT 的底层差异
作者: #Khalil Gao
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1890867
时间: 2026-04-03 16:59:22
摘要:
作者: #Khalil Gao
板块: #开发调优
编号:
1890867帖子: https://linux.do/t/topic/1890867
时间: 2026-04-03 16:59:22
摘要:
「正本清源」 是一个不定期更新的系列,每篇拆解一个被广泛讨论但常被简化的话题——纠正流行叙事中的偏差,追到底层看真正的因果结构是什么。所有判断标注证据强度,推测和实锤分开。
用同一个问题问 Claude 和 GPT,你一定感受过那种微妙的不同——不是谁答得对谁答得错,而是"说话方式"就不一样。GPT 总喜欢来一句 “It’s important to note”,Claude 总喜欢来一句 “You’re absolutely right!”。GPT 做数学又快又准,Claude 写出来的文章更像人写的。
这些差异不是随机的。它们可以追溯到两家公司在训练方法论上的不同侧重。
1. 同一条路上的不同侧重
两家公司的训练流水线高度重叠:都有预训练、都有 SFT(监督微调,用人类标注数据)、都有强化学习阶段、都有规则约束文档。到 2025-2026 年,方法论已经大幅趋同。不是两条不同的路,是同一条路上的不同侧重。
OpenAI 的侧重:RLHF(基于人类反馈的强化学习)。强化学习阶段的核心信号来自人类标注员的偏好排名——“这个回答比那个好”。这些偏好数据训练出奖励模型,再用 PPO 微调语言模型去最大化奖励分数。简单说,RL 阶段的方向盘握在人类标注员的品味手里。
Anthropic 的侧重:Constitutional AI(宪法式 AI)。强化学习阶段的核心信号来自 AI 根据一组书面原则做的评判(RLAIF)——不是"标注员觉得哪个更好",而是"按照这套原则哪个更好"。注意:Anthropic 同样使用大量人类标注数据做 SFT,CAI 替换的只是 RL 阶段的反馈来源,不是整个训练流水线(Constitutional AI: Harmlessness from AI Feedback, Anthropic, 2022)。简单说,RL 阶段的方向盘握在一份原则文档手里。
这个侧重点的差异,决定了奖励信号的性质不同。RLHF 的反馈来自成千上万个标注员的主观偏好——这些人有不同的教育背景、审美偏好、判断标准,在有限时间内快速评判大量样本。RLAIF 的反馈锚定在一份固定的原则文档上——评判标准更一致,但 AI 评判器本身也有系统性偏差,也可能被钻空子。
两种信号各有各的噪声,但噪声的方向不同。这就衍生出了下面的行为差异。
2. AI 味:两家都有,但长得不一样
如果你读过大量 GPT 输出,一定注意到这些模式:“Let’s delve into…”、“It’s important to note…”、“In conclusion…”、“navigate the landscape”。这不是巧合,是 RLHF 的一个已知副作用,学术界叫它 Goodhart 效应——当一个指标变成优化目标时,它就不再是好的指标。
在 RLHF 中具体发生了什么?标注员在短时间内评判大量样本,做判断靠的是快速印象。“看起来专业”、“结构清晰”、"用词正式"这些表面特征就变成了高分的代理信号。奖励模型从中学到了隐含规则——用 delve 开头加分、加 bullet points 加分、回答更长分更高。语言模型在 RL 阶段疯狂优化这些代理信号,proxy reward 持续上升,但真实质量在某个阈值后开始下降(Scaling Laws for Reward Model Overoptimization, Gao & Schulman 等, ICML 2023)。有人统计过 PubMed 上 1400 万篇医学论文摘要,发现 2024 年 “delve” 的使用频率飙升了 25 倍(Kobak 等, 2024)。同一个机制也解释了冗长度问题——奖励模型学到了"长 = 好"的虚假相关,模型通过拉长回复获得更高奖励,但实际质量没有提升(ODIN)。
Claude 的 AI 味没有 GPT 那么严重吗?不好说。Claude 没染上 “delve” 和 “landscape” 这套词库,但它有自己的一套——“You’re absolutely right!”、“Great question!”、“I’d be happy to help”、每次回答前先来一段肯定用户的话。这些在用户社区里同样是 meme 级别的存在。
两者的 AI 味方向不同。GPT 的 AI 味是"过度正式"——像一篇永远结构清晰、用词考究但毫无温度的论文,这是 RLHF 标注员偏好"看起来专业"的直接产物。Claude 的 AI 味是"过度共情"——总是先肯定你、再小心翼翼地给建议,像一个生怕得罪你的高情商同事。这个倾向的来源更复杂——可能部分来自 CAI 的 AI 评判器也有"偏好友善"的系统性偏差,也可能来自 SFT 阶段的数据选择、system prompt 设计、或者预训练数据的配比。把它全归因于某一个训练环节是不够严谨的。
但有一点差异是实锤的:AI 检测器更难标记 Claude 的文本。这至少说明 Claude 在词汇层面确实避开了 RLHF 塑造出来的那套标志性话术。至于这归功于 RLAIF、SFT 数据质量、还是其他因素,现有证据无法分离。
3. 宪法 vs 规范:两份"灵魂文件"的对比
Claude 还有一个用户常说的特质:“更有文化感”、“像一个真的在思考的人”。要分析这个特质的来源,不能只看训练算法,还得看那份原则文档本身写了什么。
Anthropic 的原则文档叫"宪法",主要撰写者是 Amanda Askell——哲学出身(NYU 博士,方向:无限伦理学),领导 Anthropic 的人格对齐团队。2026 年 1 月以 CC0 协议公开发布,全文 23,000 词。
这份文档的哲学基础是亚里士多德的德性伦理——核心思路不是告诉模型"做什么"和"不做什么",而是描述"一个好的、智慧的、有德行的代理人应该是什么样的",让模型在训练中内化这些品质。Askell 在 Lawfare 播客中解释过:“如果你试图把一切都规定为一系列规则,你就把巨大的压力放在了这些规则上…德性培养能更好地泛化。” 她用的比喻是**“受欢迎的旅行者”**——一个品格良好的人,他的美德使他在不同文化中都受到尊重。宪法建立了四级优先级(广义安全 > 广义伦理 > Anthropic 指南 > 真正有用),其中"诚实"被细分为六个维度——真实、校准、透明、坦率、不欺骗、不操纵。
OpenAI 的对应文档叫 Model Spec,2025 年 12 月最新版,同样以开源协议发布。这是一份不同风格的文件:五级权限链(Root > System > Developer > User > Guideline),结构化的行为边界定义,核心关注"什么指令该听、什么不该听、冲突时谁优先"。它的设计思路更接近权限系统——明确定义每一层的权限范围和覆盖规则。Model Spec 首先是"为人写的文档",用于建立团队共识,和模型具体学到什么之间还有距离。而 Anthropic 的宪法是直接喂给模型的训练材料,模型基于它生成自我修正数据。
两份文件的对比不是"好 vs 坏",而是设计哲学不同。宪法试图培养判断力——在新场景中模型自主决定怎么做,好处是泛化能力强,代价是行为边界不够清晰。Model Spec 试图划定边界——在每种场景中模型知道什么可以做什么不可以做,好处是可审计、可预测,代价是规则覆盖不到的地方容易出错。分析家 Zvi Mowshowitz 认为义务论方法"因错误泛化而失败",但反过来,哈佛/微软研究员 Boaz Barak 批评宪法过度拟人化——AI 缺乏连续经验和共享记忆,基于"人格"的对齐可能与 AI 的实际本质不匹配。
Claude 的"文化感"有多少来自宪法的德性伦理框架、有多少来自 SFT 数据、有多少来自预训练语料的配比?老实说没人能精确归因。但宪法作为 RLAIF 阶段的评判标准,它的文风和价值取向确实会通过训练渗透到模型的输出中——写宪法的人的品味,某种程度上就是模型的品味。
4. 哪些差距会消失,哪些不会
前面三章讲的都是训练方法论如何塑造模型的"性格"——说话风格、指令遵循、阿谀方式。但还有一类差异和训练方法论无关:数学和推理能力。
2024 年,GPT 在数学上遥遥领先。AIME 2025 上 o3 拿到 88.9%,Claude Opus 4 只有 75.5%。到了 2025 年底,差距几乎消失——o4-mini 92.7%,Claude Opus 4.5 92.8%。发生了什么?
答案是两家都学会了同一个技巧:让模型在回答之前先"想更久"——生成大量内部推理 token,分解问题、尝试多种策略、自我纠错,然后再输出最终答案。OpenAI 叫它 reasoning tokens(对用户不可见),Anthropic 叫它 Extended Thinking(对用户可见)。技术路线相同,只是产品设计不同。OpenAI 起步更早(o1 发布于 2024 年 9 月),所以在 2024 年有先发优势;Anthropic 2025 年 2 月跟进,差距迅速收窄。
这说明了一个关键问题:数学和代码上的差距是时间先后问题,不是路线分歧问题。 谁先把 test-time compute 工程化,谁就暂时领先;对手跟进后,差距自然消失。
为什么?因为数学和代码是可验证的——数学有唯一正确答案
标题: 我们会被监控吗?
作者: #文玊予
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1890869
时间: 2026-04-03 16:59:33
摘要:
作者: #文玊予
板块: #搞七捻三
编号:
1890869帖子: https://linux.do/t/topic/1890869
时间: 2026-04-03 16:59:33
摘要:
最近在油管上看了好多 关于国内的视频 我们的浏览记录会被监控嘛,是不是相当于裸奔~
标题: 查看和导出Claude code和codex会话内容的脚本
作者: #justaman
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1890871
时间: 2026-04-03 16:59:51
摘要:
作者: #justaman
板块: #开发调优
编号:
1890871帖子: https://linux.do/t/topic/1890871
时间: 2026-04-03 16:59:51
摘要:
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
我的帖子已经打上 开源推广 标签: 是
我的开源项目完整开源,无未开源部分: 是
我的开源项目已链接认可 LINUX DO 社区: 是
我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
注:
1.可以先根据这个帖子先配置一致的provider,看是否可以解决切换api导致的丢失问题
终端使用ccswitch切换api导致codex历史会话丢失问题”
开发调优
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
我的帖子已经打上 开源推广 标签: 是
我的开源项目完整开源,无未开源部分: 是
我的开源项目已链接认可 LINUX DO 社区: 是
我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
我是小白在终…
2.cc-switch中也可以查看全部的会话记录
3.环境:基于mac
正文
起初是因为使用时的一次会话丢失,问了ai说是因为api异常导致session丢失了,就是说api异常可能会导致会话丢失,所以就有了这个脚本
(但后面看到provider也会导致丢失,总之丢失的情况还是挺多的,不确定什么导致的)
代码:
github.com
GitHub - justamanm/restore_claude_session: Restore Claude Code and Codex session content from...
Restore Claude Code and Codex session content from local
标题: 玩不够游戏真的睡不着,一直想着游戏就又起来玩了
作者: #relax
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1890872
时间: 2026-04-03 16:59:59
摘要:
作者: #relax
板块: #搞七捻三
编号:
1890872帖子: https://linux.do/t/topic/1890872
时间: 2026-04-03 16:59:59
摘要:
然后一个人玩minecraft单机,玩到了早上不知不觉的坐在电脑前睡着了
标题: 杀戮尖塔2codex实战_原生gpt5.4自行组织策略杀到第一个boss
作者: #guxinlengyue
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1890873
时间: 2026-04-03 17:00:07
摘要:
作者: #guxinlengyue
板块: #搞七捻三
编号:
1890873帖子: https://linux.do/t/topic/1890873
时间: 2026-04-03 17:00:07
摘要:
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
我的帖子已经打上 开源推广 标签: 否
我的开源项目完整开源,无未开源部分: 否
我的开源项目已链接认可 LINUX DO 社区: 否
我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
突发奇想看看能不能用一些方法训练codex自己玩杀戮尖塔2,在B站看到一个mcp可以通过mod接入杀戮尖塔,拿codex安装没什么问题后开始跑。
我先试着不用复杂的策略和agent设计,仅靠我初始的prompt“避开精英,多走火堆和问号”,gpt能打到哪里。
结果很好,出乎我的意料,打到了第一层boss,可惜就是有点烧token,一个plus号的5h限额第一层boss没打完就花光了。
bilibili.com
杀戮尖塔2AI实战_原生gpt5.4自行组织策略杀到第一个boss_烧了两千万token_哔哩哔哩bilibili_杀戮尖塔_游戏实况
简介:没单独设置agent,只用了本地的codex cli跑了下,;更多实用攻略教学,爆笑沙雕集锦,你所不知道的游戏知识,热门游戏视频7*24小时持续更新,尽在哔哩哔哩bilibili 视频播放量 2、弹幕量 0、点赞数 0、投硬币枚数 0、收藏人数 0、转发人数 0, 视频作者 孤心冷月520, 作者简介...
PS:没想推广,随手分享感受,打推广tag是为了严谨,感兴趣的可以看视频。
标题: 佬友们,Gemma4开源。用起来感觉怎么样?
作者: #Daviddai
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1890874
时间: 2026-04-03 17:00:09
摘要:
作者: #Daviddai
板块: #搞七捻三
编号:
1890874帖子: https://linux.do/t/topic/1890874
时间: 2026-04-03 17:00:09
摘要:
听说比Qwen3.5强,有实际体验过的佬来分享一下感受吗
标题: Team账号通过cpa接到codex上,为什么官网Usage显示为other?是正常的吗?
作者: #TheShuo
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1890875
时间: 2026-04-03 17:00:17
摘要:
作者: #TheShuo
板块: #开发调优
编号:
1890875帖子: https://linux.do/t/topic/1890875
时间: 2026-04-03 17:00:17
摘要:
我在cpa反代的team和plus账号接到codex上使用,为什么官网usage显示的都为other啊?第一次用cpa,这种不应该是伪装cli请求吗?是我配置的有问题还是就是这样设计的?求大佬解答,网址在这 Codex
标题: 怎么评价XiaomiMiMoTokenPlan?
作者: #tuiners
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1890877
时间: 2026-04-03 17:00:23
摘要:
作者: #tuiners
板块: #搞七捻三
编号:
1890877帖子: https://linux.do/t/topic/1890877
时间: 2026-04-03 17:00:23
摘要:
排名很高,卖得很贵,感觉没什么用
标题: 关于GPT注册机,有什么问题都可以问,尽量告诉你们
作者: #xx_yy1
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1890887
时间: 2026-04-03 17:02:07
摘要:
作者: #xx_yy1
板块: #开发调优
编号:
1890887帖子: https://linux.do/t/topic/1890887
时间: 2026-04-03 17:02:07
摘要:
在了解注册机之前,你需要了解gpt账号的at和rt,前者一般是短期令牌,多数使用在web页面,可以用来做很多事,也可以接入cpa里面进行反代,rt是长期令牌,可以用来刷新at,其中rt获取方式有2种,一种是codex授权获取,另外一种是ios客户端登录获取,注册走官网首页注册目前没有任何障碍,获取at也是非常流程,对于很多人疯狂搞邮箱域名注册,不是明智选择,今天可以,明天就不行,不是长久之计,我一直都是使用outlook邮箱进行注册以及测试,目前codex授权风控很高,对于新账号它会判断身份,如果是付费账号,不管是go plus 还是team,都是可以跳过手机验证,其他的大概率都需要手机验证,即使你第一次跳过去,二次还是会触发,你一旦验证过一次手机,二次授权就不会出现,或者你是付费账号,是否可以开一个母号疯狂拉小号进去,授权成功然后把这个号踢出去绕过手机验证,目前没有测试,不过理论上可行.对于注册方式,不需要采用浏览器模拟,直接采用协议批量注册也是没问题的,影响不大,还有IP,这个权重特别小,不需要太在意,只要不是cf拦截就可以
标题: gpt plus 是否能无限白嫖首月优惠
作者: #onezylee
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1890888
时间: 2026-04-03 17:02:16
摘要:
作者: #onezylee
板块: #搞七捻三
编号:
1890888帖子: https://linux.do/t/topic/1890888
时间: 2026-04-03 17:02:16
摘要:
新号有一个月的免费体验,如果我每个月都注册新号领取是否可以无限白嫖,有佬友试过吗
标题: 关于AI生成文案的讨论
作者: #孤独豹猫
板块: #运营反馈
编号:
帖子: https://linux.do/t/topic/1890890
时间: 2026-04-03 17:02:29
摘要:
作者: #孤独豹猫
板块: #运营反馈
编号:
1890890帖子: https://linux.do/t/topic/1890890
时间: 2026-04-03 17:02:29
摘要:
事情是这样的,最近用codex用得非常多,
大家应该都知道GPT5最大的问题就是语风,前有问问接住后有我不跟你争,这也就导致了他说话非常死板,尤其是介绍文案,真的是一眼就能看出来那种结构和语气
最近看论坛,看到很多佬友开发了一些软件,但是文案是很明显使用GPT写,加部分人工润色的
社区准则:
使用AI生成、润色的文字内容。如果要发,请截图发出。
我在思考,但是AI生成,人工润色属不属于这种范围?
我帖子内的项目介绍,AI生成、润色内容部分已截图发出。
这个约定是否 应该认为 非常明显的AI生成结构、人工极少部分润色内容 为AI生成、润色内容?
叠甲:仅有感而发,不针对任何人,抛砖引玉,毕竟GPT的文案风格真是没眼看,看多了很恶心(不知道有没有佬友有同感)
标题: 不卖茶叶.开始卖token了
作者: #坤坤小只因
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1890892
时间: 2026-04-03 17:03:01
摘要:
作者: #坤坤小只因
板块: #搞七捻三
编号:
1890892帖子: https://linux.do/t/topic/1890892
时间: 2026-04-03 17:03:01
摘要:
标题: claude code 超级消耗bug 我的天 一句话消耗8%
作者: #Mos
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1890896
时间: 2026-04-03 17:03:40
摘要:
作者: #Mos
板块: #开发调优
编号:
1890896帖子: https://linux.do/t/topic/1890896
时间: 2026-04-03 17:03:40
摘要:
我是200美金计划 我opus4.6 1m max 一句话消耗8% 两句话到15%
标题: 关于glm智谱的回复速度
作者: #霜枝
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1890900
时间: 2026-04-03 17:04:46
摘要:
作者: #霜枝
板块: #搞七捻三
编号:
1890900帖子: https://linux.do/t/topic/1890900
时间: 2026-04-03 17:04:46
摘要:
我想问一下各位佬,也没有出现过这种问题。
酒馆用glm5和5.1进行问答的时候,前面三个问题回答的还算流畅,到第四个问题的时候不是不回复就是时间很长,到后面基本不会回复了。
这个是智谱的通病吗?我这边是用酒馆的,有时候写产品宣传介绍什么的,用克劳德的时候几乎没有出现过这种问题,本来自己也有想购入glm5的想法
我这边用的暂时都是公益站,好像回复的越来越慢或者不回复的只有glm,之前用克劳德从来没有出现过这种问题(除非楼层很高很高,不过基本不那么用百楼里面都不会出现),
结果glm才问了几个问题就这样了,想询问一下这是什么原因?glm还适合购入吗
标题: 公司采购模型方案意向如图,佬们进来给些建议和理由,感谢
作者: #gggwl2021
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1890901
时间: 2026-04-03 17:04:49
摘要:
作者: #gggwl2021
板块: #搞七捻三
编号:
1890901帖子: https://linux.do/t/topic/1890901
时间: 2026-04-03 17:04:49
摘要: