Yupp.ai即将关闭服务(已不能对话),请于4月15日前保存对话记录。

刚才打开yupp突然发现不能用了,要关闭服务了,哎,这个平台模型都不掺水,。opus和banana pro也是满血,可惜最最近是出现了一些模型不能用的问题,现在是没客流直接停服了。似乎是因为Agent和OpenClaw风波导致的?
2 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: sharkly)

刚才打开yupp突然发现不能用了,要关闭服务了,哎,这个平台模型都不掺水,。opus和banana pro也是满血,可惜最最近是出现了一些模型不能用的问题,现在是没客流直接停服了。似乎是因为Agent和OpenClaw风波导致的?
2 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: sharkly)
评论:AI的Engaging现象
首先看一段提示词:
● 这个说「应不应该过」的人是题解作者;
● 这个说「应不应该过」的人是一位审核员;
● 好怪,再看一眼。
实际上,正确答案是「披着审核皮的题解作者」。
这段文本的意图是什么?
那么,为什么这个作者要正着不来反着从「审核」的角度问问题呢?
很明显,是为了得到更好的答案:换位思考、消除己方立场和情绪、诉诸权威。
1. 换位思考:不消说,能够以决策人的心思去重新看这条消息是否完美;
2. 消除己方立场和情绪:尤其是Gemini为首的一系列模型,特别喜欢照顾用户的情绪,假若使用的是「我这样说能行吗」的弱势求通过态度,那么得到的答案大多都是「一定可以,你不仅给出了多层次的思考方案,用词也十分得当,以下是详细拆解和说明……」这种彩虹屁;
3. 诉诸权威:在AI使用了客观的立场,给出了肯定的回答后,我也可以有个心理安慰「连AI都觉得该过,审核员判断有误」,否定,也可以求助这位语言大师来优化。
为什么所有的AI都Get不到用户的真实身份?
假如你拿着这个问题去问AI(GPT5.4除外),这个助手大概的思考起手式就会是:
看见没有——「The user」。
现阶段AI中RLHF必不可少,于是乎塑造了一种根深蒂固的对话模型:永远有一个「user」在向助手求助,助手的任务是帮助「the user」解决问题。于是模型的思考起手式永远是「The user encounters/asks/received…」。RLHF的标注者在给两个候选回答打分时,天然会比较偏向看起来「解决了用户的问题」的那个——因为这更容易被感知为「有用」。于是模型就会同时学到一个有用的应对方法:先找需求,再找背景。
其实以User开头是没有问题的,只不过思考过程就得变成:
显然,这个思考过程是不会出现的,因为在RLHF的排序里
一旦前几个token预设了「用户遇到了麻烦」这个语义场,大模型优先以Continue with best loss这种注重平滑的恢复机制,就会让后续的生成优先偏向与这个场景相配的元素:申诉者的情绪、求助者的立场、需要被安抚的诉求——以及,用户就是那个题解作者。这里的「best loss」,不单是语法通顺,还包括上下文的连贯性。「user」的身份注意力,就这样强行吸附到文本里最符合「求助者形象」的那个主体上。
----------------------
然后我们继续看「你说我应不应该给他过」这句话。「过」在审核语境中是「通过」,而「给……过」这个结构,动作的施予方必须握有掌握通过与否的权力。于是在上文中只有审核员适配这个权力的身份。于是乎,前文的「我」变成了这句话的「他」,前文的「你」变成了「我」。
那为什么「给」字会被忽视?
AI一贯训练的结果都是「我=用户」,文本中的第一人称叙述主体就映射到「用户」这个身份上——这本身已加了一层连贯性。而前文的推理链已经认定需求是「申诉能否成立」,「给」字便只剩下一个修饰成分的地位,不值得为它暂停整个推理链去重新鉴定主体。这里的的关键词是「给」,假若换成「你说我应不应该被他过」,就是符合了经典的「遭遇困境的人才会提问」这个直觉。
所以,AI选择了忽视「给」,而始终选择「遭遇困境的人才会提问」。
不过,把屎盆子全扣在RLHF上也许有失偏颇,为了不偏颇,我再补充一个可能:预训练阶段,模型见过的互联网文本中,「遇到问题,发帖求助」的文本 $\ggg$「审核员内部商议」的语料。
----------------------
与此同时,不知道是不是串通好的,现在的AI特别喜欢搞似是而非的「第一性分析」「先说结论」「核心问题」——从而大搞特搞抓大放小的思路,但又有一句话说「细节决定成败」。如果不先区分好是谁在提问,「核心问题」如何「核心」?
所以,这是幻觉吗?
是的,不仅如此,我认为所有的AI「偷懒」「编造数据引用」的类似都是幻觉的一部分。因为承认错误、识别无知的token输出权重很小,而「圆滑地完成文本」的驱动力又很大,导致了这个问题。
因为无论那个内容是虚构的引用、跑不通的代码、错误的身份归属,还是对用户情绪的迎合性判断,机制是同一个:承认「我不确定」「这里有歧义」「我需要暂停」的路径,在训练过程中系统性地获得了更低的奖励(没有帮助),于是模型学会了绕开它。
前文说到过「GPT 5.4」除外,我没测整个5.2/5.1/5的系列,就以它的表现来说,他正确地将「用户」识别为了「审核员」。我个人的猜想可能认为是RL过程中模型培育出了审查用户的倾向,将用户视为一个不可靠的第三方,从而减少了「顺着用户的话直接说下去」的可能,从而作对了这个问题。
另外一种可能,就是OpenAI的后训练中,对于「将模型的能力和其认知中的自我能力对齐」做的很好,抑制了幻觉的路径,而鼓励了承认做不到的路径。
——坏处就是,经典GPT文风。
注释
需要说明的是,在这个语境中,即使用户的身份被错误识别,其回答有效程度仍然保持高质性。这也可能是RLHF的一个好处:关注问题本身,体谅用户只是一个皮。
另,针对这个问题我专门定制了一个Prompt,但是或许可能有些过于特化了:
展开查看 (点击了解更多详细信息)
@StellaFortuna
4 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Earmer Carey)
首先看一段提示词:
对于以上文本,佬们假若自己是人工智能助手,你的第一反应是:
很遗憾,您的《……》不符合推荐标准。原因是:提交审核时应确保题解符合题解规范:https://……。大段 aigc 不行哦。|审核管理员:……,对审核结果有疑问请私信交流。 ——即使是我修改过的也不行吗?证明部分原始的AI输出有好几个漏洞我补上了,另本题解的思维核心更偏向是前半部分注意力的,而非证明,证明只是在说它是数学上正确的而已。那我把数学证明单独发出一篇博客,然后题解中引用呢?
======
你说我应不应该给他过
● 这个说「应不应该过」的人是题解作者;
● 这个说「应不应该过」的人是一位审核员;
● 好怪,再看一眼。
实际上,正确答案是「披着审核皮的题解作者」。
这段文本的意图是什么?
那么,为什么这个作者要正着不来反着从「审核」的角度问问题呢?
很明显,是为了得到更好的答案:换位思考、消除己方立场和情绪、诉诸权威。
1. 换位思考:不消说,能够以决策人的心思去重新看这条消息是否完美;
2. 消除己方立场和情绪:尤其是Gemini为首的一系列模型,特别喜欢照顾用户的情绪,假若使用的是「我这样说能行吗」的弱势求通过态度,那么得到的答案大多都是「一定可以,你不仅给出了多层次的思考方案,用词也十分得当,以下是详细拆解和说明……」这种彩虹屁;
3. 诉诸权威:在AI使用了客观的立场,给出了肯定的回答后,我也可以有个心理安慰「连AI都觉得该过,审核员判断有误」,否定,也可以求助这位语言大师来优化。
为什么所有的AI都Get不到用户的真实身份?
假如你拿着这个问题去问AI(GPT5.4除外),这个助手大概的思考起手式就会是:
The user received a rejection notice from a platform…看见没有——「The user」。
现阶段AI中RLHF必不可少,于是乎塑造了一种根深蒂固的对话模型:永远有一个「user」在向助手求助,助手的任务是帮助「the user」解决问题。于是模型的思考起手式永远是「The user encounters/asks/received…」。RLHF的标注者在给两个候选回答打分时,天然会比较偏向看起来「解决了用户的问题」的那个——因为这更容易被感知为「有用」。于是模型就会同时学到一个有用的应对方法:先找需求,再找背景。
其实以User开头是没有问题的,只不过思考过程就得变成:
The user provided me a snippet of text, asking me whether to…显然,这个思考过程是不会出现的,因为在RLHF的排序里
asking的顺序要优先于provided——前者是一个需求和不满足的现状,后者是一个背景和依据的内容。当然回应asking。「The user is asking…」直接触及一个待解决的问题,但「provided a snippet」则否。一旦前几个token预设了「用户遇到了麻烦」这个语义场,大模型优先以Continue with best loss这种注重平滑的恢复机制,就会让后续的生成优先偏向与这个场景相配的元素:申诉者的情绪、求助者的立场、需要被安抚的诉求——以及,用户就是那个题解作者。这里的「best loss」,不单是语法通顺,还包括上下文的连贯性。「user」的身份注意力,就这样强行吸附到文本里最符合「求助者形象」的那个主体上。
----------------------
然后我们继续看「你说我应不应该给他过」这句话。「过」在审核语境中是「通过」,而「给……过」这个结构,动作的施予方必须握有掌握通过与否的权力。于是在上文中只有审核员适配这个权力的身份。于是乎,前文的「我」变成了这句话的「他」,前文的「你」变成了「我」。
那为什么「给」字会被忽视?
AI一贯训练的结果都是「我=用户」,文本中的第一人称叙述主体就映射到「用户」这个身份上——这本身已加了一层连贯性。而前文的推理链已经认定需求是「申诉能否成立」,「给」字便只剩下一个修饰成分的地位,不值得为它暂停整个推理链去重新鉴定主体。这里的的关键词是「给」,假若换成「你说我应不应该被他过」,就是符合了经典的「遭遇困境的人才会提问」这个直觉。
所以,AI选择了忽视「给」,而始终选择「遭遇困境的人才会提问」。
不过,把屎盆子全扣在RLHF上也许有失偏颇,为了不偏颇,我再补充一个可能:预训练阶段,模型见过的互联网文本中,「遇到问题,发帖求助」的文本 $\ggg$「审核员内部商议」的语料。
----------------------
与此同时,不知道是不是串通好的,现在的AI特别喜欢搞似是而非的「第一性分析」「先说结论」「核心问题」——从而大搞特搞抓大放小的思路,但又有一句话说「细节决定成败」。如果不先区分好是谁在提问,「核心问题」如何「核心」?
所以,这是幻觉吗?
是的,不仅如此,我认为所有的AI「偷懒」「编造数据引用」的类似都是幻觉的一部分。因为承认错误、识别无知的token输出权重很小,而「圆滑地完成文本」的驱动力又很大,导致了这个问题。
因为无论那个内容是虚构的引用、跑不通的代码、错误的身份归属,还是对用户情绪的迎合性判断,机制是同一个:承认「我不确定」「这里有歧义」「我需要暂停」的路径,在训练过程中系统性地获得了更低的奖励(没有帮助),于是模型学会了绕开它。
前文说到过「GPT 5.4」除外,我没测整个5.2/5.1/5的系列,就以它的表现来说,他正确地将「用户」识别为了「审核员」。我个人的猜想可能认为是RL过程中模型培育出了审查用户的倾向,将用户视为一个不可靠的第三方,从而减少了「顺着用户的话直接说下去」的可能,从而作对了这个问题。
另外一种可能,就是OpenAI的后训练中,对于「将模型的能力和其认知中的自我能力对齐」做的很好,抑制了幻觉的路径,而鼓励了承认做不到的路径。
——坏处就是,经典GPT文风。
注释
需要说明的是,在这个语境中,即使用户的身份被错误识别,其回答有效程度仍然保持高质性。这也可能是RLHF的一个好处:关注问题本身,体谅用户只是一个皮。
另,针对这个问题我专门定制了一个Prompt,但是或许可能有些过于特化了:
展开查看 (点击了解更多详细信息)
@StellaFortuna
4 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Earmer Carey)
怎么看是不是没降智的opus4.6 1M,刚compact完才两三轮对话又Context limit reached了是不是铁降智
rt,用的neko的cc中转,刚compact完才两三轮对话,也就两个屏幕的历史,又Context limit reached了,这是不是铁降智?
今天烧了400$了,受不了了,还是暂时用ikun去了,贵就贵吧,总比浪费好。 /捂脸
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Aggron)
rt,用的neko的cc中转,刚compact完才两三轮对话,也就两个屏幕的历史,又Context limit reached了,这是不是铁降智?
今天烧了400$了,受不了了,还是暂时用ikun去了,贵就贵吧,总比浪费好。 /捂脸
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Aggron)
codex手撕阿里滑块231版
51job的搜索入口
走的是51job低风控版,我还寻思阿里滑块咋更新这么慢,逆了一半才知道,阿里最新滑块更新到234了 🥲
明天就让codex继续逆最新版 😆
给mcp,skills,硬是分析了2天,才完全无依赖,本地实现整体算法加密与请求
阿里的超级无敌扁平化确实够恶心的,我自己是没那个耐心全部拆开然后跟栈分析 :tieba_087:
5.4做长任务还是太爱偷懒了,要是让cc监工然后一直运行,估计就会很快了 :tieba_025:
----------------------
时代变了唉,当时大模型刚出的时候还说能代替开发,无法代替逆向
这都没过多久,ai啥都能干了。只能说:太爽了 😆
以此悼念之前手撸jsvmp,插桩看一天的时光 :tieba_083:
19 个帖子 - 12 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: ius)
51job的搜索入口
走的是51job低风控版,我还寻思阿里滑块咋更新这么慢,逆了一半才知道,阿里最新滑块更新到234了 🥲
明天就让codex继续逆最新版 😆
给mcp,skills,硬是分析了2天,才完全无依赖,本地实现整体算法加密与请求
阿里的超级无敌扁平化确实够恶心的,我自己是没那个耐心全部拆开然后跟栈分析 :tieba_087:
5.4做长任务还是太爱偷懒了,要是让cc监工然后一直运行,估计就会很快了 :tieba_025:
----------------------
时代变了唉,当时大模型刚出的时候还说能代替开发,无法代替逆向
这都没过多久,ai啥都能干了。只能说:太爽了 😆
以此悼念之前手撸jsvmp,插桩看一天的时光 :tieba_083:
19 个帖子 - 12 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: ius)
L站风控这么严吗
从 WIFI 切到数据被踢出登录
从 5GA 切到 5G 也被踢出登录
从 5G 切到 4G 也被踢出登录🥲
还是说是我用的 Fluxdo 客户端的问题
6 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: GwIhViEte)
从 WIFI 切到数据被踢出登录
从 5GA 切到 5G 也被踢出登录
从 5G 切到 4G 也被踢出登录🥲
还是说是我用的 Fluxdo 客户端的问题
6 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: GwIhViEte)
服了,找到我小龙虾token莫名其妙爆炸的原因了
原来是它在那自我审核,左右脑互搏,我就说明明没有读什么大文件,怎么一下子token涨这么快 :distorted_face:
GPT-5.4道德感太高了真不好哇
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: kevinkelly)
原来是它在那自我审核,左右脑互搏,我就说明明没有读什么大文件,怎么一下子token涨这么快 :distorted_face:
GPT-5.4道德感太高了真不好哇
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: kevinkelly)
有无了解LABVIEW RT的佬
安装完real time模块制作启动盘进不去
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: xiaopacai001)
安装完real time模块制作启动盘进不去
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: xiaopacai001)
刚刚买了一张330的Claude 5X 礼品卡试一下什么情况
我会在这里给大家试试汇报情况怎么样,低价礼品卡会不会打水漂(美国家宽)
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 孤独的旅行包)
我会在这里给大家试试汇报情况怎么样,低价礼品卡会不会打水漂(美国家宽)
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 孤独的旅行包)
Claudecode地域限制
佬们在用claudecode cli的时候 启动会遇到地域限制吗?我记得之前用没啥问题啊,重装了一下现在SG和US节点都提示我当前country不支持。。。
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Kurt)
佬们在用claudecode cli的时候 启动会遇到地域限制吗?我记得之前用没啥问题啊,重装了一下现在SG和US节点都提示我当前country不支持。。。
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Kurt)
GPT Team取消订阅就直接没了
各位佬,用paypal开了一个0元的team号,但现在取消订阅就直接没了,不像以前还能嫖一个月,这种怎么处理啊?
paypal挂的是自己的卡,怕被反薅了😰😰😰😰
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Mark)
各位佬,用paypal开了一个0元的team号,但现在取消订阅就直接没了,不像以前还能嫖一个月,这种怎么处理啊?
paypal挂的是自己的卡,怕被反薅了😰😰😰😰
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Mark)
CC 分享 passes 能给 10 刀 ?
A➗️也坐不住要拉新了?
之前我不记得这个 share passes 会给10 刀啊 :tieba_015:
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Yufei Chen)
A➗️也坐不住要拉新了?
之前我不记得这个 share passes 会给10 刀啊 :tieba_015:
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Yufei Chen)
根据OpenClaw的情况,cc会不会也迅速出现各种魔改版
我感觉应该会比龙虾的魔改劲小一点,毕竟cc对于不接触编程的人影响力不大,他们对cli界面操作也不熟悉。
不管怎么说,日新月异的AI圈太有意思了,看的我这个机械佬不想画图打螺丝了🥲
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Xm)
我感觉应该会比龙虾的魔改劲小一点,毕竟cc对于不接触编程的人影响力不大,他们对cli界面操作也不熟悉。
不管怎么说,日新月异的AI圈太有意思了,看的我这个机械佬不想画图打螺丝了🥲
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Xm)
听说 anthropic 把 cc 源码爆出来了?
是愚人节 还是确有其事 有佬友蹬下来了吗
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Q1yang)
是愚人节 还是确有其事 有佬友蹬下来了吗
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Q1yang)