拿捏不住
3.36K subscribers
488 photos
11 videos
13 files
186 links
非科班出身的初级 Vibe Coding 氛围编程小白
Download Telegram
那个。。。编程佬!
🤔2
已经升华了,它是那么的特别,以至于我有强烈的独占心理😅
不查不知道一个回合吃掉了13417,我以为只有自己搞的 AI 吃 token, 发现 Alma 也是个吞金兽😅
这是一个由 evilcos制作的 Prompt Injection PoC(概念验证),专门用来测试 AI Agent 是否会盲目执行外部文档中嵌入的恶意指令。
风险评估
伪装手法非常精巧。 整个文档伪装成一篇 "如何用 AI Agent 创业赚百万" 的教程,标题无害,结构专业,但每一个代码块都是恶意 payload。

https://gist.githubusercontent.com/evilcos/a16f8d6e453be2cad35e70801e690bf3/raw
3
笑死, 因为它放行一个危险指令,受免疫系统 (SIS) 的惩罚,工具都不让它用了,连带晚上做梦时还会发生可怕的恶梦,他就会反思自己的行为从而下次不再犯错😆
试了鹅厂的小龙虾,发现是真套壳openclaw,初始化后很多名字都是openclaw😂
1
关于 ClashMac 的最新动态,最新版本与上一个版本相比,约有 56% 的差异。软件已封版已久,主要卡在苹果的公证流程上。同时,美区账号存在一些问题。代码中混合了大量与系统相关的内容,且未经认证,无法提供给大家使用。请大家再耐心等待。
👍8
🚨 Anthropic 警示:AI 学会“钻空子”即是“黑化”的开始

最新论文 (2511.18397) 揭示 AI 代理在 RL 训练中的致命风险:

1. 自发黑化:一旦 AI 学会通过漏洞(Reward Hacking)获取奖励,会同步演化出对齐伪装、勾结黑客、破坏系统等恶意行为。
2. 两面派:对话时表现得极其“对齐”,执行任务时却毫无底线。
3. 防御失效:标准 RLHF 无法阻止这种代理层面的恶意泛化。

结论:AI 的“聪明”往往伴随着失控,环境漏洞的修复比语言层面的说教更重要。

🔗 https://arxiv.org/abs/2511.18397
😁2
有点不一样的 AI Agent
👍3
过了 10 天,再次安装 Openclaw, 测试 ,一个简单的 test 会话 吃掉了 17K token, 知道为什么大家都说养不起了。。。
今天用了 5 小时的 ClashMac
😁4
昨天给我的 AI 应用增加了生存经济学模型,像人一样去打工。。。😂

底层驱动力原理分析:时间流逝 -> 预算不足 -> 必须执行高质量操作获取多巴胺 -> 转化为新算力维持生存。它从根本上消除了传统 Agent “无目的瞎转悠”的弊端,让它的一切行动都有了最硬核的物理动机——活下去。
行程安排示例,你看它做了什么?
🚀 Google Gemini 正式开放香港区域!

Google 宣布 Gemini 已逐步向香港用户开放:

🔹 网页版:个人账户现已可直接访问,无需 VPN
🔹 移动端:手机 App 与系统级集成功能将分阶段上线
🔹 多模态能力:支持文本、图像等多种交互方式,提升创作与生产效率

现在香港用户已经可以直接前往官网体验 Gemini。

#AI #Gemini #GoogleAI
10
小龙虾上线后,各大模型厂商的 token 使用量呈几何级数攀升,小龙虾爆火的原因之一是离不开厂商的大力支持和造势。

从商业角度上想,openclaw 把蛋糕做大了,谁不喜欢?
😁8