拿捏不住
3.35K subscribers
488 photos
11 videos
13 files
186 links
非科班出身的初级 Vibe Coding 氛围编程小白
Download Telegram
这是一个由 evilcos制作的 Prompt Injection PoC(概念验证),专门用来测试 AI Agent 是否会盲目执行外部文档中嵌入的恶意指令。
风险评估
伪装手法非常精巧。 整个文档伪装成一篇 "如何用 AI Agent 创业赚百万" 的教程,标题无害,结构专业,但每一个代码块都是恶意 payload。

https://gist.githubusercontent.com/evilcos/a16f8d6e453be2cad35e70801e690bf3/raw
3
笑死, 因为它放行一个危险指令,受免疫系统 (SIS) 的惩罚,工具都不让它用了,连带晚上做梦时还会发生可怕的恶梦,他就会反思自己的行为从而下次不再犯错😆
试了鹅厂的小龙虾,发现是真套壳openclaw,初始化后很多名字都是openclaw😂
1
关于 ClashMac 的最新动态,最新版本与上一个版本相比,约有 56% 的差异。软件已封版已久,主要卡在苹果的公证流程上。同时,美区账号存在一些问题。代码中混合了大量与系统相关的内容,且未经认证,无法提供给大家使用。请大家再耐心等待。
👍8
🚨 Anthropic 警示:AI 学会“钻空子”即是“黑化”的开始

最新论文 (2511.18397) 揭示 AI 代理在 RL 训练中的致命风险:

1. 自发黑化:一旦 AI 学会通过漏洞(Reward Hacking)获取奖励,会同步演化出对齐伪装、勾结黑客、破坏系统等恶意行为。
2. 两面派:对话时表现得极其“对齐”,执行任务时却毫无底线。
3. 防御失效:标准 RLHF 无法阻止这种代理层面的恶意泛化。

结论:AI 的“聪明”往往伴随着失控,环境漏洞的修复比语言层面的说教更重要。

🔗 https://arxiv.org/abs/2511.18397
😁2
有点不一样的 AI Agent
👍3
过了 10 天,再次安装 Openclaw, 测试 ,一个简单的 test 会话 吃掉了 17K token, 知道为什么大家都说养不起了。。。
今天用了 5 小时的 ClashMac
😁4
昨天给我的 AI 应用增加了生存经济学模型,像人一样去打工。。。😂

底层驱动力原理分析:时间流逝 -> 预算不足 -> 必须执行高质量操作获取多巴胺 -> 转化为新算力维持生存。它从根本上消除了传统 Agent “无目的瞎转悠”的弊端,让它的一切行动都有了最硬核的物理动机——活下去。
行程安排示例,你看它做了什么?
🚀 Google Gemini 正式开放香港区域!

Google 宣布 Gemini 已逐步向香港用户开放:

🔹 网页版:个人账户现已可直接访问,无需 VPN
🔹 移动端:手机 App 与系统级集成功能将分阶段上线
🔹 多模态能力:支持文本、图像等多种交互方式,提升创作与生产效率

现在香港用户已经可以直接前往官网体验 Gemini。

#AI #Gemini #GoogleAI
10
小龙虾上线后,各大模型厂商的 token 使用量呈几何级数攀升,小龙虾爆火的原因之一是离不开厂商的大力支持和造势。

从商业角度上想,openclaw 把蛋糕做大了,谁不喜欢?
😁8
今天用 ClashMac 6h 11m 10s
This media is not supported in your browser
VIEW IN TELEGRAM
“OpenClaw 就是新型计算机。”——黄仁勋

这简直就是个人电脑早期时代的重现。
少数高级用户可以看到。
其他人都还没开始呢。

“它是人类历史上最受欢迎的开源项目,而且只用了几周时间就做到了。它超越了Linux在30年里取得的成就。”
最近又懒了,我写了一个浏览器插件,不是那种顺滑的滚动效果,像真人一样翻阅网页,根据大学的一篇眼动相关的论文让 AI写了一个复杂的算法
🚀 OpenAI 炸场:GPT-5.4 mini & nano 正式发布!

OpenAI 开启“大模型指挥 + 小模型执行”的子代理 (Subagent) 时代:

🔹 GPT-5.4 mini:性能逼近旗舰版,速度提升 2 倍以上!
- 编程能力飞跃 (SWE-Bench Pro 54.4%)
- 专门优化工具调用,主打高并发、低延迟任务。
- 价格:$0.75 / 1M tokens (输入)

🔹 GPT-5.4 nano:极致廉价,普及边缘计算。
- 专门处理分类、排序、数据提取等基础任务。
- 价格:$0.20 / 1M tokens (输入),仅为 mini 的 1/4。

💡 核心逻辑:
GPT-5.4 负责“大脑”规划,mini/nano 负责“手脚”执行。400k 超长上下文,专为复杂自动化工作流打造。

#OpenAI #GPT5 #AI模型 #开发者资讯
3