Oilbeater 的自习室
547 subscribers
60 photos
1 video
2 files
172 links
读书,技术,冷知识,随笔
Download Telegram
现在 AI 的 Benchmark 都没法看了,打算自己搞个测试集,把 Kube-OVN 历史上比较难的 Bug 挑出来,切到修复前让 Claude Code 驱动各家 AI,看看谁能解决这些问题。
5
DeepSeek 在 2025 年春节发了模型,是最值得尊敬那个。
DeepSeek 在 2026 年春节没发模型,是最值得尊敬那个。
2
自从买了 CC 的订阅,晚上睡觉前总想把额度用一用,然后就睡不了觉了……
😁8
CC 送了几个一周免费的名额,需要的自取 https://claude.ai/referral/hsC80IRSjQ
用了 tmux 后,CC 会给每个 subagent 单独开一个窗口
MiniMax, Kimi 和 GLM 春节没发红包,没发奶茶,没上春晚,这个月在 OpenRouter 上的 Token 量翻了好几倍,国内这些大厂还是长点心吧
😁1
把连续两个 Claude Code Max 5 小时额度用完了,感觉自己已经力竭了
DeepSeek 新论文 DualPath 主要是去解决 KV Cache 填充的性能问题。

在 Agent 多轮对话情况下,90% 以上的 Token 都会命中 KV Cache 就会导致 Prefill 一直需要加载 KV Cache。一般的机器是一个存储网卡,八个计算网卡,存储网卡很容易打满成为性能瓶颈。

于是 DualPath 做的就是让 Decode 机器也加载 KV Cache 然后通过计算网卡传递给 Prefill 机器,增加了一条传递 KV Cache 的通路。这样能提升大概 90% 左右吞吐量。

不过从论文看 KV 还是从存储加载的,但是 Decode 机器其实是有算好的上一轮 KV Cache 的,如果能直接把差量直接传递给 Prefill 不知道带宽占用和延迟表现会不会更好一些

https://arxiv.org/pdf/2602.21548
1
无意中发现了《暗棋圣手》这个小时候玩过的游戏,小时候很喜欢玩简单又带点策略,也很拼运气
NanoClaw diss OpenClaw 的博客,关于安全方面我觉的 NanoClaw 的安全也就那样,毕竟真要做事总得挂个目录进去,能注入木马的方式有的是,而且只是走网络就可以发起很多攻击了。

关于代码是不是人读过我觉得会是未来比较大的派系斗争了,一方面是完全放飞的 Vibe Coding,另一是要古手搓 AI 辅助。

https://nanoclaw.dev/blog/nanoclaw-security-model
想着从手机侧控制我在 GCP 上开发机的启停,设计了一个通过 telegram bot 触发 cloudflare work 的 serverless function 启动一个 docker 然后在 docker 里运行 GCP CLI 的架构。

打算开干的时候发现 GCP 有 Android 的 APP。
NanoBot 的系统提示词不知道是怎么设计的,太考虑安全了,基本每一步都得我允许才会继续往下操作
之前没太懂,现在有点明白了,以后的软件可能慢慢都变成 skill 了,现在的各种龙虾之后就会成为驱动 skill 的入口,还是有必要去抢一抢的

https://frostming.com/posts/2026/create-a-claw/
随便试了几个视频理解的任务,gemini-3-pro 幻觉严重,表现还不如 GLM 4.6V