LinuxDo 新帖推送
197 subscribers
258K photos
322K links
Download Telegram
标题: 清明踏青🏔登山
作者: #debug
板块: #搞七捻三
编号: 1909104
帖子: https://linux.do/t/topic/1909104
时间: 2026-04-06 22:07:13
摘要:
上次爬这座山还是高中了。。。
二十多的我,就不如十几岁的我妹了,她爬山爬的嗖嗖的,陡峭的坡都如履平地,一点不带累的(估计是因为我没吃饭,滴水未沾,但是我妹也没吃!)其实我初中也这样然后我就把包全给她了hhh(都是衣服不沉,其实轮着背的)
人的一生中,精力体力最旺盛的,应该就是初高中了吧,大学简直是断崖式下降(指的我自己,因为本来就没多好。。。所以开始有意识的多少,适当的锻炼)
这山被包了之后,好多地方都拦起来了,小路那种惊险刺激陡峭的劈立千仞土路坡,好像不让爬了,寺庙和基地都不能进了,以前其实是可以的,我和我爸还去看过里面的雷达和钻过乌漆嘛黑的山洞,和同学排排队肩搭肩也钻过,防空洞也挺凉快的,还看见同学攀爬过,坡度堪比垂直的峭壁,他甚至都没有防护。。。沿路卖东西的玩的也都几乎没有了,进来还得登记,估计是为了防火安全
中间看见小车卡住了,靠人力发射hhh,还看见有个妈妈,背着小朋友在爬,好厉害,还有骑行上来的,也是牛,突然觉得我平时骑行爬的那些坡也不算什么了。。。
就是天不太好,有点雾蒙蒙的
这种人文气息,有了人类文明的社会!
标题: codex的free账号是只有5美元的额度了,用完了就没有了吗?
作者: #dongs
板块: #搞七捻三
编号: 1909110
帖子: https://linux.do/t/topic/1909110
时间: 2026-04-06 22:08:26
摘要:
请问各位佬, 是不是注册的账号把赠送的api额度用完了,这个号就不会再刷新额度了?
标题: 佬们,请留下你们推荐的 APP
作者: #𝓺𝓾𝓷𝔃𝓱𝓸𝓷𝓰
板块: #搞七捻三
编号: 1909128
帖子: https://linux.do/t/topic/1909128
时间: 2026-04-06 22:10:18
摘要:
想体验一些有趣、好用的 APP,什么类型、什么用途的都好,希望各位佬友能推荐一些,希望佬的推荐内容是:

APP
类型
场景
使用体验

谢谢佬们
标题: 为什么Claude Code的缓存命中率能达到100%?
作者: #clow7280
板块: #开发调优
编号: 1909146
帖子: https://linux.do/t/topic/1909146
时间: 2026-04-06 22:13:45
摘要:
最近开了Max 5x,频繁使用CC,所以想弄一个美观且信息密度高的状态栏。
这次没有直接用开源项目的方案,自己结合CC写了一个自定义的状态栏来显示一些必要信息。
有关缓存命中率的部分,我也是参考了Customize your status line官方文档中的定义来计算的。
具体代码片段如下:
# Cache hit rate
CUR_TOTAL_IN=$((CUR_INPUT + CUR_CACHE_CREATE + CUR_CACHE_READ))
if [ "$CUR_TOTAL_IN" -gt 0 ] 2>/dev/null; then
CACHE_HIT=$(awk "BEGIN { printf \"%.0f\", ${CUR_CACHE_READ}/${CUR_TOTAL_IN}*100 }")
CTX_CONTENT+="Hit ${CACHE_HIT}% "
fi

注意到这个缓存命中率一开始可能会在60%至90%,后边的请求会直接达到99%甚至100%。
这就导致这个指标变得没有意义了起来,绝大多数停下来的时候都是100%。╮(╯▽╰)╭


而且,即使代码中没有限制最大值,这个值也从来没有超过100%。如果是计算方法有误,这个值是不是会偶尔超过100%。
所以,有没有懂的佬友讲一下,是真的能达到这么恐怖的缓存命中率吗?
标题: 还在疑惑今天为什么余额花的这么快
作者: #时雨雪
板块: #搞七捻三
编号: 1909147
帖子: https://linux.do/t/topic/1909147
时间: 2026-04-06 22:14:01
摘要:
结果是opencode的dcp插件不知道为什么不生效了 每次都是把全量上下文塞进去,请求一次一刀没了。
标题: 佬们,你们的皮卡丘,能用了吗?
作者: #icemouce
板块: #搞七捻三
编号: 1909157
帖子: https://linux.do/t/topic/1909157
时间: 2026-04-06 22:14:56
摘要:
(话题已被作者删除)
标题: 看到存在一个免费GPT Pro的可能(未验证)
作者: #Summer
板块: #搞七捻三
编号: 1909164
帖子: https://linux.do/t/topic/1909164
时间: 2026-04-06 22:15:42
摘要:
操作非常的简单,只需要在有订阅的基础上,你取消订阅,视账户而定,会送你一个月让你不要退订,有没有大佬验证一下。据说有这个弹窗就是可以了。
标题: 清明返深真的很堵,明天再出发了,这个过路费省不了
作者: #luh52
板块: #搞七捻三
编号: 1909172
帖子: https://linux.do/t/topic/1909172
时间: 2026-04-06 22:16:07
摘要:
目前堵车问题,感觉都没有好的办法,大家一起聊聊
标题: 放假了,重置一般
作者: #无情的一天
板块: #搞七捻三
编号: 1909174
帖子: https://linux.do/t/topic/1909174
时间: 2026-04-06 22:16:28
摘要:
每次放假都感觉脑子被一键格式化了一般
空荡荡
标题: 终于还是到了这一天,感觉cc 5倍的套餐不够用了
作者: #A.Ziegler
板块: #搞七捻三
编号: 1909181
帖子: https://linux.do/t/topic/1909181
时间: 2026-04-06 22:17:27
摘要:
我该怎么办,一天用了20%,废寝忘食编程一天了。
标题: DDG邮箱无法获取别名
作者: #Zyb
板块: #搞七捻三
编号: 1909199
帖子: https://linux.do/t/topic/1909199
时间: 2026-04-06 22:20:34
摘要:
之前DDG还是可以创建很多别名的,今天我新注册了一个发现不能创建别名了,是因为我这边用的自己的cf导致的么?我轮询好久都拿不到一个新的别名了
标题: 你们是把ai当人还是当机器?
作者: #陈东
板块: #搞七捻三
编号: 1909209
帖子: https://linux.do/t/topic/1909209
时间: 2026-04-06 22:21:49
摘要:
我感觉我是把ai当老婆了,回答错了我还会安慰她
标题: 为啥大伙们在囤outlook邮箱?
作者: #诉爱喵
板块: #开发调优
编号: 1909222
帖子: https://linux.do/t/topic/1909222
时间: 2026-04-06 22:22:55
摘要:
这两天登录l站就看见有人在发outlook邮箱,我很好奇这不是随便注册吗,为啥大伙们需要囤
标题: 支付宝也内置小龙虾了,配置还挺高
作者: #wm(猫猫头大帅哥的饲主)
板块: #搞七捻三
编号: 1909230
帖子: https://linux.do/t/topic/1909230
时间: 2026-04-06 22:23:52
摘要:
配置还挺高的

是root权限,阿里云的机器
不过我没有内测资格
支付宝搜 aclaw就能看见小程序
标题: [论文随笔分享] 探索拓展大语言模型智能体的边界
作者: #KAZE桑
板块: #文档共建
编号: 1909236
帖子: https://linux.do/t/topic/1909236
时间: 2026-04-06 22:24:38
摘要:
受到 @bfloat16 佬的启发,个人决定开一个笔记分享系列,一方面是促进自己阅读论文的动力,希望每次阅读时,能够细心一些分析有价值的论文,并将这些感悟记录下来,留给有需要的佬友。另一方面是希望与佬们交流见闻,促进自己的视野。本论文分享系列会持续更新,聚焦LLM/Agentic/CV方向的论文。

0.元信息
论文标题:Expanding LLM Agent Boundaries with Strategy-Guided Exploration
单位:苹果
原始论文:[2603.02045] Expanding LLM Agent Boundaries with Strategy-Guided Exploration
1.前言
本文提出了一种可插拔式的方法,基于GRPO进行实验,因此可以视为对GRPO的改进,但也可应用于其他RL方法。其主要针对策略模型的采样阶段,不涉及奖励函数部分。该方法能够根据本轮的轨迹情况,将反馈引入下一轮,从而改变采样阶段的行为,这一理念较为新颖有趣。
过往已有类似的生成温度调节和采样阶段设计,但本文的设计更为灵活简洁;此外,其聚焦于Agentic场景的应用效果,领域也更为新颖。本文的方法图质量实在是不尽人意,实在过于模糊,论文整体可视化做得也比较差,难以相信出自苹果之手…虽然近年来苹果的论文质量确实有些一般就是了。
2.问题
本文聚焦于解决传统RL方法在LLM后训练中探索能力匮乏的问题。简单来说,我们在进行RL后训练时,期望模型找到一条最佳的采样路径,但受限于奖励函数的设计缺陷与复杂的决策空间,这通常很难实现。
在奖励函数方面,我们常常面临奖励过于稀疏的问题,例如分类正确性奖励仅反馈0或1,对应正确与否,那么不同的探索路径也只会得到0/1的优势差异。当组间优势差异过低时,便会产生优势消失问题,模型容易陷入优化困难的局面,难以积极探索新的路径。
3.动机
作者注意到,单纯改变生成温度来引入多样性,在Agentic交互中效果不佳。原因在于,虽然温度改变了模型的交互坐标,但其决策本身并未变化——例如点击的仍是同一个按钮,只是