【个人暴论】不要迷信智能体的自动记忆、自动skill系统
个人总结,所谓的智能体自动记忆系统,都是垃圾【看标签】,还有自动skill等。
自动记忆无非就是从对话中,再消耗大量token去总结对话,形成类似claude.md\agent.md\memory.md(这里只是打个比方,列举的这些文件还是很有用的)的文件,但是这些文件真的能有多少帮助,我个人体感下来,并没有多少,还不如自己多多总结写几个skill来的更直接,也就省掉了大量的token,毕竟token就是钱,不要不拿token当钱来花。
好的,接下来就继续说skill,本来skill就是一个很严谨的东西,skill的定义是最佳实践。啥叫最佳实践,那得是经过实际验证的东西,而不是靠总结就有用的。为啥现在这么多垃圾skill,原因大抵也是如此。
补个刀:
一切带“自动”两个字的智能体,背后将由大量的token承担,你有钱你可以任性。
23 个帖子 - 19 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: coldingcode)
个人总结,所谓的智能体自动记忆系统,都是垃圾【看标签】,还有自动skill等。
自动记忆无非就是从对话中,再消耗大量token去总结对话,形成类似claude.md\agent.md\memory.md(这里只是打个比方,列举的这些文件还是很有用的)的文件,但是这些文件真的能有多少帮助,我个人体感下来,并没有多少,还不如自己多多总结写几个skill来的更直接,也就省掉了大量的token,毕竟token就是钱,不要不拿token当钱来花。
好的,接下来就继续说skill,本来skill就是一个很严谨的东西,skill的定义是最佳实践。啥叫最佳实践,那得是经过实际验证的东西,而不是靠总结就有用的。为啥现在这么多垃圾skill,原因大抵也是如此。
补个刀:
一切带“自动”两个字的智能体,背后将由大量的token承担,你有钱你可以任性。
23 个帖子 - 19 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: coldingcode)
单身狗勿看!
在线求助!有媳妇的兄弟们,有男友的姐妹们,大家五一都打算去哪儿浪?
我家这位已经开始问我计划了,但我现在脑子里还是空白。😂 既想带她去个出片的地方(保命要紧📸),又怕去了全是人头。
各位“拖家带口”的同行们,有没有那种小众、高级、媳妇拍完照能夸我半年的宝藏地儿?
评论区交换一下坐标,拉兄弟一把!👇️
57 个帖子 - 47 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 八戒)
在线求助!有媳妇的兄弟们,有男友的姐妹们,大家五一都打算去哪儿浪?
我家这位已经开始问我计划了,但我现在脑子里还是空白。😂 既想带她去个出片的地方(保命要紧📸),又怕去了全是人头。
各位“拖家带口”的同行们,有没有那种小众、高级、媳妇拍完照能夸我半年的宝藏地儿?
评论区交换一下坐标,拉兄弟一把!👇️
57 个帖子 - 47 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 八戒)
离谱,有人直接在openai社区把这波低价plus号商的信息都爆出来了
OpenAI Developer Community – 20 Apr 26
Eligibility for the ChatGPT Google trial continues to be illegally exploited...
ChatGPT Bugs
bug
Up to now there are still countless people taking credentials from Google trial eligible accounts and using Android packet sniffing methods to apply them to other accounts that are not eligible including Plus one month six months one year plans...
20 个帖子 - 18 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Lick Liu)
OpenAI Developer Community – 20 Apr 26
Eligibility for the ChatGPT Google trial continues to be illegally exploited...
ChatGPT Bugs
bug
Up to now there are still countless people taking credentials from Google trial eligible accounts and using Android packet sniffing methods to apply them to other accounts that are not eligible including Plus one month six months one year plans...
20 个帖子 - 18 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Lick Liu)
OpenClaw创始人:“他们要的根本不是你的订阅费,而是你的代码”
https://twitter.com/steipete/status/2046199257430888878
前段时间A➗️也禁止订阅用在第三方
明眼人都知道咋回事 🤣
感觉好多人都有一个误区
“我生成的都是垃圾代码,用不用无所谓”
确实,对于普通人而言,生成的代码对于AI确实无益
但是你完整做完一个项目的过程是很有价值的
你在做项目的过程中,会不断的纠正 AI 输出,这些交互是可以变成训练数据的
而且还是当前先进AI模型中的稀缺玩意儿-“人类反馈数据”
52 个帖子 - 45 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 点点点…点娘!)
https://twitter.com/steipete/status/2046199257430888878
前段时间A➗️也禁止订阅用在第三方
明眼人都知道咋回事 🤣
感觉好多人都有一个误区
“我生成的都是垃圾代码,用不用无所谓”
确实,对于普通人而言,生成的代码对于AI确实无益
但是你完整做完一个项目的过程是很有价值的
你在做项目的过程中,会不断的纠正 AI 输出,这些交互是可以变成训练数据的
而且还是当前先进AI模型中的稀缺玩意儿-“人类反馈数据”
52 个帖子 - 45 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 点点点…点娘!)
万能充要重出江湖吗?😀
从 2027 年起,所有在欧盟销售的手机都必须配备可更换电池,并使用 USB-C 充电器
据欧盟规定,从明年起,欧洲销售的智能手机和平板电脑必须配备可更换电池,旨在减少电子垃圾。新规于2023年获批,2027年2月18日生效,要求用户无需专用工具即可自行更换电池,且停产型号的替换电池需至少供应五年。欧盟官员称,此举到2030年可为消费者节省多达200亿欧元。目前绝大多数设备电池只能由专业人员更换,导致用户常因更换成本高而购买新机。
SMARTPHONES and tablets sold in Europe will have to feature replaceable batteries starting next year, according to EU rules, amid efforts to slash electronic waste across the bloc.
45 个帖子 - 35 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: chahanshuli2018)
从 2027 年起,所有在欧盟销售的手机都必须配备可更换电池,并使用 USB-C 充电器
据欧盟规定,从明年起,欧洲销售的智能手机和平板电脑必须配备可更换电池,旨在减少电子垃圾。新规于2023年获批,2027年2月18日生效,要求用户无需专用工具即可自行更换电池,且停产型号的替换电池需至少供应五年。欧盟官员称,此举到2030年可为消费者节省多达200亿欧元。目前绝大多数设备电池只能由专业人员更换,导致用户常因更换成本高而购买新机。
SMARTPHONES and tablets sold in Europe will have to feature replaceable batteries starting next year, according to EU rules, amid efforts to slash electronic waste across the bloc.
45 个帖子 - 35 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: chahanshuli2018)
休假一天,带两个老婆来农庄吃泥焗鸡
真是两个啊,不骗人,可以问下线下见过我的佬友,我的日常出门装就是这一身经典服装。
我老婆穿的也很简单,就不上人图了,哪天有大事穿好看了一定上图!
这些天一直在忙着做剧,今天完结了一个项目,最近一直跟着导演学习核心思维,预计下个星期我就能教你们这些干货了,真的太干了!跟开了上帝视角一样丝滑流畅。
83 个帖子 - 70 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 鸭老师🛡)
真是两个啊,不骗人,可以问下线下见过我的佬友,我的日常出门装就是这一身经典服装。
我老婆穿的也很简单,就不上人图了,哪天有大事穿好看了一定上图!
这些天一直在忙着做剧,今天完结了一个项目,最近一直跟着导演学习核心思维,预计下个星期我就能教你们这些干货了,真的太干了!跟开了上帝视角一样丝滑流畅。
83 个帖子 - 70 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 鸭老师🛡)
简简单单救赎一下
从毁了 全都毁了继续讨论:
毁了吗?又救活了
但是就像之前说的 能活多久不晓得
看他有没有闲工夫 剔不剔除 node的兼容代码吧
如果不剔除 很难不怀疑在
以下是替代物
自动化仓库:github.com
GitHub - CometixSpace/claude-code
通过在 GitHub 上创建帐户来为 CometixSpace/claude-code 开发做出贡献。
别问 问就是 Android Termux 能继续用哈哈
27 个帖子 - 26 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 哈雷彗星)
从毁了 全都毁了继续讨论:
毁了吗?又救活了
但是就像之前说的 能活多久不晓得
看他有没有闲工夫 剔不剔除 node的兼容代码吧
如果不剔除 很难不怀疑在
@ant内部仓库上 仍然持续发布 js bundle以下是替代物
npm install -g @cometix/claude-code自动化仓库:github.com
GitHub - CometixSpace/claude-code
通过在 GitHub 上创建帐户来为 CometixSpace/claude-code 开发做出贡献。
别问 问就是 Android Termux 能继续用哈哈
27 个帖子 - 26 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 哈雷彗星)
君の公益 暂时关闭注册
用户破一万了,先这样吧
一些情况说明
● 不会以任何形式出售或者兑换额度,包括LDC
● 后续可能会开放二级注册
● 签到额度会略微调整,这里指回调至5-10刀
● 分组倍率会略微调整,这里指降低至1.5左右
27 个帖子 - 26 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 慕鸢)
用户破一万了,先这样吧
一些情况说明
● 不会以任何形式出售或者兑换额度,包括LDC
● 后续可能会开放二级注册
● 签到额度会略微调整,这里指回调至5-10刀
● 分组倍率会略微调整,这里指降低至1.5左右
27 个帖子 - 26 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 慕鸢)
命理拙作《月源》卷三(总纲)
总纲
这一模块不是人生专题,也不是基础概念表。
它其实就干一件事:
把五行、干支、十神、宫位、岁运,变成可以落到现实上的过程。
卷一、卷二作为教学模块,这一模块的功能则是,
● 你应该按什么顺序看;
● 看到了以后如何转变为现实结论;
● 同一个象为什么会在不同人身上长成不同事件;
● 什么时候能下结论,什么时候只能停在倾向;
● 同样是婚恋、事业、疾病、学业,为什么会在不同命主身上长成完全不同的结果。
所以这一模块不是“象义堆砌”,而是真正的实施路径。
命理断错,大多不是因为不会背象,而是因为:
● 静态结构和动态事件分不清楚;
● 把一个十神当成全部,多见于“星座爱好者”(我好像就是XXX类型的人!);
● 把喜欢的理论先套上去,再找证据;
● 没区分结构、时机、对象、结果;
● 没建立“能断到哪里”的边界意识。
这一模块的任务,就是把这些常见误区一一拎出来单独讲。
后续卷四:每个不同模块的专题,高手可以当成提示词用,新手看个乐子得了。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 踏雪寻玫)
总纲
这一模块不是人生专题,也不是基础概念表。
它其实就干一件事:
把五行、干支、十神、宫位、岁运,变成可以落到现实上的过程。
卷一、卷二作为教学模块,这一模块的功能则是,
● 你应该按什么顺序看;
● 看到了以后如何转变为现实结论;
● 同一个象为什么会在不同人身上长成不同事件;
● 什么时候能下结论,什么时候只能停在倾向;
● 同样是婚恋、事业、疾病、学业,为什么会在不同命主身上长成完全不同的结果。
所以这一模块不是“象义堆砌”,而是真正的实施路径。
命理断错,大多不是因为不会背象,而是因为:
● 静态结构和动态事件分不清楚;
● 把一个十神当成全部,多见于“星座爱好者”(我好像就是XXX类型的人!);
● 把喜欢的理论先套上去,再找证据;
● 没区分结构、时机、对象、结果;
● 没建立“能断到哪里”的边界意识。
这一模块的任务,就是把这些常见误区一一拎出来单独讲。
后续卷四:每个不同模块的专题,高手可以当成提示词用,新手看个乐子得了。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 踏雪寻玫)
记一次对 Kimi K2.6 的真实项目需求的横向评测(首个 T1 榜国产模型)
项目
这是一个 Unity C# 项目,我进行测试的是一份皮肤系统需求案,我已经做了好预制体,而模型需要编写代码。
本轮与上两轮评测的项目和环境都完全一致:
● 第一轮
● …
● 第十轮
模型来源
● Kimi K2.6: 官方 API
速度
令牌数
● Kimi K2.6: 9.9M(¥8.63, 输出 ¥2.07 + 缓存输入 ¥5.346 + 无缓存输入 ¥1.22)
代码行数
● Kimi K2.6: +1422, -13
完成度
Kimi K2.6
审查结论:
详细 (点击了解更多详细信息)
代码质量
最终总结
● Kimi K2.6 花费的时间是 33 分钟,这个速度可以说很慢了,对比 GPT-5.4(medium) 的话慢了一倍,但对比 Opus 4.6(Max) 只慢了 20% 左右。
● 总花费接近一千万 Token,使用 API 的成本为 8.63 人民币,这个花费不算非常高也谈不上便宜,但比 GLM 5.1 的价格要便宜一点。
● 缓存命中效果不错,大约 90% 的输入都命中了缓存。
● Kimi K2.6 做对了绝大部分模型都未做对的系统注册和入口函数的改写,别看这两个改动都只需要一句代码,但是 GPT 与 Claude 的差距几乎总在这里,因为需求案是没有主动提到这两点的,属于是项目框架和已有功能的改进,如果模型不深入阅读代码库,则不会知道要写这两行代码。
● 另一个模型常犯的协议类型映射问题,Kimi K2.6 也做对了。
● 而以上两点 Opus 4.6 均未正确实现,当然 Opus 4.6 还有其它一些小问题,Kimi K2.6 也犯了几个小问题,但是以上两点决定了这个需求是否基本正确,是更重要的。
● GPT 5.3 Codex High 与 Medium 这两个思考程度的模型,有一个未写对协议类型映射,有一个犯了一两个小问题,其实将 Kimi K2.6 排在它们前面或者后面都说得过去,我认为水平接近。
● 综合以上几点,并再综合我非常高兴终于有一个国产模型可以踏入 T1 行列,所以虽然水平相当,但我还是把 Kimi K2.6 排在 GPT 5.3 Codex 的前面!
● 不敢相信,以为这一刻会来的更晚,但它确实来了!
● 所有模型均采用一次过的方式完成测评,所以可能存在偶然性,大家可以积极试一试 Kimi K2.6,看看它的表现是否能达到评测的水平,期待你的反馈!
本次继续使用自己开发的开源 VS Code 插件 Unify Chat Provider 以实现在 Copilot 中使用以上模型。
13 个帖子 - 10 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: SmallMain)
项目
这是一个 Unity C# 项目,我进行测试的是一份皮肤系统需求案,我已经做了好预制体,而模型需要编写代码。
本轮与上两轮评测的项目和环境都完全一致:
● 第一轮
● …
● 第十轮
模型来源
● Kimi K2.6: 官方 API
速度
令牌数
● Kimi K2.6: 9.9M(¥8.63, 输出 ¥2.07 + 缓存输入 ¥5.346 + 无缓存输入 ¥1.22)
代码行数
● Kimi K2.6: +1422, -13
完成度
Kimi K2.6
审查结论:
详细 (点击了解更多详细信息)
代码质量
最终总结
体外话:很多人想知道 Qwen 3.6 全系列的评测,其实全系列都已测试过,但均未有很好的成绩,几乎都有一点编译错误,所以就不额外发帖了。如果你玩端侧的话,推荐 Qwen3.6 35B A3B 这个模型,质量确实非常不错。
● Kimi K2.6 花费的时间是 33 分钟,这个速度可以说很慢了,对比 GPT-5.4(medium) 的话慢了一倍,但对比 Opus 4.6(Max) 只慢了 20% 左右。
● 总花费接近一千万 Token,使用 API 的成本为 8.63 人民币,这个花费不算非常高也谈不上便宜,但比 GLM 5.1 的价格要便宜一点。
● 缓存命中效果不错,大约 90% 的输入都命中了缓存。
● Kimi K2.6 做对了绝大部分模型都未做对的系统注册和入口函数的改写,别看这两个改动都只需要一句代码,但是 GPT 与 Claude 的差距几乎总在这里,因为需求案是没有主动提到这两点的,属于是项目框架和已有功能的改进,如果模型不深入阅读代码库,则不会知道要写这两行代码。
● 另一个模型常犯的协议类型映射问题,Kimi K2.6 也做对了。
● 而以上两点 Opus 4.6 均未正确实现,当然 Opus 4.6 还有其它一些小问题,Kimi K2.6 也犯了几个小问题,但是以上两点决定了这个需求是否基本正确,是更重要的。
● GPT 5.3 Codex High 与 Medium 这两个思考程度的模型,有一个未写对协议类型映射,有一个犯了一两个小问题,其实将 Kimi K2.6 排在它们前面或者后面都说得过去,我认为水平接近。
● 综合以上几点,并再综合我非常高兴终于有一个国产模型可以踏入 T1 行列,所以虽然水平相当,但我还是把 Kimi K2.6 排在 GPT 5.3 Codex 的前面!
● 不敢相信,以为这一刻会来的更晚,但它确实来了!
● 所有模型均采用一次过的方式完成测评,所以可能存在偶然性,大家可以积极试一试 Kimi K2.6,看看它的表现是否能达到评测的水平,期待你的反馈!
本次继续使用自己开发的开源 VS Code 插件 Unify Chat Provider 以实现在 Copilot 中使用以上模型。
13 个帖子 - 10 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: SmallMain)