标题: codex真笨,气坏我了
作者: #浴乎沂
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1940825
时间: 2026-04-10 22:16:26
摘要:
作者: #浴乎沂
板块: #搞七捻三
编号:
1940825帖子: https://linux.do/t/topic/1940825
时间: 2026-04-10 22:16:26
摘要:
codex沉迷在一个思维误区中无法自拔,大晚上逼得我写600字小作文跟它对线,无语
标题: 现在开源模型的16比特,Q8,Q6,Q4,效果损失到底多大?
作者: #比卡丘
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1940827
时间: 2026-04-10 22:16:30
摘要:
作者: #比卡丘
板块: #开发调优
编号:
1940827帖子: https://linux.do/t/topic/1940827
时间: 2026-04-10 22:16:30
摘要:
之前看了好几个评测视频,基本上都说Q8就没什么损失,
Q4不到10%,是真的这样吗?
有真实测试数据的介绍文章或者视频吗,谢谢佬友分享。
标题: 疑似free bug号?
作者: #PongPong
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1940841
时间: 2026-04-10 22:18:56
摘要:
作者: #PongPong
板块: #搞七捻三
编号:
1940841帖子: https://linux.do/t/topic/1940841
时间: 2026-04-10 22:18:56
摘要:
如题,突然发现有一个号明明显示额度空了但是还一直可以调用?只听过bug team号,还没听过bug free号. 会不会是单纯的额度多?
标题: 有个闲置mac studio m1max 32G 的,想用来跑Gemma 4推荐吗
作者: #xiaomai
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1940848
时间: 2026-04-10 22:19:51
摘要:
作者: #xiaomai
板块: #开发调优
编号:
1940848帖子: https://linux.do/t/topic/1940848
时间: 2026-04-10 22:19:51
摘要:
各位大佬,我想问下我有个闲置mac studio m1max 32G 的,想用来跑Gemma 4推荐吗,有没有本地跑过的,效果咋样,看中他无限制这点了
标题: 请问大家AI漫剧是怎么做的?
作者: #goan
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1940858
时间: 2026-04-10 22:20:53
摘要:
作者: #goan
板块: #开发调优
编号:
1940858帖子: https://linux.do/t/topic/1940858
时间: 2026-04-10 22:20:53
摘要:
现在AI漫剧这么火,大家有做过的吗?是怎样一个流程呢
标题: CPA怎么开启流式传输呢?
作者: #东山 崔
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1940859
时间: 2026-04-10 22:21:02
摘要:
作者: #东山 崔
板块: #开发调优
编号:
1940859帖子: https://linux.do/t/topic/1940859
时间: 2026-04-10 22:21:02
摘要:
刚配置好CPA,但是目前在cc中使用时内容一下子全出来不喜欢,没找到在哪开启啊,配置keepalive不管用,求助各位佬!
标题: 《小米创业思考》工程师思维,才是做成事的底层逻辑
作者: #mark_chenm
板块: #读书成诗
编号:
帖子: https://linux.do/t/topic/1940863
时间: 2026-04-10 22:21:27
摘要:
作者: #mark_chenm
板块: #读书成诗
编号:
1940863帖子: https://linux.do/t/topic/1940863
时间: 2026-04-10 22:21:27
摘要:
《小米创业思考》告诉我:“工程师思维”就是把世界看作一个可以被拆解、被理解、并被优化的大型系统。
不再用感性的情绪去面对失败,而是用理性的坐标去定位问题;
不再迷信玄学营销,而是深挖效率时,你就在用工程师思维“做成事”了。
不可否认“运气”很重要,但把“运气”从成功的变量里剔除掉,变成“确定性”,事情可能就不一样了。
标题: gemini 报错502,各种方法没有用
作者: #近我者哈
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1940864
时间: 2026-04-10 22:21:31
摘要:
作者: #近我者哈
板块: #搞七捻三
编号:
1940864帖子: https://linux.do/t/topic/1940864
时间: 2026-04-10 22:21:31
摘要:
只是在edge才这样,chrome网页版和app能用。
目前已经尝试过的方法
清楚所有cookie和缓存
更换ip(应该不是ip的问题,自建的,tag的,真家宽都试过)
关闭edge安全DNS
检查clash verge代理,没有开启ipv6
佬友们有没有遇见过类似情况的?
标题: 提问:哪个模型对视频与书籍学习的能力好一点
作者: #BrK
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1940865
时间: 2026-04-10 22:21:31
摘要:
作者: #BrK
板块: #开发调优
编号:
1940865帖子: https://linux.do/t/topic/1940865
时间: 2026-04-10 22:21:31
摘要:
我最近有想做一个就是把一系列专业书籍都放入一个坑中,然后对ai进行提问判断对错以及找出所在的出处,比如视频的几分几秒,书本的第几页,让学生多翻翻书算是。对于视频来说,画面内容转化为文字,会不会损失太多信息,你们觉得呢?
标题: 去年325的gemini 2.5pro免费号池 vs 今年的 oai 5.4 免费号池? 如出一辙?
作者: #Mci77777
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1940866
时间: 2026-04-10 22:21:34
摘要:
作者: #Mci77777
板块: #搞七捻三
编号:
1940866帖子: https://linux.do/t/topic/1940866
时间: 2026-04-10 22:21:34
摘要:
去年的gemini 2.5pro是真好用.
今年的5.4 也是非常不错的.
我仿佛看到了 后面的几个月光景 基本上一致的路线?
什么时候claude也来加入 free账号送api
标题: 大善人的opus用不了,还有别的可以用的吗
作者: #hapic
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1940886
时间: 2026-04-10 22:24:22
摘要:
作者: #hapic
板块: #搞七捻三
编号:
1940886帖子: https://linux.do/t/topic/1940886
时间: 2026-04-10 22:24:22
摘要:
RT,还有别的可替代的吗,用习惯了opus4.6,其它的模型总感觉差点意思。
其它平台购买成品号,也不是长久的办法。
自己开吧,又没有支付渠道
各位佬友有推荐的,稳定,不掺水的渠道么
标题: cc的那个薅羊毛的 $100 in extra usage, on us 需要填信用卡,填什么卡,有封号风险吗
作者: #lawrnsjs
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1940891
时间: 2026-04-10 22:25:08
摘要:
作者: #lawrnsjs
板块: #开发调优
编号:
1940891帖子: https://linux.do/t/topic/1940891
时间: 2026-04-10 22:25:08
摘要:
claude code的那个薅羊毛的 $100 in extra usage, on us 需要填信用卡,填什么卡,有封号风险吗
标题: 佬们佬们,大家有试过UU加速器加速claude code吗? 稳吗? 容易被封吗? 别人说比家宽稳是真的吗?
作者: #小萝卜
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1940896
时间: 2026-04-10 22:26:30
摘要:
作者: #小萝卜
板块: #搞七捻三
编号:
1940896帖子: https://linux.do/t/topic/1940896
时间: 2026-04-10 22:26:30
摘要:
佬们佬们,大家有试过邪修UU加速器加速claude code吗? 稳吗? 容易被封吗? 别人说比家宽稳是真的吗? https://x.com/byCanen/status/2040403286935867778
标题: 模型微调哪个平台成本低?
作者: #471820
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1940903
时间: 2026-04-10 22:28:01
摘要:
作者: #471820
板块: #开发调优
编号:
1940903帖子: https://linux.do/t/topic/1940903
时间: 2026-04-10 22:28:01
摘要:
要对qwen3.5-27B做CPT训练和DPO训练,线下没有卡用,只能线上。发现有阿里云百炼、HuggingFace、AutoDL等平台可选。但成本计算有点复杂,有没有做过的佬友给些建议
标题: Minimax Music2.6上了 最低套餐每天也能创作100首
作者: #impouo
板块: #国产替代
编号:
帖子: https://linux.do/t/topic/1940910
时间: 2026-04-10 22:28:52
摘要:
作者: #impouo
板块: #国产替代
编号:
1940910帖子: https://linux.do/t/topic/1940910
时间: 2026-04-10 22:28:52
摘要:
最便宜套餐也可以尝试玩起来了 去查了下token plan说明
文档来源:
MiniMax 开放平台文档中心
TokenPlan 多模态生成教程 - MiniMax 开放平台文档中心
订阅 Token Plan 后,让你的 Agent 拥有 MiniMax 全模态能力,生成视频、音乐、语音和图片。
微信公众号官号文章:
https://mp.weixin.qq.com/s/KYFyMoTxxyP5nbo73pAN9A
标题: 问一下佬友们华为的十年服务器哪里可以买到呢
作者: #kexincolar
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1940918
时间: 2026-04-10 22:29:38
摘要:
作者: #kexincolar
板块: #搞七捻三
编号:
1940918帖子: https://linux.do/t/topic/1940918
时间: 2026-04-10 22:29:38
摘要:
其实很想要这个服务器 想要一个线路差的便宜一点建站玩玩
但是不知道哪里可以买到
标题: 关于agent记忆设计这件事
作者: #cimi
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1940928
时间: 2026-04-10 22:30:45
摘要:
作者: #cimi
板块: #开发调优
编号:
1940928帖子: https://linux.do/t/topic/1940928
时间: 2026-04-10 22:30:45
摘要:
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
我的帖子已经打上 开源推广 标签: 是
我的开源项目完整开源,无未开源部分: 是
我的开源项目已链接认可 LINUX DO 社区: 是
我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
我认为目前agent的限制不在于模型的能力有多强,而是没有记忆模块没有设计好。
项目地址: GitHub - makenBlous/memCore: Local-first memory core for a single-user long-running conversational agent. · GitHub
目前很多成熟的框架和系统都喜欢用RAG那套,或者是GraphRAG.如果agent的记忆设计只是这样,那充其量就是个大号的电子图书馆和agent没有半毛钱关系。
我思考了一下结合网上查到的资料整理了一份属于我的记忆模块的设计,我打算从记忆衰减与升格、作用域、身份权重(后面想了想废弃了)、多时间维度、记忆来源依据等等:
1.图便利是基础,但是图的点不能是一个单纯的实体,而是有各种属性的记忆对象(没错面向对象开发)。原本我想设计为中学语文的语法结构,后面发现主谓宾定状补时间地点起因经过结果等等这些语法词汇分析出来只能比较好的描述一件事,而不是能很好的描述记忆,所以我该为了记忆对象,同时简化了两个节点之间的9条连线
第 1 列
第 2 列
第 3 列
组成
说明
为什么重要
对象
经过整理的正式记忆(事实、偏好、约束、事件、观察、技能)
记忆不再停留在原始对话层,而是进入可管理的结构层
证据
来源、片段、命中依据、支持材料
系统需要知道这条记忆凭什么成立
版本
当前版本、历史版本、冲突版本、回退轨迹
记忆会变化,变化本身也必须被记录
2.记忆也有区别,我们人类是有临时记忆和长期记忆的区别,同理,我把记忆划分为候选记忆和正式记忆,候选记忆在多次事件命中,强有力证据的支持或者用户主动要求记忆的情况下才会升级为正式记忆。这不代表候选记忆会直接删除,只是优先级没有那么高。
第 1 列
第 2 列
第 3 列
作用域
说明
我的理解
用户层
稳定偏好、长期约束、跨项目成立的习惯与身份信息
这是最慢变化的一层
项目层
项目规则、项目知识、交付边界、项目经验
这是系统真正进入长期协作的关键一层
任务层
当前目标、过程判断、阶段决策、任务图
这是离当前上下文最近的一层
工具层
某类工具的适用性、失败边界、调用经验
这是与具体工具绑定的一层
生命周期
候选 -> 观察期正式 -> 正式长期 -> 归档 / 休眠 / 回退
3.记忆的迭代,这个进行设计的时候让我想了软件开发,把记忆也进行版本迭代,比如旧时代的电话和新时代的电话是完全两个概念,但是都属于电话这个名称,这就是语言的歧义。所以我设计了一套证据链和时间维度来完成记忆的迭代问题,让记忆进入系统后可以一直优化更新,而不是进入之后停留。
4.检索记忆,这个就是老生常谈了,什么多路召回啊,噢对了,我目前的图设计是以SQLlite为基础的实体联系设计(借鉴软工的ER图),这样就不会消耗性能去专门部署一个引擎了,特别适合轻量化的个人。sql检索,关系检索,时间维度检索等等多种方式检索,向量检索页不会少。
最后我写完才发现Memory Palace项目居然和我的很多想法相合,天崩了啊!不过还好,不是蹭热度啊!哈哈哈,最后可以去看个人记忆架构设计这是我的思路,我比较懒个人记忆架构设计这篇文章是我用AI根据我的项目和我的想法提取的
标题: 助我飞升三级,再发一个grok50$ API KEY
作者: #taiyangshnng
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/1940932
时间: 2026-04-10 22:31:00
摘要:
作者: #taiyangshnng
板块: #福利羊毛
编号:
1940932帖子: https://linux.do/t/topic/1940932
时间: 2026-04-10 22:31:00
摘要:
xai-v6gsXl2kvtK6IgiHPpNiVkl6OSsu42vRa8MkauLx79my6ZKpLdHnzXdoUX5Hb6DYzg7clZeYpMOmwqfX
佬们给我来个赞
标题: 感觉OpenCode Go用量也不是很多
作者: #ji233
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1940981
时间: 2026-04-10 22:36:55
摘要:
作者: #ji233
板块: #搞七捻三
编号:
1940981帖子: https://linux.do/t/topic/1940981
时间: 2026-04-10 22:36:55
摘要:
刚买了个OpenCode Go,想搭配Oh My OpenAgents使用,模型是GLM-5.1,感觉用下来用量其实有点不是很狗(但是确实速度挺快的)
其实根据他们的文档,用量限制是:
5 小时限制 — 12 美元使用额度
每周限制 — 30 美元使用额度
每月限制 — 60 美元使用额度
感觉和Claude的Pro差不多的吧用量限制(?