LinuxDo 新帖推送
182 subscribers
252K photos
314K links
Download Telegram
标题: 自建中转站服务器配置选择
作者: #eason_lx
板块: #开发调优
编号: 2156118
帖子: https://linux.do/t/topic/2156118
时间: 2026-05-11 20:24:12
摘要:
各位佬,如下两个配置的服务器用来作中转站分别最多能支持多少人使用
标题: 关于Agent Memory的反思(三)
作者: #tdwhere
板块: #搞七捻三
编号: 2156133
帖子: https://linux.do/t/topic/2156133
时间: 2026-05-11 20:26:08
摘要:
长文手敲。最近太忙了,在地铁上用我灵活的双指打下大半的文字,各位佬友,欢迎一块讨论~
重新整理了一下,对于AI记忆本质的理解,不知道对不对,希望能够比较干净的说明清楚。
谈论AI记忆的时候,我们需要搞清楚的是,到底什么是记忆? 从现有模型的基本原理来看,现有LLM的底层能力其实来自对token序列条件分布的建模。其记忆涵盖的内涵其实包括三个方面,第一个是模型权重中的参数记忆(对此我们不过多的进行讨论),其次是,当前上下文里的工作记忆、外部系统里的长期/结构化记忆。故而,我们可以将之比拟为一个注意力有限的,或者说脑容量有限的人。一旦内容挤满、甚至超出了脑容量,模型就会开始注意力涣散,胡言乱语。
从这个视角出发,就会发现现有的解决思路大体面对的就是两个问题。
第一个,模型内生记忆能力的问题。我有没有办法提升模型的脑容量?也就是扩大模型一次推理中可承载和有效使用的信息量。上下文长度、长程注意力、KV cache 改进等等,都是在这一方向上做出的努力。
第二个,也是我在关注的问题是,如果我们现在固定脑容量是不变的,那么问题就变成如何把历史信息、用户偏好、任务状态、外部知识等保存在模型之外,并通过索引、召回、排序、压缩、编排和治理,让合适的信息在合适的时候进入上下文。各种 RAG、向量库、知识图谱、MCP 记忆服务、用户画像系统、长期任务状态管理等,都可以被放在这个方向之下。
这里插一嘴,所以随着对第一个问题的持续深入,有没有可能第二个问题就变得不再重要了呢?我的理解是不大可能。事实上,定义第二个问题重要性的,并不在于数据库知识库型的“记得多少过去”问题,而面对的是“过去应该如何影响现在”。记得全部并不就等同于拥有记忆,继而就超忆症患者而言,记忆的核心含义我觉得在于对过去的选择性组织、解释,保有完整的认知能力。(这里我针对的是有看到的言论,我觉得是错误的)正是因为记忆对现在的影响。所以第二个问题的一大立足点在于,记忆腐化问题的思考。
这一腐化可能的来源有,模型幻觉,过度泛化、时效失效、权重放大、语境漂移和反馈自增强等等。也就是说,一个本没有对错的信息,可能会在时间的流逝下,被不断加强,以至于对后续行为产生巨大漂移。我们可以归结这一类问题为“治理问题”。即什么应该被记住,什么应该被遗忘;什么只是临时状态,什么可以成为长期偏好;什么可以影响当前任务,什么应该被压低权重;什么需要用户确认,什么已经被新的反馈推翻。而这一内容,是必须显式表达,用户要可以直接接入的。
更进一步,所以让模型本事去裁判模型记下的记忆是否有效,本质上和要枪击犯的人监督一堆枪是否会伤人一样。就算这个人真的改过自新了,从制度上看,还总是令人感到不安的,更何况,我说的真的改过,又有多么难。另一面是,同一条历史信息,在不同用户、不同任务和不同阶段中,意义可能完全不同。(事实上,人类的语意联想虽然看似有逻辑,但实际上变化的想到迅速,我现在看到我自己一年前写的诗,我感觉我的理解都已经完全不同了)所以虽然模型可以根据语义相似度或注意力权重判断“相关”,但裁决“相关”的关要,不能只是模型本身。
我们接着第二个问题,那其实现有的方案,思考的路径大抵是,关于如何召回,和储入什么的问题。这里会分化出,文本本身,嵌入向量(两种形式)。当然还包括这二者的结合。演化出对记忆对象的各种定义,和包含对记忆对象直接关系的定义(图结构),以及结合嵌入向量去提高召回准确度等等的方法。简单来说可以理解为服务于两个目标,一个是更精确更相关的召回,另一个是更好的,对结构进行治理(遗忘问题),包括压缩、遗忘等等。
前段时间看到文献对于记忆系统的一个拆解大概如下公式所述:

\text{Memory System}=\text{Raw Ledger}+\text{Derived Views}+\text{Policy}

它的意涵是,历史并不直接自动的成为记忆本身,而首先以Raw Ledger的形式被保留为可追溯的记录(像是系统日志一样),再经由 Derived Views 被压缩、索引、重组,最后由 Policy 决定何时读、何时写、何时更新、何时遗忘。可以用动态过程去把这个公式转化为:

H_{\le t-1}\xrightarrow{\text{Ledger / Views / Policy}}M_t\Rightarrow A_t

我觉得这个是对第二个问题的很好的数学表达。
不过我近期在做agent memory项目的时候想到的问题在于,我自己倒是对整个流程都做了自己的创新和重新定义,但是我发现,始终写入记忆的,还是ai。也就是说,我所说的,腐化问题虽然我这么重视,但还是存在的。
这意味着,记忆治理不能只发生在召回阶段,也必须前置到写入阶段。AI 可以提出“这件事值得被记住”,但这条记忆以什么形式被写入、具有什么权重、是否有时效、是否需要用户确认、是否绑定原始证据,都应该成为系统显式处理的问题。
想到最近质问朋友的话,这个事情一定要ai来解决么?Agent Memory的管理,ai到底扮演什么样的角色?我觉得蛮有意思的,我现在的方案倾向是需要更为全面的治理结构,也就是说,存入,召回等等都是需要纳入治理的。而从中开出的另一个方向,也是我留给我自己的问题。
如果ai能记得一切了,能按我的想法去做了。那会不会出现两种情况,1.它知道我的边界在哪里,故而直接敷衍我(这不是更容易嘛),但从数据上看,他确实更懂我了 2.用户和ai陷入一种舒适的闭合,再没有创新的可能。比如一直用同一种架构,一直用同样的语言。我称之为舒适的共谋,而我觉得这种共谋其实是系统的失败。那么如何解决这个问题呢?(后续有想法了再续前缘)
标题: 免费Gopay代充,自己提供有试用资格的账号,限10人
作者: #puppywang
板块: #福利羊毛
编号: 2156143
帖子: https://linux.do/t/topic/2156143
时间: 2026-05-11 20:27:18
摘要:
RT,私信我有资格的 accessToken, 机器人开通,需要排队
标题: 怎么识别不同的模型
作者: #moonbird
板块: #开发调优
编号: 2156180
帖子: https://linux.do/t/topic/2156180
时间: 2026-05-11 20:32:30
摘要:
佬友们有没有什办法来分辨大模型,我只会问大模型你是什么模型,但是感觉不太靠谱
标题: 佬友们,claude-code的plugins 都使用了哪些啊?
作者: #fengchuan
板块: #开发调优
编号: 2156205
帖子: https://linux.do/t/topic/2156205
时间: 2026-05-11 20:37:04
摘要:
如题,在如今这个环境,作为一位程序员,前端后端都要开始涉及一点开发,想问一下佬友们都用了哪些plugins?
以及,都用什么模型去做前端的页面测试?
标题: mac上的gpt app无法调整思考强度
作者: #chairman
板块: #开发调优
编号: 2156218
帖子: https://linux.do/t/topic/2156218
时间: 2026-05-11 20:38:50
摘要:
下载了mac上的gpt app,很流畅,但是连思考强度都无法选择,使用pro模型也不会显示pro思考中,有啥解决办法么?
标题: 想问一下大佬们中转站就是newapi+sub2api建起来的吗
作者: #HJL19244
板块: #开发调优
编号: 2156222
帖子: https://linux.do/t/topic/2156222
时间: 2026-05-11 20:39:31
摘要:
自己琢磨了好久,目前买了服务器,用域名可以登newapi了,但是又看到有些中转站是pincc的。就很好奇,但从成本角度讲,是不是自己有号源用newapi+sub2api比较好。但是我也没号源其实 ,就想问问经验丰富的大佬中转站怎么运营的好,不知道算不算商业秘密,如果是也请衷告一声,我听劝
标题: 【提醒帖】你的身份证还能找到吗?
作者: #Renown72
板块: #搞七捻三
编号: 2156223
帖子: https://linux.do/t/topic/2156223
时间: 2026-05-11 20:39:33
摘要:
有群友五一收假后太累,随手把身份证放了一处地方,今天要用到,结果翻了个底朝天才找到,没曾想其他群友听到后也去找了找自己的身份证,目前造成大范围身份证遗失事件,特地来L站提醒一下各位佬友(
标题: 有宜昌的佬友么
作者: #kakazeoo
板块: #搞七捻三
编号: 2156248
帖子: https://linux.do/t/topic/2156248
时间: 2026-05-11 20:43:27
摘要:
这两天准备跟对象去宜昌玩,前两天打算去大瀑布和三峡人家逛逛,佬们有推荐的小店吗
标题: LDC 士多问题。。新人求解。。
作者: #wag1719
板块: #搞七捻三
编号: 2156259
帖子: https://linux.do/t/topic/2156259
时间: 2026-05-11 20:44:38
摘要:
LDC 士多店铺的积分可以花钱买吗 这个积分有啥用 我看很多佬在上面卖东西 那我也卖一些东西 得到的积分可以有啥用呢?是可以提升等级还是有其他的功能吗 换勋章或者啥的?我如果想卖东西有什么要求没有?。。。。路过的佬方便的话打几个字解答下 感谢
标题: 说说你用过的lsposed插件吧
作者: #AAAI
板块: #开发调优
编号: 2156263
帖子: https://linux.do/t/topic/2156263
时间: 2026-05-11 20:45:22
摘要:
其实不论手机的,电脑也不是不行,油候猴脚本啥的用的不错都推荐下哈
标题: GPT 最新Team和PLUS额度对比(真假自辩)
作者: #Aliesz
板块: #前沿快讯
编号: 2156289
帖子: https://linux.do/t/topic/2156289
时间: 2026-05-11 20:49:54
摘要:
刚在外面看到一份关于GPT额度的统计,感觉这数值有点玄乎,顺手搬过来给各位 L 友看看。
先叠个甲: 来源不明,不一定可靠! 尤其是里面的 Pro 和 Plus 的比例看起来有点奇怪。大家就当个参考,别太当真,如果有正在实测的大佬欢迎回帖。




账号类型
5 小时限制
周限 (Weekly Limit)




普号 (Free)
-
$10.58


Plus
$27.67
$92.23


Team
$16.24
$135.33


Pro
$152.23
$507.43



看到有的佬开了48个月的Teams,说体感没有PLUS抗用,看起来应该是5小时额度比PLUS少了快一半
标题: modal 现在好像不用绑卡,也有30刀每月
作者: #Alan
板块: #福利羊毛
编号: 2156332
帖子: https://linux.do/t/topic/2156332
时间: 2026-05-11 20:54:16
摘要:
之前的可用额度好像是5刀来着,今天一看变成绑卡之后的30刀了
标题: 其他区的Apple id可以升级双重认证吗
作者: #小黄花
板块: #开发调优
编号: 2156347
帖子: https://linux.do/t/topic/2156347
时间: 2026-05-11 20:55:50
摘要:
我买了一个香港的Appleid,更改完密码看到要升级双重认证,但是以前用白嫖号的经验告诉我不能升级,有大佬告诉我升级了有什么坏处吗?或者能不能升级
标题: 计算机专业研究生如何从零开始发一篇论文
作者: #QinJ
板块: #搞七捻三
编号: 2156349
帖子: https://linux.do/t/topic/2156349
时间: 2026-05-11 20:55:57
摘要:
先说一下本人背景信息,一个985院校的计算机专业研究生,目前研一,之前从没有搞过科研发过文章。然后了解到实验室(实验室是搞数据库的)要求学生发一篇ccf-b及以上(至少是在投状态)的文章(说是担心我们毕业的问题,虽说学院有10%的挂的比例,就是开题答辩10%会需要第二次才能过,中期答辩包括最后的答辩几乎都是有这个比例的,但是第二次一般都会让学生通过,除非盲审不过那种才会出现延毕的情况)才会放几个月实习,但是实验室对于论文的指导几乎没有,主要以做项目为主,目前本人就在做一个项目。目前困惑的点我很想通过发一篇文章然后出去实习,但是没有一个明确的方向(实验室学长学姐几乎都没有论文),也不知道做什么方向的研究会更容易发论文一些。希望能有大佬能给出一些建议,我真是没招了。
标题: 桌面音响求推荐,预算600内
作者: #m99
板块: #搞七捻三
编号: 2156391
帖子: https://linux.do/t/topic/2156391
时间: 2026-05-11 21:00:08
摘要:
至少要比小米10s外放好 预算600内
目前选择是漫步者1700 预计618价格低于¥400
标题: 新注册的gpt free 登录上去免费额度就只有百分之97,什么原因
作者: #hausthy
板块: #搞七捻三
编号: 2156395
帖子: https://linux.do/t/topic/2156395
时间: 2026-05-11 21:00:14
摘要:
佬们有同样的问题的吗
标题: 人工智能与能源双向赋能有了路线图
作者: #超人不会飞
板块: #前沿快讯
编号: 2156401
帖子: https://linux.do/t/topic/2156401
时间: 2026-05-11 21:00:34
摘要:
佬们,分析分析,相关A股会不会涨?
《关于促进人工智能与能源双向赋能的行动方案》的通知(https://www.gov.cn/zhengce/zhengceku/202605/content_7068153.htm)
当飞速增长的算力需求遇上深刻变革的能源系统,推动人工智能与能源从“单向支撑”走向“深度融合”,已成为培育新质生产力、建设能源强国的必答题。近日,国家能源局会同国家发展改革委、工业和信息化部、国家数据局印发了《关于促进人工智能与能源双向赋能的行动方案》(国能发科技〔2026〕34号,以下简称《行动方案》),为这场“双向奔赴”勾勒出清晰的路线图。
《行动方案》围绕人工智能与能源双向赋能的主线,统筹布局了10方面内容,细化分解为29项重点任务,并明确了分阶段目标:到2027年,支撑人工智能创新发展的安全、绿色、经济的能源保障体系初步构建,清洁能源与算力设施互动能力显著提升。能源领域高价值场景逐步开放应用,能源高质量数据集共建共享长效管理机制初步建立。到2030年,人工智能算力设施的清洁能源供给保障能力、能源领域人工智能专用技术研发和应用达到世界领先水平,双向赋能取得明显成效。
“以能赋智”:筑牢绿色算力底座
人工智能规模化发展,离不开稳定、绿色、经济的能源保障。
《行动方案》围绕算力设施“接得上、供得稳、用得绿”,从保障算力设施安全可靠的能源供给、推动算力设施绿色低碳转型、促进算力电力高效经济协同三个维度,系统构建支撑人工智能创新发展的能源保障体系。
在规划源头上统筹布局。《行动方案》提出,统筹大型新能源基地与国家算力枢纽规划布局,推动算力设施、互联网骨干直联点在新能源富集地区有序合理汇集,促进新能源就近就地消纳;结合地区能源、水资源等承载力,探索百万千瓦级人工智能算力设施与配套能源系统协同建设,选择具备条件的地区开展试点,推动算电协同一体化发展。
在供给质量上精益求精。《行动方案》明确,开展供电质量提升专项行动,构建政府、电网、用户三方协同治理体系,引导算力设施合理配置供电可靠性和电能质量提升装置,确保算力设施电能质量;扎实推进算力设施绿电消费占比统计以及碳排放核算工作,加强绿电直连政策指引,持续提升算力设施能效碳效,构建绿电供给、高效用能、碳排放管控协同的全链条绿色低碳发展体系。
在互动机制上挖掘潜力。《行动方案》指出,充分发挥算电协同规模效应,挖掘算力设施灵活调节潜力,推动建立算力与电力互动机制,以电力市场价格信号引导算力设施优化能量管理和跨网跨区等多形式算力调度,提升算力设施经济效益;鼓励新建算力设施与可再生能源发电企业签订多年期绿色电力交易合同,提升绿电消费比例与供应稳定性,构建算力设施经济高效绿色供能体系。
“以智强能”:创新驱动智慧转型
能源既是人工智能发展的保障底座,也为人工智能技术释放价值提供了丰厚土壤。当前,我国新能源占比快速提升,对电网安全稳定运行提出了更高要求,亟须发挥人工智能在新能源功率预测、电网智能调度、设备状态监测与故障预警等方面的技术优势,全面支撑新型能源系统建设。
在开放能源领域人工智能高价值应用场景方面,《行动方案》强调,以场景需求牵引人工智能技术创新,加速人工智能技术与能源产供储销全链条深度融合和规模化发展,形成技术创新与产业应用的良性循环。《行动方案》梳理了清洁能源供给、电网安全运行、煤炭智能开发、油气高效勘探、能源新业态等五个纬度的高价值场景,为人工智能技术在能源领域落地提供了明确的实践指引。
在挖掘数据价值方面,《行动方案》明确,以业务场景为牵引,加速推进能源核心场景高质量数据集建设;制定能源行业数据分类分级标准规范,加强能源关键信息基础设施与数据保护。
在强化模型创新方面,《行动方案》提出,推动人工智能自主可控软硬件在能源领域深度应用,加快自主智算芯片与国产深度学习框架的适配优化,推动多框架协同运行,推动能源领域大模型高效迁移技术在典型场景中的应用。
“双向奔赴”:构建协同发展新格局
察势者智,驭势者赢。人工智能与能源的双向赋能,正加快形成创新驱动、深度融合、安全高效的发展新格局。
《行动方案》从标准体系、安全治理、国际合作、人才培养等多个维度,构筑协同发展的良性生态:开展“人工智能+”能源标准化提升行动,加强“人工智能+”能源标准化顶层设计,建立健全人工智能与能源双向赋能标准体系;探索建立“人工智能+”能源安全治理体系,开展人工智能安全治理顶层设计,探索建立能源领域人工智能研发与应用基本安全原则;促进多元融合国际交流合作;构建复合人才培养体系。
在政策保障方面,《行动方案》提出,鼓励企业联合科研机构、高校、社会服务机构等单位构建产学研用创新联合体,开展攻关协作和资源共享,促进创新链和产业链深度融合;加速人工智能技术成果产业化,推动能源领域人工智能应用相关技术装备优先纳入能源领域首台(套)重大技术装备支持范围,营造允许试错、宽容失败的能源领域人工智能应用创新环境。
据悉,下一步,国家能源局将推动建立部门、地方、企业协调推进工作机制,做好人工智能与能源双向赋能工作各项要素保障,切实发挥企业创新主体作用,统筹推进人工智能与能源融合发展。
标题: OpenAI警告我网络霸凌
作者: #哈基文
板块: #开发调优
编号: 2156428
帖子: https://linux.do/t/topic/2156428
时间: 2026-05-11 21:05:13
摘要:
不知道佬们有没有收到类似警告。
起因应该是昨晚用gpt5.4逆向一个软件,它不给我逆,不给任何代码实现细节,我只好让它尽可能分析代码,给出“测试”(破解)方案,最后不了了之。没想到今天收到警告了,gpt道德感怎么这么高,我还以为号被封了
标题: S-UI无了???
作者: #Easonn
板块: #搞七捻三
编号: 2156446
帖子: https://linux.do/t/topic/2156446
时间: 2026-05-11 21:07:42
摘要:
补药啊哥们
标题: ds2api的dsv4vision为什么一定要用备用key?
作者: #吞天蛤蟆
板块: #搞七捻三
编号: 2156451
帖子: https://linux.do/t/topic/2156451
时间: 2026-05-11 21:08:56
摘要:
rt,Hermes在用Camofox的browser_vision,调用vision模型为什么一定得用备用key,神了,弄半天就一个key的问题。难道更本质的原因是有的账号有灰度vision,有的没有,而不同的key使用的不同的账号?(但是这说不通啊,key和账号又没关联吧)