多跳LLM代理的“冷启动”问题获解
在“生产级代理推理”系列最终篇中,作者提出了一种名为“归纳潜在上下文持久性”(ILCP)的方法,旨在解决多跳LLM代理中的“冷启动”问题。当前多跳代理流程中,当控制权从代理A转移至代理B时,接收方会丢弃A的隐藏状态,并从提示文本重新构建上下文,这类似于5G/6G网络中用户设备切换基站后的“冷启动”。受此启发,作者将发送方的循环状态压缩为微小潜在负载,通过切换传输,使接收方将其作为软提示前缀,避免重复填充。该方法已在ICML 2026的同行评审论文中被验证,在6G切换测试中完全消除乒乓切换(0.0% vs 6.5%基线),后切换准确率提升平均5.1个百分点、峰值13.3个百分点。代理侧V1版本(含β-VAE压缩器、门控MLP投影器等)已搭建,但基准测试尚为未来工作。作者明确区分电信与LLM场景,强调诚实写作。 #LLM #人工智能 #多跳代理 #网络切换 #ILCP #模型效率 #科技前沿
在“生产级代理推理”系列最终篇中,作者提出了一种名为“归纳潜在上下文持久性”(ILCP)的方法,旨在解决多跳LLM代理中的“冷启动”问题。当前多跳代理流程中,当控制权从代理A转移至代理B时,接收方会丢弃A的隐藏状态,并从提示文本重新构建上下文,这类似于5G/6G网络中用户设备切换基站后的“冷启动”。受此启发,作者将发送方的循环状态压缩为微小潜在负载,通过切换传输,使接收方将其作为软提示前缀,避免重复填充。该方法已在ICML 2026的同行评审论文中被验证,在6G切换测试中完全消除乒乓切换(0.0% vs 6.5%基线),后切换准确率提升平均5.1个百分点、峰值13.3个百分点。代理侧V1版本(含β-VAE压缩器、门控MLP投影器等)已搭建,但基准测试尚为未来工作。作者明确区分电信与LLM场景,强调诚实写作。 #LLM #人工智能 #多跳代理 #网络切换 #ILCP #模型效率 #科技前沿
最强Switch 2保护壳Killswitch 2限时折扣
知名配件品牌Dbrand推出的Switch 2专用保护壳Killswitch 2正在限时促销。这款保护壳以其出色的做工和多功能设计广受好评,可完整包裹主机背面与边缘,并配备加厚Joy-Con保护套,提升握持手感和人体工学体验。旅行套装包含由弹力绑带固定的屏幕保护盖(可收纳10张卡带)以及摇杆帽,原价80美元,现于Dbrand官网仅售69.99美元,百思买售价71.99美元。此前Dbrand曾因Steam Machine配件发布闹出乌龙,但Killswitch 2凭借扎实的做工和实用性被认为是目前市面上最优秀的Switch 2保护方案。 #Switch2 #Dbrand #Killswitch2 #游戏配件 #折扣 #主机保护 #任天堂
知名配件品牌Dbrand推出的Switch 2专用保护壳Killswitch 2正在限时促销。这款保护壳以其出色的做工和多功能设计广受好评,可完整包裹主机背面与边缘,并配备加厚Joy-Con保护套,提升握持手感和人体工学体验。旅行套装包含由弹力绑带固定的屏幕保护盖(可收纳10张卡带)以及摇杆帽,原价80美元,现于Dbrand官网仅售69.99美元,百思买售价71.99美元。此前Dbrand曾因Steam Machine配件发布闹出乌龙,但Killswitch 2凭借扎实的做工和实用性被认为是目前市面上最优秀的Switch 2保护方案。 #Switch2 #Dbrand #Killswitch2 #游戏配件 #折扣 #主机保护 #任天堂
AI 集体思维困境
聊天机器人看似聪明,但实际上它们的回答往往比想象中更加可预测和缺乏创意。澳大利亚初创公司Springboards发现,主流大语言模型在回答开放性问题时存在严重的“集体思维”问题,比如随机数总是倾向7,车型多为丰田或本田,广告语也高度雷同。该公司推出的Flint模型则刻意“欢迎幻觉”,通过独特训练生成更多样化、更意想不到的回答,例如在随机数游戏中给出3.7916,在车名中给出福特F-150。研究表明,这种同质化源于主流模型在相似数据上以相似方式训练,导致不同模型间的回答趋同。对于需要创意的任务(如头脑风暴、旅行规划),这构成了明显局限。 #AI #大模型 #创造力 #集体思维 #科技 #创业 #Springboards
聊天机器人看似聪明,但实际上它们的回答往往比想象中更加可预测和缺乏创意。澳大利亚初创公司Springboards发现,主流大语言模型在回答开放性问题时存在严重的“集体思维”问题,比如随机数总是倾向7,车型多为丰田或本田,广告语也高度雷同。该公司推出的Flint模型则刻意“欢迎幻觉”,通过独特训练生成更多样化、更意想不到的回答,例如在随机数游戏中给出3.7916,在车名中给出福特F-150。研究表明,这种同质化源于主流模型在相似数据上以相似方式训练,导致不同模型间的回答趋同。对于需要创意的任务(如头脑风暴、旅行规划),这构成了明显局限。 #AI #大模型 #创造力 #集体思维 #科技 #创业 #Springboards
AI初创公司新思路
过去25年,应用软件初创公司专注于提高个人和团队的生产力,并采用按席位定价的商业模式。大型语言模型(LLM)的出现,最初催生了“Copilot for [x]”这类提高用户生产力的工具。然而,一家名为EvenUp的初创公司展示了另一种可能性:直接出售工作成果本身。以人身伤害律师为例,他们需要为客户撰写“需求包”文件。传统软件思维会开发一个辅助工具,但EvenUp选择直接提供AI生成的完整需求包。这种模式的销售周期不同,定价对人类完成该工作的成本而非软件订阅,其竞争对手是国际外包团队。AI驱动的产品在一致性和服务水平协议上远超外包,创造了10倍级的高性价比机会。这一模式启示创业者,寻找已有外包服务的垂直行业,用AI直接出售成品,而非工具。 #AI创业 #商业模式 #人工智能 #法律服务 #自动化
过去25年,应用软件初创公司专注于提高个人和团队的生产力,并采用按席位定价的商业模式。大型语言模型(LLM)的出现,最初催生了“Copilot for [x]”这类提高用户生产力的工具。然而,一家名为EvenUp的初创公司展示了另一种可能性:直接出售工作成果本身。以人身伤害律师为例,他们需要为客户撰写“需求包”文件。传统软件思维会开发一个辅助工具,但EvenUp选择直接提供AI生成的完整需求包。这种模式的销售周期不同,定价对人类完成该工作的成本而非软件订阅,其竞争对手是国际外包团队。AI驱动的产品在一致性和服务水平协议上远超外包,创造了10倍级的高性价比机会。这一模式启示创业者,寻找已有外包服务的垂直行业,用AI直接出售成品,而非工具。 #AI创业 #商业模式 #人工智能 #法律服务 #自动化
Netflix《黄金门票》综艺秀用AI复活吉恩
Netflix公布了新综艺《威利旺卡的黄金门票》的首个预告片,其中通过人工智能技术再现了已故演员吉恩·怀尔德的声音。该无剧本系列剧基于《威利旺卡与巧克力工厂》改编,由Netflix与Eureka制片公司联合制作。节目获得了怀尔德遗产方授权,并与AI公司ElevenLabs合作,重现了这位经典角色扮演者的声音。剧中设定了12张黄金门票获得者及其搭档,他们将面对一系列源自电影和罗尔德·达尔原著的挑战。节目还将致敬1971年电影的场景,考验选手的体能、心智和道德。吉恩·怀尔德的妻子卡伦·B·怀尔德代表遗产方表示,这能让新一代感受到丈夫带来的温暖与想象力。该剧定于9月23日首播。 #Netflix #AI #电影 #综艺 #威利旺卡 #吉恩怀尔德 #科技
Netflix公布了新综艺《威利旺卡的黄金门票》的首个预告片,其中通过人工智能技术再现了已故演员吉恩·怀尔德的声音。该无剧本系列剧基于《威利旺卡与巧克力工厂》改编,由Netflix与Eureka制片公司联合制作。节目获得了怀尔德遗产方授权,并与AI公司ElevenLabs合作,重现了这位经典角色扮演者的声音。剧中设定了12张黄金门票获得者及其搭档,他们将面对一系列源自电影和罗尔德·达尔原著的挑战。节目还将致敬1971年电影的场景,考验选手的体能、心智和道德。吉恩·怀尔德的妻子卡伦·B·怀尔德代表遗产方表示,这能让新一代感受到丈夫带来的温暖与想象力。该剧定于9月23日首播。 #Netflix #AI #电影 #综艺 #威利旺卡 #吉恩怀尔德 #科技
Broadcom 推出平台工程 2.0,应对 AI 安全与合规挑战
Broadcom 近日发布平台工程 2.0 框架,旨在解决 AI 工作负载在传统基础设施上运行所引发的安全与合规问题。此框架基于平台工程 1.0 的成功基础,是自然演进而非替代。1.0 版本为容器化、以开发者为中心的人工节奏工作流程设计,而 AI 的出现从工作负载特征、安全需求和成本模型三方面打破了这一模式。企业面临影子AI比影子IT更危险的境地,不仅面临数据泄露风险,还会造成不可控的巨额成本——有企业报告称,某模型API月度成本从日均25万美元飙升至40万美元。单个应用团队各自设置防护栏的方式已证明不可持续,安全领导无法回答最基本的问题。平台工程2.0 提出将AI治理从应用代码下沉至平台本身,通过模型治理控制平面和工作负载隔离作为结构性保障,建立统一的模型注册和路由层,实现跨提供商的认证、策略执行和监控。 #Broadcom #平台工程 #AI安全 #合规 #云计算 #DevOps #FinOps
Broadcom 近日发布平台工程 2.0 框架,旨在解决 AI 工作负载在传统基础设施上运行所引发的安全与合规问题。此框架基于平台工程 1.0 的成功基础,是自然演进而非替代。1.0 版本为容器化、以开发者为中心的人工节奏工作流程设计,而 AI 的出现从工作负载特征、安全需求和成本模型三方面打破了这一模式。企业面临影子AI比影子IT更危险的境地,不仅面临数据泄露风险,还会造成不可控的巨额成本——有企业报告称,某模型API月度成本从日均25万美元飙升至40万美元。单个应用团队各自设置防护栏的方式已证明不可持续,安全领导无法回答最基本的问题。平台工程2.0 提出将AI治理从应用代码下沉至平台本身,通过模型治理控制平面和工作负载隔离作为结构性保障,建立统一的模型注册和路由层,实现跨提供商的认证、策略执行和监控。 #Broadcom #平台工程 #AI安全 #合规 #云计算 #DevOps #FinOps
Ovi AI 发布,成为初创团队的高效QA伙伴
Ovi AI 是一套人工智能驱动的质量保障系统,专为软件工程团队设计。它能自动连接GitHub和Linear等开发工具,学习产品全貌,并在工程师提交PR或工单后,通过/qa指令在60秒内完成首次分析。Ovi AI不仅能够找出需求中的潜在风险与缺口、生成测试方案,还能在浏览器中执行探索性测试,捕获Bug并给出明确的“GO/NO-GO”决策。其目标是帮助团队将原本花费在返工上的20%至50%迭代产能,提升至专注于路线图的95%。目前Ovi AI已开放早期申请,锁定创始会员价格为每月299美元。 #AI #QA #软件测试 #初创企业 #开发效率 #自动化
Ovi AI 是一套人工智能驱动的质量保障系统,专为软件工程团队设计。它能自动连接GitHub和Linear等开发工具,学习产品全貌,并在工程师提交PR或工单后,通过/qa指令在60秒内完成首次分析。Ovi AI不仅能够找出需求中的潜在风险与缺口、生成测试方案,还能在浏览器中执行探索性测试,捕获Bug并给出明确的“GO/NO-GO”决策。其目标是帮助团队将原本花费在返工上的20%至50%迭代产能,提升至专注于路线图的95%。目前Ovi AI已开放早期申请,锁定创始会员价格为每月299美元。 #AI #QA #软件测试 #初创企业 #开发效率 #自动化