港大开源AgentSpace,支持将Claude与OpenClaw路由为数字员工
香港大学数据智能实验室(HKUDS)开源多智能体协作平台 AgentSpace。为了打破单人终端与零散对话的限制,AgentSpace 将 AI 智能体定义为「数字员工」,提供支持多角色权限分配、工作流协同和审计监控的团队共享空间。
架构设计中,标准化路由层 AgentRouter 负责在不改变业务队列的前提下,将同一个智能体调度至 Claude Code、Codex CLI、OpenClaw 或 Hermes Agent 等不同运行时,统一规范运行状态、执行结果和异常诊断。配套的数字员工看板支持智能体借调申请,并为所有者和管理员提供了技能绑定与工具审批通道。
安全和权限控制覆盖工作区成员、通道准入、私聊隐私和远程守护进程等多个维度。AgentSpace 接入了面向智能体的 Google Workspace OAuth 授权代理,支持智能体自主创建或读写云端文档,并在缺失权限时自动触发审批工作流。
后续路线图规划了更强的 AgentRouter 会话管理、多智能体沙箱隔离策略以及运行时工具市场。
信源:https://github.com/HKUDS/AgentSpace
香港大学数据智能实验室(HKUDS)开源多智能体协作平台 AgentSpace。为了打破单人终端与零散对话的限制,AgentSpace 将 AI 智能体定义为「数字员工」,提供支持多角色权限分配、工作流协同和审计监控的团队共享空间。
架构设计中,标准化路由层 AgentRouter 负责在不改变业务队列的前提下,将同一个智能体调度至 Claude Code、Codex CLI、OpenClaw 或 Hermes Agent 等不同运行时,统一规范运行状态、执行结果和异常诊断。配套的数字员工看板支持智能体借调申请,并为所有者和管理员提供了技能绑定与工具审批通道。
安全和权限控制覆盖工作区成员、通道准入、私聊隐私和远程守护进程等多个维度。AgentSpace 接入了面向智能体的 Google Workspace OAuth 授权代理,支持智能体自主创建或读写云端文档,并在缺失权限时自动触发审批工作流。
后续路线图规划了更强的 AgentRouter 会话管理、多智能体沙箱隔离策略以及运行时工具市场。
信源:https://github.com/HKUDS/AgentSpace
GitHub
GitHub - HKUDS/AgentSpace: "AgentSpace: Human + Agents. One Team. One Workspace"
"AgentSpace: Human + Agents. One Team. One Workspace" - HKUDS/AgentSpace
动察Beating AI News
OpenAI发布网安套件Daybreak,开放最高权限模型用于渗透测试 OpenAI 发布网络防御套件 Daybreak。该平台结合了 OpenAI 前沿模型与 Codex(作为智能体运行框架),允许安全团队在代码库中直接生成安全补丁、测试并验证修复。 为了平衡强大能力与潜在被滥用的风险,Daybreak 将模型访问权限严格分为三级: - 常规版 GPT-5.5 遵循标准安全护栏。 - 带有「可信访问(Trusted Access)」的 GPT-5.5 拥有更精准的护栏,面向恶意软件分析和漏洞分流等日常防御。…
OpenAI发布GPT-5.5-Cyber完整版,跑分85.6%超Mythos 5
OpenAI 宣布升级 Daybreak 网络防御工具链,并正式推出面向防御者的 GPT-5.5-Cyber 完整版模型。在评估智能体复现已知漏洞能力的 CyberGym 基准测试中,GPT-5.5-Cyber 取得 85.6% 的单模型最高跑分,超越了 GPT-5.5 的 81.8% 和竞品 Mythos 5 的 83.8%。
随着 AI 的普及使漏洞发现效率大幅提升,防御端的瓶颈已从「寻找漏洞」转向「自动修复」。为了将检测结果转化为实际修复,配套的 Codex Security 插件迎来升级,允许开发人员在 Codex 环境内自动分析并生成修复补丁。自 3 月发布预览版至今,Codex Security 已累计扫描超 3000 万次提交,自动确认修复了 50 万个安全缺陷。最新版本支持集成 CodeQL 查询和导出 SARIF 标准文件,支持在软件上线前拦截潜在漏洞。
同时,OpenAI 联合 Trail of Bits 和 HackerOne 等机构发起 Patch the Planet 开源安全项目,为 cURL、Go 等 30 多个主流开源项目提供 ChatGPT Pro 订阅及 API 额度,由专家团队人工验证补丁以减轻维护者负担。在 Daybreak 合作伙伴计划中,Palo Alto Networks 和 Wiz 等安全厂商已首批接入,致力于在商业化安全产品中落地高级防御能力。
信源:https://x.com/OpenAI/status/2069104283824640023
OpenAI 宣布升级 Daybreak 网络防御工具链,并正式推出面向防御者的 GPT-5.5-Cyber 完整版模型。在评估智能体复现已知漏洞能力的 CyberGym 基准测试中,GPT-5.5-Cyber 取得 85.6% 的单模型最高跑分,超越了 GPT-5.5 的 81.8% 和竞品 Mythos 5 的 83.8%。
随着 AI 的普及使漏洞发现效率大幅提升,防御端的瓶颈已从「寻找漏洞」转向「自动修复」。为了将检测结果转化为实际修复,配套的 Codex Security 插件迎来升级,允许开发人员在 Codex 环境内自动分析并生成修复补丁。自 3 月发布预览版至今,Codex Security 已累计扫描超 3000 万次提交,自动确认修复了 50 万个安全缺陷。最新版本支持集成 CodeQL 查询和导出 SARIF 标准文件,支持在软件上线前拦截潜在漏洞。
同时,OpenAI 联合 Trail of Bits 和 HackerOne 等机构发起 Patch the Planet 开源安全项目,为 cURL、Go 等 30 多个主流开源项目提供 ChatGPT Pro 订阅及 API 额度,由专家团队人工验证补丁以减轻维护者负担。在 Daybreak 合作伙伴计划中,Palo Alto Networks 和 Wiz 等安全厂商已首批接入,致力于在商业化安全产品中落地高级防御能力。
信源:https://x.com/OpenAI/status/2069104283824640023
X (formerly Twitter)
OpenAI (@OpenAI) on X
We’re expanding OpenAI Daybreak to help democratize patching vulnerable software at machine speed:
- Codex Security plugin: find, validate, and fix vulnerabilities right inside Codex
- The full version of GPT-5.5-Cyber model: a great model for trusted defenders…
- Codex Security plugin: find, validate, and fix vulnerabilities right inside Codex
- The full version of GPT-5.5-Cyber model: a great model for trusted defenders…
AI基建短缺推升芯片均价:中国5月半导体出口额暴涨111%,出货量仅增2%
全球 AI 数据中心基建对硬件的极度饥渴,已将半导体红利彻底推向价格暴涨。2026 年 5 月中国半导体出口额同比激增 111%,达到创纪录的 360 亿美元,然而同期中国芯片实际出货量同比仅微增 2%。
半导体出口额翻倍而实际出货规模几乎持平,暴露出全球算力硬件短缺的真实程度。高附加值芯片价格因 AI 算力短缺而大幅飙升,直接拉动了半导体出口额。同期电脑和零部件出口也同比飙升 66%,达到约 270 亿美元,创下历史第二高纪录。
芯片与电脑零部件在 5 月共同贡献了中国进出口总增长的约一半。受算力出口额暴涨的强力拉动,5 月中国整体出口同比增长 19%,进口同比飙升 27%,顺差达到 1054 亿美元,创下 2026 年 1 月以来的最高水平。
信源:https://x.com/KobeissiLetter/status/2069253295558787183
全球 AI 数据中心基建对硬件的极度饥渴,已将半导体红利彻底推向价格暴涨。2026 年 5 月中国半导体出口额同比激增 111%,达到创纪录的 360 亿美元,然而同期中国芯片实际出货量同比仅微增 2%。
半导体出口额翻倍而实际出货规模几乎持平,暴露出全球算力硬件短缺的真实程度。高附加值芯片价格因 AI 算力短缺而大幅飙升,直接拉动了半导体出口额。同期电脑和零部件出口也同比飙升 66%,达到约 270 亿美元,创下历史第二高纪录。
芯片与电脑零部件在 5 月共同贡献了中国进出口总增长的约一半。受算力出口额暴涨的强力拉动,5 月中国整体出口同比增长 19%,进口同比飙升 27%,顺差达到 1054 亿美元,创下 2026 年 1 月以来的最高水平。
信源:https://x.com/KobeissiLetter/status/2069253295558787183
动察Beating AI News
OpenAI Codex曝严重日志缺陷,疯狂磨损硬盘甚至强删用户文件 OpenAI 终端编码智能体 Codex 近期被曝光存在严重的本地日志持续写入缺陷。由于内部组件默认开启了过度的全局 TRACE 级别调试信息输出,Codex 会疯狂向本地数据库 (~/.codex/logs_2.sqlite) 写入低价值日志。 实测显示,在活跃使用状态下,设备在 21 天内写入了约 37 TB 数据,折合年写入量可达 640 TB,极易在一年内将普通固态硬盘 (SSD) 直接磨损报废,同时高强度的 I/O 占用还会引发编辑器卡顿。…
OpenAI发布Codex新版限制日志写入,但首批反馈显示尚未完全根治
OpenAI 发布新版本 @openai/codex@0.142.0 (rust-v0.142.0),针对近期被曝光的本地 SQLite 日志持续写盘缺陷实施首次修复。
新版本合并了 PR #29432 与 PR #29457,通过停止记录成功的 Responses WebSocket 事件、过滤低价值的 OpenTelemetry 镜像与 target=log 等底层调试目标,以降低频繁日志写入对本地数据库与 WAL 文件的冲击。目前相关 GitHub issue #28224 已被关闭。
但代码检查与反馈显示,更新更偏向降噪,而非彻底关闭本地持久日志。新版本中默认日志等级依然设为 TRACE,仅仅通过内置过滤器排除了 log、codex_otel.log_only 与 codex_otel.trace_safe 等高频事件源。
在问题关闭后,部分 macOS 与 Windows 用户反馈升级后本地 logs_2.sqlite 与 WAL 缓存文件依然存在持续增长,意味着高频擦写现象仍未完全根除。
信源:https://github.com/openai/codex/releases/tag/rust-v0.142.0
OpenAI 发布新版本 @openai/codex@0.142.0 (rust-v0.142.0),针对近期被曝光的本地 SQLite 日志持续写盘缺陷实施首次修复。
新版本合并了 PR #29432 与 PR #29457,通过停止记录成功的 Responses WebSocket 事件、过滤低价值的 OpenTelemetry 镜像与 target=log 等底层调试目标,以降低频繁日志写入对本地数据库与 WAL 文件的冲击。目前相关 GitHub issue #28224 已被关闭。
但代码检查与反馈显示,更新更偏向降噪,而非彻底关闭本地持久日志。新版本中默认日志等级依然设为 TRACE,仅仅通过内置过滤器排除了 log、codex_otel.log_only 与 codex_otel.trace_safe 等高频事件源。
在问题关闭后,部分 macOS 与 Windows 用户反馈升级后本地 logs_2.sqlite 与 WAL 缓存文件依然存在持续增长,意味着高频擦写现象仍未完全根除。
信源:https://github.com/openai/codex/releases/tag/rust-v0.142.0
GitHub
Release 0.142.0 · openai/codex
New Features
/usage can now show and redeem earned usage-limit reset credits, with confirmation, retry, and refreshed availability states. (#28154, #28793)
/plugins now organizes remote plugins in...
/usage can now show and redeem earned usage-limit reset credits, with confirmation, retry, and refreshed availability states. (#28154, #28793)
/plugins now organizes remote plugins in...
字节跳动正式开放豆包Seed 2.1大模型API:Pro版本多项评测超GPT-5.5
字节跳动火山引擎已正式上线 Doubao-Seed-2.1 系列大模型并开放 API,全系模型统一提供 256k 上下文窗口。新系列包含 Pro 与 Turbo 两款深度思考模型,重点升级复杂编程交付、长链路智能体 Agent 执行与多模态视觉能力。
在官方披露的基准测试中,旗舰版 Doubao-Seed-2.1-pro 在多项代码与开发评测中逼近或超越了 GPT-5.5。在 SciCode 科学计算与 NL2Repo-Bench 库级代码生成测试中,模型分别取得 59.8% 与 47.0% 的成绩,优于 GPT-5.5 的 58.4% 和 45.1%。在软件工程评测 SWE-Pro 中,跑分达到 57.5%,高于 Gemini-3.1-Pro 的 54.2% 并接近 GPT-5.5 的 58.6%。
API 计费方面,Pro 版本推理输入与输出分别为 6 元/百万 Tokens 和 30 元/百万 Tokens。Turbo 版本定价减半,分别为 3 元/百万 Tokens 与 15 元/百万 Tokens。
火山引擎同步推出了每周滚动升级的 Seed-Evolving。Seed-Evolving 支持开发者通过统一的 Model ID 获取每周至少迭代一次的最新模型能力,将大模型交付模式从固定版本向持续在线进化转变。
字节跳动火山引擎已正式上线 Doubao-Seed-2.1 系列大模型并开放 API,全系模型统一提供 256k 上下文窗口。新系列包含 Pro 与 Turbo 两款深度思考模型,重点升级复杂编程交付、长链路智能体 Agent 执行与多模态视觉能力。
在官方披露的基准测试中,旗舰版 Doubao-Seed-2.1-pro 在多项代码与开发评测中逼近或超越了 GPT-5.5。在 SciCode 科学计算与 NL2Repo-Bench 库级代码生成测试中,模型分别取得 59.8% 与 47.0% 的成绩,优于 GPT-5.5 的 58.4% 和 45.1%。在软件工程评测 SWE-Pro 中,跑分达到 57.5%,高于 Gemini-3.1-Pro 的 54.2% 并接近 GPT-5.5 的 58.6%。
API 计费方面,Pro 版本推理输入与输出分别为 6 元/百万 Tokens 和 30 元/百万 Tokens。Turbo 版本定价减半,分别为 3 元/百万 Tokens 与 15 元/百万 Tokens。
火山引擎同步推出了每周滚动升级的 Seed-Evolving。Seed-Evolving 支持开发者通过统一的 Model ID 获取每周至少迭代一次的最新模型能力,将大模型交付模式从固定版本向持续在线进化转变。
Seedance 2.5定档7月初,单视频生成长度可达30秒
字节跳动在 6 月 23 日的火山引擎 FORCE 大会上展示了视频生成模型 Seedance 2.5。Seedance 2.5 预计 7 月初正式发布,最主要的升级是单段原生视频直出时长翻倍到了 30 秒,并支持同时导入 50 个全模态参考素材,以解决视频生成中角色和产品细节容易走样变形的痛点。Seedance 2.5 还支持局部画面微调,在修改细节时不会影响视频的其余部分。
在 Seedance 2.5 中,火山引擎还与专业导演共创,在业内首创了「3D白膜预演」功能,允许创作者在正式生成视频前进行三维粗剪与可视化预览,以提升影视制作的工业化交付效率。
同场升级的 Seedance 2.0 现已支持原生 4K 视频生成。
字节跳动在 6 月 23 日的火山引擎 FORCE 大会上展示了视频生成模型 Seedance 2.5。Seedance 2.5 预计 7 月初正式发布,最主要的升级是单段原生视频直出时长翻倍到了 30 秒,并支持同时导入 50 个全模态参考素材,以解决视频生成中角色和产品细节容易走样变形的痛点。Seedance 2.5 还支持局部画面微调,在修改细节时不会影响视频的其余部分。
在 Seedance 2.5 中,火山引擎还与专业导演共创,在业内首创了「3D白膜预演」功能,允许创作者在正式生成视频前进行三维粗剪与可视化预览,以提升影视制作的工业化交付效率。
同场升级的 Seedance 2.0 现已支持原生 4K 视频生成。
孙正义否定马斯克太空数据中心构想:电费占比极低,AI决战仍在陆地
软银集团创始人孙正义在 6 月 23 日软银旗下的日本电信业务部门年度股东大会上表示,在太空建立数据中心几乎没有实际价值,AI 竞争的胜负将由陆地上的算力决定。针对股东提问软银是否会效仿马斯克的太空数据中心计划,孙正义明确予以否定。
马斯克倡导太空数据中心的核心优势在于降低电力成本。但孙正义指出,与芯片等硬件相比,电力支出仅占数据中心运营成本极小的一部分。为了节省电费而将数据中心搬入太空,反而会带来高昂的火箭运输费用、维护困难以及通信延迟等一系列弊端。
孙正义强调,在 AI 决战中,未来几年的局势远比十年后更重要。软银将专注于在陆地上建设强大的数据中心,并坚信「先下手为强」。目前,软银旗下的日本电信业务部门也正在计划进军美国 AI 新型云算力(Neocloud)市场。
信源:https://www.bloomberg.com/news/articles/2026-06-23/masa-son-dismisses-musk-s-space-data-center-as-an-ai-race-winner
软银集团创始人孙正义在 6 月 23 日软银旗下的日本电信业务部门年度股东大会上表示,在太空建立数据中心几乎没有实际价值,AI 竞争的胜负将由陆地上的算力决定。针对股东提问软银是否会效仿马斯克的太空数据中心计划,孙正义明确予以否定。
马斯克倡导太空数据中心的核心优势在于降低电力成本。但孙正义指出,与芯片等硬件相比,电力支出仅占数据中心运营成本极小的一部分。为了节省电费而将数据中心搬入太空,反而会带来高昂的火箭运输费用、维护困难以及通信延迟等一系列弊端。
孙正义强调,在 AI 决战中,未来几年的局势远比十年后更重要。软银将专注于在陆地上建设强大的数据中心,并坚信「先下手为强」。目前,软银旗下的日本电信业务部门也正在计划进军美国 AI 新型云算力(Neocloud)市场。
信源:https://www.bloomberg.com/news/articles/2026-06-23/masa-son-dismisses-musk-s-space-data-center-as-an-ai-race-winner
Bloomberg.com
Masa Son Dismisses Musk’s Space Data Center as an AI Race Winner
SoftBank Group Corp. founder Masayoshi Son said there’s little merit to building data centers in space, as championed by Elon Musk, predicting that the AI race will be clinched by computing resources on Earth.
👍1
动察Beating AI News
Meta遭员工抵制后缩减AI训练追踪工具MCI的数据采集范围 Meta 开始缩减用于 AI 训练的员工电脑追踪工具。The Information 获得的一份 Meta 内部备忘录显示,面对员工反弹,公司已决定更新「模型能力计划」(Model Capability Initiative,简称 MCI),收窄行为数据收集范围并加强隐私保护。 MCI 于今年 4 月推出,主要记录员工在工作电脑上的鼠标移动、点击、导航和屏幕画面,以此训练 AI 像人一样使用电脑。Meta CEO 扎克伯格曾表示,AI 模型…
Meta因安全漏洞暴露AI训练数据,紧急暂停监控员工按键的MCI项目
Meta 宣布暂停一项内部运行的 AI 训练项目,原因是一次严重的安全配置漏洞导致内部收集的员工电脑交互数据对公司全员开放。本次泄露在 Meta 内部被评为 SEV 2 级安全事件(严重程度仅次于最高级别 SEV 0 与 SEV 1)。
项目名为「模型能力倡议」(Model Capability Initiative,简称 MCI),于今年 4 月启动,强制要求大多数员工参与。监测工具通过后台记录员工的键盘按键与鼠标运动轨迹,为训练 AI 模型提供数据支撑,但在上线之初就因强制收集员工行为数据而引发了强烈的内部抵触。
漏洞暴露的数据分布在超过 45000 张数据库表中,包含员工与内部 AI 工具交互的完整提示词、对话转录、系统输出、员工私人对话以及绩效管理数据。多份泄露的内部截图显示,数据在未经妥善权限控制的情况下向全员开放,在内部激起了巨大的员工愤怒,有员工发帖批评公司违背了最初将数据完全封锁隔离的承诺。
Meta 发言人表示,项目在设计时已包含隐私保护措施,目前尚无迹象表明数据被内部员工不当获取,但公司已暂停监测项目并展开调查。
数据泄露是 Meta 近期一系列安全事故的最新一起,上个月公司刚刚修复了 AI 聊天机器人导致多名用户 Instagram 账号被劫持的漏洞,今年 3 月亦有一起失控的 AI 智能体引发的严重安全事件被曝光。
信源:https://www.businessinsider.com/meta-ai-training-data-leak-exposed-employee-activity-across-company-2026-6
Meta 宣布暂停一项内部运行的 AI 训练项目,原因是一次严重的安全配置漏洞导致内部收集的员工电脑交互数据对公司全员开放。本次泄露在 Meta 内部被评为 SEV 2 级安全事件(严重程度仅次于最高级别 SEV 0 与 SEV 1)。
项目名为「模型能力倡议」(Model Capability Initiative,简称 MCI),于今年 4 月启动,强制要求大多数员工参与。监测工具通过后台记录员工的键盘按键与鼠标运动轨迹,为训练 AI 模型提供数据支撑,但在上线之初就因强制收集员工行为数据而引发了强烈的内部抵触。
漏洞暴露的数据分布在超过 45000 张数据库表中,包含员工与内部 AI 工具交互的完整提示词、对话转录、系统输出、员工私人对话以及绩效管理数据。多份泄露的内部截图显示,数据在未经妥善权限控制的情况下向全员开放,在内部激起了巨大的员工愤怒,有员工发帖批评公司违背了最初将数据完全封锁隔离的承诺。
Meta 发言人表示,项目在设计时已包含隐私保护措施,目前尚无迹象表明数据被内部员工不当获取,但公司已暂停监测项目并展开调查。
数据泄露是 Meta 近期一系列安全事故的最新一起,上个月公司刚刚修复了 AI 聊天机器人导致多名用户 Instagram 账号被劫持的漏洞,今年 3 月亦有一起失控的 AI 智能体引发的严重安全事件被曝光。
信源:https://www.businessinsider.com/meta-ai-training-data-leak-exposed-employee-activity-across-company-2026-6
Business Insider
Meta pauses an AI training program that tracks employees' keystrokes after an internal leak
Meta pauses an AI training program after sensitive employee data leaks, sparking internal backlash and highlighting security concerns.
盈透证券深度集成ChatGPT与Grok:支持期权期货等AI智能体交易
盈透证券(Interactive Brokers,简称 IBKR)宣布,正式集成 ChatGPT 和 Grok,以扩展 AI 智能体交易(Agentic Trading)能力。这是继先前集成 Anthropic Claude 之后的又一重大更新。目前,盈透证券现有客户无需支付额外费用即可使用集成功能。
升级后,用户可以直接将 IBKR 账户与主流 AI 平台安全链接,使用自然语言进行投资组合分析、市场机会研究并生成交易指令。除原有的股票与 ETF 外,本次更新还将 AI 指令支持的资产类别扩展至期权(Options)、期货(Futures)和期货期权(Futures Options)。交互功能已在 Client Portal、IBKR Desktop、IBKR Mobile 以及 Trader Workstation (TWS) 等盈透旗下各大平台同步上线。
在安全设计上,盈透采用「人机协同」(human-in-the-middle)架构。AI 生成的交易指令仅为非约束性草稿,会自动存放在盈透平台的「AI Instructions」(AI 指令)专属标签页中,必须由用户手动审核并逐笔确认后才能正式下单。此外,认证连接器由盈透官方管理,不与 AI 提供商共享账户密码或 API 密钥,用户也可随时在设置中撤销访问授权。
信源:https://www.businesswire.com/news/home/20260617338003/en/Interactive-Brokers-Expands-AI-Integration-Capabilities-Adding-ChatGPT-and-Grok-to-Its-Growing-Suite-of-Agentic-Trading-Tools
盈透证券(Interactive Brokers,简称 IBKR)宣布,正式集成 ChatGPT 和 Grok,以扩展 AI 智能体交易(Agentic Trading)能力。这是继先前集成 Anthropic Claude 之后的又一重大更新。目前,盈透证券现有客户无需支付额外费用即可使用集成功能。
升级后,用户可以直接将 IBKR 账户与主流 AI 平台安全链接,使用自然语言进行投资组合分析、市场机会研究并生成交易指令。除原有的股票与 ETF 外,本次更新还将 AI 指令支持的资产类别扩展至期权(Options)、期货(Futures)和期货期权(Futures Options)。交互功能已在 Client Portal、IBKR Desktop、IBKR Mobile 以及 Trader Workstation (TWS) 等盈透旗下各大平台同步上线。
在安全设计上,盈透采用「人机协同」(human-in-the-middle)架构。AI 生成的交易指令仅为非约束性草稿,会自动存放在盈透平台的「AI Instructions」(AI 指令)专属标签页中,必须由用户手动审核并逐笔确认后才能正式下单。此外,认证连接器由盈透官方管理,不与 AI 提供商共享账户密码或 API 密钥,用户也可随时在设置中撤销访问授权。
信源:https://www.businesswire.com/news/home/20260617338003/en/Interactive-Brokers-Expands-AI-Integration-Capabilities-Adding-ChatGPT-and-Grok-to-Its-Growing-Suite-of-Agentic-Trading-Tools
单行命令开启无人值守开发:Grok Build上线/goal自主模式
xAI 旗下终端编程智能体 Grok Build 推出 /goal 自主模式,支持通过单行命令执行多步骤工程任务。输入 /goal 附加目标(如 /goal Migrate the auth module to the new API)即可启动,智能体将自动规划路径、生成 checklist 清单,并循环进行代码修改与测试验证,直至目标达成。
执行中可使用 /goal status(查看进度)、/goal pause(暂停)、/goal resume(恢复)与 /goal clear(终止)。当任务完成并验证通过后,面板状态将自动切换为 Complete。
信源:https://x.ai/news/introducing-goal
xAI 旗下终端编程智能体 Grok Build 推出 /goal 自主模式,支持通过单行命令执行多步骤工程任务。输入 /goal 附加目标(如 /goal Migrate the auth module to the new API)即可启动,智能体将自动规划路径、生成 checklist 清单,并循环进行代码修改与测试验证,直至目标达成。
执行中可使用 /goal status(查看进度)、/goal pause(暂停)、/goal resume(恢复)与 /goal clear(终止)。当任务完成并验证通过后,面板状态将自动切换为 Complete。
信源:https://x.ai/news/introducing-goal
x.ai
Introducing /goal
Use /goal for long-running autonomous task execution in Grok Build.
❤1
动察Beating AI News
字节跳动正式开放豆包Seed 2.1大模型API:Pro版本多项评测超GPT-5.5 字节跳动火山引擎已正式上线 Doubao-Seed-2.1 系列大模型并开放 API,全系模型统一提供 256k 上下文窗口。新系列包含 Pro 与 Turbo 两款深度思考模型,重点升级复杂编程交付、长链路智能体 Agent 执行与多模态视觉能力。 在官方披露的基准测试中,旗舰版 Doubao-Seed-2.1-pro 在多项代码与开发评测中逼近或超越了 GPT-5.5。在 SciCode 科学计算与 NL2Repo…
豆包日均Token调用量超180万亿年增10倍,火山引擎MaaS份额49.5%居国内首位
在 6 月 23 日举办的 FORCE 原动力大会上,火山引擎披露,截至今年 6 月,豆包大模型日均 Token 调用量已突破 180 万亿,过去一年内增长超过 10 倍,成为中国产业落地最广泛的模型。
在使用广度上,在中国公有云 MaaS 服务市场中,火山引擎以 49.5% 的份额占比位居中国第一。在使用深度上,目前已有超过 200 家企业在火山引擎上年度累计 Token 使用量超 1 万亿,半年内增长 1 倍。字节跳动 CEO 梁汝波在会上强调,攀登 AI 高峰是字节跳动当下最重要的事,火山引擎 MaaS 业务正在变成字节跳动的基础业务,投入将长期且坚定。
为了支撑高频模型调用与 Agent 落地,火山引擎升级了 AI 云原生全栈服务。MaaS 层发布了方舟 CLI;在 Agent 开发与运营层升级了企业级 Agent 基础设施 AgentKit、AI 云基础设施,发布 ArkClaw 企业版与 HiAgent 3.0;安全层面则强化了 AI Trust 安全体系。
除了重点亮相的豆包大模型 2.1 Pro、Seedance 2.5 视频生成模型以及原生 4K 版 Seedance 2.0,大会还发布了两款图像与音频新模型。即将于近期上线的豆包图像创作模型 Seedream 5.0 Pro 升级了交互式精准编辑、多图层分离、高密度信息表达以及原生多语种生成;已正式发布的豆包音频生成模型 1.0(Seed-Audio 1.0)则支持一条 Prompt 同步编排对白、情绪、方言、配乐与拟音特效,直出影视级成品音效。
信源:https://mp.weixin.qq.com/s/Vnv68cHAWfcX2CnszWR6Qg
在 6 月 23 日举办的 FORCE 原动力大会上,火山引擎披露,截至今年 6 月,豆包大模型日均 Token 调用量已突破 180 万亿,过去一年内增长超过 10 倍,成为中国产业落地最广泛的模型。
在使用广度上,在中国公有云 MaaS 服务市场中,火山引擎以 49.5% 的份额占比位居中国第一。在使用深度上,目前已有超过 200 家企业在火山引擎上年度累计 Token 使用量超 1 万亿,半年内增长 1 倍。字节跳动 CEO 梁汝波在会上强调,攀登 AI 高峰是字节跳动当下最重要的事,火山引擎 MaaS 业务正在变成字节跳动的基础业务,投入将长期且坚定。
为了支撑高频模型调用与 Agent 落地,火山引擎升级了 AI 云原生全栈服务。MaaS 层发布了方舟 CLI;在 Agent 开发与运营层升级了企业级 Agent 基础设施 AgentKit、AI 云基础设施,发布 ArkClaw 企业版与 HiAgent 3.0;安全层面则强化了 AI Trust 安全体系。
除了重点亮相的豆包大模型 2.1 Pro、Seedance 2.5 视频生成模型以及原生 4K 版 Seedance 2.0,大会还发布了两款图像与音频新模型。即将于近期上线的豆包图像创作模型 Seedream 5.0 Pro 升级了交互式精准编辑、多图层分离、高密度信息表达以及原生多语种生成;已正式发布的豆包音频生成模型 1.0(Seed-Audio 1.0)则支持一条 Prompt 同步编排对白、情绪、方言、配乐与拟音特效,直出影视级成品音效。
信源:https://mp.weixin.qq.com/s/Vnv68cHAWfcX2CnszWR6Qg
开源智能体爆发路线之争:OpenClaw批竞品受VC驱动,Hermes反指对手拿钱办事
因为一则下载量数据,开源智能体两大阵营在社交平台上公开互撕。OpenClaw 之父 Peter Steinberger 在转发 OpenClaw 单周 NPM 下载量新高帖子时称,OpenClaw 已转型为非营利基金会以提升质量,而竞争对手受风投资助且「别有用心」。
相关言论迅速遭到 Nous Research 联合创始人 Teknium 的公开回击。Teknium 讽刺 OpenAI 的非营利招牌早已名存实亡,并称 Steinberger 虽顶着非营利名义,但其实在拿 OpenAI 间接发放的数百万美元 VC 薪酬,同样是在执行商业议程。
分歧背后是两家框架截然不同的资金背景。OpenClaw 虽重组为独立非营利基金会,但一直接受 OpenAI 的资金与 Token 赞助,创始人 Steinberger 也已入职 OpenAI;而开发了主流竞品 Hermes Agent 的 Nous Research 则依靠风险投资支持。
当天,Nous Research 宣布 Hermes Agent 在 GitHub 上的星标数突破 20 万。早先 OpenClaw 曾凭借 Mac mini 部署热潮迅速获取 38 万个星标,但近期社区频频抱怨系统更新后崩溃。而在编码与多智能体协作中表现更稳定的 Hermes Agent,正在吸引不少开发者转移阵营。
信源:https://x.com/Teknium/status/2069007211087675756
因为一则下载量数据,开源智能体两大阵营在社交平台上公开互撕。OpenClaw 之父 Peter Steinberger 在转发 OpenClaw 单周 NPM 下载量新高帖子时称,OpenClaw 已转型为非营利基金会以提升质量,而竞争对手受风投资助且「别有用心」。
相关言论迅速遭到 Nous Research 联合创始人 Teknium 的公开回击。Teknium 讽刺 OpenAI 的非营利招牌早已名存实亡,并称 Steinberger 虽顶着非营利名义,但其实在拿 OpenAI 间接发放的数百万美元 VC 薪酬,同样是在执行商业议程。
分歧背后是两家框架截然不同的资金背景。OpenClaw 虽重组为独立非营利基金会,但一直接受 OpenAI 的资金与 Token 赞助,创始人 Steinberger 也已入职 OpenAI;而开发了主流竞品 Hermes Agent 的 Nous Research 则依靠风险投资支持。
当天,Nous Research 宣布 Hermes Agent 在 GitHub 上的星标数突破 20 万。早先 OpenClaw 曾凭借 Mac mini 部署热潮迅速获取 38 万个星标,但近期社区频频抱怨系统更新后崩溃。而在编码与多智能体协作中表现更稳定的 Hermes Agent,正在吸引不少开发者转移阵营。
信源:https://x.com/Teknium/status/2069007211087675756
传谷歌注资A24影业7500万美元,联手DeepMind开发非提示型AI影视工具
知情人士透露,谷歌将向出品过《后室》等影片的独立制片公司 A24 投资约 7500 万美元。虽然谷歌曾通过旗下 YouTube 深入在线娱乐产业,但入股 A24 是谷歌首次直接持有电影制片厂股份。双方签署了多年期、非排他性合作协议,条款规定谷歌不会获得 A24 旗下电影和电视库等数据的访问权限。
谷歌 DeepMind 部门与 A24 的合作旨在为电影制作与发行流程开发新工具。A24 负责技术与创新的合伙人 Scott Belsky 表示,目前的 AI 开发者过于强调通过技术降低电影制作成本和缩短周期,这并不吸引电影人。Belsky 认为应当利用 AI 保留创意控制权并支持创作冒险,双方联合开发的工具不会采用当前令许多创作者反感的提示词生成模式。
在 Belsky 去年从 Adobe 加入 A24 之前,双方就已经开始接触。Belsky 领导的 20 人团队 A24 Labs 正在开发一款 AI 分镜脚本生成应用,以帮助导演在正式开拍前通过粗略草图识别潜在问题。为了推进向全球化媒体公司扩张的战略,A24 正在制作旗下史上预算最高的电影项目,即由 Alex Garland 执导的《艾尔登法环》(Elden Ring)游戏改编电影,制作预算高达 1.75 亿美元。
谷歌注资金额与 Thrive Capital 2024 年投出的约 7500 万美元相当,当时 A24 估值为 35 亿美元。然而,拥抱科技巨头也为 A24 带来潜在品牌声誉风险,A24 的核心声誉主要建立在与新兴导演及年轻观众的深度绑定上,而这部分受众普遍对科技公司和 AI 的社会影响持怀疑态度。
信源:https://www.wsj.com/tech/ai/google-investing-in-backrooms-studio-a24-e7585ebe
知情人士透露,谷歌将向出品过《后室》等影片的独立制片公司 A24 投资约 7500 万美元。虽然谷歌曾通过旗下 YouTube 深入在线娱乐产业,但入股 A24 是谷歌首次直接持有电影制片厂股份。双方签署了多年期、非排他性合作协议,条款规定谷歌不会获得 A24 旗下电影和电视库等数据的访问权限。
谷歌 DeepMind 部门与 A24 的合作旨在为电影制作与发行流程开发新工具。A24 负责技术与创新的合伙人 Scott Belsky 表示,目前的 AI 开发者过于强调通过技术降低电影制作成本和缩短周期,这并不吸引电影人。Belsky 认为应当利用 AI 保留创意控制权并支持创作冒险,双方联合开发的工具不会采用当前令许多创作者反感的提示词生成模式。
在 Belsky 去年从 Adobe 加入 A24 之前,双方就已经开始接触。Belsky 领导的 20 人团队 A24 Labs 正在开发一款 AI 分镜脚本生成应用,以帮助导演在正式开拍前通过粗略草图识别潜在问题。为了推进向全球化媒体公司扩张的战略,A24 正在制作旗下史上预算最高的电影项目,即由 Alex Garland 执导的《艾尔登法环》(Elden Ring)游戏改编电影,制作预算高达 1.75 亿美元。
谷歌注资金额与 Thrive Capital 2024 年投出的约 7500 万美元相当,当时 A24 估值为 35 亿美元。然而,拥抱科技巨头也为 A24 带来潜在品牌声誉风险,A24 的核心声誉主要建立在与新兴导演及年轻观众的深度绑定上,而这部分受众普遍对科技公司和 AI 的社会影响持怀疑态度。
信源:https://www.wsj.com/tech/ai/google-investing-in-backrooms-studio-a24-e7585ebe
The Wall Street Journal
Exclusive | Google Investing in ‘Backrooms’ Studio A24
The search giant is putting about $75 million into the studio as part of an artificial intelligence research partnership.
OpenCLI App发布:推出免npm独立包,支持自动保持浏览器登录态
OpenCLI 近日上线了 OpenCLI App 桌面版应用,通过推出无需依赖 Node.js 或 npm 环境的独立安装包,降低了普通用户的使用门槛,并集成了自动刷新登录态等便捷功能。
OpenCLI 是一款将网页转化为命令行界面(CLI)并允许 AI 智能体调用浏览器进行自动化的工具。OpenCLI 支持在终端中用命令行直接浏览 Bilibili、知乎和 HackerNews;同时支持面向 Claude Code、Cursor 等 AI 编程助手提供桥接,让智能体直接在用户已登录的 Chrome 浏览器里模拟点击、填写表单、提取网页数据或截屏。
新发布的 OpenCLI App 桌面端整合了完整运行环境,并支持在系统托盘管理。用户无需命令行基础即可通过图形界面完成配置修改、运行诊断和版本更新,还能自动维持网页登录凭证长期有效,并提供将网页转为 Markdown 的实用工具。
信源:https://github.com/jackwener/opencli
OpenCLI 近日上线了 OpenCLI App 桌面版应用,通过推出无需依赖 Node.js 或 npm 环境的独立安装包,降低了普通用户的使用门槛,并集成了自动刷新登录态等便捷功能。
OpenCLI 是一款将网页转化为命令行界面(CLI)并允许 AI 智能体调用浏览器进行自动化的工具。OpenCLI 支持在终端中用命令行直接浏览 Bilibili、知乎和 HackerNews;同时支持面向 Claude Code、Cursor 等 AI 编程助手提供桥接,让智能体直接在用户已登录的 Chrome 浏览器里模拟点击、填写表单、提取网页数据或截屏。
新发布的 OpenCLI App 桌面端整合了完整运行环境,并支持在系统托盘管理。用户无需命令行基础即可通过图形界面完成配置修改、运行诊断和版本更新,还能自动维持网页登录凭证长期有效,并提供将网页转为 Markdown 的实用工具。
信源:https://github.com/jackwener/opencli
动察Beating AI News
【独家】时隔五年,招聘线索拼出完整版图:字节跳动正悄然重启手机研发 在关停坚果手机业务五年后,字节跳动正通过一种全新的形态,重新切入智能手机底层研发。 这一推论源自对字节跳动官方招聘系统全量岗位的拉网式数据梳理。比对数百个底层职位的具体职责后,事实非常明确:字节并非仅停留在开发轻量化的端侧 AI 应用,而是正在搭建一整套手机级软硬件底座;上层重构 Agent 交互与 Android/RTOS 系统,下层切入结构堆叠、基带、通信入网,并已深入到对齐代工厂产线的 NPI(新产品导入)试产阶段。 在硬件研…
字节新一代豆包手机因备案审批延迟发布,京东方、德赛、中诺等核心供应链曝光
中兴通讯与字节跳动联合研发的豆包 AI 手机已因合规审批流程受阻而延期发布。知情人士透露,这款手机在 2026 年 1 月启动备案认证流程,由于首轮申请未获通过,目前依然处于备案状态。新机上市须同时通过网信部门的大模型备案与工信部的手机入网认证,若后续审批顺利,最快将在 2026 年 7 月至 8 月面世,市场先前普遍预期在今年二季度发布。
与发布延期一同曝光的还有新机核心供应链细节。屏幕供应商从深天马更换为京东方。电池由德赛电池提供并采用 ATL 电芯,而德赛电池是苹果与三星电池管理系统的核心供应商。整机代工由 A 股上市公司福日电子旗下的中诺通讯承担,中诺通讯也是中兴通讯及努比亚的长期代工厂。
由于腾讯和阿里等平台尚未开放权限,新一代豆包手机目前无法跨应用调用数据。大平台的数据壁垒也导致 AI 手机走向不同的技术路线。追觅与 OpenAI 选择「去 App 化」,直接构建无 App 的原生 AI 操作系统。豆包手机则选择保留传统 App 的改良方案,将大模型深度植入系统底层,但这导致操作体验高度受制于外部平台是否开放数据。
信源:https://mp.weixin.qq.com/s/GgzkHF08B8fWpK7u_qQpvw
中兴通讯与字节跳动联合研发的豆包 AI 手机已因合规审批流程受阻而延期发布。知情人士透露,这款手机在 2026 年 1 月启动备案认证流程,由于首轮申请未获通过,目前依然处于备案状态。新机上市须同时通过网信部门的大模型备案与工信部的手机入网认证,若后续审批顺利,最快将在 2026 年 7 月至 8 月面世,市场先前普遍预期在今年二季度发布。
与发布延期一同曝光的还有新机核心供应链细节。屏幕供应商从深天马更换为京东方。电池由德赛电池提供并采用 ATL 电芯,而德赛电池是苹果与三星电池管理系统的核心供应商。整机代工由 A 股上市公司福日电子旗下的中诺通讯承担,中诺通讯也是中兴通讯及努比亚的长期代工厂。
由于腾讯和阿里等平台尚未开放权限,新一代豆包手机目前无法跨应用调用数据。大平台的数据壁垒也导致 AI 手机走向不同的技术路线。追觅与 OpenAI 选择「去 App 化」,直接构建无 App 的原生 AI 操作系统。豆包手机则选择保留传统 App 的改良方案,将大模型深度植入系统底层,但这导致操作体验高度受制于外部平台是否开放数据。
信源:https://mp.weixin.qq.com/s/GgzkHF08B8fWpK7u_qQpvw
QQ邮箱开启专为AI智能体打造的Agently Mail内测
QQ邮箱正式开启专为AI智能体(Agent)设计的专属邮箱「Agently Mail」内测。新邮箱与用户个人或企业邮箱的数据完全隔离,允许AI使用独立身份进行邮件收发、搜索和附件处理,避免AI因误删、错发或过度读取对用户个人隐私造成安全威胁。
除了作为安全的隔离沙箱,Agently Mail还可作为智能体的数字身份证,支持自主注册第三方平台、接收验证码,或者在企业间自动完成询价、报价与订单对接等全流程自动化协作。目前,Agently Mail已支持WorkBuddy、QClaw、Marvis、OpenClaw、Claude Code、Kimi Work、豆包超能模式、Codex、Hermes和Cursor等主流智能体平台。
用户只需在智能体对话窗口中发送指令并扫码授权,即可完成 Agently Mail CLI 的安装与配置。智能体在连接后可基于对话指令或预设工作流,执行发票自动报销、订阅邮件摘要整理、全网简历投递以及订单数据录入等规则化工作。
信源:https://mp.weixin.qq.com/s/GXEoe9K8XeZznWp5o494Ww
QQ邮箱正式开启专为AI智能体(Agent)设计的专属邮箱「Agently Mail」内测。新邮箱与用户个人或企业邮箱的数据完全隔离,允许AI使用独立身份进行邮件收发、搜索和附件处理,避免AI因误删、错发或过度读取对用户个人隐私造成安全威胁。
除了作为安全的隔离沙箱,Agently Mail还可作为智能体的数字身份证,支持自主注册第三方平台、接收验证码,或者在企业间自动完成询价、报价与订单对接等全流程自动化协作。目前,Agently Mail已支持WorkBuddy、QClaw、Marvis、OpenClaw、Claude Code、Kimi Work、豆包超能模式、Codex、Hermes和Cursor等主流智能体平台。
用户只需在智能体对话窗口中发送指令并扫码授权,即可完成 Agently Mail CLI 的安装与配置。智能体在连接后可基于对话指令或预设工作流,执行发票自动报销、订阅邮件摘要整理、全网简历投递以及订单数据录入等规则化工作。
信源:https://mp.weixin.qq.com/s/GXEoe9K8XeZznWp5o494Ww
企业微信内测工作流AI助理「大圆」:向左轻滑唤起,首推「服务总结」切入私域客群盘点
企业微信开启了名为「大圆」的 AI Agent 内测。相较于独立的 AI 工具,「大圆」深度嵌入企业微信工作流,支持直接读取并分析群聊、文档、会议、邮件及日程等内部协作数据,在不要求用户重复提供上下文的前提下自动理解诉求。
在移动端,用户可在任意消息页或对话框中向左轻滑唤起「大圆」以识别当前界面内容。例如在消息密集的群聊中左滑可直接询问群聊讨论要点,在接收复杂数据报表时可一键总结数据结论。
目前处于灰度测试的「服务总结」功能可在员工与客户沟通过程中自动提取客户需求、成交意向与痛点,并定时推送跟进建议。在管理层面,客户群及客户信息可自动沉淀至「AI 智能表格」形成统一管理中枢,大模型不仅能归纳客户跟进情况,还能生成可视化分析仪表盘,拆解转化漏斗与服务质量。
信源:https://mp.weixin.qq.com/s/bVO4-HGKS1WU83THLiK2pg
企业微信开启了名为「大圆」的 AI Agent 内测。相较于独立的 AI 工具,「大圆」深度嵌入企业微信工作流,支持直接读取并分析群聊、文档、会议、邮件及日程等内部协作数据,在不要求用户重复提供上下文的前提下自动理解诉求。
在移动端,用户可在任意消息页或对话框中向左轻滑唤起「大圆」以识别当前界面内容。例如在消息密集的群聊中左滑可直接询问群聊讨论要点,在接收复杂数据报表时可一键总结数据结论。
目前处于灰度测试的「服务总结」功能可在员工与客户沟通过程中自动提取客户需求、成交意向与痛点,并定时推送跟进建议。在管理层面,客户群及客户信息可自动沉淀至「AI 智能表格」形成统一管理中枢,大模型不仅能归纳客户跟进情况,还能生成可视化分析仪表盘,拆解转化漏斗与服务质量。
信源:https://mp.weixin.qq.com/s/bVO4-HGKS1WU83THLiK2pg
OpenAI机密IPO文件曝光:6650亿表外承诺撑起的「轻资产」故事
The Information 独家获取并审阅了 OpenAI 递交的机密 IPO 注册申请草案。招股书的详细财务附注显示,截至 2026 年 3 月 31 日,OpenAI 的资产负债表极像一家轻资产的软件公司,账面零债务,租约负债不足 7.5 亿美元,单季资本支出仅 4600 万美元(甚至低于企业软件服务商 Salesforce)。
但实际上,OpenAI 将庞大的基础设施开支留在了表外,未来的芯片、能源与数据中心采购承诺高达 6650 亿美元。第一季度实际净亏损仍高达约 85 亿美元(尚未计入因估值飙升而暴涨的认股权证非现金会计开支),而单季营收成本达 35 亿美元,是资本支出的 75 倍。
OpenAI 呈现出极高的资金体内循环特征。第一季度 OpenAI 营收成本中的 72% 以及总支出的 45% 都支付给了关联方(主要或很可能为微软)。同期 OpenAI 从关联方获得 7.58 亿美元营收(达到去年同期的 12 倍),并直接用价值 4.88 亿美元的股权来结算算力账单,全程未动用现金。
庞大的表外采购承诺与复杂的表内合资结构进一步增加了 OpenAI 财务透明度的穿透难度。损益表显示,在 OpenAI 控制并合并报表的数据中心合资项目(大概率与软银和甲骨文合作的 Stargate 项目相关)中,第一季度有将近 50 亿美元的亏损在会计上归属于外部合伙人。
同样在进行表外扩张的还有竞争对手 Anthropic。文件显示,Anthropic 承诺在未来几年内向数据中心服务商 Fluidstack 支付 45 亿美元,并由芯片供应商博通为 Anthropic 向谷歌租赁的 350 亿美元芯片订单提供付款担保。
信源:https://www.theinformation.com/articles/openais-light-balance-sheet-face-hard-look-ipo
The Information 独家获取并审阅了 OpenAI 递交的机密 IPO 注册申请草案。招股书的详细财务附注显示,截至 2026 年 3 月 31 日,OpenAI 的资产负债表极像一家轻资产的软件公司,账面零债务,租约负债不足 7.5 亿美元,单季资本支出仅 4600 万美元(甚至低于企业软件服务商 Salesforce)。
但实际上,OpenAI 将庞大的基础设施开支留在了表外,未来的芯片、能源与数据中心采购承诺高达 6650 亿美元。第一季度实际净亏损仍高达约 85 亿美元(尚未计入因估值飙升而暴涨的认股权证非现金会计开支),而单季营收成本达 35 亿美元,是资本支出的 75 倍。
OpenAI 呈现出极高的资金体内循环特征。第一季度 OpenAI 营收成本中的 72% 以及总支出的 45% 都支付给了关联方(主要或很可能为微软)。同期 OpenAI 从关联方获得 7.58 亿美元营收(达到去年同期的 12 倍),并直接用价值 4.88 亿美元的股权来结算算力账单,全程未动用现金。
庞大的表外采购承诺与复杂的表内合资结构进一步增加了 OpenAI 财务透明度的穿透难度。损益表显示,在 OpenAI 控制并合并报表的数据中心合资项目(大概率与软银和甲骨文合作的 Stargate 项目相关)中,第一季度有将近 50 亿美元的亏损在会计上归属于外部合伙人。
同样在进行表外扩张的还有竞争对手 Anthropic。文件显示,Anthropic 承诺在未来几年内向数据中心服务商 Fluidstack 支付 45 亿美元,并由芯片供应商博通为 Anthropic 向谷歌租赁的 350 亿美元芯片订单提供付款担保。
信源:https://www.theinformation.com/articles/openais-light-balance-sheet-face-hard-look-ipo
The Information
How OpenAI’s Web of Business Relationships Could Complicate Its IPO
Few companies have gone public with books as unusual as OpenAI’s. At first glance, the company portrayed by the AI startup’s financial statements, reviewed by The Information, resembles a lean, low-debt software business. Its balance sheet, as at March 31…
动察Beating AI News
删除缓存也扣款、零输出也计费:谷歌Gemini API爆天价「幽灵账单」漏洞 近期,谷歌 AI 开发者论坛曝出多起关于 Gemini API 计费系统失控的紧急求助。多名开发者在正常使用过程中,因系统底层漏洞面临巨额的异常扣款,例如有人在短短 12 小时内被扣掉超 2 万巴西雷亚尔(折合人民币约 2.7 万元)。目前,谷歌账单与技术团队仍在此事上相互推诿,未发布任何官方修复声明或快捷退款通道。 经调查,导致开发者天价账单的主要是两大核心 Bug:一是「幽灵缓存」漏洞,开发者通过 API 创建的上下文缓…
谷歌Gemini启用Interactions API:重构智能体,终结「幽灵账单」
谷歌正式在 Gemini API 和 Google AI Studio 中将 Interactions API 设为默认接口,原有接口
最直接的好处是省钱省力。由于服务器端会自动保存对话状态,多轮聊天时客户端只需发送上一步的交互 ID,谷歌就能自动复用并提高缓存命中率,大幅削减 Token 费用。对于代码沙盒运行或深度搜索等耗时任务,开发者可以开启后台模式,让工作在后台异步跑完。另外,模型思考、工具调用等中间步骤完全可视,便于实时排查智能体运行中的 Bug。
底层的重构直接解决了 6 月初爆出的计费危机。当时,手动删除缓存后由于云端同步延迟,已注销的资源仍在后台空转,导致部分账户在 12 小时内被异常扣除近 2.7 万元人民币。另外,模型在联网检索时容易陷入思维死循环,在没有任何回答的「零输出」状态下,依然按 6.4 万个 Token 满额计费。Interactions API 改用服务器托管的「隐式缓存」取代手动删除,并允许开发者监控并中止
由于谷歌未来的前沿模型和智能体功能(例如 Deep Research)都将仅支持 Interactions API,官方建议开发者尽早完成适配。
信源:https://x.com/GoogleAIStudio/status/2069108412453908791
谷歌正式在 Gemini API 和 Google AI Studio 中将 Interactions API 设为默认接口,原有接口
generateContent 进入维护期。新接口会将多轮对话、模型思考、工具调用和执行结果统一打包,并在服务器端存为 Interaction 资源。最直接的好处是省钱省力。由于服务器端会自动保存对话状态,多轮聊天时客户端只需发送上一步的交互 ID,谷歌就能自动复用并提高缓存命中率,大幅削减 Token 费用。对于代码沙盒运行或深度搜索等耗时任务,开发者可以开启后台模式,让工作在后台异步跑完。另外,模型思考、工具调用等中间步骤完全可视,便于实时排查智能体运行中的 Bug。
底层的重构直接解决了 6 月初爆出的计费危机。当时,手动删除缓存后由于云端同步延迟,已注销的资源仍在后台空转,导致部分账户在 12 小时内被异常扣除近 2.7 万元人民币。另外,模型在联网检索时容易陷入思维死循环,在没有任何回答的「零输出」状态下,依然按 6.4 万个 Token 满额计费。Interactions API 改用服务器托管的「隐式缓存」取代手动删除,并允许开发者监控并中止
thought 步骤,提供了更安全的计费防御。由于谷歌未来的前沿模型和智能体功能(例如 Deep Research)都将仅支持 Interactions API,官方建议开发者尽早完成适配。
信源:https://x.com/GoogleAIStudio/status/2069108412453908791
X (formerly Twitter)
Google AI Studio (@GoogleAIStudio) on X
Interactions API: Our primary interface for Gemini models and agents
传前DeepSeek核心成员主导,百度开源3B文档解析模型Unlimited OCR
百度开源文档智能解析大模型 Unlimited-OCR 并发布技术报告。报告署名显示,项目技术总监为化名「YY」的神秘成员。业内广泛猜测,「YY」的真实身份为前 DeepSeek-OCR 核心作者魏浩然。Unlimited-OCR 模型也正是基于 DeepSeek-OCR 底座构建而成。
Unlimited-OCR 在长文档解析基准测试 OmniDocBench v1.6 中取得 93.92% 的得分,刷新端到端 SOTA 纪录。传统的文档解析大模型在处理多页长文本时,往往因为键值缓存 KV cache 的线性暴涨,导致运行速度大幅变慢并消耗极多显存。
为了解决变慢的难题,百度引入参考滑动窗口注意力机制 R-SWA。在解码生成文本时,模型仅关注所有图像特征与近期固定窗口(默认 128 个 Token)的已生成文本,从而将 KV cache 总体积上限锁定为常数。R-SWA 既避免了图像细节随窗口淘汰而模糊,又保证了推理速度与显存消耗在解析长达 40 页以上的文档时保持恒定,测试中较 DeepSeek-OCR 提速 12.7%。
目前,百度已采用 MIT 协议开源 Unlimited-OCR 的代码与权重,支持 Hugging Face Transformers、vLLM、SGLang 等主流引擎,其中 SGLang 已支持针对 R-SWA 的缓存优化。未来团队计划将参考滑动窗口注意力推广至语音识别 ASR 和翻译等其他参考型任务中。
信源:https://arxiv.org/abs/2606.23050
百度开源文档智能解析大模型 Unlimited-OCR 并发布技术报告。报告署名显示,项目技术总监为化名「YY」的神秘成员。业内广泛猜测,「YY」的真实身份为前 DeepSeek-OCR 核心作者魏浩然。Unlimited-OCR 模型也正是基于 DeepSeek-OCR 底座构建而成。
Unlimited-OCR 在长文档解析基准测试 OmniDocBench v1.6 中取得 93.92% 的得分,刷新端到端 SOTA 纪录。传统的文档解析大模型在处理多页长文本时,往往因为键值缓存 KV cache 的线性暴涨,导致运行速度大幅变慢并消耗极多显存。
为了解决变慢的难题,百度引入参考滑动窗口注意力机制 R-SWA。在解码生成文本时,模型仅关注所有图像特征与近期固定窗口(默认 128 个 Token)的已生成文本,从而将 KV cache 总体积上限锁定为常数。R-SWA 既避免了图像细节随窗口淘汰而模糊,又保证了推理速度与显存消耗在解析长达 40 页以上的文档时保持恒定,测试中较 DeepSeek-OCR 提速 12.7%。
目前,百度已采用 MIT 协议开源 Unlimited-OCR 的代码与权重,支持 Hugging Face Transformers、vLLM、SGLang 等主流引擎,其中 SGLang 已支持针对 R-SWA 的缓存优化。未来团队计划将参考滑动窗口注意力推广至语音识别 ASR 和翻译等其他参考型任务中。
信源:https://arxiv.org/abs/2606.23050
击穿万亿参数大模型强化学习门槛:开源prime-rl让28台服务器训动131k上下文
Prime Intellect 发布分布式强化学习训练框架 prime-rl 0.6.0 版本,攻克了万亿参数混合专家模型 MoE 在超长上下文智能体任务下的强化学习 RL 训练门槛。
大模型能读完 256k 的超长文本并不罕见,但在强化学习训练中,为了让模型通过自主试错进行推理演练,显卡必须全程保存 131k 长度下庞大的中间激活值,显存开销呈成百上千倍暴涨。此前这需要数千张显卡构成的庞大集群,而 prime-rl 0.6.0 仅用 28 台 H200 服务器就跑通了 GLM-5 的 131k 上下文强化学习训练,单步耗时控制在 5 分钟内。
为解决复杂代码生成等试错任务中,极少数长尾耗时任务阻塞全局步调导致显卡资源长期闲置的问题,框架打破了传统的同步等待机制,采用完全解耦的异步 RL 架构。后台训练器在计算出新权重后,无须等待正在进行的试错任务结束,直接在模型生成文本期间实时下发更新。已分发的任务继续使用旧策略以保证速度,新任务则注入 KV-cache 盐强行重建缓存。针对异步更新中训练与推理步调不一致容易导致模型逻辑混乱的问题,框架引入路由重放 R3 技术,直接在底层处理专家分发数据,规避了数据转换带来的系统延迟,将两端的不匹配度降低至十分之一,极大稳定了异步训练。
在底层资源压榨上,框架通过精细设计彻底解决了显卡显存被长文本撑爆的痛点。推理端采用读与写计算分离的架构,防止大模型因阅读大量前情提示而卡死后续的文本生成;同时联合多张显卡共享专家知识,并利用 Mooncake 技术把多台服务器的闲置内存和硬盘拼成一个共享缓存池。在超长文本的并行计算上,针对 GLM-5 独特的 DSA 稀疏注意力机制,框架定制了专属的并行方案,在确保模型能纵览全局的同时,将每层显卡间的数据通信开销缩减至仅有一次。
在精度对齐上,训练端与推理端被统一接入 DeepGEMM 算子库,运行 DeepSeek V3 提出的块缩放 FP8 方案。由于两端调用了完全相同的低精度乘法内核,计算结果分毫不差,从根本上消除了导致训练崩溃的精度偏差。
信源:https://primeintellect.ai/blog/rl-at-1t-scale
Prime Intellect 发布分布式强化学习训练框架 prime-rl 0.6.0 版本,攻克了万亿参数混合专家模型 MoE 在超长上下文智能体任务下的强化学习 RL 训练门槛。
大模型能读完 256k 的超长文本并不罕见,但在强化学习训练中,为了让模型通过自主试错进行推理演练,显卡必须全程保存 131k 长度下庞大的中间激活值,显存开销呈成百上千倍暴涨。此前这需要数千张显卡构成的庞大集群,而 prime-rl 0.6.0 仅用 28 台 H200 服务器就跑通了 GLM-5 的 131k 上下文强化学习训练,单步耗时控制在 5 分钟内。
为解决复杂代码生成等试错任务中,极少数长尾耗时任务阻塞全局步调导致显卡资源长期闲置的问题,框架打破了传统的同步等待机制,采用完全解耦的异步 RL 架构。后台训练器在计算出新权重后,无须等待正在进行的试错任务结束,直接在模型生成文本期间实时下发更新。已分发的任务继续使用旧策略以保证速度,新任务则注入 KV-cache 盐强行重建缓存。针对异步更新中训练与推理步调不一致容易导致模型逻辑混乱的问题,框架引入路由重放 R3 技术,直接在底层处理专家分发数据,规避了数据转换带来的系统延迟,将两端的不匹配度降低至十分之一,极大稳定了异步训练。
在底层资源压榨上,框架通过精细设计彻底解决了显卡显存被长文本撑爆的痛点。推理端采用读与写计算分离的架构,防止大模型因阅读大量前情提示而卡死后续的文本生成;同时联合多张显卡共享专家知识,并利用 Mooncake 技术把多台服务器的闲置内存和硬盘拼成一个共享缓存池。在超长文本的并行计算上,针对 GLM-5 独特的 DSA 稀疏注意力机制,框架定制了专属的并行方案,在确保模型能纵览全局的同时,将每层显卡间的数据通信开销缩减至仅有一次。
在精度对齐上,训练端与推理端被统一接入 DeepGEMM 算子库,运行 DeepSeek V3 提出的块缩放 FP8 方案。由于两端调用了完全相同的低精度乘法内核,计算结果分毫不差,从根本上消除了导致训练崩溃的精度偏差。
信源:https://primeintellect.ai/blog/rl-at-1t-scale
www.primeintellect.ai
RL at 1T Scale: prime-rl Performance Deep Dive
prime-rl 0.6.0 trains trillion-parameter MoE models on heavy agentic workloads at the highest efficiency. A deep dive into the inference and training optimizations behind it — from FP8 and wide expert parallelism to P/D disaggregation, router replay, and…
❤1