互联网从业者充电站

Forwarded from Post Bot

1:17

Media is too big

VIEW IN TELEGRAM

😂

⚡️

永久网址

❤️

： 1820036.com

豪礼大放送高端嫩模劳力士手表奔驰E300等大礼等你来豪夺每笔存款加赠 1%

❤️

🏆182体育封神榜🏆
4.11号神秘大哥PG电子赏金女王一举斩获830万并成功提现
4.5号东南亚盘总PA真人百家豪赢644万一路长虹一天实现暴富
3.28号实力大哥PG电子爆出890万并以成功提现实现财富自由
截止到3.23号大哥在PA真人百家乐累计盈利突破1000万

1️⃣ 平台公平、公正、公开，信誉第一、服务第一
2️⃣ 免实名不限ip 无需绑定手机号码和银行卡
3️⃣ u存u提每日提款无上限 资金保障、大额无忧
平台😁😀 😚🙁 😛☺️ 😉😋以及多种电子钱包存取款、大额出款无忧 （您的最佳选择，欢迎体验）

大额出款额外奖励8888-128888，双重日存彩金128888+4688每日送，周流水彩金68888每周送，双重签到彩金16888+3888送不停

每日存款彩金每日送，每笔存款加赠

🔤

1️⃣

182体育 #无风控 电子真人零审核包出款

🌐 官网注册链接： 1820036.com

🍎专属VIP客服： @vipkf_182ty8
⚽️ 体育赛事推荐：@VIP182TYTJ
➡️ 双向用户点击： @vipkf_182ty2_bot
🍉 吃瓜搞笑：@chiguagaoxiaoxinwen
✅ 更多优惠活动关注福利频道： @vip182ty888

🏆代理合营🏆
新平台新机遇好发展佣金稳
代理合营频道：@DLHY182TY

Please open Telegram to view this post

VIEW IN TELEGRAM

🤡2

97 views16:02

182体育PG电子放水

互联网从业者充电站

Forwarded from Post Bot

😈👿👹👺🤡💩

🤩

美 · 加 · 墨

😀

🏆

世界杯指定官网：

😀

6G.com

😔

全球同步赛事热潮，与世界球迷共同狂欢

😂

世界杯专属礼遇:
😔 世界杯狂欢开启，投注即领16U
😄 新人 · 首存豪礼返利
🔤 每月逢 6 现金大反馈

👩‍❤️‍👨

👩‍❤️‍👩

💑

👨‍❤️‍👨

👩‍❤️‍💋‍👨

🪢

🧶

🧵

🪡

🧥

🔥

上押1000万U+

💵

亿万储备金

🌊

世界杯大额秒提，放心畅玩！

😃 爆庄实录｜3天狂揽1086万U
😃 新客首存6万U，豪提209万U
😃 500一拉，PG实力兑现133万U

😀 彩票入口： 6G.COM
🌟 加拿大 · PC28 · 超高赔率

🇭🇰

香港六合彩,特码 💦💦 倍

1️⃣1️⃣1️⃣1️⃣ 6G.com
😕1️⃣1️⃣1️⃣ @AA6G
1️⃣1️⃣1️⃣1️⃣ @KF6G
1️⃣1️⃣1️⃣1️⃣ www6gvip

🌟

四年一度足球盛宴，黑马、绝杀、荣耀时刻，6G与你共燃世界杯！

Please open Telegram to view this post

VIEW IN TELEGRAM

🤡2

124 views16:04

🔥 6G.com大品牌

互联网从业者充电站

据说微软和英伟达搞的什么什么下一代电脑，就是把GB10（就我之前那两个小黑盒的GPU）腾挪到这个电脑里了，芯片设计是联发科和英伟达一起搞的，系统是个Windows in Arm（第一个槽点🌚）

预计发布的联想电脑，内存可能分32GB和64GB两种（第二个槽点🌚）。前面提到的GB10迷你主机DGX Spark， GPU带宽特别低，不超过300，胜在统一内存大，有128GB。同架构搞到这个N1X芯片上，内存还这么点，不知道能干嘛。（不过据说有128版本）

最重要的是，这台电脑，预计售价15万新台币…（第三个槽点🌚）

114 views17:22

互联网从业者充电站

互联网充电｜优质资源
优质内容｜内幕消息

😁1

102 views17:39

互联网从业者充电站

以后的互联网公司的组成是，一个ceo和一堆会写程序的机器人。

这是张小龙2011-01-10 15:05 通过网页发布的饭否

😂

91 views18:08

互联网从业者充电站

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

#出海运营秘籍👉@yunying23

顶美激情❤️‍🔥直播，躲在她家激情❤️‍🔥撸狗

46 views21:19

互联网从业者充电站

读了费曼物理学讲义，我觉得博主写的太复杂了
我跟费曼学习的这5年，就下面这个方法最有效，也很容易执行：
1. 建立连接：读大量的书，读大量的书，知识才扎实，才会在脑袋里形成足够的连接和想象力，费曼最牛逼的是类比想象力
2. 加深记忆：每本书的关键部分我都会拍照OCR或者手抄，读第一遍是了解的过程，抄第二遍核心是懂得的过程
3. 以讲代学：我喜欢懂得一个知识以后，公开通过博客或者社交媒体分享我的感悟，分享的这一步才是最重要的，分享就需要你重新按照自己的语言去重新组织，去向陌生人讲解深刻的道理，当你可以用类比的白再讲解一遍后，那就是融会贯通、顿悟的时刻
这就是我从费曼身上学习到最简单也是最有效的学习方法
配图是青海大环线的翡翠湖

互联网充电｜优质资源
优质内容｜内幕消息

❤1

42 views22:15

互联网从业者充电站

发现了一个比 Opus 4.8 更有分量的新模型。

临下班发现自变量机器人发布了一个新的世界模型，叫 WALL-WM。

我知道很多人的焦点是 Anthropic 发布的 Opus 4.8，但放眼整个 AGI 领域，WALL-WM 也很值得说一说，因为它认真挑战了一件大家一直默认、却很少有人质疑的事。

我也是看完论文才反应过来，今天绝大多数 VLA 和 WAM 模型，它们学习的基本单位，可能从一开始就没选对。

咱们慢慢说起。

先讨论一个特别普通的场景。吃完饭收拾桌子，我们脑子里其实有一份清单。拿起杯子，走到水池，放下。再回来拿起碗，叠到一起，端走。

这份清单里的每一项，都是一个完整的小动作，有头有尾。没有人会这么想：我先把手抬起来一点，再往前挪一截。人脑子里装的是一个个动作，不是一截一截的时间。

但可惜的是，机器人现在学习操作，恰恰是按时间一截一截在学的。这可能正是很多模型长任务容易出现卡点的地方，也是 WALL-WM 这个模型彻底想解决的问题。

1
今天教机器人干活，主流的做法是这样的。给它看一眼当前的画面，告诉它一句指令，让它输出接下来的一段动作。

这段动作有多长呢，是定死的，比如往后 16 步，或者 32 步。学完这一段，再看一眼画面，再输出下一段。一段一段往下滚。

这一段固定长度的动作，论文里叫动作块。

那这个动作块是按什么分出来的？其实是按一个固定的节拍。不管机器人正在干什么，到了第 16 步就断一次，到了第 32 步再断一次。

这就好比剪一段视频，不管里面演的是什么，掐着表每隔几秒钟断开一次。

也就是说，一个完整的抓取动作，伸手过去刚够到杯子，手指还没合拢，正好赶上分段，这个动作就被分成了两半。前半截留在这一块里，后半截被推到了下一块。

模型对着这种被切断、被混在一起的目标反复练，练到最后，记住的更多是局部的对应关系，而不是一个动作从头到尾本来的样子。

所以模型最后学会的，是一些零碎的局部规律。这一帧画面长这样，下一步手大概往这边动。它记住的是相关性，不是一个完整动作从头到尾的逻辑。

这就是为什么很多机器人看着会动，真换个稍微复杂点的活，或者把任务拼长一点，它就乱套了。它从来没有在完整动作这个层面上理解过世界。

WALL-WM 做的，是换了个分段的依据。不按固定节拍分，而是按动作本身分。

机器人世界里，本来就有一些天然成块的动作。伸手，抓取，抬起，移动，放下。这每一个都是一件有头有尾的完整事情，论文把它叫做事件，Event。

一个事件什么时候开始，什么时候结束，不看表，看这件事本身干完了没有。伸手这个事件，从手开始动，到够着了，就结束。

下一个事件抓取接上。整套训练数据，全部围着这些事件重新组织了一遍。

到这儿，很多人可能觉得，这不就是换了个整理数据的方式嘛，听着没那么了不起。

我一开始也这么想，后来越琢磨越觉得不是。这背后藏着的，是一套完全不一样的世界观。

过去大家默认的链条是这样的：看到画面，输出动作。一步到位。WALL-WM 把这个链条改成了：先有指令，指令拆成一个个事件，事件再落成具体动作。中间多了一层东西，叫事件空间。

这一层多得很关键。因为事件这个词，恰好能被三种东西同时看懂。语言能描述它，一句放下杯子，说的就是一个事件。

视频能拍到它，画面里手从抬起到松开，演的就是这个事件。动作能执行它，机械臂一套关节运动，做的也是这个事件。

这里还能再往深想一层。过去大家谈多模态，谈的总是怎么把语言、画面、动作这几样东西捏到一块。WALL-WM 的想法其实更进一步。

它发现这三样东西的麻烦，根上不在于捏不到一起，而在于它们本来就活在不同的时间尺度里。

语言说的是一件一件的事，一句话对应一个动作。视频要细得多，它得一帧一帧把事情怎么发生记下来。

到了动作这一层就更碎了，是毫秒级别的关节运动。一个比一个细，节奏天生对不齐，硬塞进同一个固定长度里，自然别扭。而事件，恰好是这三样都认得的那个交汇点。

语言、画面、动作，本来是三套互相对不上的东西，现在有了事件这个共同的单位，三方第一次能在同一个地方碰头了。

这是 WALL-WM 整篇论文最有意思的地方。分段的依据，决定了这个模型到底是在背规律，还是在理解行为。

2
刚才说语言、画面、动作这三方，第一次能在事件这个地方交汇。

可仔细想想，这三方里头，画面凭什么当那个中间人。这就得说说语言和动作之间的鸿沟。

语言太抽象了。一句把杯子放到桌上，七个字，里面藏着多少东西。

手伸多远，用多大劲，杯子歪了怎么扶，桌子边缘在哪。这些语言一个字都没说。

动作又太具体了。机械臂每个关节在每一小段时间里转了多少度，是一长串冰冷的数字。

可这串数字本身不告诉你它在干嘛，看半天也看不出这是在放杯子还是在擦桌子。

一边太虚，一边太实，中间怎么搭桥。

WALL-WM 的答案是视频。视频这个东西妙就妙在，它正好卡在中间。

往抽象那头看，视频是有意思的。画面里手抬起来，靠近杯子，松开，这一连串变化，对应的就是放下这个意思，跟语言能对上。往具体那头看，视频又是连续的，密的。

它一帧一帧记下了手是怎么慢慢移过去的，什么时候碰到了杯子，碰到之后杯子有没有晃。

这些时间上的先后，物理上的因果，动作执行最需要的恰恰就是这些。视频既听得懂语言在说什么，又看得见动作该怎么落地。

这是第二个值得停下来让我琢磨的地方。

现在很多做机器人的团队，思路是这样的。先拿一个现成的看图说话模型，它已经会看图、会理解语言了。

然后在后面接一个负责输出动作的部件，拿机器人的数据训一训，齐活。

WALL-WM 的看法不太一样。它认为视频模型里真正值钱的东西，根本不是会生成画面这个本事。

一个视频模型能把没发生的画面画出来，看着挺唬人，但那不是重点。

重点是，视频在学怎么把画面画对的过程中，顺带摸清了这个世界的一些基本规矩。东西没托住会往下掉，手推一下杯子杯子会跟着动，水倒太满会溢出来。

要把这些画得不露馅，它就得先搞懂背后是怎么回事。这些没人专门教过它，是看了海量视频之后自己琢磨出来的常识。

这些常识，才是机器人最缺的（大家可以往前翻，之前我也写过这个逻辑）。

一个机器人如果只靠自己那点操作数据来学世界怎么运转，太慢也太贵了，得在真机上反复试错，磕磕碰碰。可视频模型已经从互联网上无数段画面里，把这份常识攒下来了。

其实利用视频里这份世界知识，整个世界模型方向这两年都在做，不算新鲜。WALL-WM 的不一样在于，它搬运这份知识的时候，不是直接落到动作上，而是先把它组织到事件这一层，再落到动作上。

让机器人不用从零开始撞墙，而是站在视频已经摸清的世界规律上，再去学怎么动手。

所以这一部分记住一句话就够了。视频不是用来生成好看画面的，视频可能是机器人借用真实世界经验的一条近路。

3
视频这座桥搭好了，按事件训练的路也通了，可还剩最后一个问题。想法再好，落不了地也白搭。

按事件来训练，是 WALL-WM 的根。但现实是，外面跑着的机器人系统，绝大多数还是按固定动作块那套来设计的。

整套部署的流程，硬件的节拍，都是围着块转的。如果新模型非得把人家整套系统推倒重来才能用，那再好的想法，愿意接的人也不多。

WALL-WM 在这儿做了个挺聪明的设计。它从同一个训练好的底子上，分出了两种干活的方式，谁也不耽误谁。

第一种适合多步骤的长任务。机器人要完成一个大任务，比如收拾一整张桌子，由一个负责动脑子的部件先想好下一步要做哪件事，告诉机器人一句，把杯子放到架子上。

机器人就老老实实把这一整件事从头干到尾，伸手、抓、抬、移、放，一气呵成。干完了，回头看一眼现在桌上什么情况，再领下一件事。

它跟着任务本身的节奏走，一件事该用多久就用多久，不被那个生硬的固定步数打断。

任务越长，这种方式的优势越明显，因为它每次心里装的都是一件完整的事，不会走着走着忘了自己原本要干嘛。

第二种是为了照顾老系统。它表面上还是按原来那套固定块的方式在推理，外面的系统感觉不到什么变化，照样能接。但里子换了。

它不再是看一眼画面就硬猜下一块动作，而是先让那个动脑子的部件在背后过一遍，想清楚现在整个任务进行到哪一步了，接下来该是个什么事件，把这个判断当成方向，再去生成下一块具体动作。表面没变，脑子里多了一层对事件的盘算。

有了这套设计之后，WALL-WM 就能平滑地接进现有的系统里。

写到这儿我突然冒出一个念头。

绕了这么大一圈，WALL-WM 真正在做的事，其实是让机器人开始用人的方式去理解世界。

就像开头说的那个收拾硕子的例子，我们做家务的时候，天生就是按照事件为单位在行动。

可过去这些年，我们却一直逼着机器人按机器的节拍去学，掐着固定的步数，把一个个完整的动作切得七零八落。

所以这篇论文最打动我的，不是哪个具体的设计有多巧，而是它回到了最根上问了一句，我们一开始让机器人分段的那个依据，是不是从头就选错了。

35 views22:54

About

Blog

Apps

Platform