互联网从业者充电站
29.1K subscribers
24.7K photos
955 videos
851 files
14K links
互联网从业者专属
内容多为技术、产品、设计、运营等不同话题内容;
目标人群为程序员、设计师、产品经理、运营管理等不同职能。
投稿/合作: @inside1024_bot


内容来源网络
Download Telegram
Forwarded from Post Bot
Media is too big
VIEW IN TELEGRAM
😂😂😂😂😂😂😂😂 ⚡️⚡️⚡️⚡️⚡️⚡️⚡️⚡️⚡️⚡️

永久网址❤️❤️❤️❤️1820036.com

豪礼大放送 高端嫩模 劳力士手表 奔驰E300等大礼等你来豪夺 每笔存款加赠 1%

❤️❤️ ❤️❤️ ❤️❤️ ❤️❤️ ❤️❤️ ❤️❤️ ❤️❤️
🏆182体育 封神榜🏆
4.11号神秘大哥PG电子赏金女王一举斩获830万并成功提现
4.5号东南亚盘总PA真人百家豪赢644万一路长虹一天实现暴富
3.28号实力大哥PG电子爆出890万并以成功提现实现财富自由
截止到3.23号大哥在PA真人百家乐累计盈利突破1000万

1️⃣ 平台公平、公正、公开,信誉第一、服务第一
2️⃣ 免实名 不限ip 无需绑定手机号码和银行卡

3️⃣ u存u提 每日提款无上限 资金保障、大额无忧
平台
😁😀 😚🙁 😛☺️ 😉😋以及多种电子钱包存取款、大额出款无忧 (您的最佳选择,欢迎体验)

大额出款额外奖励8888-128888,双重日存彩金128888+4688每日送,周流水彩金68888每周送,双重签到彩金16888+3888送不停

每日存款彩金每日送,每笔存款加赠
🔤1️⃣
182体育 #无风控 电子真人零审核包出款

🌐 官网注册链接: 1820036.com

🍎专属VIP客服: @vipkf_182ty8
⚽️ 体育赛事推荐:@VIP182TYTJ
➡️ 双向用户点击: @vipkf_182ty2_bot
🍉 吃瓜搞笑:@chiguagaoxiaoxinwen
更多优惠活动关注福利频道: @vip182ty888

🏆代理合营🏆
新平台 新机遇 好发展 佣金稳
代理合营频道:
@DLHY182TY
Please open Telegram to view this post
VIEW IN TELEGRAM
🤡2
Forwarded from Post Bot
😈👿👹👺🤡💩

🤩🤩 美 · 加 · 墨 😀😀😀😀
🏆 世界杯指定 官网:😀 6G.com
😔 全球同步赛事热潮,与世界球迷共同狂欢

😂 世界杯专属礼遇:
😔 世界杯狂欢开启,投注即领16U
😄 新人 · 首存豪礼返利
🔤 每月逢 6 现金大反馈

👩‍❤️‍👨👩‍❤️‍👩💑👨‍❤️‍👨👩‍❤️‍💋‍👨🪢🧶🧵🪡🧥
🔥 上押1000万U+ 💵亿万储备金
🌊 世界杯大额秒提,放心畅玩!
😃 爆庄实录|3天狂揽1086万U
😃 新客首存6万U,豪提209万U
😃 500一拉,PG实力兑现133万U


😀 彩票入口: 6G.COM
🌟 加拿大 · PC28 · 超高赔率
🇭🇰 香港六合彩,特码 💦💦

1️⃣1️⃣1️⃣1️⃣ 6G.com
😕1️⃣1️⃣1️⃣ @AA6G
1️⃣1️⃣1️⃣1️⃣ @KF6G
1️⃣1️⃣1️⃣1️⃣ www6gvip
🌟 四年一度足球盛宴,黑马、绝杀、荣耀时刻,6G与你共燃世界杯!
Please open Telegram to view this post
VIEW IN TELEGRAM
🤡2
据说微软和英伟达搞的什么什么下一代电脑,就是把GB10(就我之前那两个小黑盒的GPU)腾挪到这个电脑里了,芯片设计是联发科和英伟达一起搞的,系统是个Windows in Arm(第一个槽点🌚

预计发布的联想电脑,内存可能分32GB和64GB两种(第二个槽点🌚)。前面提到的GB10迷你主机DGX Spark, GPU带宽特别低,不超过300,胜在统一内存大,有128GB。同架构搞到这个N1X芯片上,内存还这么点,不知道能干嘛。(不过据说有128版本)

最重要的是,这台电脑,预计售价15万新台币…(第三个槽点🌚
以后的互联网公司的组成是,一个ceo和一堆会写程序的机器人。

这是张小龙2011-01-10 15:05 通过网页发布的饭否

😂
This media is not supported in your browser
VIEW IN TELEGRAM
#出海运营秘籍👉@yunying23

顶美激情❤️‍🔥直播,躲在她家激情❤️‍🔥撸狗
读了费曼物理学讲义,我觉得博主写的太复杂了
我跟费曼学习的这5年,就下面这个方法最有效,也很容易执行:
1. 建立连接:读大量的书,读大量的书,知识才扎实,才会在脑袋里形成足够的连接和想象力,费曼最牛逼的是类比想象力
2. 加深记忆:每本书的关键部分我都会拍照OCR或者手抄,读第一遍是了解的过程,抄第二遍核心是懂得的过程
3. 以讲代学:我喜欢懂得一个知识以后,公开通过博客或者社交媒体分享我的感悟,分享的这一步才是最重要的,分享就需要你重新按照自己的语言去重新组织,去向陌生人讲解深刻的道理,当你可以用类比的白再讲解一遍后,那就是融会贯通、顿悟的时刻
这就是我从费曼身上学习到最简单也是最有效的学习方法
配图是青海大环线的翡翠湖

互联网充电优质资源
优质内容内幕消息
1
发现了一个比 Opus 4.8 更有分量的新模型。

临下班发现自变量机器人发布了一个新的世界模型,叫 WALL-WM。

我知道很多人的焦点是 Anthropic 发布的 Opus 4.8,但放眼整个 AGI 领域,WALL-WM 也很值得说一说,因为它认真挑战了一件大家一直默认、却很少有人质疑的事。

我也是看完论文才反应过来,今天绝大多数 VLA 和 WAM 模型,它们学习的基本单位,可能从一开始就没选对。

咱们慢慢说起。

先讨论一个特别普通的场景。吃完饭收拾桌子,我们脑子里其实有一份清单。拿起杯子,走到水池,放下。再回来拿起碗,叠到一起,端走。

这份清单里的每一项,都是一个完整的小动作,有头有尾。没有人会这么想:我先把手抬起来一点,再往前挪一截。人脑子里装的是一个个动作,不是一截一截的时间。

但可惜的是,机器人现在学习操作,恰恰是按时间一截一截在学的。这可能正是很多模型长任务容易出现卡点的地方,也是 WALL-WM 这个模型彻底想解决的问题。

1
今天教机器人干活,主流的做法是这样的。给它看一眼当前的画面,告诉它一句指令,让它输出接下来的一段动作。

这段动作有多长呢,是定死的,比如往后 16 步,或者 32 步。学完这一段,再看一眼画面,再输出下一段。一段一段往下滚。

这一段固定长度的动作,论文里叫动作块。

那这个动作块是按什么分出来的?其实是按一个固定的节拍。不管机器人正在干什么,到了第 16 步就断一次,到了第 32 步再断一次。

这就好比剪一段视频,不管里面演的是什么,掐着表每隔几秒钟断开一次。

也就是说,一个完整的抓取动作,伸手过去刚够到杯子,手指还没合拢,正好赶上分段,这个动作就被分成了两半。前半截留在这一块里,后半截被推到了下一块。

模型对着这种被切断、被混在一起的目标反复练,练到最后,记住的更多是局部的对应关系,而不是一个动作从头到尾本来的样子。

所以模型最后学会的,是一些零碎的局部规律。这一帧画面长这样,下一步手大概往这边动。它记住的是相关性,不是一个完整动作从头到尾的逻辑。

这就是为什么很多机器人看着会动,真换个稍微复杂点的活,或者把任务拼长一点,它就乱套了。它从来没有在完整动作这个层面上理解过世界。

WALL-WM 做的,是换了个分段的依据。不按固定节拍分,而是按动作本身分。

机器人世界里,本来就有一些天然成块的动作。伸手,抓取,抬起,移动,放下。这每一个都是一件有头有尾的完整事情,论文把它叫做事件,Event。

一个事件什么时候开始,什么时候结束,不看表,看这件事本身干完了没有。伸手这个事件,从手开始动,到够着了,就结束。

下一个事件抓取接上。整套训练数据,全部围着这些事件重新组织了一遍。

到这儿,很多人可能觉得,这不就是换了个整理数据的方式嘛,听着没那么了不起。

我一开始也这么想,后来越琢磨越觉得不是。这背后藏着的,是一套完全不一样的世界观。

过去大家默认的链条是这样的:看到画面,输出动作。一步到位。WALL-WM 把这个链条改成了:先有指令,指令拆成一个个事件,事件再落成具体动作。中间多了一层东西,叫事件空间。

这一层多得很关键。因为事件这个词,恰好能被三种东西同时看懂。语言能描述它,一句放下杯子,说的就是一个事件。

视频能拍到它,画面里手从抬起到松开,演的就是这个事件。动作能执行它,机械臂一套关节运动,做的也是这个事件。

这里还能再往深想一层。过去大家谈多模态,谈的总是怎么把语言、画面、动作这几样东西捏到一块。WALL-WM 的想法其实更进一步。

它发现这三样东西的麻烦,根上不在于捏不到一起,而在于它们本来就活在不同的时间尺度里。

语言说的是一件一件的事,一句话对应一个动作。视频要细得多,它得一帧一帧把事情怎么发生记下来。

到了动作这一层就更碎了,是毫秒级别的关节运动。一个比一个细,节奏天生对不齐,硬塞进同一个固定长度里,自然别扭。而事件,恰好是这三样都认得的那个交汇点。

语言、画面、动作,本来是三套互相对不上的东西,现在有了事件这个共同的单位,三方第一次能在同一个地方碰头了。

这是 WALL-WM 整篇论文最有意思的地方。分段的依据,决定了这个模型到底是在背规律,还是在理解行为。

2
刚才说语言、画面、动作这三方,第一次能在事件这个地方交汇。

可仔细想想,这三方里头,画面凭什么当那个中间人。这就得说说语言和动作之间的鸿沟。

语言太抽象了。一句把杯子放到桌上,七个字,里面藏着多少东西。

手伸多远,用多大劲,杯子歪了怎么扶,桌子边缘在哪。这些语言一个字都没说。

动作又太具体了。机械臂每个关节在每一小段时间里转了多少度,是一长串冰冷的数字。

可这串数字本身不告诉你它在干嘛,看半天也看不出这是在放杯子还是在擦桌子。

一边太虚,一边太实,中间怎么搭桥。

WALL-WM 的答案是视频。视频这个东西妙就妙在,它正好卡在中间。

往抽象那头看,视频是有意思的。画面里手抬起来,靠近杯子,松开,这一连串变化,对应的就是放下这个意思,跟语言能对上。往具体那头看,视频又是连续的,密的。

它一帧一帧记下了手是怎么慢慢移过去的,什么时候碰到了杯子,碰到之后杯子有没有晃。

这些时间上的先后,物理上的因果,动作执行最需要的恰恰就是这些。视频既听得懂语言在说什么,又看得见动作该怎么落地。

这是第二个值得停下来让我琢磨的地方。

现在很多做机器人的团队,思路是这样的。先拿一个现成的看图说话模型,它已经会看图、会理解语言了。

然后在后面接一个负责输出动作的部件,拿机器人的数据训一训,齐活。

WALL-WM 的看法不太一样。它认为视频模型里真正值钱的东西,根本不是会生成画面这个本事。

一个视频模型能把没发生的画面画出来,看着挺唬人,但那不是重点。

重点是,视频在学怎么把画面画对的过程中,顺带摸清了这个世界的一些基本规矩。东西没托住会往下掉,手推一下杯子杯子会跟着动,水倒太满会溢出来。

要把这些画得不露馅,它就得先搞懂背后是怎么回事。这些没人专门教过它,是看了海量视频之后自己琢磨出来的常识。

这些常识,才是机器人最缺的(大家可以往前翻,之前我也写过这个逻辑)。

一个机器人如果只靠自己那点操作数据来学世界怎么运转,太慢也太贵了,得在真机上反复试错,磕磕碰碰。可视频模型已经从互联网上无数段画面里,把这份常识攒下来了。

其实利用视频里这份世界知识,整个世界模型方向这两年都在做,不算新鲜。WALL-WM 的不一样在于,它搬运这份知识的时候,不是直接落到动作上,而是先把它组织到事件这一层,再落到动作上。

让机器人不用从零开始撞墙,而是站在视频已经摸清的世界规律上,再去学怎么动手。

所以这一部分记住一句话就够了。视频不是用来生成好看画面的,视频可能是机器人借用真实世界经验的一条近路。

3
视频这座桥搭好了,按事件训练的路也通了,可还剩最后一个问题。想法再好,落不了地也白搭。

按事件来训练,是 WALL-WM 的根。但现实是,外面跑着的机器人系统,绝大多数还是按固定动作块那套来设计的。

整套部署的流程,硬件的节拍,都是围着块转的。如果新模型非得把人家整套系统推倒重来才能用,那再好的想法,愿意接的人也不多。

WALL-WM 在这儿做了个挺聪明的设计。它从同一个训练好的底子上,分出了两种干活的方式,谁也不耽误谁。

第一种适合多步骤的长任务。机器人要完成一个大任务,比如收拾一整张桌子,由一个负责动脑子的部件先想好下一步要做哪件事,告诉机器人一句,把杯子放到架子上。

机器人就老老实实把这一整件事从头干到尾,伸手、抓、抬、移、放,一气呵成。干完了,回头看一眼现在桌上什么情况,再领下一件事。

它跟着任务本身的节奏走,一件事该用多久就用多久,不被那个生硬的固定步数打断。

任务越长,这种方式的优势越明显,因为它每次心里装的都是一件完整的事,不会走着走着忘了自己原本要干嘛。

第二种是为了照顾老系统。它表面上还是按原来那套固定块的方式在推理,外面的系统感觉不到什么变化,照样能接。但里子换了。

它不再是看一眼画面就硬猜下一块动作,而是先让那个动脑子的部件在背后过一遍,想清楚现在整个任务进行到哪一步了,接下来该是个什么事件,把这个判断当成方向,再去生成下一块具体动作。表面没变,脑子里多了一层对事件的盘算。

有了这套设计之后,WALL-WM 就能平滑地接进现有的系统里。

写到这儿我突然冒出一个念头。

绕了这么大一圈,WALL-WM 真正在做的事,其实是让机器人开始用人的方式去理解世界。

就像开头说的那个收拾硕子的例子,我们做家务的时候,天生就是按照事件为单位在行动。

可过去这些年,我们却一直逼着机器人按机器的节拍去学,掐着固定的步数,把一个个完整的动作切得七零八落。

所以这篇论文最打动我的,不是哪个具体的设计有多巧,而是它回到了最根上问了一句,我们一开始让机器人分段的那个依据,是不是从头就选错了。