Muyun99的杂谈
73 subscribers
718 photos
13 videos
16 files
425 links
Download Telegram
日本旅游第一站:京都
这个五一也太幸福了吧,回成都的松弛就是可以把行程安排放心的交给发小,先是两天的自驾川西之旅,牦牛肉和各种湖泊。然后去湖边露营,划着充气船在湖上荡着飘着,晚上第一次去livehouse,又是差点倒下,给妹子挡了点酒,发现她比我能喝多了。最后一天和妹子去看了苏打绿的演唱会,现场太感动了,青峰的嗓音平等地穿透每一个人,词语精准有力。

以拥抱结束的这个假期是幸福的,感情里的感性和理性可能会和生活中的自己倒置,相互的沟通就变的尤为宝贵,时间的力量在于你只要拉长战线去看,过去的日子就会越来越短暂,而未来是充满了无限可能的,充实饱满
其实有时候都不太懂平时自己在想些什么,工作上干的活都那么需要那么理性,但脑子里又时不时蹦出一堆想法,一些意象,一曲旋律,一小片的诗句。感性人格和理性人格的结合才是一个完整真实的人,这是我的年终总结,拖到了25岁生日这一天,终是完工了。祝大家快乐,在新的一年都能成为很好的自己!

另外,创作的文章在发布的那一刻,他对于创作者就已经过时了,被误解和文字的过时是创作者的宿命,我希望未来能够多写一些不一样的文字,感受思考的进步

https://muyun.work/2023-summary.html
回了一趟学校,和秦师傅@qrzbing偶遇,我还在想今夕是何年哈哈哈哈,像是回到了之前在学校的日子
五月减重大成功,继续加油,身体状况回到18岁也是很好哒~
看了下运动情况,其实五月的运动量主要来自于骑单车,骑车通勤了142公里。另外的运动是爬楼梯两次,每次40min左右,健身房又是一个月都没去了哈哈哈哈

然后想着每个月不仅要做财务方面的统计,也要对睡眠情况,压力状况和运动情况,生活上对外输出,工作上的关键里程碑做一个分析,前面几个都可以在健康里面找到,也找到了对应的导出脚本,需要自己写分析和可视化工具。后面两个需要自己整理。用可量化的记录方式进行自我觉察,是我一直以来想做的事情,去年推动了财务情况的数据可追溯,今年希望能够推动更多东西,加油加油
周四周五两天都无心工作,因为大的部门层面(去年1000人,今年600多人)将会迎来大的调整,有很多变动,主要就是人员会进行分流。有很多选项,去合资公司(主要是两个合资,一个是和大陆的,一个是和大众的),留在地平线去做量产交付(分高阶和低阶),还有就是一小撮人(十多个人)去做具身智能的预研,我和我mentor应该会去做具身智能

又是一个新的赛道,技术栈其实和自动驾驶很相近,但是机器人的自由度明显会更高一些,会是用不一样的思路去做
年轻人对第一家公司总是有情怀的,我也是这样,从实习到现在待了两年了。这波调整给的选项其实都不完美,去合资公司面临着开荒和公司级别的生存战,从过往我司的合资公司经历看到,长安引入了华为做竞争,大众引入了大疆做竞争,大陆的合资目前还不明朗。虽然大众和大陆都是外企,但是国内的合资看起来都是要卷起来才行

对于留守地平线做量产,就是会变成很卷的样子。华为出身的苏菁目前在我们公司全是CTO的地位,搞政治斗争很厉害,我们上千人部门的老大,去年部门被削到600,今年项目交付之后直接被吞并了。端到端智驾我们强度很大地做了三个月,把该踩的坑都趟过去了,刚看到曙光就不做了,还是挺遗憾的,昨天去实车了第一版也是最后一版

小的具身智能实验室可能是这次调整里比较特别的一块,我还是很幸运能够有这个机会去加入,应该还是我mentor力保了我一手,再次感恩我mentor。这块儿的问题在于换了一个行业,还是会有很不一样的地方,但毕竟是前沿,有做research和发paper的机会,对我个人来说其实是一个机会啦,也能够弥补我没有去读博的遗憾。

读博可能更多是为了做一些有价值的paper来证明自己的实力吧,硕士期间实验室和老师的环境和个人规划问题没能做出来有些遗憾。phd这个title对我来说还好,可能在后续一些选择上会有优势,比如高校教职,大厂头部计划这种,但代价就是时间成本和长时间独自消化压力的预期。我过去一年想明白的是读博不是幸福生活的必要前提,所以对我来说,进这个实验室做research和发paper其实还算是挺好的选择
那我为什么会失眠焦虑呢,如果我是一个人,可能会没那么失落。但是我现在有一个女友,她在成都做小学老师,虽然她多次向我表达过对现在工作的不满,但她跳槽就是在等我回成都之后再跳槽,我规划的是明年的三四月份回来,回地平线成都base也好,跳槽回来也好,都是一个选项

现在这个变动其实会导致未来的不确定性增大啦,我不知道对于我回成都来说是好事儿还是坏事儿。从我的人生理想来说,我就是想和爱人亲人朋友生活在一块儿,过一些日常,事业上的事情顺便就做了,不过这个的前提是不用为家庭现金流等操心了。问了一些前辈和同学,大家都不推荐回成都,以事业为重,挣几年钱再说哈哈哈。可能我内心深处也是这样的想法吧~

其实最好的状态呢,是她也愿意来上海干几年,我们再一块儿回成都。但我的感受是她应该不会做出这样的选择,从小到大都生活在四川,上学也是,这不是一个容易的抉择。

以上纯属个人的碎碎念,整理一下思路和想法~这周得写一下一直想写的文章了,关于自动驾驶的scaling law,也会写一点点对具身智能的了解。再不写就真的要换行业了,没得写了…
感觉是又要重新学一遍线性代数了,我记得我本科上线代和研究生上矩阵论的时候,都重新温习了一遍 3Blue1Brown 的《线性代数的本质》课程,三个小时的视频时长却能够让人对抽象的线性代数大为改观(https://www.bilibili.com/video/BV1ys411472E/)

可惜的是,我每次和我硕士阶段的师弟师妹强烈安利这门课程时,他们都并没有去看。虽然我最后矩阵论依然是通过考前刷了几个小时题目去压线通过的,但我隐隐约约能感受到各种子空间,各种线性变换带给我对这个世界的改观
另外还想重新温习一下概率论,前两天同事在做 world model 模型用于生成驾驶场景,初版就做出了挺 fancy 的效果了,在某一帧甚至能给出指令来制造车辆 cutin,车祸的场景,然后就能看到自车撞车之后倒车,胡乱打雨刷器的效果,还挺好玩,后续潜力还挺大的。

然后另外一个同事就说,真实世界是一个庞大的概率分布,world model 生成的视频就是对这个分布的一个采样。我觉得特别有意思,就补了一句说,我们所处的这个世界也是对这个分布的一个采样,这个分布上每一个点都是另外一个平行宇宙。

突然又想到了另外一个科幻故事,地外生物在消灭行星系的时候想保存下这个行星系的文明,就把文明用一串超极长的二进制进行编码,然后在长度为 2 的尺子上标记了一个点,通过这个点的位置能够得到这一串二进制,解码之后就能恢复出整个星系的文明
最近转了方向,工作第一年(202305到202406)从自动驾驶 NN 后处理到端到端自动驾驶,从 202407 开始,就做具身智能方向了,主要做上肢的抓取(model-based grasp),具体来说就是在 graspnet 数据集上刷刷点,然后把实际机械臂 demo 给搭建起来。Demo 系统具体涉及到 ROS 系统,3D 打印来打印一些难打印的物体,机械臂的正逆运动学,手眼标定等等。然后就从之前做端到端特别卷的状态回归到目标是发论文提升效果的 wlb 的状态了

这工作一年的历程中,我其实没有做太多算法上的创新,做了很多 dirty work 以及 data-centric 上面的活儿,具体来说包含模型量化,和下游软件同学对接把模型部署上去,端到端项目中就负责数据闭环的活儿。这些经历让我对除了算法优化之外的工作内容其实都了解得比较多了,从数据如何流转,Badcase 挖掘,模型量化和部署到最后产出软件包。对于算法侧呢,感觉自己好像有点丧失算法优化的敏感度了,我发现我的优势貌似在总结前人工作,看了足够多的文章之后,就可以用自己的叙事框架把内容给重新梳理一遍,而且角度还是会比较新颖,但是近期让我在实际优化算法的时候,会陷入困境,很长时间可能都没有正反馈。之前偏向做工程的事情的时候,做完一件事儿就会有一个结果,解决掉了就是正反馈,解决不掉就报风险,引入其他人的帮助。

我讨厌自己这种缺乏算法迭代上的负反馈状态,我总觉得我虽然进入一个新领域会比较慢,但是创造力还是在的,但近期的实验不顺让我开始怀疑这种事儿了哈哈哈。特别是每周的双日同步会上,另外一个确实很厉害的老哥把点刷刷提,peer pressure 压力有点大hhh,他确实很厉害,sparse4d 系列论文的作者,nuscenes 榜单上霸榜了很久,但是周会上他的改动也比较小,比如发现组合数据集中某个数据集的相机视角有问题,改了一下坐标系,调整之后涨点很多,anchor 的设置方式这种涨点也有,调调学习率涨点也很多。或许我不应该纠结一下子改个学习范式,以发论文的思路去搞,而是先应该脚踏实地的去尝试各方面的调整,想到的某些 trick 都用一用,大厦倾覆并不是一蹴而就的

我再次发现自己的心态不好了,应对挑战和工作领域调整的情况下,不能很好的去调整自己的做事方法和缺乏负反馈下的做事方式,不应该逃避,需要正面面对一下。下周去找同事们好好学习一下,有一个背景类似的同学换了很多方向,但是在每个方向上都做的很好,我需要讨教一下经验了~
https://mp.weixin.qq.com/s/YPJv-qvv4YvrbP3PyXQrMw

这次A股大涨,本来想着今天跌了就加仓的,但是还是这么疯狂的涨,市场和人们的贪婪让我感到害怕。虽说我知道A股不会像加密货币一样大落,但是我依然坚定的认为,我当前投资(包括基金+公司未上市的期权)与现金和公积金的资产配置已经是个不健康的配置了,所以不会跑步入场hhh

闪电到来的时候我在场,虽然A股配置的不多,是因为我不太想参与这个市场。我想不能看绝对值,收益率整体的稳健是我的目标。我的投资风格经历了加密货币市场的拷打,整体已经和孟岩老师趋同了。况且人们贪婪的时候我恐惧,穿越熊市周期的时候我从来没有恐惧过,但是这几天的上涨让人有点害怕

这次股市的上涨是情绪主导的,情绪的起因是政策,但是股市最终是否能落到实体经济上促进就业和生育率,我仍然是悲观的。大众的悲观情绪来的慢,但和会不会陷入“失去的三十年”有莫大的关系
看了下自己beancount记的帐,去年到今年,恩格尔系数从18%跌到了15%,本就挥霍的生活雪上加霜

本来我工作前两年对于投资的预期是,不追求绝对收益金额,追求收益率和积攒本金(本业上好好努力),但是消费才是制约我资产增值速率的关键…

然后发现年初制定的预算里面,恩格尔系数是23%,差的也太多了…主要是因为谈恋爱了,出行和礼物花销相较于预期增加的比较多
上周学了些美联储降息的影响,金融和经济确实有意思,央行美联储之类的角色扮演的是使用金融工具来维持局面稳定(也不排除收割他国资产的目的),所以有很多信号都能够指示经济周期的循环往复。美联储的加息降息是一个“无聊”的周期,逻辑链条应该是某种事件引爆了某个危机,为了应对这个危机开始使用金融工具开始短期干扰,如果短期不奏效就继续。

沉疴用猛药,国内几大揽子政策齐下,一是给股票注入活力,二是降低现金流受挫的人的房贷压力。而房产作为普通人的大部分资产,毕竟是有残值在,而引导普通人入股市,以乌合之众的认知来说,这些钱是用来普惠大众的还是滋养金字塔顶端的人,不得而知,富的越富,因为资源会带来消息提前量,而中国这种政策股市,消息提前量就容易转化成真金白银,其实还是吸的众多股民的血

我之前玩加密货币市场的时候认识到一个深刻的道理,凭运气得来的投资收入,必定会凭运气亏出去。加密货币市场里面的更是得劲,2倍10倍涨幅轻而易举,跌幅其实也是如此。试想一下,节后第一天如果涨,大众会怎么操作,会恐慌还是会加仓,波动引入的不确定性会让大多数人频繁交易,而这种频繁交易会消耗自己大量的心力,有盈利会嫌盈利的不够多,有亏损会想着翻盘,很少有人收手,赌徒心态是人性的弱点,是多巴胺而驱使

节后还是得想办法去开个美股和港股的户,A股真的碰不得。作为Tesla的拥趸,还是挺看好他的robotaxi的,国内国际市场不一样,国内保就业,所以robotaxi在政策上得缓一缓,老美的认知已经被waymo洗刷一波了,资本会更倾向于头部,tesla robotaxi是个机会
过往常常用模仿学习的思路去做事,时常在想自己是否在最优下降曲线上,自己做的事是否前沿和有竞争力,自己的选择是不是最优的。然后在这个过程中产生对于不确定性的怀疑

最近接触了强化学习,需要自己去定一个 Reward,这个 Reward 可以不像模仿学习一样是可微的,也可以不是 Dense 的 Reward,甚至在具身操作领域,HIL-SERL 证明了用一个二分类的 Sparse Reward 在真机强化学习上也能把任务做 Work。在生活的很多阶段我们其实都处于这样的状态中,如果只看结果即最终的奖励,会学到一些 ShortCut,如果缺乏约束,会出现非预期解。这些路子很多,例如刑法里的还有厚黑学里的。随着三观变正,也逐步摸到了世界会奖励什么样的人,复利,利他,真诚这样的品德被更好地实践。但这些还是太宏大了,作为个体存在,或许很多时刻是心有余而力不足,也没有 RL 里面的多次试错机会,也并不是个人最优而是一个种群最优问题,这里多个 Reward 之间存在更多的 Tradeoff,又会让人迷茫了。好的 Reward 到底应该怎么定呢?
很多人学会了看名人传记,试图找到找到共性,一个通用的 Reward,但小小的一册书哪能写得完人一生的故事,作者的倾向性,对于苦难和成功的美化,对于人性弱点的弱化,都会让 Reward 的变得有 Bias。然后大家去考古,翻合订本,看看这个人到底说了什么以及做了什么,总有一些蛛丝马迹。逐步地去从他者那里拿到了一些 Common Reward。

生活里面 Reward Function 的来源是一个学问,从他者的制定再到自己用归纳的方式去学。这条路子是逆强化学习,去学一个 Value Function 打分器,而且这个打分器可以是密集的。在没有平行宇宙的 Setting 下,这个交互环境只允许我们试错一下,那么学会去打分,建立心中的准绳是更加重要的

论文攒了一上午,还没有阅读消化,Paper 仓鼠的习惯还是没有改,有些累了,先写到这里吧,我会做一些小的实践:
1. 更加密集的奖励,不只奖励结果,也奖励过程,这也是很多人说的:经常庆功,就能成功
2. 对休息做奖励,好的状态对理解力有非常好的正向作用
3. 将重要的他者 Reward 纳入到自己的考虑范围中,不要陷入自己的 Bias 中过深
恍惚间居然有快一年没在 tg channel 上发自己的碎言片语了,24 年的年终总结其实有部分原因也是这个,没有 tg 上的文字作为冷启动,靠一个短的时间窗口是有些难完成一个大部头的。分享欲逐步变弱,生活上有趣的事情渐渐收敛到对象那里去了,经历了非常多次的争吵之后(异地几乎每次见面都会吵架),在慢慢变好,我也更加坚定这份感情了。另外就是工作上的事儿变得难做了起来,从24年的7月转到具身智能方向之后,这个资源现状下做的事情会有些受限,但是我慢慢在确信,我们做的事情以及遭遇的挑战其实在其他企业也是一样的,这方面我逐步变得自洽。另外是很多小伙伴都跳槽了,这让我重新审视现在的工作状态,其实对我来说可能是好事儿,慢慢地可以纳入更有挑战的事情里面去了。重视休息,让自己变得更好吧~