LinuxDo 新帖推送
189 subscribers
254K photos
317K links
Download Telegram
标题: 一觉起来office图标大变样
作者: #auroraee
板块: #搞七捻三
编号: 1085777
帖子: https://linux.do/t/topic/1085777
时间: 2025-10-24 19:27:47
摘要:
之前就看到说微软更新了office图标,今天下午上完课回来就发现图标大变样
标题: Meta“自由Transformer”深度解读:打破AI八年铁律,以“潜意识规划”超越“概率鹦鹉”
作者: #xstar
板块: #前沿快讯
编号: 1085794
帖子: https://linux.do/t/topic/1085794
时间: 2025-10-24 19:32:56
摘要:
“8年铁律”一夜作废,这次连“思考方式”都被改写了
播客音频讲解
音频介绍了 Meta 推出的一项名为 Free Transformer 的重大人工智能架构创新,该架构旨在打破自 2017 年以来 Transformer 模型 逐个标记 生成的核心规则。
这项新模型通过在解码器中引入 潜在随机变量 (Z),有效地增加了模型的 “潜意识” 层,使其能够在生成文本之前进行 “预先思考” 和规划。
技术论文详细介绍了 Free Transformer 如何作为 条件变分自编码器 (VAE) 的扩展来实现,并仅增加约 3% 的计算开销,便能在 GSM8K 和 HumanEval 等推理和结构化生成基准测试中显著提升性能,表明了它可能标志着 自回归时代 后的新开端。中文报道强调,这一进展可能改变 AI 的底层规则,使模型不再只是 “概率鹦鹉”。

01|为什么GPT突然不会“写作文”了?
周末陪侄子写周记,他憋了半小时只蹦出一句“今天天气真好”。
我随口提示:“先想好主题,再动笔啊。”
——这句人类常识,恰恰是今天所有大模型的软肋。
自2017年Transformer诞生以来,GPT、LLaMA、Claude全都遵循同一个套路:

把句子拆成token,像词语接龙一样,边写边猜下一个词。

问题就来了:

写到一半发现跑题?没辙。
想写影评,写着写着变成吐槽?认命。
要生成长篇代码,全局结构一团浆糊?概率鹦鹉自己也很无奈。

Meta FAIR这次干脆掀桌:“别猜了,先想清楚再写!”

02|Free Transformer到底“自由”在哪?
关键改动:塞进去一个“潜意识层”z
在标准Transformer的腰眼(大概一半深度)插入一段可学习的潜变量z,相当于给模型先打草稿再动笔。




环节
传统GPT
Free Transformer




写之前
没想法,先写再说
采样z,拿到“大纲”


写作中
全靠前面词猜后面
z持续指导风格/结构


写错方向
一错到底
z强行拉回主线



训练=偷偷学“提纲”

前半段Transformer临时当编码器,把整段答案压缩成z。
后半段继续当解码器,按z的“大纲”重写一遍。
损失函数:重构误差 + KL散度,再加一个“自由比特阈值”防止z死记硬背。

推理=直接开盲盒
训练完把前半段直接扔掉,推理时从均匀分布里随机抽一个z塞进去——
计算开销≈0,效果却原地起飞。

03|实验室显微镜:z到底学了啥?
团队设计了一道“小学题”:

数据:64位字符序列,里面随机埋8个连续相同字母(如HHHHHHHH)。
任务:让模型找到这8个字母的位置并复现。

结果像调显微镜焦距一样直观:




KL阈值κ
z学到的东西
生成结果




太小(≈0)
啥也没学
字母位置乱跳,错得离谱


适中(18 bits)
目标位置
同一z多次生成,8连字母永远卡在同一列


太大(48 bits)
连噪声都背下来
过拟合,反而写不对8连字母



一句话:z真能当提纲用,但容量得调得刚刚好。

04|真刀真枪上战场,它赢了吗?
用1.5B和8B两种尺寸在主流基准开测:




任务
传统Transformer
Free Transformer
提升




HumanEval+(代码一次过)
5.2%
8.5%
+63%


GSM8K(小学数学题)
15.1%
19.6%
+30%


MMLU(综合知识)
48.7%
53.9%
+5.2pp



训练只多花3%算力,推理几乎零成本。
Meta放话:数学、编程、逻辑推理这类**“全局规划”刚需任务**,Free Transformer直接开挂。

05|下一步:AI开始“先想后说”,人类慌不慌?
Free Transformer真正刺激的点,不在于又刷了几个百分点,而是第一次把“思考”搬进了潜空间。

与人类写作对齐:先定中心思想→再填细节,而不是逐词硬编。
与思维链互补:思维链(Chain-of-Thought)是显性推理,Free T是隐性规划。
多模态想象空间:视频脚本、交互叙事、复杂系统设计……所有需要“长周期一致”的场景,都可能被z接管。

当然,挑战也摆在眼前:

z的最佳容量、最佳注入层、最佳先验分布,统统需要炼丹。
一旦z被“投毒”,模型将系统性地跑偏,这比单句幻觉可怕得多。


结尾:技术终于追上了“人话”
写完这篇稿子,我突然想起侄子那篇周记:

“我先写了结尾,今天真是难忘的一天’,然后倒着填故事,结果全班最高分。”

Meta只是让AI也学会了这招——先写结局,再写开头。
你觉得这种“先想后说”的AI,会把我们带去哪里?评论区等你开脑洞。
标题: yubikey有没有能实现C+A的开源替代?
作者: #球儿
板块: #搞七捻三
编号: 1085795
帖子: https://linux.do/t/topic/1085795
时间: 2025-10-24 19:33:19
摘要:
如题,有没有开源项目同时支持C口+A口的?或者说有没有便宜的C+A口能直接买的?
大家都在用哪个?
标题: 孤独真的是人生的常态吗?
作者: #甜豆烧鸡
板块: #搞七捻三
编号: 1085801
帖子: https://linux.do/t/topic/1085801
时间: 2025-10-24 19:35:29
摘要:
已经毕业一年多了,这几个月感觉干嘛都好没意思,自大学后,也基本没认识新的朋友了。
大家毕业后都是怎么认识新朋友的?感觉好孤独,有时候真的好需要有个人陪//
标题: 原来这就是仁义礼智信
作者: #小罗
板块: #搞七捻三
编号: 1085805
帖子: https://linux.do/t/topic/1085805
时间: 2025-10-24 19:37:01
摘要:
无敌了
标题: 机械硬盘要到什么时候才能降价呀
作者: #Micraow
板块: #搞七捻三
编号: 1085821
帖子: https://linux.do/t/topic/1085821
时间: 2025-10-24 19:39:52
摘要:
记得三年前左右那个时候固态硬盘,还有机械硬盘都挺便宜的。有一天碰到我一个朋友跟我说什么什么硬盘又降价了,赶紧抓紧买点,过段时间恐怕要涨价。
但我当时并没有特别强烈的存储需求,也就没有管了
哪知道自那之后硬盘的价格就一直在涨,现在我原本的机械硬盘有点不够用了,想组个nas,见预算4000左右组NAS,怎么配置呢? 结果看硬盘的时候才发现价格已经涨了那么多。
只能先等等了,佬们觉得啥时候硬盘能降价啊
标题: 《抽奖》2*GPT team车位 快速抽半小时极速开,手慢无
作者: #方木木
板块: #福利羊毛
编号: 1085843
帖子: https://linux.do/t/topic/1085843
时间: 2025-10-24 19:43:40
摘要:
【奖品 1】:ChatGPT TEAM 车位《24日新开》 * 2 个 极速开奖
特别声明: 由于是 Team 邀请,不保证能使用一个月
活动时间:
开始时间:2025 年 10 月 24 日 19:43
截止时间:2025 年 10 月 24 日 20:13
参与方式:
在本帖下回复任意内容 + 点赞哈 。
抽奖规则:
每位用户仅允许参与一次。
使用论坛官方抽奖工具随机抽取中奖者。
中奖后请及时提供邮箱给我
注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后 12 小时内在本帖公布,并通过私信通知领奖方式。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系抽奖发起人。
标题: 突然发现3级了, 搞个帖子纪念下哈哈
作者: #SenseHu
板块: #搞七捻三
编号: 1085874
帖子: https://linux.do/t/topic/1085874
时间: 2025-10-24 19:48:48
摘要:
新人第一帖
论坛的氛围是真的好, 佬们的公益站蹬的好爽,
祝大家开开心心每一天
标题: 年轻的来报个到?
作者: #Chris233
板块: #搞七捻三
编号: 1085888
帖子: https://linux.do/t/topic/1085888
时间: 2025-10-24 19:52:38
摘要:
一直好奇L站里最年轻的佬友能有多年轻啊
会不会有小学生(
标题: 求助,路由器分配IP: 255.255.255.255??
作者: #可爱滴捏~
板块: #开发调优
编号: 1085929
帖子: https://linux.do/t/topic/1085929
时间: 2025-10-24 20:01:44
摘要:
宽带接入如图光猫,光猫下有个 有线连接的荣耀边缘路由器
我笔记本正在连着光猫wifi
以下问题,是偶发,我都住半个月了,偶发两次这种情况:

荣耀ip怎么可能是这样的,且荣耀路由器无法上网,也无法进入荣耀管理界面
我笔记本设备去哪了?光猫明明给我分配了正常的ip了,我也能正常上网的
标题: 今年最大的一笔亏损
作者: #www-data
板块: #搞七捻三
编号: 1085938
帖子: https://linux.do/t/topic/1085938
时间: 2025-10-24 20:04:04
摘要:
一把刀,准备玩两天就卖…………腰斩的腰斩,亏了7k。今年最大的一笔的亏损………………
吃瓜吃到自己身上了md
标题: 分享下你的AI开发小技巧吧
作者: #王翦
板块: #搞七捻三
编号: 1085973
帖子: https://linux.do/t/topic/1085973
时间: 2025-10-24 20:10:20
摘要:
我个人利用AI开发大概5、6年了。从最开始的机器学习模型补全(tabnine),到github copilot,再到现在的agent。模型能力越来越强,但用起来反而更累了。
我接触编程十多年,一直觉得自己是兴趣驱动的程序员。但最近,说实话,我真的开始有点厌恶编程了。
工作还好,毕竟更多是在开会划水。但是在写一些兴趣项目时,本来是下班最开心的时候,现在的工作流已经完全纯粹变成了打开cc/codex,打字,不断的reset etry,本来10分钟的活,AI输出一小时,context用光,输出满屏bullshit,开始you are absolutely right。
但毕竟工具在那里,又不太想自己干,只能无能狂怒,用上千行prompt教他写几百行代码。最后发现领域小众,训练集样本太少,脱离概率空间,还是得自己写……
不仅自己开发如此,社区也完全一团糟。ai发的issue,ai写的文档,遇到感兴趣的项目,打开发现代码原来是纯粹一坨。一个功能分八个模块,模块里还有classV1,V2,V3。文档里写着:这个this implemention now works perfectly。我真是f**k了。
所以佬友们,你们是怎么样使用AI协助进行开发的?怎么样才能真的加快效率,不至于快到飚?
标题: Gemini生成的回答,竟然把127.0.0.1输成1227.0.0.1 发给客户……
作者: #wsa01378
板块: #搞七捻三
编号: 1085987
帖子: https://linux.do/t/topic/1085987
时间: 2025-10-24 20:12:44
摘要:
好像这是遇到第二次了,之前一次也出现叠字。
幸好发日志给他立刻发现错误。这种错误不应该发生吧
标题: 京东一键价保也不准
作者: #l200104
板块: #搞七捻三
编号: 1085999
帖子: https://linux.do/t/topic/1085999
时间: 2025-10-24 20:14:28
摘要:
前天买的抽水器44.91,今天一看竟然只要36了,马上申请价保,结果只给补了3块,还好找客服要回来了
标题: i人必备成长指南
作者: #Taoxu
板块: #资源荟萃
编号: 1086065
帖子: https://linux.do/t/topic/1086065
时间: 2025-10-24 20:25:29
摘要:
各位佬友们都需要吗?
我刚买的 还热乎着 ! 拿走 !!!!

链接: https://pan.baidu.com/s/1TJ_eKyQvIFthIlsFNKCO-w?pwd=1111
标题: Gemini3.0有灰度?
作者: #Karia
板块: #前沿快讯
编号: 1086075
帖子: https://linux.do/t/topic/1086075
时间: 2025-10-24 20:27:42
摘要: