linux.do
20.9K subscribers
110K photos
195 videos
110 files
239K links
linux.do最新话题和热议话题
Download Telegram
Qwen 3.5 即将发布,新PR揭示线性注意力与 MoE 细节

Qwen似乎已准备好发布其下一代模型。根据 Hugging Face Transformers 代码库的最新动态显示,一项名为「Adding Support for Qwen3.5」的 PR已被提交,正式为即将到来的 Qwen 3.5 系列模型铺平道路

在本次更新中最引人注目的技术细节,莫过于一个名为 Qwen3_5DynamicCache 的新类别。根据代码注释,该缓存机制被设计为:
“A dynamic cache that can handle both the attention cache (which has a seq_len dimension) and the linear attention cache (which has a constant shape regardless of seq_len).”
(一個動態緩存,可同時處理具有序列長度維度的注意力緩存,以及具有恆定形狀的線性注意力緩存。)
根据 PR 中新增的,Qwen 3.5 系列将是一个庞大的家族,涵盖了纯文本、多模态视觉以及混合专家模型(MoE):

● 多模态视觉能力:包含 Qwen3_5VisionModelQwen3_5ForConditionalGeneration,并配备了自动图像处理器(Auto Image Processor),
● MoE 架构:代码中明确列出了 Qwen3_5MoeQwen3_5MoeText,证实 Qwen 3.5 将继续沿用Moe
Qwen3.5-9B-Instruct 现身 Hugging Face PR。**

2B 稠密模型,35B-A3B MoE(混合专家模型);支持视觉功能,采用基于 Gated DeltaNet 的混合架构。**
github.com/huggingface/transformers

Adding Support for Qwen3.5 (#43830)
mainbozheng-hit:qwen3_5
已打开 05:51AM - 08 Feb 26 UTC
bozheng-hit
+6720 -9
This PR adds the support of codes for the upcoming Qwen3.5 series models. For information about Qwen, please visit: 👉https://qwen.ai Special thanks to @JJJYmmm for helping complete the code in this PR. We also appreciate the valuable feedback and thorough review provided by @vasqu and @ArthurZucker ! 🙏

23 posts - 18 participants

Read full topic

via LINUX DO - 热门话题 (author: Bunn)

Invalid media:
image
image
88code开始捂嘴了

顺便一说,我才发现,88code的富可敌国人都没了,刚才想艾特一下88code官方的人。
结果找不到了。
@chris1667 别偷看了,出来解释一样,捂嘴算什么?

还在沉默等待退款的兄弟,要么在沉默中爆发,要么在沉默中死亡。

----------------------

谨以此事对L站各位佬友做个提醒,L站的富可敌国是没有任何保障的。

不要看到有富可敌国的商家就觉能能够上车。

充多少用多少,做好下一刻商家就突然提桶跑路的准备。

(因为他们真的可以捞够了就无痛跑路)

----------------------

关联
来谈一下88code的诚信问题(大米树:什么?退款时间到了?续费,续一个月!)
[避坑/实测] (88code疑似跑路,privnode已跑路)A÷ 退款政策剧变,帮大家测试本站几家富可敌国中转站的退款效率

60 posts - 37 participants

Read full topic

via LINUX DO - 热门话题 (author: 万象心生)

Invalid media:
image
image
Promptizer 白嫖 70,000 Credits (一款帮你优化Prompts 工具)

兑换码:GET-PROMPTIZER
站点:https://promptizer.site/

70K Credit:
兑换码 50K
注册送 20k

48 posts - 41 participants

Read full topic

via LINUX DO - 热门话题 (author: Davon)

Invalid media: image
Gemini App什么时候能有

Codex都有app端了, 用着还比较顺手, 期盼gemini也搞一个, 到时就可以搞个完美ai打架了

8 posts - 8 participants

Read full topic

via LINUX DO - 最新话题 (author: mxy user)
机器学习 生存预测模型调优

各位佬们这个效果够用吗 私有数据集 原先是60多慢慢加东西调上来的
3 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: 07)

Invalid media: image
唉,心态崩了

唉,今天真的难受。我也没想到外科规培能这么极端啊。直接把我心态搞崩了。一边上吐下泻,一边背负着巨大而繁琐的任务,最后还要被主任刁难。

本来是这周开始从门诊转入住院部,工作模式从固定八小时变成任务量优先。然后这个普外科就是一堆破事儿。首先是事儿特别多特别繁琐,交代我两句之后就把一堆琐碎的活全丢给我了,得亏同为规培生(或者研究生)的学长学姐人好,这周看我是新来的,只用我学习写病程,手术都是他们干的。但是也做得好累,毕竟写病程最痛苦的地方就是在十几个病程里翻找别人乱写给你留下的坑。

为什么说外科病程也有这种坑呢?不都是随便套模板写写得了嘛?这就要说到伟大的主任了。

这个伟大的,精神变态的主任,我敢说,他思想的根子上就没把规培生当人看。因为他吃饱了撑的没事干就要干我们这群可怜的规培生/专硕。

首先是他特别喜欢抓迟到,但凡你迟到一分钟,指着你鼻子就开始骂了,他骂累了就会让你滚去写几千字的检讨。不写?那他会让你知道什么是普外科主任的权力。他可不在乎我们这群底层穷鬼生活得多么不容易,对他来说,反正不用管床写病历,每天干点行政事务,偶尔上去手术室做一台大手术。他觉得,既然我都到了,你凭什么迟到?一定是你目无王法。

所以不迟到就好了?不不不,交班的时候也是可以骂人的。你交班记录写得好不好主要看他当时心情,反正他一个浸淫住院部工作多年的老东西总有办法挑毛病。

如此种种,不胜枚举。但有一点可能值得一提,那就是他在手术台上最喜欢骂人。一般来说,他上去干的基本都是大手术,而大手术这种东西就是突出一个时间长和特别难做。所以你会被他骂上五个小时。至于你的收获?那恐怕收效甚微,因为任何手术,尤其是大手术,都必然需要老主刀手把手带。

另外一个值得骂娘的地方就是他要求周一大查房的时候只能用英语向他口述病人情况。至于规培生一口中式英语能让人听懂几个词,或者说他能听懂几个词,那就不得而知了。反正得念,哪怕整个科室从来没有过一个外国病人。我估计这跟他的经历有关,可能是他怀念着曾经在外国留学的光荣日子,转头又想到了,那些科室曾经的老东西是怎么占住萝卜坑,让他这个留洋归来的优秀人才只能屈居副主任十几年的。

当然,他下辖的医师们也有样学样,对一切“无知的弱者们”极度不耐烦。这一点倒是有差异,唯有那几个他最优秀最满意的住院医师能学的最像。

唉,科室的工作模式总是表现出那种藏不住的野蛮,那种虽然我可能没有那个资格做大手术,但是我就是练出来了。至于练whisper这种普外科最高难度的手术需要什么样的代价就不得而知了,更进一步说,我到底何德何能为这种究极手术扶镜呢?然后因为主刀不满意被骂半天。

唉,他们就不说了,说得再多也没啥用。说说我今日之惨状吧。

一觉醒来就上吐下泻,也不知道是急性肠胃炎还是胃肠型感冒,更没时间去看病。是的,虽然我正在普外科工作,但是没有机会去普外科治病。因为人手不够,我请假了别人就得替我干活。纯担责的事情没人会乐意,所以作为回报,我必须替他们去干他们最不想干的大手术。我觉得我做不来,要知道,一边被骂上五六个小时,一边用五六个小时来保持一个姿势以维持腹腔镜的视野稳定是纯粹反人类的行为。好像他的辱骂中,突然就出现了某种神秘的伟力接管了我的身体,以至于我的艰苦工作毫无意义。

我总是在自问,如果当初继续吃学习的苦,是不是今日就可以去最舒服的大医院混日子,而不是在这种偏僻之地受社会的苦了?须知,研究生尚且能自我欺骗说自己也就能考上这所大学的研究生了,为了那张证书,一切苦难都是可以容忍的。可是我不是研究生啊,我踏马是来干活挣工资的。结果你这家公司待遇极差,工作压力极高,我为什么还要留在这里呢?

还不是跑不掉,规培本来就是合法的极端压迫,我中途跑路的代价就是退还这段时间来的一切工资收入,然后被拉进三年不得再次规培的黑名单。

但是想请假也请不了,请一次假背负的责任跟欠了高利贷一样,更别说上级医生的原则是除非你倒地上,否则一律不批。

唉,现在就是很后悔,非常后悔,为什么就想不开读了这个临床医学专业,现在想跑路了才发现自己是个废人,好像除了进电子厂再无出路了。

但话说回来了,能跑路我还是想跑路的。哪怕送外卖当保安呢?

12 posts - 10 participants

Read full topic

via LINUX DO - 最新话题 (author: heglin)
有没有佬知道aws用的那个人机验证呀

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: mofas)
印度免费新域名 未来可以托管CF

链接:印度域名

6 posts - 6 participants

Read full topic

via LINUX DO - 最新话题 (author: 秋意浓)

Invalid media: image
水一个帖子,有人吗

不知道发什么,先来无事

14 posts - 12 participants

Read full topic

via LINUX DO - 最新话题 (author: yulinzhiyu)
哪里还有什么靠谱的流量卡渠道么?

想给我爸办个流量卡,他套餐费太贵了,一个月除去 Wi-Fi 要 120 多。看了号易和 172 ,基本上没有发江苏的移动卡了,淘宝的靠谱吗?怎么感觉不靠谱的说,最近好像是竞合期,都没有便宜卡了。

5 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 木瓜蛋白酶Tea🎋)
[发现]Antigravity-Manager反代banana生成4K时会返回一张缩略图误导前端

反重力反代api的banana的图+语言生图是会返回两张图片的。之前一直拿到的都是缩略图,难受死我了

因此只需要解析全部图片保留4k即可
5 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: CubePlus1)

Invalid media:
image
image
好玩好玩 把openclaw网页版转发到cf搭建的网页上了~~

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 吴亦Fan?)

Invalid media: image
“请勿试吃”四组新解法

Claude opus4.6评论:

最后一句很精辟!

问问他的新想法,真的震惊到我了,这个太有思想了 这个更精辟,我被折服了

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 欣欣|林可欣)

Invalid media:
image
image
image
image
大家放假了吗?

如果还没放假,可以说说哪个行业的,还在坚守。

5 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: fist2005)

Invalid media: image
一句话全自动vibe25个小时达成!

先挖个坑,明天再看看(readme都不想看…一堆环境变量)

全流程脚本都在,应该可以看看ai到底花了多少时间在不同的地方了

query:

consider a solution for AI native headless-browser-service that: can support typical browser operations like navigate/click from text instruction, can render current page as image snapshot, can render current DOM as multi-level markdown document, can pass typical headless/browser signature check by some anti-bot service. notice all build/test process shall performed in docker container to avoid dependency/damage to development host. a complete set of test examples(of static/dynamic html file) could be made and served by test server in development/test process

(codex自己总结好像到也没有离题万里)=>

这个项目本质上是一个“把真实 Chromium 浏览器能力做成 HTTP 服务”的后端:你用 API 传入一个 URL + 一串明确的浏览器动作(点击/输入/等待/滚动/断言/抽取),服务端用 Playwright 在容器里跑完,然后把结果(步骤状态、日志、以及页面产物)返回给你。

它现在能支持的“人话”使用场景主要是这些:

网页截图/预览:给一个页面地址,渲染后返回截图(适合做分享卡片、缩略图、监控截图留档)
动态页面采集:把 JS 渲染后的最终 HTML 抓回来,或者把 DOM 转成 Markdown(更适合喂给搜索/LLM/索引)
低成本自动化操作:模拟用户路径(打开页面→输入→点击→等待结果出现),用来做流程回归/冒烟监控
结构化抓取:从页面里“抽取”你关心的字段(文本/属性/表单值/标题/当前 URL/片段 HTML),直接得到 JSON
断言式巡检:用“元素存在/可见/文本包含/属性等于/URL 匹配”等断言判断页面是否正常(类似轻量 E2E)
登录态复用(实验特性):可选开启 sessions,让多次调用复用 cookie/storage(适合需要先登录再操作的多步任务)
指令转动作(实验特性):把少量确定性文本指令(navigate/click/type/wait/scroll)转换成 actions 计划,但不执行

一些关键“产品化”特性(影响怎么用):

API Key 鉴权 + 租户隔离(默认开启),并且有并发/限流/产物 TTL 与容量上限
产物(screenshot/html/markdown)默认以“引用”形式返回,可再用 GET /v1/artifacts/:id 下载;存储支持内存/本地文件/S3 兼容对象存储(对象存储会配合 Postgres 做元数据与 GC)
内置 SSRF 防护:因为它能访问任意 URL,所以默认会拦截一些高风险内网/元数据地址(同时也会在浏览器网络层做 guard)

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: Z Y)

Invalid media: image
Gemini 3 Pro满血版目前可以在哪里用?

最近准备写毕业论文
主力模型想用Gemini,可以付费。

但是官网的Gemini好像有点懒不像满血版,也没有回退功能,Aistudio的使用体验不错但是额度太少了。

反重力antigravity里面都是满血版嘛?
或者cursor和windsurf里面的?
或者去购买Api使用?

求各位佬推荐靠谱的使用方式呀,求求

6 posts - 6 participants

Read full topic

via LINUX DO - 最新话题 (author: fgh kmn)
网站登录 验证码好还是人机验证好呀?

有没有大佬给推荐下 好用的方案

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: BlackDragon)
cursor如何添加自定义模型

佬们,cursor免费版不支持添加自定义模型吗,试着添加了一下好像没什么用,他那个弄的界面有点看不明白,我记得去年用还是可以添加自定义模型的,是不是只有他的pro用户才可以自定义多个模型

7 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: 鹿鸣)
国产大模型知识量还是不太够啊

想象一下,一个外国人都比你更懂天龙八部…… :bili_040:

6 posts - 6 participants

Read full topic

via LINUX DO - 最新话题 (author: zzGreg 周周·格雷哥)

Invalid media:
image
image
浅谈vibe coding现状以及大胆预测未来的发展

当前vibe coding阶段正处于从“人写代码”转向“人与 AI 协同演进架构”的核心阵痛期。

而导致这种情况发生的根本原因是:大模型无法理解人类的真实意图,无法去解耦复杂的业务,往往遇到“防御性编程”或者用户刁钻的需求亦或者现实中物理的因素,大模型就歇菜了,开始按着自己的理解方式对相应的业务需求进行编写。

但对于人来说,需要的是面对各种现实的场景,复杂的需求,随着经验的累计,会形成一套自己的方法论和编程技巧,往往能根据"经验"做出符合业务需求的产品。但人的核心痛点就在于,写的慢,想的久,对于这个日新月异的时代,是一种低效的表现。

但对于公司来说,要的是效果,要的是竞争力,要的是快人一步,要的是比对手提前占据市场,而且还要思考投入的经济以及未来可以获得的收益,所以对于领导来说,大模型就是一个非常直击他们心脏的工具,原因就在于:低成本,高效率(看人)。所以这几个月,在媒体或者社交平台,能时不时看到,某某公司APP出问题了,某某大厂程序员被裁了,某某组织的支付系统瘫痪了。显然,这就是当前人与 AI 协同演进架构的具体表现:快了,但也不可控了

所以网上有人挪喻/嘲讽道:“开猿节流”,“降本增笑”。

这里浅提一下当前主流大模型的原理:预测!采用的是 Transformer架构,这里我不去深究原理,我们开发也没必要去深究原理,我下面给出Gemini的对这种架构的解释,感兴趣的佬友可以自己去了解

紧接上文

时代不会因为这种小的问题而停止发展,AI的发展一定是势不可挡的,哪怕在实际生产中会遇到问题,越来越多的企业也会逐渐的接纳这种新型的coding方式,为了验证我的想法,并且表达自己的观点,前两天有幸去了深圳,和具身智能领域的中,大厂的一些产品经理,HR,技术总管进行了交流,也认识了一些初创公司的创始人,和其探讨了vibe coding的现状以及未来。

这里我总结为三派:

第一派,我称之为冥顽不灵的顽固派,这类派别以超级大厂为首,他们认为这玩意不可靠,这玩意就是瞎扯淡,下令公司成员不得使用AI,就算用也只能当参考,你必须要有自己深厚的技术栈以及卓越的工程师思维,不能交付不可控的东西。

第二派,我称之为循序渐进的保守派,这类派别以中大厂为首,他们认为一个工程师,必须要有自己的技术栈,要有一定的广度和一定的深度,以及对实际工程有一定的理解,在实际生产中,你可以使用AI,但必须小心,同理不能交付不可控的东西。

第三派,我称之为积极探索的激情派,这类派别以小公司以及初创公司为主,对于他们来说,需要快速做出MVP,接着占据市场,获得融资,他们鼓励用AI,甚至会为技术人员每月支付几百刀的额度。

相信佬友看到这里,也能对当前的行业有一个大概的认知,vibe coding在当前的时代到底发展到一个什么程度了,我们究竟是在闭门造车?还是在拥抱时代?我相信,每个人都有不同的答案。

仅仅只是说到这里就结束了吗?

显然不是,我与一些深耕十几年的老码农以及海归开发者也进行了一些交流。在交流中,我得出了一个结论:这些技术人员,无论是深研算法领域,还是软件开发领域,都在接触AI,只是用的程度不同,但可以论证一个点是:AI coding确实是在逐渐走入我们的生活。

但在交流中,谈到了一个比较露骨以及非常现实的问题->目前AI无法理解人的真实需求,无法对业务进行详细的解耦,当我们vibe出了一个黑盒之后,一旦我们需要对业务逻辑进行更改,那么所产生的连锁反应是不可估量的。

所以能看到这些大模型厂商,不断的推出新的概念,像MCP,skills,coworker…他们目的到底是什么?是为了营销?还是拉取投资?还是为了解决问题?

我进行了一个非常深度的思考,我认为:工具的诞生,就是为了解决实际的问题,而宣传这种工具的作用,可以让投资者看到未来的前景与希望。

所以,这些工具的出现,就是在为复杂业务的解耦做准备,打根基,定未来。因为大模型的本质是预测,所以为了解决,也可以说是限制这种不可控性,诞生了很多新概念,比如编排工作流,多模型合作,Spec约束,不断的将已有的概念融合进来,就是为了约束这种不可控性,让所有的预测都在框架下产生,哪怕再有问题,我的框架也会将不可控性给束缚住,可以看到站内的CCG,CCW都是秉持着这种思想诞生的。

说完了现状,我继续大胆预测一下未来,这里我先叠甲(只是大二学生,见解有限,说的不对请指正)。

我认为当前的AI发展已经到达了一个点,这个点受到了基础设施,电力,政策,民情,土地各种因素的限制,这也就是当前AI发展的一个弊端,将自身能力依赖于现实基础,这也就是Transformer这种底层架构的弊端,预测,你就只能通过无穷的算力去堆叠,建设庞大的机房,需要无穷的电力(这也反映了新能源未来也是一片坦荡啊),但这种的前景是有限的,因为预测永远无法闭环,底层架构就出现了问题,但这并不妨碍当前大模型确实给人类带来了相当大的益处,肉眼可见的走进我们的生活。

而真正实现AGI,短期内是无法实现的,资本也不会允许,他们不可能看着自己的机房成为一片废铁,在我看来,AGI就像理想国一样,永远只是梦境中的幻想,而真正的“AGI”,是靠着人类通过已有AI的工具,搭建出来的各种便捷的,服务于民的工具,就像最近A社推出的11个插件,说是造成了几千亿美金股市的动荡,因为跨过了业务层,直达用户层。我觉得这个事情是非常值得思考的,我们究竟是坐等着AGI的出现?还是积极投身于真正服务于民的产品?A社似乎已经意识到了这一点,开始提前布局了。

所以我在这里,想提倡也是号召各位佬友,转变自己的思维,做每一个事情,都必须要运用到

第一性原理

对个人,要考虑未来
对团队,要考虑他人
对企业,要考虑市场

感觉说的很大套话了,有点像心灵鸡汤了,但总之理是这个理,不要再秉持固有思维,多考虑用户思维,也就是利他思维。

所以再回过头来想,我们面对的复杂的项目的业务逻辑,AI真的做不到吗?还是我们开发的工具不够多,搭建的框架不够好?我们真的用好了AI吗?

最近在站内也看到了很多佬也在提倡新思想,新框架,但很多人也只是按部就班的使用,我觉得需要跳出按部就班的思维,从第一性原理去考虑每一件事,比如前不久的一个开源框架

和最近看到的

假如把这两种想法融合起来,再辅以多模型的合作,结合各种新技术,我们是不是真的能够把复杂的业务逻辑给解耦成一块一块的简单小东西呢?将编程技术像拼夕夕砍一刀一样,你给点想法,我给点思路,真就把技术门槛给砍下来了呢?这也是我正在努力的一个方向,但奈何学业压力(时间不够)以及个人思想可能存在狭隘之处,更想与佬友一起探讨,分享各自的见解

最后总结一下我认为未来的发展潮流就是:

面向用户编程

面向业务编程

面向未来编程

真正实现惠利与民

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: potato)

Invalid media:
image
image
image
image
image
请问这个linuxdo吧是哪个佬友开的吗

要么就是求邀请码的,要么就是骂的
5 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: Kiana)

Invalid media: image