LinuxDo 新帖推送
193 subscribers
255K photos
318K links
Download Telegram
标题: 高速GPT来了?Cerebras重塑AI推理极限,大模型响应迈入“毫秒级”时代
作者: #HCPTangHY
板块: #前沿快讯
编号: 1477087
帖子: https://linux.do/t/topic/1477087
时间: 2026-01-18 09:32:23
摘要:
前置新闻: OpenAI 与 Cerebras 签署 100 亿美元协议,购入 750 兆瓦推理算力 - 前沿快讯 - LINUX DO
AI芯片巨头Cerebras已经宣布与OpenAI达成深度战略合作,共同推出当前全球最快的AI推理服务。基于Cerebras的专用计算平台,OpenAI最新的开源模型GPT-OSS-120B实现了每秒3000个Token的惊人生成速度,这一数据是传统GPU芯片的15倍,标志着大模型彻底告别“逐字蹦出”的延迟时代,迈入即时响应的新纪元。
此次技术突破的核心在于Cerebras的CS-3超算系统,它解决了传统硬件在处理复杂AI任务时的算力瓶颈。在通俗意义上,这意味着原本需要数分钟才能完成的复杂逻辑推理、长文档生成或全栈代码编写,现在可以在不到1秒钟内瞬间完成。除了OpenAI的最新模型,该平台还全面适配了当前主流的前沿大模型,包括Meta的Llama 3.3与Llama 4系列、国产大模型Qwen 3以及GLM-4.7。测试数据显示,即使是235B参数的Qwen 3超大模型,也能在该平台上跑出每秒1400词的极速,而Llama 4 Maverick的生成速度更是高达每秒2500词。
Cerebras通过这种“不牺牲模型精度和规模”的提速方案,不仅大幅降低了单次查询的算力成本,更为“实时AI智能体”的普及铺平了道路。Meta、Perplexity与DeepLearning.AI等行业巨头已率先接入该服务。为了满足全球激增的算力需求,Cerebras目前已在美国和欧洲战略性部署了六个新建数据中心,预计将为全球企业和开发者提供每秒超4000万词的吞吐能力,推动AI技术在药物研发、智能搜索引擎及自动驾驶等领域的进一步落地。

与此同时的奥特曼
标题: 【求助帖】PC端如何便捷查看sonos beam 2的音量
作者: #Michael J
板块: #搞七捻三
编号: 1477088
帖子: https://linux.do/t/topic/1477088
时间: 2026-01-18 09:33:50
摘要:
RT
除了web(感谢佬友amanduo提供的思路,web有时候能解决很多问题),还有别的方法能直接显示sonos beam 2的音量吗?
例如小插件,或者别的方式?
标题: 求助:普通人从0开始学习AI的路径或者课程
作者: #哈了个哈哈
板块: #搞七捻三
编号: 1477106
帖子: https://linux.do/t/topic/1477106
时间: 2026-01-18 09:45:44
摘要:
不是程序员,就上班族,目的是成为一个关于AI的自媒体博主
标题: 变态跑操音乐
作者: #Lightyear Forever
板块: #搞七捻三
编号: 1477115
帖子: https://linux.do/t/topic/1477115
时间: 2026-01-18 09:47:24
摘要:
之前学校初中部跑操放 Hand Clap, 我们打赌等学校的那些虐人狂根本没看过歌词. 后来果然给换了. 结果学校直接换成了库里之歌. 给我们国际部的人都听笑了, 还好我们不跑.
标题: 【小白初试】本地管理gpt team号池 自动邀请
作者: #donkfeng
板块: #开发调优
编号: 1477124
帖子: https://linux.do/t/topic/1477124
时间: 2026-01-18 09:48:51
摘要:
github项目链接
vibecoding 练习
平常自己可能会薅一些team账号的羊毛,然后邀请同门师兄一起上车使用,但薅多了之后发现每次邀请很麻烦,而且总忘记账号密码()。近来放了寒假,闲暇之际,打算测试一下
目前vibecoding的能力,也算是给自己开发一个小玩具练练手。
实际使用
其实这种自动邀请,我看到很多佬友们自己运营的team号池,都在网页中有这个功能了,而且使用起来很方便快速,但我寻找半天没发现有开源的项目,索性就自己搓一个玩一玩。但我这个仅限于自己本地管理自己的号池,还没有部署在网页上给别人用的打算,而且我是一个小白白,对于服务器部署方面并不擅长。。。。

这是控制台的截图,大概使用流程就是,你在这个项目里添加账号,他会自动跳转一个浏览器页面,你正常登录,之后就会保存你的登录信息,然后邀请和同步成员等工作他都会自己进行,目前对我这种10个左右的账号来说用起来还是很方便。
具体有没有bug还需实际测试,目前自己使用一周还未出现问题。但如果openai改动他team邀请界面的UI,那这个项目大概率会失效,还需要进一步适配
开发工具
先是使用中转站的cc的planmode,规划项目的技术栈,然后让他快速写初稿,之后到某一个阶段,他总是反复调一个bug但失败的时候,我就转到了codex,我个人体感,codex真的很强,记得之前做一个深度学习项目,我的mae总是很高,在1.4,然后cc让他来回来去改了一周,也没啥效果,我上了一个team车,用上了官方的codex,他一通思考,至少思考了十多分钟,然后修改了一行代码,把激活函数从relu,改成了gelu(好像是这个,有点记不清了),之后再训练,mae直接干到0.几,当时对codex的好感度直接promax。科研人必备了 如果对项目有什么问题,欢迎大家一起交流,我也想向大家学习
标题: 二周年快乐!我为 Linux Do 打 call
作者: #lokafai
板块: #搞七捻三
编号: 1477130
帖子: https://linux.do/t/topic/1477130
时间: 2026-01-18 09:50:49
摘要:
新鲜入驻的 Linuxer 一枚~ 正巧碰上 Linux Do 二周年庆典,愿平台汇聚更多技术同好,在开源的路上越走越远,越来越好!
标题: Leaflow是什么?
作者: #udjjf
板块: #开发调优
编号: 1477140
帖子: https://linux.do/t/topic/1477140
时间: 2026-01-18 09:54:35
摘要:
最近在帖子老是看到这个词,还在售卖邀请码,有没有佬说一下是啥平台
标题: 记一次N5105+PVE8.4+ikuai的折腾
作者: #Dennis
板块: #开发调优
编号: 1477142
帖子: https://linux.do/t/topic/1477142
时间: 2026-01-18 09:54:56
摘要:
之前是把N5105的一个网口直通给了ikuai作为wan口,然后时不时出现(几乎每天)断开重连的情况), 但愣是没怎影响到网络的使用,只是看到这么多日志心烦,现在回收了直通的wan口,也改为虚拟口后,一切安静了~
标题: 最近用了一个公益站还不错。
作者: #chi code
板块: #开发调优
编号: 1477145
帖子: https://linux.do/t/topic/1477145
时间: 2026-01-18 09:56:10
摘要:
最近在开发的时候遇到了一个向量模型的问题,一直在找,但是昨天居然在L站2周年的时候发现了一个宝藏公益站,里面居然有各种各样的免费模型,希望我的帖子能把大佬架起来,让公益站开的更久,也能支持更多的模型,但是使用模型的佬友们注意点,他这里面是好多贡献者令牌,每个贡献者一个令牌,可能是因为模型冲突的问题吧,希望唔系唔系能做的更好@一下大佬。https://linux.do/t/topic/1474234?u=chiclaude
标题: GitHub 宣布:GitHub Copilot 订阅已支持 OpenCode
作者: #Davon
板块: #前沿快讯
编号: 1477160
帖子: https://linux.do/t/topic/1477160
时间: 2026-01-18 09:59:49
摘要:
微软旗下 GitHub 宣布,可以在OpenCode 中使用 GitHub Copilot 订阅。
这意味着在 OpenCode 里也能直接用上 Copilot 的 AI 编程能力,比如智能补全、生成代码、解释代码等。对习惯用 OpenCode 的开发者来说,又多了一个顺手的 AI 编程搭档。但是哈,我个人感觉微软的Copilot 上下文很小,输出也是,所以具体还需要进一步体验
标题: 【求助】这是什么情况,申请gemini 学生优惠遇到问题了
作者: #xfb615
板块: #开发调优
编号: 1477173
帖子: https://linux.do/t/topic/1477173
时间: 2026-01-18 10:02:08
摘要:
我的申请页面是这样的,提示 您的账户在年满 18 岁之前,人工智能功能有限

可我看过自己账号资料设置,明明已经超过18岁了,而且这个号是两年前申请的资料也没改过,就是平时用得少(难道和这个有关? )我有点好奇,谷歌到底是根据什么来判断年龄的呢。遇到这样的情况怎么破
标题: 求助各位大佬,前端开发还可以继续走下去吗?现在前景比较好的方向有那些?
作者: #muzi123
板块: #开发调优
编号: 1477182
帖子: https://linux.do/t/topic/1477182
时间: 2026-01-18 10:04:07
摘要:
本人是二本本科,进入一家小公司,本来以为是前端,结果是全干。后面发现其他也不是很难,学了点后端就搞定了,后面有AI就更简单了,基本就是面向AI编程。就这样干了大半年,工资5-k左右,包住宿,包中午饭,但是好景不长,我有个同事最近用AI上线好几个项目,代码也没怎么审查,老板觉得他工作效率高,就安排其他工作了。问题来了,后面项目上线一大堆问题,多次加班,老板还坚决认为是我乱搞系统导致的,天地良心啊,我基本都没怎么改原本项目,背了好几个锅。想过完年找新工作,鉴于现在AI怎么强大,不知道继续深造前端还有没有用?听很多佬说,大模型有前途,我想问问具体要学什么,或者做到什么程度才用工作。或者各位佬有自己的看法,也可以说说。
标题: copilot 多开?
作者: #guan
板块: #搞七捻三
编号: 1477188
帖子: https://linux.do/t/topic/1477188
时间: 2026-01-18 10:05:12
摘要:
vscode 里自动补全感觉copilot 比windsurf 强不少,但免费额度只能支持1周的量,
如果有多个github 账号,如何能尽量减少账号的登录和登出切换,快速使用下一个账号的额度?谢谢
标题: 买个服务器用来部署公益中转和openwebui?
作者: #Haggi
板块: #搞七捻三
编号: 1477196
帖子: https://linux.do/t/topic/1477196
时间: 2026-01-18 10:06:41
摘要:
需求如题,有啥推荐吗,一个月30以内能搞定吗
标题: 好企业收集加工人维权
作者: #txiaoleixiao112
板块: #搞七捻三
编号: 1477206
帖子: https://linux.do/t/topic/1477206
时间: 2026-01-18 10:09:35
摘要:
如题所示
想开发一个这样的APP
目前的技术就是小程序原生开发
H5用react
APP用fulter
后端用GO开发
各位佬怎么看

先说前景:刷视频刷到一个打着为工人维权的角度开发一个app,但是里面穿插收费和广告
实在是看不惯

ok 进入正题。之前开发了一半的项目,目前想继续开发,然后初衷就是把项目开源。人多力量大,也不会因为被举报导致项目终止。各位佬怎么看,需要继续进行下去不
标题: 加入家庭组是否会降智
作者: #duck_lite
板块: #搞七捻三
编号: 1477209
帖子: https://linux.do/t/topic/1477209
时间: 2026-01-18 10:12:23
摘要:
rt,因为一直没资格所以选择了家庭组.感觉没那么好用?甚至不如我之前在aistudio上用的2.5pro,所以加入别人的家庭组使用的是阉割版的Gemini 3 Pro吗
标题: chrome的这个vertical tab不错啊,可以卸载arc和dia了
作者: #jiji262
板块: #开发调优
编号: 1477211
帖子: https://linux.do/t/topic/1477211
时间: 2026-01-18 10:12:31
摘要:
UI上的更新看来确实不是核心竞争力啊
标题: 何……何意味?
作者: #丹坊小学徒
板块: #搞七捻三
编号: 1477224
帖子: https://linux.do/t/topic/1477224
时间: 2026-01-18 10:14:40
摘要:
标题: 想问问佬们一般是怎么赚取LDC
作者: #walengzhi
板块: #搞七捻三
编号: 1477249
帖子: https://linux.do/t/topic/1477249
时间: 2026-01-18 10:22:46
摘要:
如题,想请教佬们一般是怎么获取LDC的,最近ddl临近,在赶论文实验,想用LDC买一些Hotaru的Claude Code额度,但是杯水车薪
(趁机好评+感谢一波L站里的各个公益站大佬)
标题: 大家有没有AI公益站统一管理程序?
作者: #Alex Yang
板块: #搞七捻三
编号: 1477256
帖子: https://linux.do/t/topic/1477256
时间: 2026-01-18 10:25:38
摘要:
陆陆续续注册了不少AI公益站,使用的时候都是在Cherry Studio里面随便选择模型,遇到不能用的就直接换其他模型,也不知道哪些站点还活着,哪些站点的模型有什么变化。
那么,有没有办法将自己注册过的AI公益站进行统一管理,可以随时了解站点的生存状况,模型的新增和实效情况?