LinuxDo 新帖推送

标题: 大模型API调用和网页端对比
作者: #吃风筝的人
板块: #开发调优
编号: 1409620
帖子: https://linux.do/t/topic/1409620
时间: 2026-01-06 01:40:53
摘要:

一直好奇一件事，网页端大模型和API调用相对比，回答质量有什么差别。之前根据使用体验一直感觉是API更准，而且对话能调的设置也更多一些。Gemini更新之后感觉网页端又行了……吗？而且网页端的确多一些联动小功能感觉还挺好用的。
另外同为API，aistudio的和vertex的有区别吗？
对话内容偏重数学专业和计算机算法领域，三家大模型Oai，Gemini和Claude大家推荐谁比较适合？
个人因为累积薅了好几回gcp300$的羊毛，所以用Gemini比较多。Claude是通过GitHub copilot学生包使用的，然后就是近期的Google反重力，一般也是编程写代码用。Oai只用过网页端，之前先后充过几次会员，感觉对话效果一般，没有明显拉开差距，所以就没怎么用了。近期再次开用也是因为k12教师认证，让我重新注意到它。能用网页端5.2，但不能用codex。模型经测试和我朋友的正经会员相比没有降智。
另外吐槽一句，oai思考拉满回答是真慢啊。

1 view17:41

LinuxDo 新帖推送

标题: 孩子们别睡了，反重力画图额度是不是炸缸了
作者: #橴湙
板块: #搞七捻三
编号: 1409622
帖子: https://linux.do/t/topic/1409622
时间: 2026-01-06 01:41:02
摘要:

1 view17:41

LinuxDo 新帖推送

标题: 一觉醒来L站物价贬值十亿倍，身价50积分的我成了顶级富豪
作者: #nic
板块: #搞七捻三
编号: 1409623
帖子: https://linux.do/t/topic/1409623
时间: 2026-01-06 01:41:29
摘要:

一觉醒来L站物价贬值十亿倍，身价50积分的我成了顶级富豪。
“什么？gpt team只要0.01积分，gpt plus只要 0.5积分，各来一个，不，给我来五个！”
“公益站0.1积分1000刀？先来一万刀我刷刷 “

1 view17:43

LinuxDo 新帖推送

标题: 新年再添一喜:QQ飞车1/6白嫖的道具就抽到了付费赛车~
作者: #欣欣|林可欣
板块: #搞七捻三
编号: 1409624
帖子: https://linux.do/t/topic/1409624
时间: 2026-01-06 01:44:19
摘要:

周年活动抽奖道具都是免费送的 大概花了200个“水晶”
正好今天是1月6号  有缘分



豆包统计的社区数据:

虽然不一定是这一期的，但是每一期概率差不多

1 view17:46

LinuxDo 新帖推送

标题: 才发现其实苹果ARM架构的CPU真的很强果断下单4台mac mini
作者: #ChenSa
板块: #开发调优
编号: 1409631
帖子: https://linux.do/t/topic/1409631
时间: 2026-01-06 01:47:22
摘要:

买了4台Mac mini m4 跑项目一定很爽 原因是今天测了一下我的m3 macbook 真的很吊 性能比肩我的桌面端R7 7950 …

1 view17:48

LinuxDo 新帖推送

标题: Pt站星陨阁工作组招募
作者: #xiaoyan
板块: #搞七捻三
编号: 1409636
帖子: https://linux.do/t/topic/1409636
时间: 2026-01-06 01:52:42
摘要:

如违反规则请直接删除！
均为黑工）无人民币工资
站点以国漫为主，需要进站的佬可以留下邮箱，id，任意一站低隐私，如无其他站点，也可以说明一下
招 web，美工，UI设计，保种，剪辑，Java Vue
保种5t两年，退休永v
剪辑为去头尾去广告，操作简单
计划Java+Vue进行重构，已新建文件夹，有兴趣和精力的大佬烦请留个联系方式）
有兴趣也可以发送邮箱至y08lin4@gmail
（linuxdo不常访问）

1 view17:53

LinuxDo 新帖推送

标题: 真的，一直到现在，我实在再没有吃到那夜似的好*积分*了
作者: #ggvis
板块: #搞七捻三
编号: 1409639
帖子: https://linux.do/t/topic/1409639
时间: 2026-01-06 01:58:43
摘要:

真的，一直到现在，我实在再没有吃到那夜似的好积分，——也不再看到那夜似的好赞了。

赶上了末班车，水到了几百积分，真怀念这个遍地是赞，到处是积分的好时候啊
PS：新的积分规则真是简洁明了

1 view18:01

LinuxDo 新帖推送

标题: 一些关于积分规则的建议和讨论
作者: #Lison
板块: #运营反馈
编号: 1409640
帖子: https://linux.do/t/topic/1409640
时间: 2026-01-06 02:02:11
摘要:

对于积分规则，有如下建议：

积分主要由登录签到获取，适当提高签到分数的获取，比如 20。
每在线时长一小时 1 分。

在关键板块：

任何发帖都需要消耗 1 积分。防止无意义的水贴。（这样可以保证回复有信息量）
发布任何话题都需要消耗 10 积分。防止出现没有意义的话题（不然可能入不敷出）。
得到回复将得到 1 积分（也就是说让人有讨论的欲望）。
点赞需要消耗积分，给出点赞扣 1 分，则获得点赞的人得 5 分。（让回复有代价但高回报）
积分可以用来问题悬赏。

在水贴板块或者抽奖板块：

回复和主题发布都不消耗和奖励积分。但是点赞仍然是给出点赞扣 1 分，则获得点赞的人得 2 分。鼓励有趣的水贴。

这样可以减少关键板块的水贴量，增加论坛的硬核纯度，降低无用信息密度，同时也保证了浏览量。

1 view18:03

LinuxDo 新帖推送

标题: 【抽奖】GPT 1年 Plus 未绑卡 *1
作者: #Online Mo
板块: #福利羊毛
编号: 1409645
帖子: https://linux.do/t/topic/1409645
时间: 2026-01-06 02:05:09
摘要:

抽奖主题： GPT 1年 Plus 未绑卡 *1
 奖品详情：
[奖品1]：GPT 1年 Plus 未绑卡
 活动时间：
时间：Tue, Jan 6, 2026 12:00 AM CST→Sat, Jan 10, 2026 12:00 AM CST
 参与方式：
在本帖下任意回复。
 抽奖规则：
每位用户仅允许参与一次。
使用官方抽奖工具随机抽取中奖者。
 注意事项：
本活动将在活动截止时间后关闭回帖，以确保公正性。
中奖者将在活动结束后24小时内在本帖公布，并通过私信通知领奖方式。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
期待您的积极参与，祝您好运！如有任何疑问，欢迎随时联系抽奖发起人。

1 view18:06

LinuxDo 新帖推送

标题: 大家现在codex 官方号用什么轮询？
作者: #你好坏噢
板块: #开发调优
编号: 1409647
帖子: https://linux.do/t/topic/1409647
时间: 2026-01-06 02:07:06
摘要:

搞了plus号不知道用什么轮询好，搞多几个直接不用上中转站了
看了几个中转系统 都是中转中转站的

1 view18:08

LinuxDo 新帖推送

标题: 刚才服务器上的geminicli自动挡把没运行的镜像全当垃圾删了望周知
作者: #啊天
板块: #开发调优
编号: 1409650
帖子: https://linux.do/t/topic/1409650
时间: 2026-01-06 02:09:59
摘要:

自动挡滴神
哭了没’
半夜气的

1 view18:12

LinuxDo 新帖推送

标题: 与claude4.5o-t谈“让AI「随机」”
作者: #欣欣|林可欣
板块: #搞七捻三
编号: 1409657
帖子: https://linux.do/t/topic/1409657
时间: 2026-01-06 02:19:05
摘要:

这几天一上线就看到大事件，然后水一堆
导致本来想发的一直没发
今天清库存!
来自1月3号的灵感:
我最近经常看到让ai进行随机工作的情况
自从知道AI的原理以及概率性逻辑
我一直在思考这个问题
毫无厘头，直接让人家给一个随机的数字
80%的会给42
概率性使然
就算有1亿个人问他这个问题，他每一次也相当于是第一次回答这个问题
而第一次的概率就是如此之大
所以显然让他随机是不可能的
到底为什么不可能？
我的想法是:
人工智能在模仿人类!
你让做这种选择题
本质上就是让人类随机选一个人
太大的主观因素
招聘环节 三个人，你知道他们的所有信息，非要你随机选一个，你肯定会受到某个人颜值是你偏爱的影响 无可厚非，一定有一定影响
具体一个情景
发了一篇文章搞了个抽奖，评论区有100人回复 有人回复很长，有人简单回复支持
有人对你进行批评，有人写了一堆金句
把这100条全部丢给爷爷，让他你随机选一条定位抽奖，目标
100% 他不会去学那些回复支持的人
99%他不会选择那些批评你的人(除非说的精辟 中肯 建设性 而非纯粹攻击性，但是很少)
到底会选谁呢？不言而喻
这是真实发生的 有很多例证
所以ai会怎么想？
叫我随机一下 我看看 有些人回答的很不错 选他们比较好，但是用户要求我随机，让我重新思考
再看看大部分回复很平庸，甚至是简单的两个字 但是他们数量太多了，该选谁呢？ 这很难选择，让我再思考一下
还有些人对用户进行的批评 该选择他们吗？会不会被用户认为是刻意的？ 是否应该照顾用户的情绪呢？ 但这时候又违背了随机
看起来想要随机非常困难 综合考虑，我还是选择这位回答优质的用户吧~
大概就是这样的思路
所以，你怎么看？

1 view18:20

LinuxDo 新帖推送

标题: 深夜闲聊：如果Claude模型全部开源会发生什么？
作者: #氯雷他定
板块: #搞七捻三
编号: 1409659
帖子: https://linux.do/t/topic/1409659
时间: 2026-01-06 02:21:09
摘要:

对比国内的ai厂商，基本上都是开源的，像是什么千问，glm，deepseek等，好像基本都是全参开源。
但是国外的大模型大部分都是闭源，如果Claude开源了，会对我们的生活带来什么不一样的体验吗？

1 view18:23

LinuxDo 新帖推送

标题: 佬们，为啥点赞不行啊
作者: #好哦
板块: #搞七捻三
编号: 1409660
帖子: https://linux.do/t/topic/1409660
时间: 2026-01-06 02:21:57
摘要:

佬们，为什么我经常点赞点不了，会弹出如下图所示的窗口

1 view18:23

LinuxDo 新帖推送

标题: 简单易懂的LLM相关知识梳理-ep.3-1 认识大语言模型
作者: #flymyd
板块: #文档共建
编号: 1409664
帖子: https://linux.do/t/topic/1409664
时间: 2026-01-06 02:25:58
摘要:

目录帖：
  
    
    
    
      简单易懂的LLM相关知识梳理 
  

文档共建
    
  
  
    迫于项目被砍，失业赋闲在家，恰好也快过年了不想动了，想了下写点文章回馈下社区吧。 
PS：如有年后Base重庆的AI/全栈/FAE岗可PM我 
本文从实用角度出发，梦到哪写哪。部分八股文知识就不搬了，这里主要分享一下本人在使用各种云服务及本地部署过程中学到的知识。 
这里优先介绍LLM/VLM，暂不涉及音频/视频/Omni相关模型（也可能梦到了以后补一下） 
注：文章为本人手写，部分模型介绍搬运自…
  


写着写着梦游了，所以只好改标题单开一章
===============正文分割线===============
警告：本章含有大量Transformer相关的粗浅知识。笔者也不是特别精通，仅供参考。
在又一个普通的清晨，你又在工位上吃着早餐，突然你的领导又又又叫你去会议室，等你再出来时又已经是彻底无语。
“网络安全…公司信息安全…私有化…本地部署”
好，你大概能理解公司领导那莫名其妙的掌控欲，那么有什么卡可以用呢？八张H100还是一张3060？可你根本不了解大模型的知识。
小贴士：

开放模型的权重可以在Huggingface和ModelScope下载。这也是目前世界和国内最流行的两个大模型权重托管平台
Huggingface被墙了，但有镜像站：https://hf-mirror.com
虽然ModelScope在国内，但有时候会遭到莫名其妙的限速，hf-mirror配合Aria2脚本下载也未必见得慢
我个人追踪模型前沿动向的信息源主要有：Reddit-r/LocalLLaMA、小红书、QQ群、知乎（重要程度从大到小排序）
在小红书上多刷大模型的帖子而忍住不去点美女的帖子需要一定的毅力，幸好我坚持下来了

作为一个小萌新，你上次部署大模型还是在闲鱼上花了29.9买了本地部署DeepSeek教程，最终得到了一坨奇怪的东西。这次你不得不静下心来学习一番了。
在看了一堆奇奇怪怪的教程以后，你准备了一份离职报告，准备等领导开完会以后递上去。在等领导开会的期间里，你无聊地刷着LinuxDo…突然发现了一篇行文诡异的帖子，就好像梦呓一样。看完了以后你顿觉醍醐灌顶，好像知识以托梦的形式进入了你的脑子。
如果阅读过ep.1和ep.2，相信你至少已经用过了不少大模型。但这世界上很多事情都是知其然而不知其所以然，大模型的结构到底是什么样子？
这里我将以Qwen3-32B和Qwen3-30B-A3B举例。这是两个参数量相近但结构不同的模型。
Dense模型和MoE模型
在2026年这个节点上，Dense（密集、稠密）结构通常出现于较小参数的模型上，而大参数模型都转向了MoE（混合专家）结构。
通俗一点讲，大模型就是一坨神经网络，里面是一层层的神经网络块，它们由许多参数构成。

Dense：不管你输入了什么，神经网络里的每个参数都要参与计算。比如你去一个诊所里，这里只有一个医生。不管你是感冒还是骨折了，都是他来看这个病，看病的时候还得把脑子里的所有知识都过一遍，无论是生活常识还是医学知识。
MoE：路由层会根据你的输入来判断把你的输入递交给几个特定的专家。医院有大有小，医生水平也各不相同。但无论如何这个医院都存在分诊台和好几个专科医生。每次看病都只会有几个专家来给你看病，而不是集合医院里的所有力量。

看起来MoE更好，但事物都是有两面性的。先看缺点：

Dense：推理计算量要求更高，说白了就是慢。如果这个模型是一个很大参数的Dense，每次推理的速度将会慢的发指。
MoE：很容易就可以通过扩充专家的方法达到很大的总参数量。但思维密度/深度远不如同尺寸的Dense模型。

再看优点：

Dense：在同参数量的对比下，Dense模型比MoE聪明的多。
MoE：因为每次只激活一部分专家，计算速度比同参数量的Dense模型快得多。

对比：
Dense就像是智商150的天才，但一个人的精力有限，精通STEM的时候就不太可能懂得如何炒菜，甚至可能搞出来铁钉炒鸡蛋。
而MoE像是8个智商120的人构成的团队，涉及STEM领域时可能捆起来都打不过智商150的天才（奥数题只存在做得出来和做不出来之分），但他们还掌握了更多其他的技能。
在了解了Dense与MoE之分后，让我们进入实战，通过对比两款典型的模型的样子，来了解大模型的知识。
通过阅读Model Card进行有点硬核的知识分解
首先打开Huggingface，在顶部搜索栏里搜索Qwen3-32B。你将会看到搜索结果里显示Qwen/Qwen3-32B。这是模型ID的常见表示方法：组织机构名/模型名。
点击后跳转到https://huggingface.co/Qwen/Qwen3-32B，首先看到的是Model Card（模型卡）页面。它是一个Markdown，介绍了这个模型。
如果想查看这个模型的变体（如量化版本、微调版本等），可以在网页右侧的Model tree找到。这个稍后讲。
相似总参数量的Dense与MoE的异同点
我们阅读一下Model Card里的描述节选：
Qwen3-32B has the following features:

* Type: Causal Language Models
* Training Stage: Pretraining & Post-training
* Number of Parameters: 32.8B
* Number of Paramaters (Non-Embedding): 31.2B
* Number of Layers: 64
* Number of Attention Heads (GQA): 64 for Q and 8 for KV
* Context Length: 32,768 natively and 131,072 tokens with YaRN.

人话版：
* Dense还是MoE？没标明就是Dense。
* 类型：因果语言模型（现在大模型基本都属于此类，基于前面的内容预测下一个Token，属于自回归类）
* 训练阶段：预训练与后训练（先用海量数据学习通用知识，再用各种手段如SFT和RLHF等进行后训练。如果是Base模型则没有后训练）
* 总参数量：32.8B（即328亿，通常都取个整来讲）
* 非嵌入参数量：31.2B（总参数量-非嵌入参数量=词表嵌入层参数量，算下来这里有1.6B的词汇表，这意味着有多语言支持。单英语会比这个数小不少）
* 层数：64层（64个Transformer模块堆叠，通常层数越深，模型的抽象推理能力就越强）
* 分组查询注意力：64个查询头（Q）和8个键值头（KV）。这样有利于在有限的显存里跑更长的上下文。
* 上下文长度：原生32K，通过YaRN（基于旋转位置编码 RoPE 的修改）可以扩展到128K。

补充知识：什么是GQA？
这里涉及了注意力结构的知识：

Q的数量代表思考并行度，决定了模型每一层能从Q个不同的角度去理解当前的输入。
KV的数量代表需要缓存多少数据，也就是记忆的存储成本。KV要存在显存里，所以KV多了就需要更多的显存搬运，拖慢速度。
Q:KV=1:1是典型的多头注意力（MHA），对细节的理解能力最强但显存占用很大，推理很慢。
Q有很多但KV只有1个则是多查询注意力（MQA），推理快但容易丢细节。
Q和KV都不止一个，而是按照一定比例分配，则为本模型的分组注意力（GQA），每组Q共享一个KV。属于折中方案。

补充知识：什么是YaRN？
为什么上下文长度既有32K又有128K？这里使用了常见的上下文外推技术YaRN：

原生32K意味着这个模型在预训练阶段实际见过的最大文本长度。在这个上下文长度内性能是最好的。
当需要处理长文本的时候，可以通过旋转位置编码（RoPE）来取巧，把模型的视野拉长，但会损失精度和细节。
比如说这个模型是一把尺子，只有0到32K的刻度。如果你用它去量64K的文本，那后面对于模型来说就是古神，看一眼就会发疯，开始乱吐Token。
但RoPE会把64K的文本压缩到32K（动态压缩倍率=输入长度/原生长度）。这样，虽然被拍扁以后的文字变糊了，但至少能差不多看清楚了。
YaRN是RoPE的扩展，对于宏观结构进行压缩，对于微观细节尽量不压缩。这样即保证了模型能通读，又尽可能地保留细节。

又臭又长的前置知识看完了，那么看看相似参数量的Qwen3-30B-A3B换换脑子：
Qwen3-30B-A3B has the following features:

* Type: Causal Language Models
* Training Stage: Pretraining & Post-training
* Number of Parameters: 30.5B in total and 3.3B activated
* Number of Paramaters (Non-Embedding): 29.9B
* Number of Layers: 48
* Number of Attention Heads (GQA): 32 for Q and 4 for KV
* Number of Experts: 128

1 view18:26

LinuxDo 新帖推送

标题: 🤣用erzi.me邮箱注册的gptai被封啦
作者: #chancat
板块: #搞七捻三
编号: 1409666
帖子: https://linux.do/t/topic/1409666
时间: 2026-01-06 02:31:34
摘要:

如题。。昨天翻帖子看大佬说用这个注册就是教师资格，果然如此，爽了我一晚上美滋滋的睡觉了，第二天吃午饭呢就收到邮件通知违反将停用。是ip不干净的原因吗?

还有捣鼓的两天才通过那个一年的认证，有领取资格了，结果验卡的时候傻眼，我用的小红卡被拒绝。烦死了。 来晚了啥都没赶上

1 view18:33

LinuxDo 新帖推送

标题: 导师给买了Cursor Ultra ,想咨询一下Ultra的使用上限大概是多少呢？
作者: #Yiyabo!
板块: #搞七捻三
编号: 1409667
帖子: https://linux.do/t/topic/1409667
时间: 2026-01-06 02:33:37
摘要:

如题图，今晚上导师给安排了Cursor Ultra。想咨询一下各位 Ultra 订阅我只用4.5 opus thinking，差不多能用多少呢？或者就是这个订阅的额度上限是多少呢？可以超限使用，这个号可能以后就不用了，目前这个卡也无所谓。

1 view18:33

About

Blog

Apps

Platform