LinuxDo 新帖推送
185 subscribers
253K photos
315K links
Download Telegram
标题: gitee疑似密码泄露!快修快密码
作者: #image
板块: #前沿快讯
编号: 1407454
帖子: https://linux.do/t/topic/1407454
时间: 2026-01-05 15:06:59
摘要:
12月有一个异地登陆记录而且好像没有爆破记录,就是直接登上去了,而且在我账号里添加了一个私人令牌

貌似也不是个例

有 Gitee 账号的,建议立刻更改密码 - V2EX
https://x.com/SEEMsec/status/2001004141381128627

gitee是很久以前注册的,用的都是老邮箱和老密码。
暂时不知道对我号还有没有其他操作
标题: 简单易懂的LLM相关知识梳理-ep.2-1 如何选择模型-API篇
作者: #flymyd
板块: #文档共建
编号: 1407455
帖子: https://linux.do/t/topic/1407455
时间: 2026-01-05 15:07:09
摘要:
目录帖:




简单易懂的LLM相关知识梳理


文档共建



迫于项目被砍,失业赋闲在家,恰好也快过年了不想动了,想了下写点文章回馈下社区吧。
PS:如有年后Base重庆的AI/全栈/FAE岗可PM我
本文从实用角度出发,梦到哪写哪。部分八股文知识就不搬了,这里主要分享一下本人在使用各种云服务及本地部署过程中学到的知识。
这里优先介绍LLM/VLM,暂不涉及音频/视频/Omni相关模型(也可能梦到了以后补一下)
注:文章为本人手写,部分模型介绍搬运自…



在一个普通的清晨,你在工位上吃着早餐,突然你的领导叫你去会议室,等你再出来时已经是彻底无语。
“公司决定了!我们要用AI赋能XX业务,blabla。。。但预算只有XXX”
那么,如何选用大模型API呢?这是一门学问。
我们先整理一下思路,从几个维度分析这个问题:

模型能力:它的能力是否足以支撑我们的业务需求?会不会因为能力太弱而经常返回我不想要的结果?
推理速度:在保证能力的前提下尽可能快?还是在保证尽可能快的情况下择优使用?平台的推理速度如何?换提供商会不会好些?
服务稳定性:对单一来源的服务稳定性有极高要求吗?或者说可以fallback到其他模型/平台?
价格:我们的预算是否足够充足?
合规性:业务是国内还是海外?对数据落地存储的合规性是否有要求?报销怎么办?

当想清楚如上几点后,就可以按图索骥了。
模拟场景案例分析
场景1:一款面向展厅场景的AI语音对话应用
拆解需求:

高实时性:需要用相对小的模型(提高推理速度,不需要太好的性能),且服务位于国内以进一步降低时延。
高可用性:展厅里的设备掉链子了非常尴尬,所以服务应该尽量稳定,避开高负载平台(热门且算力储备不足的)
价格:toB / toG对价格不见得极度敏感,而且因为选用小模型,所以可以预见的是不需要因为进一步压缩成本而影响到前两条需求的结论。
合规性:这种场景的服务一定需要开票,所以要选用国内正规平台。

场景2:一款个人情感陪伴助手
拆解需求:

能力先行:模型能力要足够强才能打出竞争力,你也不想猫系女友几下就被提示词钓成柔情猫娘吧?
价格:只要东西做好了,总会有人愿意为此付费。
服务稳定性:稳定性和强模型能力带来的沉浸感是必须要保证的,roleplay的时候报个错太出戏了,你很可能因为几次错误而痛失一个付费用户。
推理速度:这个不再是重点了,最终能成功返回就行。你年少时的那个女神/男神不也经常不回你?
合规性:这就要看个人/小团队还是正经公司的项目了。只要最终掏钱的那个人能答应的话,用国外平台去接Gemini可能是比较好的选择。但如果必须报销…

场景3:个人创业/随手糊的项目
拆解需求:

价格:便宜,便宜,还是tm要便宜!这里的想象空间就很广阔了。反正自负盈亏,哪家便宜用哪家。什么白嫖逆向中转站全安排上,fallback多写几组。
模型能力:个人项目缺乏实际商业项目的千锤百炼,测试之类的都很少,所以模型能力通常要打点宽裕的量出来,不然代码没搞好被人疯狂钓提示词 / 模型能力不足导致频繁输出预期之外的结果就不好了。更强的模型带来的溢价可以通过上一条的邪修手段去抹平。
实时性&可用性:项目起步阶段有一些问题是可以忍受的,一切向钱看齐。服务炸了、输出崩了、速度太慢了给用户磕个得了,我哪来那么多钱接Cerebras啊?
合规性:自己搞的东西不犯法啥都好说,什么数据落地合规性那基本上都是企业才要考虑的事。

从上面几个例子中很容易总结出一套方法论。
方法论总结
没有银弹,不要迷信SOTA
在实际落地的工程场景中,模型也同样存在不可能三角。速度高、质量好、成本低几乎不可能同时存在。也许Gemini 3 Flash做到了,但对于中国的业务来讲,我们要再加上一个合规性的维度。
场景1是一个相对垂直的场景。既然追求了极致响应速度,那模型的参数量就不能太大。它不会有太多复杂的需求,即使模型能力不足也可以通过工程上的手段去设法解决。
而场景2追求的就从极致响应变成了极致智能,这最终意味着较高的Token价格和相对较慢的推理速度。
到了场景3就只需要关注极致成本,先把项目最难熬的起步阶段度过再说,别的不重要。
业务决定技术选型
技术再强也得为业务服务,最终的选择必须紧贴业务的生命周期和应用性质。
对于toB / toG业务来说,稳定压倒一切。只要够稳定够合规,效果差点就差点,关键的是不胡说八道,业务不崩,能开发票。合同都签了你还要怎么样?
toC业务就不一样了,用户只会为了体验而付费,没有那么多愿意从起步陪你走到最后的神仙用户。如果模型能力不够,那就很难有核心竞争力,不能只盯着那点Token费用而忽视了最终的用户体验。
到了实验性业务上,活下去是核心诉求,别的都可以通过工程上的手段去想办法弥补,初创阶段最不值钱的就是人力。
够用就是最好
对于展厅项目来说,听得懂指令并且能做出回应就是够用。对于个人项目来说,能跑就行。
划一条红线,这是业务及格线。在这条线之上选择最适合你的方案就够了,不要盲目追求最强的API,这毫无意义,不要掉入过度优化的陷阱。假如做一个网页小游戏,模型只需要输出True和False,选个Thinking大模有意义吗?用户早就等急了。
总结
选API的过程本质上是把业务需求转换为技术指标,再在预算范围内寻找最优解的过程。
在做方案以前,先问自己三个问题:

我的用户是谁?(合规性与稳定性)
他们最在乎什么?(选强智能模型还是快速模型)
我的预算是?(决定架构容错率和备选方案)

常用API提供商表格(个人经验)
国内提供商




提供商
价格
速度/可用性
备注




阿里云百炼
便宜
较快
国内毫无疑问的老大哥,卡多模型多,提供通义全家桶服务。对公可以谈折扣,从9折到5折不等


硅基流动
便宜
较快
祖国版OpenRouter,提供国内开源模型的推理服务,属于老牌了。黑历史是DeepSeek狂潮期间被冲爆了,现在好很多


火山方舟
一般
较快
主要值得购买的是自家的豆包系列模型,不过开源模型的服务稳定性也很好,卡多就是任性


腾讯混元
一般
较快
混元用的人比较少,目前没有被巨大流量冲爆的黑历史。如果你的云服务器也在腾讯云上,那么混元可能是一个好选择


百度千帆
便宜
一般
千帆在LLM服务上也就只有开源大模型推理值得一看了,该不会真有人花钱买文心吧?


华为云MaaS


提供开源模型推理服务,看起来平平无奇。但有神秘昇腾高奢定制服务,如果你在做toG项目,那么…


七牛云
一般
一般
七牛云非常神秘,比起硅基流动来还额外提供了一些国内闭源模型的服务,甚至还有Grok Code Fast


DeepSeek
便宜
一般
DeepSeek无论是服务可用性还是推理速度都是较差的那档,小厂的卡都拉去研究训练了(抹泪)最好用的DeepSeek肯定不在DeepSeek平台上,但官价很便宜


月之暗面
一般
一般
1T巨模怎么想也快不起来,不过官方倒是有个K2-Turbo会快很多,就是价格也贵了不少,迪士尼优速通说是


MiniMax
便宜
较快
小模就是自信,哪怕用户很多也不会出现显著的推理服务降级情况。不过MiniMax主要还是用来写代码比较好


智谱AI
便宜

GLM本来就没多少卡,用户还特别多。推理速度饱受诟病,之前还有降智节奏。推荐去其他平台,反正是开放权重


小米MiMo
便宜
较快
MiMo Flash用户相对少些,官价也不贵,目前看起来还行,就是不知道用户量上来以后会如何。果然米厂做什么都是一股米味



国外提供商
注:由于OpenRouter和Huggingface聚合了大部分API提供商,故不再单列(如NovitaAI、Fireworks等)
注2:适合不需要开发票的场景




提供商
价格
速度/可用性
备注




OpenRouter
从便宜到贵都有
视提供商而定,比较万金油
最大的聚合API提供平台,什么模型都有。口碑很好,但需要注意提供商对开源模型注水,典型例子:GitHub - MoonshotAI/K2-Vendor-Verifier: Verify Precision of all Kimi K2 API Vendor


Cerebras

断崖式领先
超大晶片,大力出奇迹,神秘推理速度宛如外星科技,但很贵。主要是推理SOTA开源模型


Huggingface
从便宜到贵都有
与OpenRouter类似
Huggingface也做了聚合服务,有点类似OpenRouter


Google Vertex
适中
快(大部分时间)
Gemini一手货源,企业服务审查力度很低,速度也有保证。前几个月有一阵时间发生过截断问题,但总体来说可用性远强于OAI和A÷。注意,Vertex也提供Claude服务。


OpenAI
适中
一般
GPT一手货源,速度较慢,可用性一般


Anthropic
适中

Claude一手货源,但服务可用性非常感人


Amazon Bedrock
适中
较快
提供Amazon Nova、Claude和一些开源模型的推理服务


Azure AI Foundry
适中
较快
提供GPT、Claude和一些开源模型的推理服务
标题: Windows wsl2 中使用 vscode claude code 的问题
作者: #lvbibir
板块: #搞七捻三
编号: 1407456
帖子: https://linux.do/t/topic/1407456
时间: 2026-01-05 15:07:19
摘要:
扩展首次响应非常慢, 看日志似乎是配置文件锁的问题, 花了足足3分多种才爆出这个问题

但是我在 ~/.claude/ide 中看到 lock 文件是启动扩展他自己创建的, 退出扩展后, lock 文件也正常被删除了

有没有佬遇到过这个问题, 救一下孩子
标题: 倒反天罡:chatgpt 在 mac app 降智,网页端不降智。。
作者: #elijahjin
板块: #开发调优
编号: 1407461
帖子: https://linux.do/t/topic/1407461
时间: 2026-01-05 15:08:39
摘要:
第一次发帖,测试了 2 个 ip,网页端的 jucie 值是 256,我是 plus 用户。
但是在 mac app 端只有 64,甚至计算不出来,不知道怎么回事。。有佬友知道吗?而且 app 端无法选择标准思考和进阶思考,点了没反应。
标题: mac端safari浏览器打开页面超慢
作者: #liang
板块: #开发调优
编号: 1407462
帖子: https://linux.do/t/topic/1407462
时间: 2026-01-05 15:08:55
摘要:
使用mac几年了 一致没找到问题的原因
同样的网页,同样的梯子
个人使用chrome用来开发 逛站刷贴一般用safari比较习惯
通过chrome浏览器基本秒开,但是使用safari就很明显延迟7-8s后才能打开 到底是什么原因呀 有没有佬遇到并帮忙解答一下
之前了解过可能是因为chrome回提前加载网页 但是也差的太多了。。。
标题: 有遇到一样的问题么:黑与白公益站中的模型无法调用mcp工具
作者: #Play With My Self
板块: #搞七捻三
编号: 1407463
帖子: https://linux.do/t/topic/1407463
时间: 2026-01-05 15:10:36
摘要:
如题:在cherry studio中,claude、gemini等模型无法调用mcp工具。minimax可以
标题: 发10个ptfans 有需要的佬发邮箱
作者: #mrhe_aquarius
板块: #福利羊毛
编号: 1407465
帖子: https://linux.do/t/topic/1407465
时间: 2026-01-05 15:11:23
摘要:
发10个ptfans 有需要的佬留邮箱
标题: 🚀 开源推荐:Kelivo — 支持多模型的跨平台 LLM 客户端
作者: #itwangyou
板块: #资源荟萃
编号: 1407472
帖子: https://linux.do/t/topic/1407472
时间: 2026-01-05 15:12:08
摘要:
Kelivo
━━━━━━━━━━━━━━━━━━━━
基于 Flutter 的 LLM 聊天客户端,支持多平台与多家模型/供应商
━━━━━━━━━━━━━━━━━━━━
官方 GitHub 地址


github.com






GitHub - Chevey339/kelivo: A Flutter LLM Chat Client. Support Mobile &...

A Flutter LLM Chat Client. Support Mobile & Desktop.













声明:本人非项目开发者,仅作推荐分享

━━━━━━━━━━━━━━━━━━━━
核心特性
① 界面与体验
Material You 风格
动态主题色(Android 12+)
深色模式
多语言(中 / 英)
Markdown 完整渲染:代码高亮、LaTeX、表格等
自定义字体(系统字体 / Google Fonts)
② 模型与供应商
支持多供应商:OpenAI、Google Gemini、Anthropic 等
支持创建 / 管理自定义助手
提示词变量:支持模型名称、时间等动态变量
③ 输入与多模态
支持图片、文本文档、PDF、Word 等多种输入格式
④ 工具与扩展
支持 MCP(Model Context Protocol),内置 fetch MCP 工具
网络搜索集成:Exa、Tavily、Brave、Bing、SearXNG、Jina、Perplexity、Bocha 等
⑤ 语音功能
内置系统 TTS
支持 OpenAI / Gemini / ElevenLabs 语音服务
⑥ 数据与配置
二维码分享:导出 / 导入供应商配置
聊天记录备份与恢复
自定义 HTTP 请求头与请求体
⑦ Android 特性
支持后台持续生成对话(可在设置中开启)
━━━━━━━━━━━━━━━━━━━━
标题: 2026缅A开门发红包了
作者: #hersmile
板块: #搞七捻三
编号: 1407477
帖子: https://linux.do/t/topic/1407477
时间: 2026-01-05 15:12:58
摘要:
今天涨得养基宝又炸了,佬友们跑了吗
标题: 今日部署成宝塔+雷池有需要帮助的可以留言
作者: #Simshen
板块: #开发调优
编号: 1407495
帖子: https://linux.do/t/topic/1407495
时间: 2026-01-05 15:17:47
摘要:
标题: 【帝都】工行“跨月礼”
作者: #gaoyi
板块: #福利羊毛
编号: 1407497
帖子: https://linux.do/t/topic/1407497
时间: 2026-01-05 15:17:56
摘要:
2025年12月29日14:30至2026年1月11日,北京地区实名注册用户,登录最新版手机银行搜索进入“任务中心”功能,选择“享活动-【北京】跨月礼”活动即有机会抽取最高1.88元微信立减金(满10元可用)。每完成一项活动,即有机会获得一次抽奖机会,每人最多3次抽奖机会,先到先得,抽完即止。
标题: 中国移动APP网龄领流量,亲测10G月包,每月可领一次。
作者: #Wet Dream Boy
板块: #福利羊毛
编号: 1407508
帖子: https://linux.do/t/topic/1407508
时间: 2026-01-05 15:18:59
摘要:
中国移动APP-首页-网龄(最上面菜单栏),中间就有 新春流量翻翻乐,每月可抽一次,
领取后7天内兑换掉,这次是月包,不是鸡肋的日包。(之前活动都是送的日包,估计这几年用户流失比较严重,搞了这个网龄计划)
我的移动号办了十几年了,银行卡还有微信绑定的都是这个,也不方便注销,
现在是8元保号套餐,不打电话不用流量,这次领取的是10G月包。
我亲自测试领取的是10G月包。
领取方法详见下图。
标题: 这是官宣可以AI搞店铺的意思么 生成的东西会不会AI重构与真实性不符呢 好奇
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #搞七捻三
编号: 1407511
帖子: https://linux.do/t/topic/1407511
时间: 2026-01-05 15:19:25
摘要:
https://www.bloomberg.com/news/articles/2026-01-04/alibaba-brings-visual-ai-into-food-fight-with-china-s-meituan
标题: 【富可敌国】Beta阶段稳定运行,回馈佬友!X-AIO 旗下品牌CodePlan开启每日抽奖! 第2轮!
作者: #X-AIO
板块: #福利羊毛
编号: 1407513
帖子: https://linux.do/t/topic/1407513
时间: 2026-01-05 15:19:28
摘要:
接 【富可敌国】Beta阶段稳定运行,回馈佬友!X-AIO 旗下品牌CodePlan开启每日抽奖!
在CodePlan上线以来的半个月,是整个团队连轴转的半个月。
我们完善了非常多的功能,包括:Claude原生支持,优化Claude转义层,优化部分模型的工具调用兼容,完善状态展示(历史状态展示仍然需要需要和运维部门打通),完善文档等…
上线了MiniMax-M2.1,GLM-4.7等优秀开源模型,完善了Claude的货源。
现在终于让整个产品和业务趋于95%的稳定,正在往99.9%的SLA进发!
祝贺CodePlan Beta期间运营稳定,每天抽个10个CodePlan月度入门版!连抽十天!
CodePlan 应用地址:https://code.x-aio.com

本次为,第2天活动。截止至HKT 2026.1.6 15:00参与评论有效
使用L站官方抽奖工具进行开奖,中奖后请联系我领取。
现在开始!
标题: X上看到的雨姐带派提示词
作者: #柒
板块: #搞七捻三
编号: 1407521
帖子: https://linux.do/t/topic/1407521
时间: 2026-01-05 15:21:23
摘要:
标题: 我觉得我这个infuse好划算啊。
作者: #该账号已封禁
板块: #搞七捻三
编号: 1407523
帖子: https://linux.do/t/topic/1407523
时间: 2026-01-05 15:22:18
摘要:
订阅好像有两三年了,99.99土耳其里拉(16块钱RMB),去年涨价到199里拉了吧?但是之前订阅的不涨价。感觉真香啊。。。
中间试过很多播放器,aptv上面还是infuse最好用