标题: 🚀 来看看壮丽的宇宙吧!
作者: #King-Huiwen-of-Qin
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1407422
时间: 2026-01-05 14:57:54
摘要:
作者: #King-Huiwen-of-Qin
板块: #搞七捻三
编号:
1407422帖子: https://linux.do/t/topic/1407422
时间: 2026-01-05 14:57:54
摘要:
自从入手了智能望远镜以后一发不可收拾,每天都在寻找目标拍摄。
[!success] 在冬季的北半球朝南的天空能拍到最显眼的就是猎户座大星云了:
[!example] 猎户座大星云
[!example] 这是玫瑰星云
[!example] 这是圣诞树星云。由于拍摄时间过短,所以看上去还不是太明显,不过也能看出一些轮廓了
[!example] 这是马头星云。祝大家在马年事事顺利,一马当先!
[!example] 这是一张后期过的彩色月亮
标题: 求推荐国内大模型
作者: #Yaw
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1407426
时间: 2026-01-05 14:59:03
摘要:
作者: #Yaw
板块: #搞七捻三
编号:
1407426帖子: https://linux.do/t/topic/1407426
时间: 2026-01-05 14:59:03
摘要:
最近一段时间体验了一下 GLM 的月套餐在 claude 里面用起来还挺爽的,速度比较快,需求完成性也还可以,所以想问问佬们还有啥国产大模型可以接入 cladue 的
标题: 佬们,请教一下,软件功能演示宣传片(Product Launch Demo Video)是用什么制作的?
作者: #Yicun
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1407428
时间: 2026-01-05 14:59:15
摘要:
作者: #Yicun
板块: #搞七捻三
编号:
1407428帖子: https://linux.do/t/topic/1407428
时间: 2026-01-05 14:59:15
摘要:
佬们,请教一下,软件产品宣传片是用什么制作的?
标题: 最近摸鱼太少了,想收集下佬友看的小说,推荐点耐看的
作者: #Emp
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1407430
时间: 2026-01-05 14:59:53
摘要:
作者: #Emp
板块: #搞七捻三
编号:
1407430帖子: https://linux.do/t/topic/1407430
时间: 2026-01-05 14:59:53
摘要:
最近摸鱼太少了,想收集下佬友看的小说,
推荐点耐看的,什么类型都行。
标题: 【报喜】Xget 突破 7.5k stars!感谢佬友支持,汇报一下阶段性成果
作者: #Xi Xu
板块: #资源荟萃
编号:
帖子: https://linux.do/t/topic/1407433
时间: 2026-01-05 15:01:04
摘要:
作者: #Xi Xu
板块: #资源荟萃
编号:
1407433帖子: https://linux.do/t/topic/1407433
时间: 2026-01-05 15:01:04
摘要:
各位佬友大家好!
此前曾介绍过本人开发的开源项目 Xget。经过一段时间的持续迭代与维护,Xget 在社区的支持下取得了一些阶段性成果,特此向佬友们做简要汇报。
项目数据与应用情况
GitHub 数据:目前存储库累计获得 7.5k stars 及 1k forks;
扩展程序:配套浏览器扩展 Xget Now 用户基数已突破 8.5k;
生态引用:预部署实例(公共实例)目前已被 GitHub 上 100+ 个公共存储库文件引用;
榜单排名:曾位列 GitHub Trending (JavaScript, Daily) 榜单第三名。
社区认证与行业认可
平台认证:受邀入驻 GitCode 平台,并被认证为 G-Star 毕业项目;
媒体推荐:获得包括阮一峰、GitHubDaily、鱼 C 小甲鱼、玄离 199 等多位技术博主的自发推荐。
感谢 LINUX DO 各位佬友此前的关注与反馈。Xget 将继续保持更新,致力于提供更优质的体验,欢迎佬友们继续批评指正。
存储库:GitHub - xixu-me/xget: Ultra-high-performance, secure, all-in-one acceleration engine for developer resources
标题: kiro倒计时了嘛?之前的 cursor 还有windsf
作者: #张扬
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1407442
时间: 2026-01-05 15:04:18
摘要:
作者: #张扬
板块: #开发调优
编号:
1407442帖子: https://linux.do/t/topic/1407442
时间: 2026-01-05 15:04:18
摘要:
github.com/kirodotdev/Kiro
这是一个严重的aws帐号批量注册漏洞
已打开 03:48PM - 04 Jan 26 UTC
MicoMiOvO
pending-triage
pending-maintainer-response
### Before opening, please confirm:
- [x] I have [searched for duplicate or cl…osed issues](https://github.com/kirodotdev/Kiro/issues?q=is%3Aissue+)
### Operating System
all
### Kiro Version
all
### Bug Description
已经有共享出来的 Kiro aws协议注册机,非常影响付费用户
### Steps to Reproduce
<img width="747" height="894" alt="Image" src="https://github.com/user-attachments/assets/2e746783-9827-4ea4-b1fb-6832f82ae929" />
<img width="720" height="1131" alt="Image" src="https://github.com/user-attachments/assets/fa5ef543-e58f-4dca-9543-7e507ea29b6d" />
<img wid
标题: 多个CLI如何监控
作者: #特斯拉不动
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1407443
时间: 2026-01-05 15:04:35
摘要:
作者: #特斯拉不动
板块: #搞七捻三
编号:
1407443帖子: https://linux.do/t/topic/1407443
时间: 2026-01-05 15:04:35
摘要:
有佬知道运行了多个CLI怎么监控吗?手动看太麻烦了
标题: 瓦的怜悯之刃返厂了,洲的怜悯也返厂了怎么选?
作者: #𝑵𝒂𝒊𝒏𝒆
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1407444
时间: 2026-01-05 15:04:42
摘要:
作者: #𝑵𝒂𝒊𝒏𝒆
板块: #搞七捻三
编号:
1407444帖子: https://linux.do/t/topic/1407444
时间: 2026-01-05 15:04:42
摘要:
标题: 来白嫖ai网站,目前这几天的限时活动,可以获得99999点数
作者: #今天吃点啥
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/1407448
时间: 2026-01-05 15:05:46
摘要:
作者: #今天吃点啥
板块: #福利羊毛
编号:
1407448帖子: https://linux.do/t/topic/1407448
时间: 2026-01-05 15:05:46
摘要:
用来Ai文本对话或Ai绘图,各位有需要的可以到浏览器打开薅(不是广告,单纯白嫖付费ai,基本无限用gemini3.0pro,完全无限使用nanobanana和即梦4.0绘图
支持 nano banana pro、GPT5.2、Claude 4.5、海螺、即梦、通义千问
zaiwenai.com
在问 | 让知识无界,智能触手可及
在问社区是一个以科技普及为使命的免费开源社区,致力于为广大用户提供世界知识和专业服务。在问社区集成了众多优秀的大语言模型,用户可以轻松地获取和使用这些模型实现自然语言处理、智能问答、文本创作等多种功能。此外,我们还支持AI作画、文档分析、在线检索和思维导图等功能,帮助用户更高效地获取和处理信息。在问社区秉持开放、共享的精神,欢迎广大用户加入我们,共同探索科技的魅力。
标题: 又到4000点,大伙吃到肉了吗
作者: #随梦而飞
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1407452
时间: 2026-01-05 15:06:26
摘要:
作者: #随梦而飞
板块: #搞七捻三
编号:
1407452帖子: https://linux.do/t/topic/1407452
时间: 2026-01-05 15:06:26
摘要:
今天小赚3个点
标题: gitee疑似密码泄露!快修快密码
作者: #image
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/1407454
时间: 2026-01-05 15:06:59
摘要:
作者: #image
板块: #前沿快讯
编号:
1407454帖子: https://linux.do/t/topic/1407454
时间: 2026-01-05 15:06:59
摘要:
12月有一个异地登陆记录而且好像没有爆破记录,就是直接登上去了,而且在我账号里添加了一个私人令牌
貌似也不是个例
有 Gitee 账号的,建议立刻更改密码 - V2EX
https://x.com/SEEMsec/status/2001004141381128627
gitee是很久以前注册的,用的都是老邮箱和老密码。
暂时不知道对我号还有没有其他操作
标题: 简单易懂的LLM相关知识梳理-ep.2-1 如何选择模型-API篇
作者: #flymyd
板块: #文档共建
编号:
帖子: https://linux.do/t/topic/1407455
时间: 2026-01-05 15:07:09
摘要:
作者: #flymyd
板块: #文档共建
编号:
1407455帖子: https://linux.do/t/topic/1407455
时间: 2026-01-05 15:07:09
摘要:
目录帖:
简单易懂的LLM相关知识梳理
文档共建
迫于项目被砍,失业赋闲在家,恰好也快过年了不想动了,想了下写点文章回馈下社区吧。
PS:如有年后Base重庆的AI/全栈/FAE岗可PM我
本文从实用角度出发,梦到哪写哪。部分八股文知识就不搬了,这里主要分享一下本人在使用各种云服务及本地部署过程中学到的知识。
这里优先介绍LLM/VLM,暂不涉及音频/视频/Omni相关模型(也可能梦到了以后补一下)
注:文章为本人手写,部分模型介绍搬运自…
在一个普通的清晨,你在工位上吃着早餐,突然你的领导叫你去会议室,等你再出来时已经是彻底无语。
“公司决定了!我们要用AI赋能XX业务,blabla。。。但预算只有XXX”
那么,如何选用大模型API呢?这是一门学问。
我们先整理一下思路,从几个维度分析这个问题:
模型能力:它的能力是否足以支撑我们的业务需求?会不会因为能力太弱而经常返回我不想要的结果?
推理速度:在保证能力的前提下尽可能快?还是在保证尽可能快的情况下择优使用?平台的推理速度如何?换提供商会不会好些?
服务稳定性:对单一来源的服务稳定性有极高要求吗?或者说可以fallback到其他模型/平台?
价格:我们的预算是否足够充足?
合规性:业务是国内还是海外?对数据落地存储的合规性是否有要求?报销怎么办?
当想清楚如上几点后,就可以按图索骥了。
模拟场景案例分析
场景1:一款面向展厅场景的AI语音对话应用
拆解需求:
高实时性:需要用相对小的模型(提高推理速度,不需要太好的性能),且服务位于国内以进一步降低时延。
高可用性:展厅里的设备掉链子了非常尴尬,所以服务应该尽量稳定,避开高负载平台(热门且算力储备不足的)
价格:toB / toG对价格不见得极度敏感,而且因为选用小模型,所以可以预见的是不需要因为进一步压缩成本而影响到前两条需求的结论。
合规性:这种场景的服务一定需要开票,所以要选用国内正规平台。
场景2:一款个人情感陪伴助手
拆解需求:
能力先行:模型能力要足够强才能打出竞争力,你也不想猫系女友几下就被提示词钓成柔情猫娘吧?
价格:只要东西做好了,总会有人愿意为此付费。
服务稳定性:稳定性和强模型能力带来的沉浸感是必须要保证的,roleplay的时候报个错太出戏了,你很可能因为几次错误而痛失一个付费用户。
推理速度:这个不再是重点了,最终能成功返回就行。你年少时的那个女神/男神不也经常不回你?
合规性:这就要看个人/小团队还是正经公司的项目了。只要最终掏钱的那个人能答应的话,用国外平台去接Gemini可能是比较好的选择。但如果必须报销…
场景3:个人创业/随手糊的项目
拆解需求:
价格:便宜,便宜,还是tm要便宜!这里的想象空间就很广阔了。反正自负盈亏,哪家便宜用哪家。什么白嫖逆向中转站全安排上,fallback多写几组。
模型能力:个人项目缺乏实际商业项目的千锤百炼,测试之类的都很少,所以模型能力通常要打点宽裕的量出来,不然代码没搞好被人疯狂钓提示词 / 模型能力不足导致频繁输出预期之外的结果就不好了。更强的模型带来的溢价可以通过上一条的邪修手段去抹平。
实时性&可用性:项目起步阶段有一些问题是可以忍受的,一切向钱看齐。服务炸了、输出崩了、速度太慢了给用户磕个得了,我哪来那么多钱接Cerebras啊?
合规性:自己搞的东西不犯法啥都好说,什么数据落地合规性那基本上都是企业才要考虑的事。
从上面几个例子中很容易总结出一套方法论。
方法论总结
没有银弹,不要迷信SOTA
在实际落地的工程场景中,模型也同样存在不可能三角。速度高、质量好、成本低几乎不可能同时存在。也许Gemini 3 Flash做到了,但对于中国的业务来讲,我们要再加上一个合规性的维度。
场景1是一个相对垂直的场景。既然追求了极致响应速度,那模型的参数量就不能太大。它不会有太多复杂的需求,即使模型能力不足也可以通过工程上的手段去设法解决。
而场景2追求的就从极致响应变成了极致智能,这最终意味着较高的Token价格和相对较慢的推理速度。
到了场景3就只需要关注极致成本,先把项目最难熬的起步阶段度过再说,别的不重要。
业务决定技术选型
技术再强也得为业务服务,最终的选择必须紧贴业务的生命周期和应用性质。
对于toB / toG业务来说,稳定压倒一切。只要够稳定够合规,效果差点就差点,关键的是不胡说八道,业务不崩,能开发票。合同都签了你还要怎么样?
toC业务就不一样了,用户只会为了体验而付费,没有那么多愿意从起步陪你走到最后的神仙用户。如果模型能力不够,那就很难有核心竞争力,不能只盯着那点Token费用而忽视了最终的用户体验。
到了实验性业务上,活下去是核心诉求,别的都可以通过工程上的手段去想办法弥补,初创阶段最不值钱的就是人力。
够用就是最好
对于展厅项目来说,听得懂指令并且能做出回应就是够用。对于个人项目来说,能跑就行。
划一条红线,这是业务及格线。在这条线之上选择最适合你的方案就够了,不要盲目追求最强的API,这毫无意义,不要掉入过度优化的陷阱。假如做一个网页小游戏,模型只需要输出True和False,选个Thinking大模有意义吗?用户早就等急了。
总结
选API的过程本质上是把业务需求转换为技术指标,再在预算范围内寻找最优解的过程。
在做方案以前,先问自己三个问题:
我的用户是谁?(合规性与稳定性)
他们最在乎什么?(选强智能模型还是快速模型)
我的预算是?(决定架构容错率和备选方案)
常用API提供商表格(个人经验)
国内提供商
提供商
价格
速度/可用性
备注
阿里云百炼
便宜
较快
国内毫无疑问的老大哥,卡多模型多,提供通义全家桶服务。对公可以谈折扣,从9折到5折不等
硅基流动
便宜
较快
祖国版OpenRouter,提供国内开源模型的推理服务,属于老牌了。黑历史是DeepSeek狂潮期间被冲爆了,现在好很多
火山方舟
一般
较快
主要值得购买的是自家的豆包系列模型,不过开源模型的服务稳定性也很好,卡多就是任性
腾讯混元
一般
较快
混元用的人比较少,目前没有被巨大流量冲爆的黑历史。如果你的云服务器也在腾讯云上,那么混元可能是一个好选择
百度千帆
便宜
一般
千帆在LLM服务上也就只有开源大模型推理值得一看了,该不会真有人花钱买文心吧?
华为云MaaS
?
?
提供开源模型推理服务,看起来平平无奇。但有神秘昇腾高奢定制服务,如果你在做toG项目,那么…
七牛云
一般
一般
七牛云非常神秘,比起硅基流动来还额外提供了一些国内闭源模型的服务,甚至还有Grok Code Fast
DeepSeek
便宜
一般
DeepSeek无论是服务可用性还是推理速度都是较差的那档,小厂的卡都拉去研究训练了(抹泪)最好用的DeepSeek肯定不在DeepSeek平台上,但官价很便宜
月之暗面
一般
一般
1T巨模怎么想也快不起来,不过官方倒是有个K2-Turbo会快很多,就是价格也贵了不少,迪士尼优速通说是
MiniMax
便宜
较快
小模就是自信,哪怕用户很多也不会出现显著的推理服务降级情况。不过MiniMax主要还是用来写代码比较好
智谱AI
便宜
差
GLM本来就没多少卡,用户还特别多。推理速度饱受诟病,之前还有降智节奏。推荐去其他平台,反正是开放权重
小米MiMo
便宜
较快
MiMo Flash用户相对少些,官价也不贵,目前看起来还行,就是不知道用户量上来以后会如何。果然米厂做什么都是一股米味
国外提供商
注:由于OpenRouter和Huggingface聚合了大部分API提供商,故不再单列(如NovitaAI、Fireworks等)
注2:适合不需要开发票的场景
提供商
价格
速度/可用性
备注
OpenRouter
从便宜到贵都有
视提供商而定,比较万金油
最大的聚合API提供平台,什么模型都有。口碑很好,但需要注意提供商对开源模型注水,典型例子:GitHub - MoonshotAI/K2-Vendor-Verifier: Verify Precision of all Kimi K2 API Vendor
Cerebras
贵
断崖式领先
超大晶片,大力出奇迹,神秘推理速度宛如外星科技,但很贵。主要是推理SOTA开源模型
Huggingface
从便宜到贵都有
与OpenRouter类似
Huggingface也做了聚合服务,有点类似OpenRouter
Google Vertex
适中
快(大部分时间)
Gemini一手货源,企业服务审查力度很低,速度也有保证。前几个月有一阵时间发生过截断问题,但总体来说可用性远强于OAI和A÷。注意,Vertex也提供Claude服务。
OpenAI
适中
一般
GPT一手货源,速度较慢,可用性一般
Anthropic
适中
差
Claude一手货源,但服务可用性非常感人
Amazon Bedrock
适中
较快
提供Amazon Nova、Claude和一些开源模型的推理服务
Azure AI Foundry
适中
较快
提供GPT、Claude和一些开源模型的推理服务
标题: Windows wsl2 中使用 vscode claude code 的问题
作者: #lvbibir
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1407456
时间: 2026-01-05 15:07:19
摘要:
作者: #lvbibir
板块: #搞七捻三
编号:
1407456帖子: https://linux.do/t/topic/1407456
时间: 2026-01-05 15:07:19
摘要:
扩展首次响应非常慢, 看日志似乎是配置文件锁的问题, 花了足足3分多种才爆出这个问题
但是我在 ~/.claude/ide 中看到 lock 文件是启动扩展他自己创建的, 退出扩展后, lock 文件也正常被删除了
有没有佬遇到过这个问题, 救一下孩子
标题: 倒反天罡:chatgpt 在 mac app 降智,网页端不降智。。
作者: #elijahjin
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1407461
时间: 2026-01-05 15:08:39
摘要:
作者: #elijahjin
板块: #开发调优
编号:
1407461帖子: https://linux.do/t/topic/1407461
时间: 2026-01-05 15:08:39
摘要:
第一次发帖,测试了 2 个 ip,网页端的 jucie 值是 256,我是 plus 用户。
但是在 mac app 端只有 64,甚至计算不出来,不知道怎么回事。。有佬友知道吗?而且 app 端无法选择标准思考和进阶思考,点了没反应。