linux.do
21.7K subscribers
128K photos
202 videos
129 files
267K links
linux.do最新话题和热议话题
Download Telegram
AI 应用中如何设计“低成本但稳定”的多模型降级策略?

最近在做一个小项目,遇到一个比较现实的问题:如果只接一个大模型,效果相对稳定,但成本和响应速度不太可控;如果接多个便宜模型,又容易出现回答质量不稳定、风格不一致、失败重试逻辑复杂等问题。
我目前想到的方案是:

1. 简单问题优先走低成本模型
2. 复杂问题或低置信度结果再升级到更强模型
3. 模型请求失败时自动切换备用模型
4. 对关键场景做结果校验,比如 JSON 格式、敏感字段、事实一致性等
5. 记录每次调用的耗时、费用、失败率和用户反馈,再动态调整路由规则
但实际实现时有几个问题还没想清楚:
1、如何判断一个问题“简单”还是“复杂”?靠关键词、token数等,还是让模型自己判断?
2、低成本模型回答不稳定时,有没有必要做二次校验?如果校验本身也调用模型,会不会反而增加成本?
3、多模型之间输出风格不一致,一般是在 prompt 层统一,还是在后处理层统一?
想请教各位佬们:如果在实际项目里接过多个模型,会怎么设计路由、失败重试和成本控制?有没有比较简单但靠谱的实践方案?

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Wangfugui1905)
Telegram必备的搜索引擎,极搜JISOU帮你精准找到,想要的群组、频道、视频、音乐

👉 t.me/jisou2?start=a_7387292324
求解 AI建模目前能用了吗?(动漫头雕)

平时没事就做点3D打印什么的,之前接触到了ai 3D建模,就萌生出了用3D建模建kigurumi头壳(可以理解成戴在头上扮演二次元人物的面具)的想法。建模这个一般是用zbrush数字雕刻或者blender建模,然后打印出来再走和手办一样的化妆(喷漆上色等等)步骤

当事试用了tripo3d hyper3d 浑元3d
首先直观感受是,贵!这方面还是腾讯的混元比较良心,暂且开贵不谈,效果才是最重要的 :distorted_face:。

hyper3d tripo3d
b站很多人吹/或者商单,但是感觉效果很一般,他们演示的都是生成个机器人啊 生成个简单的人物啊,然后绑骨什么的,上传一个二次元角色让他做成动漫头雕的效果非常差 还特别钟情于外国人刻板印象中的亚洲动漫女孩,图片我就不放了,别恶心到大家.其他的自动分件功能什么的在基础建模都建不好的前提下更没什么用了。

浑元
无论从收费还是效果都是比较拟人的

给这三张ai三视图 生成出的效果
感觉也就那样?不过已经是这三个里最拟人的了,导入到zbrush里简单修理和分件 把头发和脸和左右耳朵拆开了 脸实在不太行打算抹掉重雕了(未完成)

做了一次体验只能说比较拉,从上次做这个大概已经四个月没接触了吧,有没有相关领域的佬友,想问下最近AI建模有没有进步,有没有什么更好的工具 :distorted_face:

顺便 L站有没玩kig的佬友 不知道能不能发自己出的照片以后在加图吧 :distorted_face:

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: kisaragi)
ios26 微信里打开相机,有一定几率卡死

佬友们有解决方案吗?动不动就卡死,需要把微信后台杀掉重启才行 😢

3 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: qppq54s)
分享一个提高开发效率、节省上下文的 sub-agent 技巧

现在交给 Codex 一个任务,很容易遇到代码以外的问题,例如环境错误、缺少配置等等。按照目前常见的 prompt,这会导致主进程直接处理这些东西。有的时候会因为配置一个 Python3 的环境,消耗高达 100 多 K 的上下文,对于主要进程产生了很大的影响。

可以给 Codex 加一个 prompt 或者加一个 skill,告诉 Codex 将这种无关紧要的、与主要核心进程无关的测试环境等问题,只派一个 sub-agent 进行处理。

主要原则就是只要结果,不在乎过程。这样 Codex 组合就不会消耗很多的上下文去编写 prompt。

这样的话,就可以把 Codex 分为“主核”和“副核”:

1. 主核
治理等级最高,可以用 GPT-5.5 Extra High 或者 High,专注于处理代码架构、代码规格等核心问题。
2. 副核
可以使用便宜一点的模型,比如 GPT-5.4 Mini High 或者 Extra High。

这样副核就可以处理一些无关紧要的功能,只要达到目的即可。这种方式不仅能提高效率,还能减少对上下文的污染,使主核能够更专注于核心问题。

18 个帖子 - 9 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: StarFox)
xiaomi mmo token plan 2亿key 分享

模型支持: MiMo-V2.5-Pro、MiMo-V2.5、MiMo-V2-Pro、MiMo-V2-Omni、

API key:tp-c5z7njxug123285gwd7fnfp5s3y9udfemk2fue1j2zd32pec

兼容 OpenAI 接口协议: https://token-plan-cn.xiaomimimo.com/v1
兼容 Anthropic 接口协议: https://token-plan-cn.xiaomimimo.com/anthropic

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 清)
这反重力额度神了,真的能用吗?

只用flash(high) 22分钟用完5小时额度,自费开的美区pro。
39 个帖子 - 18 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: 兰子p)
不懂就问,grok4.2 multi agent 和expert heavy 有啥区别,哪个搜索能力更强?

heavy是8个agent,expert是4个我记得,那multi agent是几个,请问哪个搜索能力强一点哇?

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 叅)
关于家宽拼车

买了Vircs美国家宽,想和朋友拼一下车;同一个出口登陆两个不同的claude,容易被封号吗?两个claude都是用境外实体卡和境外真实身份注册的.(即都是找朋友帮忙注册的,不是买的)

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Sipeng)
????这tm还敢让Gemini生ppt吗?Lolita?太神了哈哈哈哈哈

太神了我的天!

17 个帖子 - 14 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: cat2)
各位大佬,请问一下,5000~6000块钱左右的影像旗舰手机。有什么推荐吗?

各位大佬,请问一下,现在,就是说影像旗舰手机 然后预算是在5000~6000块钱左右,然后要能玩我的世界、三角洲和丶和平精英。请问一下,有什么手机推荐吗?还问各位大佬赐教,感激不尽。

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 王子)
唯一一个重置额度还挨骂的模型

Gemini不是知错了,只是发现自己快死了

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Asy0y0)
求助:好迷茫啊,不知道该怎么办了,不知道佬友怎么想

我是25届一本计算机毕业生,从毕业前到现在一直都很焦虑。现在在想我应该出去找工作or考研。(写完补)写的有点多,有点情绪,如果佬友看完了我就十分感激了。

1. gap1年去找工作我感觉基本找不到啊,我都不知道该怎么找了
2. 一战考研没考上,现在5月份还可以考虑二战

讲讲背景

大学期间打acm打了一段时间,xcpc都没拿到奖,只有一些其他杂赛的奖,大三那时候退役我变得很自卑,因为认识到自己其实这么菜,让我极度不自信,导致当时不敢去准备实习,选择了考研。然后一战失败了。

我前段时间看到一个词“乖孩子”思维,我感觉我从小学到大学都是这样的思维,我所做的事情只是为了满足我父母和老师,只是在做那种别人看起来“乖”的学生。我读计算机专业,没有发挥出自己的主观能动性,没有去发掘自己想要什么,只是机械性的做“该”做的事。一战失利后大学毕业之后我一下子整个人都懵了,当时我想准备一些知识去面试,但我一学就会极度焦虑,我会觉得我不可能学好,持续了很长时间,那段时间很痛苦,要么没面试要么面试也没通过,然后我在想或许可以转行。

既然放弃计算机,于是毕业后我在我爸的小工厂干杂活,但干着干着感觉我在这里已经不会有新的上限了,我爸文化程度也不高,其实小厂的结构很简单草台,所以我决定还是去公司看看,但一旦把专业选择去掉去看别的工作,感觉能够低门槛去的工作都是些很“奇怪”的东西,就感觉随便来个大专生都能去干的感觉。很迷茫,也是没什么进展。

11月有个“朋友”说让我去看看他们创业,他前几个月其实说了几次,我直到不在我爸厂里干了,在找工作也找的有点沮丧的时候才想去他那看一下,结果我去那边之后发现他们在搞传销,因为和那里很多人都聊过,让我世界观有点崩塌,为什么这样的人也会信传销,我实在不能理解。

然后经常和我聊天的女生和我表白了,我想着稳定感情就开摆了一会(或许借口开摆罢了)。

今年过年后被外婆奶奶我爸各种压力,我整个人都感觉像抑郁了(但没敢去查),和claude聊他老是让我去看心理医生…这段时间我开始看书疯狂的看,《自控力》《微习惯》《终身成长》《金钱心理学》等等之类的书(主要是当时只有书看的进去了)

看书对我来说感觉确实是很有帮助,尽管我睡眠依旧混乱,但我感觉我恢复了一点动力,我开始通过l站研究怎么用codex、反重力、cc这些(虽然是有点晚),研究付费、到研究怎么薅羊毛给我的4人小群在az上部署了CPA给他们用,尽管这段时间平均还是3点才能睡着,但感觉有点活人感了。

与此同时我爸给我的感觉就是我只要有工作就行了我爸的看法就是让我考公然后找一个最好考的,我外婆甚至要我爸让我考公然后买个岗位,我听他们的说法感觉很绝望,因为我感觉如果真的只是想找一份工作,我会如此焦虑吗,我直接去瑞幸打工都可以;虽然我内心也确实挺乱的,但也算是一直在寻找自己想做什么。哎,我感觉我一半是“死”的一半是活的。其实很久没要生活费了,我虽然住家里,除了吃饭在家吃,别的开销都是我自己通过兼职等方法赚的钱。家里情况的话其实也算小康,而且我爸工作也不辛苦(因为他在家的时间挺多的,要么看国漫要么在唱k…)。虽然吃和住确实还没法脱离,但我也确实很想离开家,感觉离开了才有“人权”。我想如果考上研了我准备自给自足。

而且经过了一段时间折腾ai和vibecoding,我感觉恢复了一点对技术的热情,我现在在思考到底是考研还是找工作,我现在有点想做回本专业相关工作了。如果是考研的话准备想考一个211然后痛定思痛重新开始。找工作的话我感觉看不到什么希望。不知道佬友怎么看?

写的有点多,有点情绪,如果佬友看完了我就十分感激了。

54 个帖子 - 36 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: linemilia)
2025.5.21 A股消费调研

以下投票皆为匿名,请放心投票
今天你冲了还是撤了?
今天你冲了还是撤了?
冲了
撤了
按兵不动

点击以查看投票。
你觉得下个交易日是涨还是跌?
你觉得下个交易日是涨还是跌?



点击以查看投票。
你当前的仓位是?
你当前的仓位是?
满仓
半仓以上
半仓以下
空仓

点击以查看投票。
你的资产解套了吗?
你的资产解套了吗?
已盈利50%以上
已盈利20%~50%
已盈利20%以内
套20%以内
套20%~50%
套50%以上

点击以查看投票。

3 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: davelyb)
Gemini Cli 停止运营

2026 年 6 月 18 日,Gemini CLI 和 Gemini Code Assist IDE 扩展程序将停止为 Google AI Pro 和 Ultra 以及使用 Gemini Code Assist 个人版免费使用该软件的用户提供服务。

参考链接:Gemini Cli 宣布停止

中文翻译:

一项重要更新:从 Gemini CLI 迁移到 Antigravity CLI

2026 年 5 月 19 日

Dmitry Lyalin(产品经理)
Taylor Mullen(首席工程师)

当我们在去年发布 Gemini CLI 时,我们的目标是把 Gemini 的能力直接带到终端中。在这个过程中,我们从数百万用户组成的社区中学到了很多:项目获得了超过 10 万 GitHub Star、6000 多个合并的 Pull Request,以及数百位贡献者的参与。我们了解到:

你们喜欢优秀的终端 UI;
你们认可我们每周发布更新的节奏;
更重要的是,你们的工作流已经超越了 2025 年初那个阶段的需求。

Gemini CLI 证明了:终端完全可以成为执行 Agent(智能体)任务的强大界面。但用户需求已经发生变化。现在,你们需要多个 Agent 相互协作、拆分任务并解决复杂问题。这意味着终端工具必须能够与整个工作流共享统一的后端架构。

在认真倾听社区反馈后,我们意识到一件事:

如果把精力集中到一个真正为“多 Agent 时代”打造的平台上,我们才能更好地服务开发者。

因此,我们决定统一产品方向,全面投入到 Google Antigravity —— 我们全新的“Agent First(智能体优先)”开发平台之中。它包含:

强大的服务端 Agent Harness(调度/执行框架)
全新的终端体验:Antigravity CLI

虽然 Antigravity CLI 在初期不会与 Gemini CLI 实现完全 1:1 的功能对应,但我们已经确保保留 Gemini CLI 最重要的核心能力,包括:

Agent Skills
Hooks
Subagents
Extensions(现已升级为 Antigravity Plugins)

无论你过去使用 Gemini CLI 来:

获取快速、可靠的答案
创建并开发新的代码项目
配置云基础设施

现在都仍然可以在 Antigravity CLI 中完成。

与此同时,我们重点优化了用户最关心的能力:

----------------------

更快的执行速度

Antigravity CLI 使用 Go 语言构建,整体响应更加迅速,执行效率更高。

----------------------

异步工作流

Antigravity CLI 能够在后台编排多个 Agent 协同工作。

这意味着你可以:

执行大型代码重构
并行研究多个主题
处理复杂任务

同时不会阻塞当前终端会话。

----------------------

统一架构

Antigravity CLI 与新版桌面应用 Antigravity 2.0 使用同一套 Agent Harness。

这意味着:

未来所有底层 Agent 能力的升级,都会自动同步到所有使用场景中,包括:

CLI
桌面端
云端工作流

----------------------

面向个人用户的重要时间线

从今天开始,Antigravity CLI 已向所有用户开放。

从 2026 年 6 月 18 日起:

Gemini CLI 与 Gemini Code Assist IDE 插件将停止为以下用户提供服务:

Google AI Pro 用户
Google AI Ultra 用户
使用 Gemini Code Assist 免费版的个人用户

我们会帮助大家平稳迁移到:

Antigravity CLI
Antigravity 2.0

你现在已经可以通过技术文档开始迁移,未来几周我们还会发布视频教程与迁移演示。

对于 Gemini Code Assist for GitHub:

2026 年 6 月 18 日后将停止新的组织安装
随后数周内也将停止请求服务

----------------------

企业用户说明

如果你的组织通过以下方式使用 Gemini CLI 或 IDE 插件:

Gemini Code Assist Standard
Gemini Code Assist Enterprise
Google Cloud 中的 Gemini Code Assist for GitHub

那么你的访问权限不会发生变化。

我们仍将继续支持:

Gemini CLI
Gemini Code Assist

并继续提供:

最新 Gemini 模型
后续功能更新

此外:

Gemini CLI 仍可通过以下方式继续使用:

付费 Gemini API Key
Gemini Enterprise Agent Platform API Key

如果你想提前体验 Antigravity CLI,也已经可以通过 Google Cloud 项目开始使用。

----------------------

我们欢迎大家在 Antigravity CLI 社区论坛中继续提供反馈,特别是在迁移过程中,如果你有希望新增的功能需求。

我们也非常期待看到大家未来使用:

Antigravity 2.0
Antigravity CLI

创造出的新作品。

22 个帖子 - 20 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: Coca_Cola)