LinuxDo 新帖推送
169 subscribers
247K photos
307K links
Download Telegram
标题: 请教如何推算模型部署需要的显存
作者: #粥粥
板块: #开发调优
编号: 2036724
帖子: https://linux.do/t/topic/2036724
时间: 2026-04-23 13:57:31
摘要:
如题,以模型minimax m2.5(原本权重,先不考虑量化)为例,如何知道这个模型具体需要多大的显存才可以部署?
另外,NPU还是GPU应该没多大区别吧,主要是看显存多少。
请佬们指条明路
标题: CPA 已支持 image 2,怎么在 New Api 里用
作者: #weny
板块: #搞七捻三
编号: 2036726
帖子: https://linux.do/t/topic/2036726
时间: 2026-04-23 13:57:35
摘要:
如题,请问这种情况除了在本地直接通过 CPA 调用外,还有别的方法吗?
标题: 分享下codex cli如何在不同项目使用不同代理的方法
作者: #lakuxiata
板块: #开发调优
编号: 2036730
帖子: https://linux.do/t/topic/2036730
时间: 2026-04-23 13:58:09
摘要:
之所以有这个想法是因为我想要在同一个环境下不同项目内使用不同的代理。所以花了一天时间,趁着牛马干活的时候找了些方案。
我现在可以使用的有cpa和rightcode两个代理,但是目前用cpa最多,我搞了5个plus和一些free号,但因为前几天plus降到free掉了两个,导致额度快不够用了。而rightcode用的太少了,之前买了180的套餐,86和chong.plus没被举报前用的还挺好的,每天120刀用的够够的,不过现在只能用余额了,本着不用就是浪费的原则给它用起来。
默认的启动命令codex都是走同一个代理,但是我想要的是a项目可以用cpa,b项目可以用rightcode,不想用复制config和auth的方式,因此想着有没这种一键切换的方式。
问了ai,看了配置文档,最终整了3个方案出来,目前实测都是可行的。
PS:问题先说在前头,不同provider之间session会话是不会共享的,也就是a项目如果用cpa的对话,转用rightcode后是看不到的。
第一种方案:
也是目前我在用的方案,很简单,使用CODEX_HOME参数启动:
CODEX_HOME=/root/.codex/rightcode codex


首先,创建一个目录,目录名随意,放在任意终端能读取到的地方都可,我是直接放在/root/.codex/目录下,路径也就是/root/.codex/rightcode;
将config.toml和auth.json这两个文件复制一份到这个目录下

启动后测试正常:

第二种方案:
这个方案是最简单但是openai不推荐,因为不安全但是能用;
直接在config.toml中provider设置里添加experimental_bearer_token,也就是你的api_key
[model_providers.rightcode]
name = "rightcode"
base_url = "https://right.codes/codex/v1"
wire_api = "responses"
experimental_beare
标题: CF-Mail 用Workers部署的简单邮局,傻瓜式操作,验证码正则,TGBot推送
作者: #marre
板块: #开发调优
编号: 2036736
帖子: https://linux.do/t/topic/2036736
时间: 2026-04-23 13:58:44
摘要:
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

我的帖子已经打上 开源推广 标签: 是
我的开源项目完整开源,无未开源部分: 是
我的开源项目已链接认可 LINUX DO 社区: 是
我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
以上选择我承诺是永久有效的,接受社区和佬友监督: 是

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出

你不知道拿CF免费的Workers干什么吗? 那就搞个邮局吧反正不要钱

单用户
无发件
验证码正则
TGBot推送
一键部署,绑定Bot
基本不用配置,纯纯的有手就行

快速开始:
访问我的GitHub
1.1 一键部署
点击如下图标:

结束
1.2 Fork部署
Fork到自己仓库后创建Workers连接到自己的Repository即可。

部署后操作

进入 Cloudflare Dashboard → 你的域名 → Email → Email Routing
启用 Email Routing
添加路由规则:


Catch-all → Send to Worker → 选择 cf-mail

然后接着访问workers即可。




github.com






GitHub - lyon-le/cf-mail: Cloudflare domain mail tempmail

Cloudflare domain mail tempmail












里面有小Ferris,长得很可爱,下次把Clawd也加上去,让他俩打一架吧
标题: 火山引擎这波很大气。
作者: #jack
板块: #国产替代
编号: 2036737
帖子: https://linux.do/t/topic/2036737
时间: 2026-04-23 13:58:50
摘要:
coding plan 也不限量,价格也不动,还支持最新模型。啊
标题: 一位谷歌云客户醒来后发现账单金额超过 18,000 美元,而预算仅为 7 美元。
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #前沿快讯
编号: 2036753
帖子: https://linux.do/t/topic/2036753
时间: 2026-04-23 14:02:44
摘要:
Tom's Hardware – 22 Apr 26





Google Cloud customer wakes up to $18,000+ bill despite $7 budget, thanks to...

Turns out the safety measures are all turned off by default.
标题: 可恶的duckduckgo
作者: #小松鼠
板块: #开发调优
编号: 2036755
帖子: https://linux.do/t/topic/2036755
时间: 2026-04-23 14:02:49
摘要:
困扰了我一个多月的疑惑,之前有段时间,下载了duckgo的插件,很久的事,然后最近想着调用一下大模型的apikey,发现验证码怎么都无法获取,glm,硅基流动,我一直以为是我开着梯子的原因,然后一个多月我始终注册不进去,但是在手机上又可以注册,我想了很久也不知道为什么,直到今天突然脑子一闪,想着一个月前的duckduckgo,我直接关闭了,这下真相大白了
标题: Sierra取消编码和算法面试,改为2小时AI辅助产品构建!
作者: #你这是违法行为
板块: #前沿快讯
编号: 2036762
帖子: https://linux.do/t/topic/2036762
时间: 2026-04-23 14:03:35
摘要:
AI 客服 agent 公司 Sierra 公布重新设计后的工程面试流程,取消了传统的编码面试和算法面试。新流程分三步:Plan 环节由候选人主导产品构思;Build 环节候选人独立用 2 小时构建产品,可自由使用任何 AI 工具和框架;Review 环节演示成果,讨论技术决策、数据模型和上线路径。


Sierra 同时将电话筛选中的编码测试替换为系统设计面试,理由是用 AI 搭建应用已经很容易,更难也更重要的是让应用以可扩展的方式投入生产。团队还在试点一种调试面试:给候选人一个中等规模代码库和一个引入跨切面特性的草稿 PR,要求审查并改进。


Sierra 称新流程让评估重心从「是否该录用」转向「这人在哪方面最强、怎么给他匹配合适的岗位」。候选人反馈普遍正面,有人在面试中用 AI 构建了一款自适应难度的问答游戏,演示环节就是面试官直接上手玩。







Sierra – 22 Apr 26





The AI-native interview

We’ve redesigned our engineering interview process from the ground up.