linux.do – Telegram

linux.do

21K subscribers

115K photos

195 videos

115 files

247K links

linux.do最新话题和热议话题

Download Telegram

About

Blog

Apps

Platform

21K subscribers

求助贴：vps上部署CPA是直接公网连接，还是套一层tailscale？

过了azure的学生认证搞了台2c1g的美国小鸡，打算把CPA部署到上面，目前有三个想法：

1. 直接开放公网8317端口，本地直接连接服务器CPA，最稳最快，但是据说很不安全？
2. 通过本地和VPS均部署tailscale组一个内网，很安全，但是我部署下来发现本地的tailscale老是和小火箭打架，很难受。
3. ssh tunnel映射8317端口到本地，似乎不如前两者稳定而且每次都要手动打开ssh。

不知道大佬们是怎么部署的，我其实很想要方案1，但是小白不是很了解网络安全之类的，是不是要套一个CF或者ngix之类的才安全？请求佬友们的帮助。

6 个帖子 - 4 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Aurelian)

43 views14:48

中转小鸡选择

中转站现在小鸡带宽太小了，4c8g 10Mb的带宽，看佬们很多基础带宽就很大的小鸡是那里来的呀？现在日活100人左右，用起来又卡卡的，想换小鸡求推荐。目前用的是diyvm的

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: beKeaton)

43 views14:48

企业接入模型 API 时，如何评估供应商稳定性和设计容灾方案？

最近在考虑企业业务中接入模型 API，想请教一下佬们怎么评估供应商对企业供应的稳定性，以及如何设计比较稳妥的接入架构。

我现在主要关心几个问题：

1. 供应商稳定性应该怎么评估？

除了价格和模型效果以外，企业接入时应该重点看哪些指标

● 可用性
● 平均响应时间
● P95 / P99 延迟
● 错误率
● 限流策略
● 高峰期稳定性
● 故障响应速度

1. SLA 应该怎么定义？

和供应商约定稳定性指标，哪些条款比较有实际意义

● 可用性怎么统计
● 5xx、超时、限流是否计入不可用。特别是网络问题如何划定边界
● 响应时间过长是否算服务异常
● 故障恢复时间应该怎么约定
● 不达标时一般是服务补偿、费用抵扣，还是其他方式

1. 多供应商 fallback 应该怎么做

如果同时接入多个模型 API 或多个供应商，比较合理的容灾方式是什么
目前想到的方案包括：

● 主备供应商切换
● 按错误率自动熔断
● 超时后切换备用模型
● 按模型能力做路由
● 按成本和延迟做动态选择
● 对关键请求做降级策略

但这里可能会遇到上下文兼容、返回格式差异、模型效果不一致、成本失控等问题。

1. 监控和告警应该怎么设计？

比较想知道大家一般会监控哪些指标：

● 请求量
● 成功率
● 错误码分布
● 超时率
● 平均延迟
● P95 / P99 延迟
● token 消耗
● 单请求成本
● 余额或额度
● 不同供应商之间的可用性对比

是否有比较成熟的监控面板或日志结构可以参考？

1. 压测应该怎么做？

在正式接入前，如何判断一个 API 供应商是否能支撑业务峰值
压测时应该关注 QPS、并发、长文本输入、流式输出、多轮上下文，还是其他指标

我也正在摸索，希望有实际接入经验的朋友分享一下工程侧的判断标准。

另外最重要的一点，接外网大模型签的SLA合规吗，是否受保护 😅

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 喝假酒的鳄鱼)

47 views14:48

关于2个月免费team席位权限的问题

如图所示，我开通了一个team 2席位的，现在我在team主空间里面可以任意切换gpt5.5 think模型，但个人账号却只是free用户？？那么如果拉人的话，是不是两个人都只能在team主空间里面使用gpt跟codex呀？那不就不是隔离了，两个人在群殴gpt，私密性很差的哦。大家用48个月gpt的时候，添加成员的时候，是不是也是一样的烦恼呢？还是我设置出了问题？我查看了team里面的成员权限，没有一项可以提升到gpt plus的选项呀。

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: xuface)

52 views14:49

高三，上交综评专业咨询。学长能不能解答下

截取了部分专业，标红的是今年新增的专业。其他都还好说，这两个机器人工程有什么区别呀？

有没有上交学长在线答疑，顺带推荐一下☺️ 感谢～

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: LatteDotEnv)

58 views14:49

Factory Droid 被封号了。

lenny订阅的优惠码领了一年会员。然后正常使用半年左右。今天发现被封号了，也没有邮件
还好最近已经转向codex来开发了

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: ageg)

61 views14:49

目前已经开了土区plus和48team，还是不够用

48team开的是澳地区的，用bibyt开的扣了18.36usd，反0.36，还没到账，都挂上cpa了

奇葩的的是两个team的额度消耗居然都不一样，一个消耗非常快，一个还好点

消耗快的是澳本体号，消耗慢的是我邀请一个新号美梯子注册的，他们两都是新号

最近想搞传奇游戏，想用AI全部重新写，素材都让AI去画

一张还行，关键是UI肯定是拼接那种的，所以UI一定要是有连贯性的，所以一直在抽卡调整

所以，非常消耗token感觉

但是plus是真耐造啊，感觉都快赶上他两个了，我准备看看下个月全用土区的得了

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 二木)

53 views15:03

问一下，龙虾现在一般都是怎么部署的

龙虾从2月份爆火到现在的部署办法有进行过什么变化吗？现在有没有一些改良版之类的？想部署到电脑上玩玩了

6 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: uu鸽)

49 views15:03

开codex plus还是找Team车位啊

人在国外，之前的配置一直是中转站cc + codex一个车位
车位是🍑上买的一个月不到40块就掉过一次，就很爽

快到期了为什么找不到车位，而都是中转站了？？
还有出plus号的，跟我自己正规买价格基本没差。中转站担心投毒不想用。

现在拼车什么价啊？还有车拼吗… 太贵我就自己上plus算了

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: londonplane)

44 views15:03

gopay 1RP红包 9/30

如题，gopay1RP红包，不过貌似现在不能嫖plus，显示跨国支付风险，所以就分享给各位大佬，希望能帮到大佬们

base64解码两次即可

YUhSMGNITTZMeTloY0hBdVoyOXdZWGt1WTI4dWFXUXZUa1k0Y0M5bGEzcHNPR2t5WWc9PQ==

5 个帖子 - 3 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Time)

45 views15:03

佬友们有没有好用的research agent推荐呀

场景就是如果想了解一个新的领域技术，可以快速上手和入门，现在我还是通过和gpt交流来获取这些内容，感觉效率上可能还是慢一点，还需要自己去阅读论文等等

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: yirzzz)

40 views15:03

Codex Desktop 频繁出现 Reconnecting...，根因大多是 OpenAI/ChatGPT 的 WebSocket 连接没有稳定命中代理。

解决思路：

1. 确认 Clash Verge 本地端口，比如 127.0.0.1:7897
2. 设置 Windows 用户级代理环境变量
3. 在 ~\.codex\config.toml 加[shell_environment_policy]

[shell_environment_policy]
set = { HTTP_PROXY = "http://127.0.0.1:7897", HTTPS_PROXY = "http://127.0.0.1:7897", ALL_PROXY = "http://127.0.0.1:7897", NO_PROXY = "localhost,127.0.0.1,::1" }

1. Clash Verge 里把 Codex.exe、chatgpt.com、openai.com、oaistatic.com、oaiusercontent.com 强制走同一代理组
2. 重启 Clash Verge 和 Codex

重点：AI 服务最好固定稳定节点

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: zhh2)

❤1

62 views15:03

有没有Office 365的车啊

佬友们好，去年上了趟车，今年他不开了，有没有佬友有车位的，求上车，感谢感谢！

5 个帖子 - 4 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Passport)

47 views15:03

佬友们，求一个便宜的deepseekv4pro使用渠道，最好是codingplan

烧额度肉疼的一批，求一个高性价比coding plan 🫠

5 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: WT.HSBG)

38 views15:03

试用了一下Deepseek V4 Pro Max的agent coding【vibe coding能力】

测试agent：Claude code ＆ reasonix
测试预设： Auto ＆ Pro only
编程语言：lua
实现要求：绘制脚本菜单、图形，与游戏场景下的part资源进行调控，开发一个地板上的经验被磁吸到玩家角色后吸收
指导：纯 vibe coding
结果：失败

有感：使用auto的时候花费较少，编程能力无明显亮点；使用Pro only的时候花费提升3倍以上，编程能力略小幅提高。第一轮编辑：模型提供了开发前提清单，经过核对后确认功能可以实现，模型自己进行第一轮开发。

deepseek模型的上下文能力有待继续观察，已经指定工作path却还是选择在桌面同步更新，不知道为什么。

第二到四轮，有多次最基础格式规范问题导致的运行不成功，不会使用控制台输出日志，强硬选择直接在画面叠加层显示，第二至三轮均运行后卡死，因为deepseek没有考虑并发工具栈承受能力，至此已经花费2元。

第五到六轮，位置复写失败，部分事件在给出的教程明确写明不支持的情况依旧尝试，出错后仍然坚持错误开发路线，强行纠正后报告无法开发，试验结束。

个人认为唯一的优点就是不会触发道德约束，能够进行网络（发包、收包、劫持等）操作，不支持image识别，现在所有tui都有点问题，感觉乱糟糟的

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 我素黑块)

54 views15:03

求解Deepseek同时支持的并发数

想问问大佬们知道目前deepseek v4同一个账号的并发数有限制吗

7 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: zhicong)

54 views15:03

请教各位，deepseek v4的编程能力能达到claude code或者codex几点几的水平？

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: yfhhh)

54 views15:03

推荐便宜的esim，能接收短信的

刚买了支持esim的二手手机，想装esim，用来注册tg等

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: CiD7)

59 views15:03