linux.do
21K subscribers
115K photos
195 videos
115 files
247K links
linux.do最新话题和热议话题
Download Telegram
求助贴:vps上部署CPA是直接公网连接,还是套一层tailscale?

过了azure的学生认证搞了台2c1g的美国小鸡,打算把CPA部署到上面,目前有三个想法:

1. 直接开放公网8317端口,本地直接连接服务器CPA,最稳最快,但是据说很不安全?
2. 通过本地和VPS均部署tailscale组一个内网,很安全,但是我部署下来发现本地的tailscale老是和小火箭打架,很难受。
3. ssh tunnel映射8317端口到本地,似乎不如前两者稳定而且每次都要手动打开ssh。

不知道大佬们是怎么部署的,我其实很想要方案1,但是小白不是很了解网络安全之类的,是不是要套一个CF或者ngix之类的才安全?请求佬友们的帮助。

6 个帖子 - 4 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Aurelian)
中转小鸡选择

中转站现在小鸡带宽太小了,4c8g 10Mb的带宽,看佬们很多基础带宽就很大的小鸡是那里来的呀?现在日活100人左右,用起来又卡卡的,想换小鸡求推荐。目前用的是diyvm的

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: beKeaton)
企业接入模型 API 时,如何评估供应商稳定性和设计容灾方案?

最近在考虑企业业务中接入模型 API,想请教一下佬们怎么评估供应商对企业供应的稳定性,以及如何设计比较稳妥的接入架构。

我现在主要关心几个问题:

1. 供应商稳定性应该怎么评估?

除了价格和模型效果以外,企业接入时应该重点看哪些指标

可用性
平均响应时间
P95 / P99 延迟
错误率
限流策略
高峰期稳定性
故障响应速度

1. SLA 应该怎么定义?

和供应商约定稳定性指标,哪些条款比较有实际意义

可用性怎么统计
5xx、超时、限流是否计入不可用。特别是网络问题如何划定边界
响应时间过长是否算服务异常
故障恢复时间应该怎么约定
不达标时一般是服务补偿、费用抵扣,还是其他方式

1. 多供应商 fallback 应该怎么做

如果同时接入多个模型 API 或多个供应商,比较合理的容灾方式是什么
目前想到的方案包括:

主备供应商切换
按错误率自动熔断
超时后切换备用模型
按模型能力做路由
按成本和延迟做动态选择
对关键请求做降级策略

但这里可能会遇到上下文兼容、返回格式差异、模型效果不一致、成本失控等问题。

1. 监控和告警应该怎么设计?

比较想知道大家一般会监控哪些指标:

请求量
成功率
错误码分布
超时率
平均延迟
P95 / P99 延迟
token 消耗
单请求成本
余额或额度
不同供应商之间的可用性对比

是否有比较成熟的监控面板或日志结构可以参考?

1. 压测应该怎么做?

在正式接入前,如何判断一个 API 供应商是否能支撑业务峰值
压测时应该关注 QPS、并发、长文本输入、流式输出、多轮上下文,还是其他指标

我也正在摸索,希望有实际接入经验的朋友分享一下工程侧的判断标准。

另外最重要的一点,接外网大模型签的SLA合规吗,是否受保护 😅

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 喝假酒的鳄鱼)
关于2个月免费team席位权限的问题

如图所示,我开通了一个team 2席位的,现在我在team主空间里面可以任意切换gpt5.5 think模型,但个人账号却只是free用户??那么如果拉人的话,是不是两个人都只能在team主空间里面使用gpt跟codex呀?那不就不是隔离了,两个人在群殴gpt,私密性很差的哦。大家用48个月gpt的时候,添加成员的时候,是不是也是一样的烦恼呢?还是我设置出了问题?我查看了team里面的成员权限,没有一项可以提升到gpt plus的选项呀。

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: xuface)
高三,上交综评专业咨询。学长能不能解答下

截取了部分专业,标红的是今年新增的专业。其他都还好说,这两个机器人工程有什么区别呀?

有没有上交学长在线答疑,顺带推荐一下☺️ 感谢~

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: LatteDotEnv)
Factory Droid 被封号了。

lenny订阅的优惠码领了一年会员。然后正常使用半年左右。今天发现被封号了,也没有邮件
还好最近已经转向codex来开发了

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: ageg)
目前已经开了土区plus和48team,还是不够用

48team开的是澳地区的,用bibyt开的扣了18.36usd,反0.36,还没到账,都挂上cpa了

奇葩的的是两个team的额度消耗居然都不一样,一个消耗非常快,一个还好点

消耗快的是澳本体号,消耗慢的是我邀请一个新号美梯子注册的,他们两都是新号

最近想搞传奇游戏,想用AI全部重新写,素材都让AI去画

一张还行,关键是UI肯定是拼接那种的,所以UI一定要是有连贯性的,所以一直在抽卡调整

所以,非常消耗token感觉

但是plus是真耐造啊,感觉都快赶上他两个了,我准备看看下个月全用土区的得了

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 二木)
问一下,龙虾现在一般都是怎么部署的

龙虾从2月份爆火到现在的部署办法有进行过什么变化吗?现在有没有一些改良版之类的?想部署到电脑上玩玩了

6 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: uu鸽)
开codex plus还是找Team车位啊

人在国外,之前的配置一直是中转站cc + codex一个车位
车位是🍑上买的一个月不到40块就掉过一次,就很爽

快到期了为什么找不到车位,而都是中转站了??
还有出plus号的,跟我自己正规买价格基本没差。中转站担心投毒不想用。

现在拼车什么价啊?还有车拼吗… 太贵我就自己上plus算了

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: londonplane)
gopay 1RP红包 9/30

如题,gopay1RP红包,不过貌似现在不能嫖plus,显示跨国支付风险,所以就分享给各位大佬,希望能帮到大佬们

base64解码两次即可
YUhSMGNITTZMeTloY0hBdVoyOXdZWGt1WTI4dWFXUXZUa1k0Y0M5bGEzcHNPR2t5WWc9PQ==
5 个帖子 - 3 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Time)
佬友们有没有好用的research agent推荐呀

场景就是如果想了解一个新的领域技术,可以快速上手和入门,现在我还是通过和gpt交流来获取这些内容,感觉效率上可能还是慢一点,还需要自己去阅读论文等等

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: yirzzz)
Codex Desktop 频繁出现 Reconnecting...,根因大多是 OpenAI/ChatGPT 的 WebSocket 连接没有稳定命中代理。

解决思路:

1. 确认 Clash Verge 本地端口,比如 127.0.0.1:7897
2. 设置 Windows 用户级代理环境变量
3. ~\.codex\config.toml[shell_environment_policy]

[shell_environment_policy]
set = { HTTP_PROXY = "http://127.0.0.1:7897", HTTPS_PROXY = "http://127.0.0.1:7897", ALL_PROXY = "http://127.0.0.1:7897", NO_PROXY = "localhost,127.0.0.1,::1" }

1. Clash Verge 里把 Codex.exechatgpt.comopenai.comoaistatic.comoaiusercontent.com 强制走同一代理组
2. 重启 Clash Verge 和 Codex

重点:AI 服务最好固定稳定节点

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: zhh2)
1
有没有Office 365的车啊

佬友们好,去年上了趟车,今年他不开了,有没有佬友有车位的,求上车,感谢感谢!

5 个帖子 - 4 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Passport)
佬友们,求一个便宜的deepseekv4pro使用渠道,最好是codingplan

烧额度肉疼的一批,求一个高性价比coding plan 🫠

5 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: WT.HSBG)
试用了一下Deepseek V4 Pro Max的agent coding【vibe coding能力】

测试agent:Claude code & reasonix
测试预设: Auto & Pro only
编程语言:lua
实现要求:绘制脚本菜单、图形,与游戏场景下的part资源进行调控,开发一个地板上的经验被磁吸到玩家角色后吸收
指导:纯 vibe coding
结果:失败

有感:使用auto的时候花费较少,编程能力无明显亮点;使用Pro only的时候花费提升3倍以上,编程能力略小幅提高。第一轮编辑:模型提供了开发前提清单,经过核对后确认功能可以实现,模型自己进行第一轮开发。

deepseek模型的上下文能力有待继续观察,已经指定工作path却还是选择在桌面同步更新,不知道为什么。

第二到四轮,有多次最基础格式规范问题导致的运行不成功,不会使用控制台输出日志,强硬选择直接在画面叠加层显示,第二至三轮均运行后卡死,因为deepseek没有考虑并发工具栈承受能力,至此已经花费2元。

第五到六轮,位置复写失败,部分事件在给出的教程明确写明不支持的情况依旧尝试,出错后仍然坚持错误开发路线,强行纠正后报告无法开发,试验结束。

个人认为唯一的优点就是不会触发道德约束,能够进行网络(发包、收包、劫持等)操作,不支持image识别,现在所有tui都有点问题,感觉乱糟糟的

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 我素黑块)
求解Deepseek同时支持的并发数

想问问大佬们知道目前deepseek v4同一个账号的并发数有限制吗

7 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: zhicong)
请教各位,deepseek v4的编程能力能达到claude code或者codex几点几的水平?

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: yfhhh)
推荐便宜的esim,能接收短信的

刚买了支持esim的二手手机,想装esim,用来注册tg等

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: CiD7)