标题: ChatGPT 的口癖
作者: #fjhorn
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1842645
时间: 2026-03-28 21:33:01
摘要:
作者: #fjhorn
板块: #搞七捻三
编号:
1842645帖子: https://linux.do/t/topic/1842645
时间: 2026-03-28 21:33:01
摘要:
是中文特有的吗?还是英文和其他小语种也有?
结尾反问一句那肯定是通用的,但是稳稳接住你呢?是不是中文语料没喂对?
标题: Gcp300的10美元押金到期会自动退吗
作者: #bngd
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1842655
时间: 2026-03-28 21:34:45
摘要:
作者: #bngd
板块: #搞七捻三
编号:
1842655帖子: https://linux.do/t/topic/1842655
时间: 2026-03-28 21:34:45
摘要:
快到期了,会自动退押金,还是自己得申请退呢?
标题: claude的pro和max除了额度以外有什么区别吗
作者: #dream
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1842661
时间: 2026-03-28 21:35:48
摘要:
作者: #dream
板块: #搞七捻三
编号:
1842661帖子: https://linux.do/t/topic/1842661
时间: 2026-03-28 21:35:48
摘要:
rt,另外相较于gpt5.4-pro呢。小白之前在用team的pro做算法相关的科研,想问问各位佬claude的话pro和max哪个更适合科研一些。更具体一些我主要是需要做idea的细化与验证方案设计。最后的话佬们有claude不封号的梯子推荐吗
标题: GLM Coding Plan 体验卡已邀请 3 人,剩余 2 张
作者: #______西班木有蛀牙
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/1842674
时间: 2026-03-28 21:38:02
摘要:
作者: #______西班木有蛀牙
板块: #福利羊毛
编号:
1842674帖子: https://linux.do/t/topic/1842674
时间: 2026-03-28 21:38:02
摘要:
我在使用GLM Coding Plan,数小时内完成过去需要数周的开发工作,赠送你1张7天AI Coding体验卡,一起来用吧:智谱AI开放平台
需要的佬自取
标题: 模型压力测试工具调研
作者: #zshuai
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1842677
时间: 2026-03-28 21:38:53
摘要:
作者: #zshuai
板块: #开发调优
编号:
1842677帖子: https://linux.do/t/topic/1842677
时间: 2026-03-28 21:38:53
摘要:
老板让调研一下业界有什么模型压力测试工具,我整理了一些,佬友们有无从事相关方向工作的?
类别
工具名称
核心支持指标
适配后端 / 推理框架
支持模型类型
归属 / 维护方
官方榜单
框架原生
vLLM Benchmark
首字速度、生成速度、总时延、吞吐量、并发能力
vLLM 原生,也能测 OpenAI 兼容接口
主流 LLM,部分 pooling 场景
vLLM 官方
无
框架原生
GuideLLM
更偏生产视角的压测;看 TTFT、ITL、总时延、吞吐拐点、SLO/SLA 是否达标
OpenAI 兼容服务、vLLM-native
主流 LLM,也支持多模态输入数据
vLLM 项目
无
框架原生
SGLang Bench
单批/服务压测、延迟、吞吐、Profiling 分析
SGLang 原生
LLM、VLM/多模态
SGLang 官方
无
框架原生
GenAI-bench
高并发下的 token 级性能测试;看吞吐、延迟、并发表现
OpenAI 兼容接口,常用于 SGLang 等服务
主流 LLM
sgl-project 社区
无
框架原生
TGI Benchmark
TGI 服务的吞吐、时延、不同 batch 配置下的性能变化
Hugging Face TGI
HF 生态生成模型
Hugging Face 官方
无
框架原生
LMDeploy Benchmark
首 token 延迟、token 吞吐、P50/P95/P99、显存占用、动态吞吐
LMDeploy / TurboMind / PyTorch backend
主流开源 LLM
LMDeploy / OpenMMLab / InternLM 生态
无
社区工具
ollama-benchmark
本地 Ollama 模型跑得快不快;常看 tokens/s、响应速度、简单负载
Ollama
本地 LLM、Embedding 等(视具体实现)
社区项目,非 Ollama 官方
无
通用压测
inference-perf
面向生产部署的通用压测;可统一比较不同推理服务
模型服务无关;支持 vLLM、SGLang、TGI 等,也适合 K8s 场景
GenAI / LLM 服务
Kubernetes SIGs 社区
无
通用压测
LLMPerf
传统 API 压测工具;看 TTFT、ITL、正确性/稳定性;但项目已归档
各类 LLM API
LLM API 服务
Ray 项目(已归档)
无
通用压测
LMeterX
一站式 API 压测平台;支持结果对比和 AI 总结,更偏平台化
LLM 服务、HTTP API、网关等
LLM、VLM、通用 API
MigoXLab 社区
无
评测+压测一体
EVALScope
不只测性能,还能测模型效果;适合“精度+性能”一起看
OpenCompass、VLMEvalKit、RAGEval 等,也可做压力测试
LLM、VLM、Embedding、Reranker、AIGC
ModelScope 社区
无
评测+压测一体
AISBench
基于 OpenCompass,兼顾精度评测和服务化性能压测,支持真实业务流量模拟
OpenCompass 兼容,本地模型、服务化模型、vLLM/Triton 等
文本、多模态模型
AISBench 社区/国内团队
无
基准体系
GCBS-AI
面向 AI 芯片、服务器、集群的综合测试套件,覆盖基础算力、训练、推理
更偏系统级/整机级平台
AI 芯片、AI 服务器、AI 集群
工业和信息化部电子第五研究所
有相关排行榜 (STF Monthly)
基准体系
MLPerf
国际最知名 AI 基准之一,测训练/推理系统性能
多厂商硬件与软件栈
训练、推理、多任务模型
MLCommons
有 (GitHub)
基准体系
AIPerf500
面向 AI 算力平台/超算的排行榜,偏系统级 AI 算力表现
智算中心、AI 集群、平台级系统
训练、推理、算力系统
AIPerf 相关组织/国内高校科研团队推动
有 (aiperf.org)
标题: 如果忘记参加了哪些公益站,可以从这里查看
作者: #V1vain
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1842679
时间: 2026-03-28 21:39:21
摘要:
作者: #V1vain
板块: #搞七捻三
编号:
1842679帖子: https://linux.do/t/topic/1842679
时间: 2026-03-28 21:39:21
摘要:
https://connect.linux.do/oauth2/log
这里可以看到自己linuxdo账号的网站授权,就可以知道之前授权的公益站。
(之前有幸进了几个公益站,但是忘存地址了,今天才发现可以在这里看,给各位佬分享下。
标题: 求一个GPT的prompt
作者: #Wind Frank
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1842682
时间: 2026-03-28 21:40:29
摘要:
作者: #Wind Frank
板块: #开发调优
编号:
1842682帖子: https://linux.do/t/topic/1842682
时间: 2026-03-28 21:40:29
摘要:
各位佬们,有没有好用的能够让GPT讲解AI、NLP领域论文的prompt?
标题: 有没有什么方式可以检测用的中转是不是官方满血的
作者: #emrpg
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1842683
时间: 2026-03-28 21:40:55
摘要:
作者: #emrpg
板块: #搞七捻三
编号:
1842683帖子: https://linux.do/t/topic/1842683
时间: 2026-03-28 21:40:55
摘要:
我之前一直在用的是淘宝买的月卡的 上面也没说是管转的还是啥的,佬们有啥办法可以测出来,主要是这几天基本都可以用了,他的不能用,我怀疑是不是那种低价的aws的,我看其他站的aws寄了他就跟着寄了
标题: 分享一下常用的网页端大模型厂商与点评
作者: #致远舰队
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1842687
时间: 2026-03-28 21:41:36
摘要:
作者: #致远舰队
板块: #搞七捻三
编号:
1842687帖子: https://linux.do/t/topic/1842687
时间: 2026-03-28 21:41:36
摘要:
以下是GPT进行的优化语句和排版,且鉴于论坛对链接的识别和自动挂审查,就全图了。
现在主要就是 qwen.ai了,同样的模型国内版(有点阉割了)和国际版回答完全不一样,不知道Qwen经历这一次动荡之后会怎么样。
z.ai 必须挂代理,不然识别到国内IP会让你手机号登录,登陆后再正常使用。
标题: 佬们平常怎么保护肩颈和腰的
作者: #nnan
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1842697
时间: 2026-03-28 21:43:43
摘要:
作者: #nnan
板块: #搞七捻三
编号:
1842697帖子: https://linux.do/t/topic/1842697
时间: 2026-03-28 21:43:43
摘要:
毕业开始上班后肩颈越来越难受
有没有什么建议或者好物推荐
标题: 我也来创作庄子外篇
作者: #人类
板块: #读书成诗
编号:
帖子: https://linux.do/t/topic/1842701
时间: 2026-03-28 21:44:06
摘要:
作者: #人类
板块: #读书成诗
编号:
1842701帖子: https://linux.do/t/topic/1842701
时间: 2026-03-28 21:44:06
摘要:
众所周知,庄子·外篇 是后人写的,那佬友们为何不一起来杜撰编写庄子·外篇呢,没准以后真变成文物了呢
我先来:
灰
孔丘见老子,问曰:“意谓周礼何由复兴?”
老子曰:“子试为之,吾不知也。”
丘遂周游列国,自谓悟得一理:圣人亦有所不知。
乃广招门徒。
后世尊为至圣先师,然已化为灰烬矣。
标题: Codex/Claude/Gemini CLI 无缝衔接
作者: #austin_zhang
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1842713
时间: 2026-03-28 21:45:48
摘要:
作者: #austin_zhang
板块: #开发调优
编号:
1842713帖子: https://linux.do/t/topic/1842713
时间: 2026-03-28 21:45:48
摘要:
有佬和我一样有这种需求么? 就是在日常工作中遇到不同的需求/任务 需要切cli 执行,但是上下文得每次都构建一次,导致每次执行很慢,或者达不到我们的效果,然后现在ACP 协议出来,我就想着能不能把 御三家 合到一块! 然后我也看到站内很多大佬分享了基于mcp的思路去实现,但是和我的需求不是很符合,我拿不到每个部分的执行细节,以及涉及到权限的部分。
以下是效果图:
然后我们还支持自动模式,采用claude code 做指挥室大脑,codex去实现,gemini 实现设计到ui的代码,在一次请求里面实现。
codex:
claude code:
支持指令(仍在完善中):
审查大大别下我帖子,我只是问问佬们有这种场景么?
标题: 海鲜市场20软妹币一个月的plus会员是怎么来的呢
作者: #void.shum
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1842726
时间: 2026-03-28 21:47:42
摘要:
作者: #void.shum
板块: #开发调优
编号:
1842726帖子: https://linux.do/t/topic/1842726
时间: 2026-03-28 21:47:42
摘要:
最近team好像崩了,请问这个plus会员充到自己账号的,又是什么来头呢?都是20-30一个月左右。
标题: 反重力这个限额真的把我整笑了
作者: #沉思者007
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1842733
时间: 2026-03-28 21:49:40
摘要:
作者: #沉思者007
板块: #开发调优
编号:
1842733帖子: https://linux.do/t/topic/1842733
时间: 2026-03-28 21:49:40
摘要:
Gemini学生Pro用户,上周用反重力的Opus 4.6对话了几轮,额度降低到40%,然后触发了周限,昨晚额度才恢复到百分之百。
我昨晚心想,这一次省着用一点,是不是就不会触发周限了。于是只进行了一两轮对话,额度降低到百分之80%。
今晚一看,又进入周限了。Gemini CLI也是一如既往的拉跨,频繁429报错,半天憋不出一句话来。
同样是20美刀的套餐,Claude Pro用起来舒服多了,ChatGPT Plus的Codex貌似更香,没想到以前浓眉大眼的谷歌变成现在这样了……
标题: 佬们是怎么解决claude频繁让allow的问题的?
作者: #背着你聪明
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1842742
时间: 2026-03-28 21:50:49
摘要:
作者: #背着你聪明
板块: #搞七捻三
编号:
1842742帖子: https://linux.do/t/topic/1842742
时间: 2026-03-28 21:50:49
摘要:
比如grok-search 都要频繁找我allow,其实根本没必要,好像是有一个设置权限的slash命令,但是我不知道给它哪些选项是安全的,佬们能分享下吗?
标题: CPA OAuth 登录认证失败
作者: #dandexing
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1842749
时间: 2026-03-28 21:52:33
摘要:
作者: #dandexing
板块: #开发调优
编号:
1842749帖子: https://linux.do/t/topic/1842749
时间: 2026-03-28 21:52:33
摘要:
想问下各位佬,CPA安装在了本地,为什么点 OAuth 登录,网页上面显示了successful,但是CPA界面上反馈“认证失败”?