标题: DeepSeek V4,经典洗车问题
作者: #小丸子
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2046961
时间: 2026-04-24 17:00:27
摘要:
作者: #小丸子
板块: #搞七捻三
编号:
2046961帖子: https://linux.do/t/topic/2046961
时间: 2026-04-24 17:00:27
摘要:
经典洗车问题,gpt、豆包、gemini都是走着去,难得啊
标题: 关于我想通过纯AI快速开发出来一个APP的天真
作者: #zzzero
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2046970
时间: 2026-04-24 17:01:04
摘要:
作者: #zzzero
板块: #开发调优
编号:
2046970帖子: https://linux.do/t/topic/2046970
时间: 2026-04-24 17:01:04
摘要:
图1是我通过gpt生成的UI图,图2是用gpt5.4开发的代码,感觉纯靠AI还是很难还原出来UI图的效果,并没有想象中的那么顺利可以快速的开发出来一个APP,需要把UI图拆解反复调整可能才会达到我想要的效果吧。
标题: 大佬们,ccswitch报错:无法访问你试图使用的功能所在的网络位置
作者: #LuoYeah
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2046976
时间: 2026-04-24 17:01:35
摘要:
作者: #LuoYeah
板块: #搞七捻三
编号:
2046976帖子: https://linux.do/t/topic/2046976
时间: 2026-04-24 17:01:35
摘要:
安装和卸载都会报错:
标题: Qwen3.6-27B和Qwen3.6-35B-A3B的nvfp4量化在dgxspark下面的速度表现
作者: #xy3
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2046994
时间: 2026-04-24 17:03:05
摘要:
作者: #xy3
板块: #开发调优
编号:
2046994帖子: https://linux.do/t/topic/2046994
时间: 2026-04-24 17:03:05
摘要:
模型来源
RedHatAI/Qwen3.6-35B-A3B-NVFP4 · Hugging Face
sakamakismile/Qwen3.6-27B-NVFP4 · Hugging Face
Qwen3.6-35B-A3B速度
单用户串行测试: num_prompts=20, request_rate=1, max_concurrency=1。低负载基线,用来看模型本身的交互体验。
吞吐 37.94 tok/s, Mean TTFT 543.42 ms, P99 TTFT 2878.45 ms, Mean TPOT 23.46 ms
8 并发用户测试: num_prompts=100, request_rate=inf, max_concurrency=8。模拟最多 8 个用户同时使用。
吞吐 164.39 tok/s, Mean TTFT 331.77 ms, P99 TTFT 786.20 ms, Mean TPOT 43.45 ms
固定 QPS 多用户测试: num_prompts=200, request_rate=4, max_concurrency=16。更接近线上持续流量,平均每秒 4 个请求。
吞吐 229.79 tok/s, Mean TTFT 521.67 ms, P99 TTFT 4542.64 ms, Mean TPOT 62.82 ms
场景
成功请求
Benchmark 时长(s)
输出吞吐(tok/s)
Mean TTFT(ms)
P99 TTFT(ms)
Mean TPOT(ms)
Mean ITL(ms)
单用户串行测试
20
136.99
37.94
543.42
2878.45
23.46
24.17
8 并发用户测试
100
135.85
164.39
331.77
786.20
43.45
44.19
固定 QPS 多用户测试
200
194.69
229.79
521.67
4542.64
62.82
62.22
Qwen3.6-27B
单用户串行测试: num_prompts=20, request_rate=1, max_concurrency=1。低负载基线,用来看模型本身的交互体验。
吞吐 11.68 tok/s, Mean TTFT 1078.83 ms, P99 TTFT 14364.02 ms, Mean TPOT 81.68 ms
8 并发用户测试: num_prompts=100, request_rate=inf, max_concurrency=8。模拟最多 8 个用户同时使用。
吞吐 79.13 tok/s, Mean TTFT 678.16 ms, P99 TTFT 4253.76 ms, Mean TPOT 89.96 ms
固定 QPS 多用户测试: num_prompts=200, request_rate=4, max_concurrency=16。更接近线上持续流量,平均每秒 4 个请求。
吞吐 132.89 tok/s, Mean TTFT 428.64 ms, P99 TTFT 761.94 ms, Mean TPOT 108.11 ms
场景
成功请求
Benchmark 时长(s)
输出吞吐(tok/s)
Mean TTFT(ms)
P99 TTFT(ms)
Mean TPOT(ms)
Mean ITL(ms)
单用户串行测试
20
445.13
11.68
1078.83
14364.02
81.68
81.37
8 并发用户测试
100
280.35
79.13
678.16
4253.76
89.96
89.79
固定 QPS 多用户测试
200
336.47
132.89
428.64
761.94
108.11
106.61
总结
由于dgxspark的内存带宽和cuda核心都比较弱,只是内存比较大,能跑MOE模型还是优先跑MOE模型。这里跑Dense模型速度快砍半了
标题: 关于aws账户注册和付费流程,避免提供水电单请教
作者: #专注于小白教程
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2046995
时间: 2026-04-24 17:03:13
摘要:
作者: #专注于小白教程
板块: #搞七捻三
编号:
2046995帖子: https://linux.do/t/topic/2046995
时间: 2026-04-24 17:03:13
摘要:
想要注册多个账号,直接使用信用卡开通付费账户,
开通付费账户后,不开机,存放3个月再用?
可以避免被要求提交水电单吗
标题: 解决DeepSeekV4pro在OpenWebUI接入无法正常输出的问题
作者: #尘末ChenM0M
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2047012
时间: 2026-04-24 17:04:20
摘要:
作者: #尘末ChenM0M
板块: #开发调优
编号:
2047012帖子: https://linux.do/t/topic/2047012
时间: 2026-04-24 17:04:20
摘要:
今天刚把v4pro接入OpenWebUI发现出现了The reasoning_content in the thinking mode must be passed back to the API.的问题
然后查看了文档发现貌似是因为思维链必须要返回,但是OWU貌似还没有适配。
所以就快速搓了个Pipeline
deepseek_v4_pipe.zip (6.4 KB)
使用方式:
管理员面板-函数-导入函数
选择并导入json附件
配置可以点小齿轮进行修改(记得填key)
默认为DeepSeek官方url(可修改),默认模型为deepseek-v4-pro
debug模式会在容器日志中输出pipe日志内容
配置完后启用会创建对应可选的模型
特性:
思维链过程完整展示
工具调用理论可行
支持流式输出
标题: 万能的佬友,作为家长,求推荐一个错题 app
作者: #xC
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2047016
时间: 2026-04-24 17:04:58
摘要:
作者: #xC
板块: #搞七捻三
编号:
2047016帖子: https://linux.do/t/topic/2047016
时间: 2026-04-24 17:04:58
摘要:
求问各位佬友,有没有好用的错题 app 推荐,橙果、试卷宝这些,主要是想把孩子的错题整理起来,然后能够根据错题举一反三(需要 APP 支持),并且支持打印。
标题: GPT2.0生图玩玩 2026424
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2047027
时间: 2026-04-24 17:05:46
摘要:
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #搞七捻三
编号:
2047027帖子: https://linux.do/t/topic/2047027
时间: 2026-04-24 17:05:46
摘要:
请注意提示词非原创 均来自互联网 或者AI自动生成
晚点继续生图
标题: 我的colocrossing的vps好像把移动的ip墙了
作者: #wayyy
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2047034
时间: 2026-04-24 17:06:20
摘要:
作者: #wayyy
板块: #开发调优
编号:
2047034帖子: https://linux.do/t/topic/2047034
时间: 2026-04-24 17:06:20
摘要:
移动的ip访问不到搭建的服务。ssh也连不上。
标题: ollama cloud的GLM 5.1能够接入vscode copilot使用吗?
作者: #moveongogo
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2047035
时间: 2026-04-24 17:06:55
摘要:
作者: #moveongogo
板块: #开发调优
编号:
2047035帖子: https://linux.do/t/topic/2047035
时间: 2026-04-24 17:06:55
摘要:
ollama cloud的GLM 5.1能够接入vscode copilot使用吗?我用了cloud模型,聊天框有输出,不能够直接修改项目代码。
标题: 各位佬友们有没有什么好用的开发skill
作者: #xymopi
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2047037
时间: 2026-04-24 17:07:13
摘要:
作者: #xymopi
板块: #搞七捻三
编号:
2047037帖子: https://linux.do/t/topic/2047037
时间: 2026-04-24 17:07:13
摘要:
各位佬友们有没有什么好用的java全栈开发skill
标题: 部门要求开始写日报,吐槽版。
作者: #whoops
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2047051
时间: 2026-04-24 17:08:07
摘要:
作者: #whoops
板块: #搞七捻三
编号:
2047051帖子: https://linux.do/t/topic/2047051
时间: 2026-04-24 17:08:07
摘要:
现在既要趁闲下来的时候去学习AI【完全学不过来】,然后领导又要求写日报,来总结今日工作情况又得汇报明日计划,感觉挺无奈的;一方面让用AI,一方面又得写版本需求,想请教下各位佬,这种情况该怎么办?【不要用AI回复 】