标题: Claude最让我震撼的一次,不是写代码,而是做行业调研
作者: #林子
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1889009
时间: 2026-04-03 12:59:03
摘要:
作者: #林子
板块: #搞七捻三
编号:
1889009帖子: https://linux.do/t/topic/1889009
时间: 2026-04-03 12:59:03
摘要:
事情的起点是:发小来跟我说有朋友要拉他一起做某种天然物质颜料的品牌,不缺资金也不缺资源,各项条件听起来能搞成的概率挺大,他在考虑要不要一起干,来找我讨论。
作为这个行业的外行人,我第一次听说这个产品类别,直觉上这个市场规模可能比较小。我自己的业务最近有些起色,也挺忙,没打算深入调研,聊了会儿劝他再去多深入了解下。
晚上回到家打开电脑跟claude讨论完个产品活动的方案,想起这事儿,随手给claude和chatgpt都发了句指令:
对天然物质颜料这个产品类别做个市场调研,当前市场规模如何、用户群体、发展阶段、主要品牌等,尤其是中国的情况。聚焦在用于传统艺术创作的天然矿物颜料这个细分市场。
然后!5分钟后claude就给我个小惊喜!这份报告对于我这样一个有商业常识但没有行业知识的人,瞬间就补齐了基本行业信息,已经完全够我给出建议了:虽然在涨但市场规模过小、产品价格过高以致用户人群非常小、供应链不好搞。出于热爱可以搞,出于赚钱就算了。
(ChatGPT那份报告不如这份,排版上也远没有这个美…)
我立马把这份报告和我的结论发给了发小。发小第一反应是:这报告有点牛逼啊!说得有道理啊。要不,你先把那个出报告的工具推荐给我一下!我感觉有点厉害!
我:哈哈哈哈哈哈哈 这重点转移得是不是有点快
报告原文如下,说实话我是真有点惊艳的,我刚工作那会儿做的调研报告可能也就这个水平,而且没有个两天出不来。
标题: 新人报到,求助一下各位大佬
作者: #zhaozilong
板块: #资源荟萃
编号:
帖子: https://linux.do/t/topic/1889015
时间: 2026-04-03 13:00:00
摘要:
作者: #zhaozilong
板块: #资源荟萃
编号:
1889015帖子: https://linux.do/t/topic/1889015
时间: 2026-04-03 13:00:00
摘要:
想问一下大家这里领取的API或者密钥怎么配置到opencode或者其它开放式的变成软件嘛,有没有帖子或者教程呢
标题: 小米的 coding plan 发布了
作者: #Mx
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1889022
时间: 2026-04-03 13:00:49
摘要:
作者: #Mx
板块: #开发调优
编号:
1889022帖子: https://linux.do/t/topic/1889022
时间: 2026-04-03 13:00:49
摘要:
来自小米群的公告:
Xiaomi MiMo Token Plan 现已正式上线!
透明计费,按需规划
统一 Credit 点数体系,按 Token 使用量换算消耗,用量一目了然。
无5小时 Token 使用限制
支持集中消耗 token ,高强度养龙虾或编程,体验拉满。
一次订阅,全模态覆盖
灵活调用 MiMo-V2-Pro / Omni / TTS,共享额度,无需单独付费。
四档套餐,极高性价比
Lite(¥39/月) —— 60M Credits,一杯咖啡开启 AI 探索
Standard(¥99/月) —— 200M Credits,日常办公开发主力方案
Pro(¥329/月) —— 700M Credits,深度嵌入工作流的专业之选
Max(¥659/月) —— 1600M Credits,全天候高强度近乎无限制
首次购买任意套餐均享 88 折优惠!
主流工具深度适配
OpenClaw | Claude Code | OpenCode | Kilocode | Cline
订阅用户专享:新模型上线前优先内测权,快人一步。
原「Xiaomi MiMo 联合全球顶级 Agent 框架开启首周限免」活动将于 4 月 3 日 内结束,诚邀即刻订阅,解锁无限生产力!
详情关注「Xiaomi MiMo」官方公众号及 Token Plan。
Xiaomi MiMo API 开放平台团队
2026 年 4 月 3 日
感觉还是贵啊,他的模型一直都贵的感觉
标题: claude封号会ban卡号吗
作者: #马克MkSaMa
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1889029
时间: 2026-04-03 13:01:58
摘要:
作者: #马克MkSaMa
板块: #搞七捻三
编号:
1889029帖子: https://linux.do/t/topic/1889029
时间: 2026-04-03 13:01:58
摘要:
最近打算尝试开一下claude会员,求各位佬们指点一下
很久以前淘宝买的claude普通outlook邮箱账户(活了很久了,没冲过会员)+ 美国家宽vps + 美国朋友真实visa卡
唯一的问题是,万一封号了会不会封卡,毕竟是朋友的卡,还是有点顾虑的
标题: windterm+tmux+opencode 无法正常选中复制
作者: #tianyunlinger
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1889039
时间: 2026-04-03 13:03:12
摘要:
作者: #tianyunlinger
板块: #开发调优
编号:
1889039帖子: https://linux.do/t/topic/1889039
时间: 2026-04-03 13:03:12
摘要:
最近windows使用windterm远程服务器,新建tmux然后使用opencode,发现没办法正常选中文本复制,鼠标只能选中一个字符就拖拽不动并被默认复制,想知道什么什么原因导致,佬友们有没有办法解决。感觉是多个显示窗口冲突了?
标题: 有人知道小米的1M上下文怎么配置吗?
作者: #akiaug
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1889041
时间: 2026-04-03 13:04:18
摘要:
作者: #akiaug
板块: #搞七捻三
编号:
1889041帖子: https://linux.do/t/topic/1889041
时间: 2026-04-03 13:04:18
摘要:
MiMo-V2-Pro 上下文窗口 256k~1M:4倍(相当于代币消耗率的4倍)
刚刚买了100的套餐,请问一下小米的那个1m上下文要怎么配置
标题: 扎针有什么推荐吗
作者: #lengyuesky
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1889042
时间: 2026-04-03 13:04:19
摘要:
作者: #lengyuesky
板块: #搞七捻三
编号:
1889042帖子: https://linux.do/t/topic/1889042
时间: 2026-04-03 13:04:19
摘要:
如题,各位佬监控面板有什么推荐吗,哪吒和komari哪个更好用
标题: OpenRouter 上 Qwen3.6 Plus 正式版来了
作者: #滤布
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/1889050
时间: 2026-04-03 13:05:25
摘要:
作者: #滤布
板块: #前沿快讯
编号:
1889050帖子: https://linux.do/t/topic/1889050
时间: 2026-04-03 13:05:25
摘要:
早上发现qwen3.6-plus-preview:free怎么都连不上,看了看 OpenRouter 发现 qwen/qwen3.6-plus:free 上线了,preview 标签没了。
背景:
• 3 月 30 日发布的 preview 版本
• 1M token 上下文
• 强制链式思维推理
• 支持工具调用
模型应该稳定了,可以投入生产使用。之前 preview 期间收集的反馈应该都整合进去了
标题: 通过Codex – OpenAI’s coding agent 插件使用codex一直报401问题,网页端又是正常的
作者: #ys123
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1889068
时间: 2026-04-03 13:07:20
摘要:
作者: #ys123
板块: #搞七捻三
编号:
1889068帖子: https://linux.do/t/topic/1889068
时间: 2026-04-03 13:07:20
摘要:
佬有遇到过了,重新授权登录了好几次,就是使用不了
标题: claude普号不充钱是不是就不容易封了?
作者: #quio
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1889076
时间: 2026-04-03 13:08:00
摘要:
作者: #quio
板块: #搞七捻三
编号:
1889076帖子: https://linux.do/t/topic/1889076
时间: 2026-04-03 13:08:00
摘要:
1月20左右注册了两个claude账号,当时一个月ip是蹭站里的临期的家宽。
之后家宽过期了,就用一般的梯子,有好几次都忘记切回美国了,最后自暴自弃以为要封号就随便换ip,结果没有封号
标题: 有必要买一个升降桌吗?
作者: #吴琨
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1889084
时间: 2026-04-03 13:09:28
摘要:
作者: #吴琨
板块: #搞七捻三
编号:
1889084帖子: https://linux.do/t/topic/1889084
时间: 2026-04-03 13:09:28
摘要:
现在居家办公,每天坐在电脑前十多个小时,最近觉得尾椎有点疼,人体工学椅、显示器都买了,换一个升降桌也不便宜,想问下靠谱吗
标题: 新人报道,进站刷帖子刷入迷了
作者: #ltzh3530
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1889087
时间: 2026-04-03 13:09:36
摘要:
作者: #ltzh3530
板块: #搞七捻三
编号:
1889087帖子: https://linux.do/t/topic/1889087
时间: 2026-04-03 13:09:36
摘要:
嘿嘿,终于进来了,昨天刷了一天帖子,忘记来报道了。感谢各位佬提供了这么友好的氛围
标题: 【抽奖】抽一个supergrok账号(无质保)
作者: #xiaohan17
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/1889094
时间: 2026-04-03 13:09:52
摘要:
作者: #xiaohan17
板块: #福利羊毛
编号:
1889094帖子: https://linux.do/t/topic/1889094
时间: 2026-04-03 13:09:52
摘要:
(在不封号的情况下4.28以后到期,具体哪天我也不清楚)
奖品详情:
supergrok账号
活动时间:
开始时间:即刻起(本帖发布之时)
截止时间:[2026年4月3日 14:30]
抽奖规则:
每位用户仅允许参与一次。
使用论坛官方工具随机抽取中奖者。
参与方式:
在本帖下回复,即参与成功
活动截止后使用官方抽奖工具随机抽取 1 位中奖者;
重复回复、违规回复等情况,视为无效参与。
使用官方抽奖工具随机抽取中奖者。
注意事项:
本活动将在截止后关闭回帖,以确保公平公正;
中奖名单将在活动结束后 12 小时内于本帖公布,并私信通知领取方式;
奖品为Super Grok账号一个,无质保,不保证具体可用时长;
因官方政策、风控、封号、回收、异常失效等不可控因素造成无法使用,不补不换;
参与本次抽奖即视为默认接受以上全部规则;
所有规则及最终解释权归活动发起人和论坛管理团队所有。
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系抽奖发起人。
标题: 新人报道,写了快300字的小作文,终于进来了
作者: #asea
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1889102
时间: 2026-04-03 13:11:13
摘要:
作者: #asea
板块: #搞七捻三
编号:
1889102帖子: https://linux.do/t/topic/1889102
时间: 2026-04-03 13:11:13
摘要:
顺便问些小白的问题,希望佬友们解答一下
奥特曼是指谁
any
公益站都是什么
标题: 佬友们有没有对付老赖的经验
作者: #xxwa
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1889105
时间: 2026-04-03 13:11:30
摘要:
作者: #xxwa
板块: #开发调优
编号:
1889105帖子: https://linux.do/t/topic/1889105
时间: 2026-04-03 13:11:30
摘要:
碰上老赖了,二审赢了,判老赖赔我接近20万,老赖直接发消息说他一分钱都没有,执行查不到他一分钱,还说光脚的不怕穿鞋的,别惹急了他。律师也说没什么办法就正常走流程。一个重大失误是诉前没走财产保全,当时律师说保全要五千起步说可能没啥作用就没做了。佬友们有无相关经验啊,有没有专门做收债收烂账的这种职业呢?
标题: 佬友们有没有感觉wsl下codex速度很慢
作者: #dianS
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1889122
时间: 2026-04-03 13:13:32
摘要:
作者: #dianS
板块: #开发调优
编号:
1889122帖子: https://linux.do/t/topic/1889122
时间: 2026-04-03 13:13:32
摘要:
codex又发大水了,这波福利不薅一下,实在过意不去,奈何网络问题限制了我的发挥,佬们有没有提速的好办法,我opencode 用的github的copilot的gemini速度就快的飞起
标题: 没有机器人我是不信的
作者: #TenHuan
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1889135
时间: 2026-04-03 13:14:30
摘要:
作者: #TenHuan
板块: #搞七捻三
编号:
1889135帖子: https://linux.do/t/topic/1889135
时间: 2026-04-03 13:14:30
摘要:
前沿快讯,发之前都不看有没有么,没有机器人的话我是不信的
标题: 来发一个dgx spark部署大模型的经验
作者: #BobbyZZY
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1889138
时间: 2026-04-03 13:14:58
摘要:
作者: #BobbyZZY
板块: #开发调优
编号:
1889138帖子: https://linux.do/t/topic/1889138
时间: 2026-04-03 13:14:58
摘要:
最近公司要做一个本地部署大模型的项目,配了dgx spark,用了一周的时间去尝试了各种模型,踩了各种坑,现在给大家汇报DGX Spark 部署 Qwen3.5 / NVFP4 大模型实战记录
这篇文档记录的是我在 NVIDIA DGX Spark(GB10,128GB unified memory) 上部署 Qwen3.5 系列模型,尤其是 NVFP4 量化模型 的完整踩坑过程、结论和推荐方案。
我最想部署的模型就是qwen3.5-122b-a10b,总参数量够大,激发参数够小,模型最强,fp4量化以后正好能在spark上跑起来
用了一周的时间去尝试了各种模型,踩了各种坑,现在给大家汇报:
哪些组合我真的跑起来了
哪些组合虽然部署成功了但实际上会崩
哪些镜像/框架最完美
哪些可以跑起来
哪些方案在 Spark 上跑不起来
我实际用过的镜像主要有:
vllm-node:latest
vllm-spark:dev210-final
vllm/vllm-openai:cu130-nightly
vllm/vllm-openai:v0.17.1-cu130
lmsysorg/sglang:dev-cu13
lmsysorg/sglang:spark
scitrera/dgx-spark-sglang:0.5.9-t5
avarok/dgx-vllm-nvfp4-kernel:latest
avarok/atlas-alpha2
2. 省流版
| 部署的模型 | 最终推荐 |
| 官方 Qwen3.5 / Qwen3 全量、FP8、GPTQ / AWQ | vllm-node:latest |
| SGLang 部署 | lmsysorg/sglang:dev-cu13 |
| 122B NVFP4 完整服务 | spark-vllm-122b 对应的 vllm-spark:dev210-final |
| NVFP4 纯文本高速服务 | avarok/atlas-alpha2 |
2.1 最推荐的模型
在 DGX Spark 上,当前真正“稳定跑起来、支持视觉、支持 reasoning 分离、支持工具调用、支持长上下文”的 NVFP4 方案,我最终跑通的是:
github.com
GitHub - jilycn/spark-vllm-122b: vLLM Qwen3.5-122B NVFP4 on DGX Spark (SM121) —...
vLLM Qwen3.5-122B NVFP4 on DGX Spark (SM121) — full Docker build with 15 patches
这个项目非常有用,对dgx spark跑qwen3.5-122b-a10b做了patch,提供了最好的支持
用**txn545/Qwen3.5-122B-A10B-NVFP4 + spark-vllm-122b**这套是我最终最认可、也最有分享价值的方案。
3. 我试过的主要模型
3.1 Qwen3.5 122B / NVFP4
txn545/Qwen3.5-122B-A10B-NVFP4
Sehyo/Qwen3.5-122B-A10B-NVFP4
RedHatAI/Qwen3.5-122B-A10B-NVFP4
3.2 Qwen3.5 27B / 35B
Qwen/Qwen3.5-27B
Qwen/Qwen3.5-27B-FP8
Qwen/Qwen3.5-27B-GPTQ-Int4
Qwen/Qwen3.5-35B-A3B
Qwen/Qwen3.5-35B-A3B-FP8
3.3 Qwen3-VL
Qwen/Qwen3-VL-32B-Thinking
Qwen/Qwen3-VL-32B-Thinking-FP8
Qwen/Qwen3-VL-32B-Thinking-GPTQ-Int4
3.4 其他 NVFP4 实验模型
txn545/Qwen3.5-27B-NVFP4
txn545/Qwen3.5-35B-A3B-NVFP4
mconcat/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-NVFP4
osoleve/Qwen3.5-27B-Text-NVFP4-MTP
4. 最大的困扰:nvfp4对spark兼容性不佳
网上很多人提到了做 DGX Spark 上,nvfp4兼容性不佳:
内核不兼容
illegal memory access
DeepGEMM / CUDA graph 报错
tokenizer 类不兼容
rope config 不兼容
启动能起来,但一请求就炸
Spark 不是普通显卡环境,对通用nvfp4不兼容
5. 我踩过的主要坑
5.1 通用 vLLM / SGLang 镜像,不等于 Spark 能稳跑
我最开始试过很多“看起来最标准”的方案:
vllm/vllm-openai:cu130-nightly
vllm/vllm-openai:v0.17.1-cu130
lmsysorg/sglang:dev-cu13
lmsysorg/sglang:spark
scitrera/dgx-spark-sglang:0.5.9-t5
结论:
模型能加载,推理时炸
attention backend 不对
CUDA graph / DeepGEMM 失败
tokenizer / config parser 不兼容
启动没问题,但多模态不工作
5.2 txn545 + SGLang 不是我最终能稳定用的路线
txn545/Qwen3.5-122B-A10B-NVFP4 的模型卡偏向 SGLang / modelopt_fp4,理论上很合理。
我实际试下来:
通过 lmsysorg/sglang:dev-cu13
加 --attention-backend triton
确实能把服务起起来
但问题是:
真正发请求后,还是会触发底层 CUDA 非法内存访问
5.3 RedHatAI/Qwen3.5-122B-A10B-NVFP4 卡在 tokenizer 兼容
它模型卡写的是:
llm-compressor
与 vLLM main 兼容并测试过
但我在 Spark 上实际遇到的是:
Tokenizer class TokenizersBackend does not exist
所以我最后没有继续把它当主线。
5.4 spark-vllm-122b 不是通用 NVFP4 镜像,但对qwen3.5-122b-a10b-nvfp4做了完整适配
我后来找到并跑通了:
github.com
GitHub - jilycn/spark-vllm-122b: vLLM Qwen3.5-122B NVFP4 on DGX Spark (SM121) —...
vLLM Qwen3.5-122B NVFP4 on DGX Spark (SM121) — full Docker build with 15 patches
它确实很强,但它强在:
针对 Qwen3.5-122B-A10B-NVFP4 做过一整套 patch
但我后面拿它直接套 27B、35B 某些 NVFP4 模型时,依然会遇到:
rope parser 不兼容
config 不兼容
所以这套要明确定位:
122B 专用主力
6.2 我最终用这套跑通了什么
我最终验证这套做到了:
122B NVFP4 启动成功
视觉可用
reasoning 分离正常
tool calling 正常
多请求稳定
长上下文正常
他是一套配套的patch适配122b的启动方式
7. vllm-node:latest:我最后的官方模型主力
我自己还在网上找到了一个 Spark 优化版vllm vllm-node:latest。
github.com
GitHub - eugr/spark-vllm-docker: Docker configuration for running VLLM on dual DGX...
Docker configuration for running VLLM on dual DGX Sparks
这套对我后来跑官方模型很重要,项目非常好用
7.1 我给它的定位
官方 Qwen3.5 全量
官方 Qwen3.5 FP8
官方 Qwen3.5 GPTQ-Int4
官方 Qwen3-VL-32B-Thinking 系列
7.2 它的优点
明