LinuxDo 新帖推送

标题: Claude最让我震撼的一次，不是写代码，而是做行业调研
作者: #林子
板块: #搞七捻三
编号: 1889009
帖子: https://linux.do/t/topic/1889009
时间: 2026-04-03 12:59:03
摘要:

事情的起点是：发小来跟我说有朋友要拉他一起做某种天然物质颜料的品牌，不缺资金也不缺资源，各项条件听起来能搞成的概率挺大，他在考虑要不要一起干，来找我讨论。
作为这个行业的外行人，我第一次听说这个产品类别，直觉上这个市场规模可能比较小。我自己的业务最近有些起色，也挺忙，没打算深入调研，聊了会儿劝他再去多深入了解下。
晚上回到家打开电脑跟claude讨论完个产品活动的方案，想起这事儿，随手给claude和chatgpt都发了句指令：
对天然物质颜料这个产品类别做个市场调研，当前市场规模如何、用户群体、发展阶段、主要品牌等，尤其是中国的情况。聚焦在用于传统艺术创作的天然矿物颜料这个细分市场。

然后！5分钟后claude就给我个小惊喜！这份报告对于我这样一个有商业常识但没有行业知识的人，瞬间就补齐了基本行业信息，已经完全够我给出建议了：虽然在涨但市场规模过小、产品价格过高以致用户人群非常小、供应链不好搞。出于热爱可以搞，出于赚钱就算了。
(ChatGPT那份报告不如这份，排版上也远没有这个美…)
我立马把这份报告和我的结论发给了发小。发小第一反应是：这报告有点牛逼啊！说得有道理啊。要不，你先把那个出报告的工具推荐给我一下！我感觉有点厉害！
我：哈哈哈哈哈哈哈 这重点转移得是不是有点快 
报告原文如下，说实话我是真有点惊艳的，我刚工作那会儿做的调研报告可能也就这个水平，而且没有个两天出不来。

3 views04:59

LinuxDo 新帖推送

标题: 新人报到，求助一下各位大佬
作者: #zhaozilong
板块: #资源荟萃
编号: 1889015
帖子: https://linux.do/t/topic/1889015
时间: 2026-04-03 13:00:00
摘要:

想问一下大家这里领取的API或者密钥怎么配置到opencode或者其它开放式的变成软件嘛，有没有帖子或者教程呢

4 views05:02

LinuxDo 新帖推送

标题: 小米的 coding plan 发布了
作者: #Mx
板块: #开发调优
编号: 1889022
帖子: https://linux.do/t/topic/1889022
时间: 2026-04-03 13:00:49
摘要:

来自小米群的公告：

Xiaomi MiMo Token Plan 现已正式上线！
透明计费，按需规划
统一 Credit 点数体系，按 Token 使用量换算消耗，用量一目了然。
无5小时 Token 使用限制
支持集中消耗 token ，高强度养龙虾或编程，体验拉满。
一次订阅，全模态覆盖
灵活调用 MiMo-V2-Pro / Omni / TTS，共享额度，无需单独付费。
四档套餐，极高性价比

Lite（¥39/月） —— 60M Credits，一杯咖啡开启 AI 探索
Standard（¥99/月） —— 200M Credits，日常办公开发主力方案
Pro（¥329/月） —— 700M Credits，深度嵌入工作流的专业之选
Max（¥659/月） —— 1600M Credits，全天候高强度近乎无限制
首次购买任意套餐均享 88 折优惠！

主流工具深度适配
OpenClaw ｜ Claude Code ｜ OpenCode ｜ Kilocode ｜ Cline
订阅用户专享：新模型上线前优先内测权，快人一步。
原「Xiaomi MiMo 联合全球顶级 Agent 框架开启首周限免」活动将于 4 月 3 日 内结束，诚邀即刻订阅，解锁无限生产力！
详情关注「Xiaomi MiMo」官方公众号及 Token Plan。
Xiaomi MiMo API 开放平台团队
2026 年 4 月 3 日

感觉还是贵啊，他的模型一直都贵的感觉

5 views05:02

LinuxDo 新帖推送

标题: claude封号会ban卡号吗
作者: #马克MkSaMa
板块: #搞七捻三
编号: 1889029
帖子: https://linux.do/t/topic/1889029
时间: 2026-04-03 13:01:58
摘要:

最近打算尝试开一下claude会员，求各位佬们指点一下
很久以前淘宝买的claude普通outlook邮箱账户（活了很久了，没冲过会员）+ 美国家宽vps + 美国朋友真实visa卡
唯一的问题是，万一封号了会不会封卡，毕竟是朋友的卡，还是有点顾虑的

6 views05:02

LinuxDo 新帖推送

标题: windterm+tmux+opencode 无法正常选中复制
作者: #tianyunlinger
板块: #开发调优
编号: 1889039
帖子: https://linux.do/t/topic/1889039
时间: 2026-04-03 13:03:12
摘要:

最近windows使用windterm远程服务器，新建tmux然后使用opencode，发现没办法正常选中文本复制，鼠标只能选中一个字符就拖拽不动并被默认复制，想知道什么什么原因导致，佬友们有没有办法解决。感觉是多个显示窗口冲突了？

5 views05:04

LinuxDo 新帖推送

标题: 有人知道小米的1M上下文怎么配置吗？
作者: #akiaug
板块: #搞七捻三
编号: 1889041
帖子: https://linux.do/t/topic/1889041
时间: 2026-04-03 13:04:18
摘要:

MiMo-V2-Pro 上下文窗口 256k~1M：4倍（相当于代币消耗率的4倍）



刚刚买了100的套餐，请问一下小米的那个1m上下文要怎么配置

6 views05:04

LinuxDo 新帖推送

标题: 扎针有什么推荐吗
作者: #lengyuesky
板块: #搞七捻三
编号: 1889042
帖子: https://linux.do/t/topic/1889042
时间: 2026-04-03 13:04:19
摘要:

如题，各位佬监控面板有什么推荐吗，哪吒和komari哪个更好用

7 views05:04

LinuxDo 新帖推送

标题: OpenRouter 上 Qwen3.6 Plus 正式版来了
作者: #滤布
板块: #前沿快讯
编号: 1889050
帖子: https://linux.do/t/topic/1889050
时间: 2026-04-03 13:05:25
摘要:

早上发现qwen3.6-plus-preview:free怎么都连不上，看了看 OpenRouter 发现 qwen/qwen3.6-plus:free 上线了，preview 标签没了。
背景：
• 3 月 30 日发布的 preview 版本
• 1M token 上下文
• 强制链式思维推理
• 支持工具调用
模型应该稳定了，可以投入生产使用。之前 preview 期间收集的反馈应该都整合进去了

4 views05:07

LinuxDo 新帖推送

标题: 通过Codex – OpenAI’s coding agent 插件使用codex一直报401问题，网页端又是正常的
作者: #ys123
板块: #搞七捻三
编号: 1889068
帖子: https://linux.do/t/topic/1889068
时间: 2026-04-03 13:07:20
摘要:

佬有遇到过了，重新授权登录了好几次，就是使用不了

2 views05:09

LinuxDo 新帖推送

标题: claude普号不充钱是不是就不容易封了？
作者: #quio
板块: #搞七捻三
编号: 1889076
帖子: https://linux.do/t/topic/1889076
时间: 2026-04-03 13:08:00
摘要:

1月20左右注册了两个claude账号，当时一个月ip是蹭站里的临期的家宽。
之后家宽过期了，就用一般的梯子，有好几次都忘记切回美国了，最后自暴自弃以为要封号就随便换ip，结果没有封号

2 views05:09

LinuxDo 新帖推送

标题: 有必要买一个升降桌吗？
作者: #吴琨
板块: #搞七捻三
编号: 1889084
帖子: https://linux.do/t/topic/1889084
时间: 2026-04-03 13:09:28
摘要:

现在居家办公，每天坐在电脑前十多个小时，最近觉得尾椎有点疼，人体工学椅、显示器都买了，换一个升降桌也不便宜，想问下靠谱吗

2 views05:11

LinuxDo 新帖推送

标题: 新人报道，进站刷帖子刷入迷了
作者: #ltzh3530
板块: #搞七捻三
编号: 1889087
帖子: https://linux.do/t/topic/1889087
时间: 2026-04-03 13:09:36
摘要:

嘿嘿，终于进来了，昨天刷了一天帖子，忘记来报道了。感谢各位佬提供了这么友好的氛围

2 views05:11

LinuxDo 新帖推送

标题: 【抽奖】抽一个supergrok账号（无质保）
作者: #xiaohan17
板块: #福利羊毛
编号: 1889094
帖子: https://linux.do/t/topic/1889094
时间: 2026-04-03 13:09:52
摘要:

（在不封号的情况下4.28以后到期，具体哪天我也不清楚）

 奖品详情：
supergrok账号
 活动时间：
开始时间：即刻起（本帖发布之时）
截止时间：[2026年4月3日 14:30］
 抽奖规则：
每位用户仅允许参与一次。
使用论坛官方工具随机抽取中奖者。
 参与方式：
在本帖下回复,即参与成功
活动截止后使用官方抽奖工具随机抽取 1 位中奖者；
重复回复、违规回复等情况，视为无效参与。
使用官方抽奖工具随机抽取中奖者。
 注意事项：
本活动将在截止后关闭回帖，以确保公平公正；
中奖名单将在活动结束后 12 小时内于本帖公布，并私信通知领取方式；
奖品为Super Grok账号一个，无质保，不保证具体可用时长；
因官方政策、风控、封号、回收、异常失效等不可控因素造成无法使用，不补不换；
参与本次抽奖即视为默认接受以上全部规则；
所有规则及最终解释权归活动发起人和论坛管理团队所有。
期待您的积极参与，祝您好运！如有任何疑问，欢迎随时联系抽奖发起人。

4 views05:11

LinuxDo 新帖推送

标题: 新人报道,写了快300字的小作文,终于进来了
作者: #asea
板块: #搞七捻三
编号: 1889102
帖子: https://linux.do/t/topic/1889102
时间: 2026-04-03 13:11:13
摘要:

顺便问些小白的问题,希望佬友们解答一下
奥特曼是指谁
any
公益站都是什么

3 views05:11

LinuxDo 新帖推送

标题: 佬友们有没有对付老赖的经验
作者: #xxwa
板块: #开发调优
编号: 1889105
帖子: https://linux.do/t/topic/1889105
时间: 2026-04-03 13:11:30
摘要:

碰上老赖了，二审赢了，判老赖赔我接近20万，老赖直接发消息说他一分钱都没有，执行查不到他一分钱，还说光脚的不怕穿鞋的，别惹急了他。律师也说没什么办法就正常走流程。一个重大失误是诉前没走财产保全，当时律师说保全要五千起步说可能没啥作用就没做了。佬友们有无相关经验啊，有没有专门做收债收烂账的这种职业呢？

3 views05:14

LinuxDo 新帖推送

标题: 佬友们有没有感觉wsl下codex速度很慢
作者: #dianS
板块: #开发调优
编号: 1889122
帖子: https://linux.do/t/topic/1889122
时间: 2026-04-03 13:13:32
摘要:

codex又发大水了，这波福利不薅一下，实在过意不去，奈何网络问题限制了我的发挥，佬们有没有提速的好办法，我opencode 用的github的copilot的gemini速度就快的飞起

2 views05:14

LinuxDo 新帖推送

标题: 没有机器人我是不信的
作者: #TenHuan
板块: #搞七捻三
编号: 1889135
帖子: https://linux.do/t/topic/1889135
时间: 2026-04-03 13:14:30
摘要:

前沿快讯，发之前都不看有没有么，没有机器人的话我是不信的

2 views05:17

LinuxDo 新帖推送

标题: 来发一个dgx spark部署大模型的经验
作者: #BobbyZZY
板块: #开发调优
编号: 1889138
帖子: https://linux.do/t/topic/1889138
时间: 2026-04-03 13:14:58
摘要:

最近公司要做一个本地部署大模型的项目，配了dgx spark，用了一周的时间去尝试了各种模型，踩了各种坑，现在给大家汇报DGX Spark 部署 Qwen3.5 / NVFP4 大模型实战记录
这篇文档记录的是我在 NVIDIA DGX Spark（GB10，128GB unified memory） 上部署 Qwen3.5 系列模型，尤其是 NVFP4 量化模型 的完整踩坑过程、结论和推荐方案。
我最想部署的模型就是qwen3.5-122b-a10b，总参数量够大，激发参数够小，模型最强，fp4量化以后正好能在spark上跑起来
用了一周的时间去尝试了各种模型，踩了各种坑，现在给大家汇报：


哪些组合我真的跑起来了


哪些组合虽然部署成功了但实际上会崩


哪些镜像/框架最完美


哪些可以跑起来


哪些方案在 Spark 上跑不起来


我实际用过的镜像主要有：


vllm-node:latest


vllm-spark:dev210-final


vllm/vllm-openai:cu130-nightly


vllm/vllm-openai:v0.17.1-cu130


lmsysorg/sglang:dev-cu13


lmsysorg/sglang:spark


scitrera/dgx-spark-sglang:0.5.9-t5


avarok/dgx-vllm-nvfp4-kernel:latest


avarok/atlas-alpha2


2. 省流版
| 部署的模型 | 最终推荐 |
| 官方 Qwen3.5 / Qwen3 全量、FP8、GPTQ / AWQ | vllm-node:latest |
| SGLang 部署 | lmsysorg/sglang:dev-cu13 |
| 122B NVFP4 完整服务 | spark-vllm-122b 对应的 vllm-spark:dev210-final |
| NVFP4 纯文本高速服务 | avarok/atlas-alpha2 |
2.1 最推荐的模型
在 DGX Spark 上，当前真正“稳定跑起来、支持视觉、支持 reasoning 分离、支持工具调用、支持长上下文”的 NVFP4 方案，我最终跑通的是：

  

      github.com
  

  
    
  

  GitHub - jilycn/spark-vllm-122b: vLLM Qwen3.5-122B NVFP4 on DGX Spark (SM121) —...

    vLLM Qwen3.5-122B NVFP4 on DGX Spark (SM121) — full Docker build with 15 patches


  

  
    
    
  

  


这个项目非常有用，对dgx spark跑qwen3.5-122b-a10b做了patch，提供了最好的支持
用**txn545/Qwen3.5-122B-A10B-NVFP4 + spark-vllm-122b**这套是我最终最认可、也最有分享价值的方案。

3. 我试过的主要模型
3.1 Qwen3.5 122B / NVFP4


txn545/Qwen3.5-122B-A10B-NVFP4


Sehyo/Qwen3.5-122B-A10B-NVFP4


RedHatAI/Qwen3.5-122B-A10B-NVFP4


3.2 Qwen3.5 27B / 35B


Qwen/Qwen3.5-27B


Qwen/Qwen3.5-27B-FP8


Qwen/Qwen3.5-27B-GPTQ-Int4


Qwen/Qwen3.5-35B-A3B


Qwen/Qwen3.5-35B-A3B-FP8


3.3 Qwen3-VL


Qwen/Qwen3-VL-32B-Thinking


Qwen/Qwen3-VL-32B-Thinking-FP8


Qwen/Qwen3-VL-32B-Thinking-GPTQ-Int4


3.4 其他 NVFP4 实验模型


txn545/Qwen3.5-27B-NVFP4


txn545/Qwen3.5-35B-A3B-NVFP4


mconcat/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-NVFP4


osoleve/Qwen3.5-27B-Text-NVFP4-MTP



4. 最大的困扰：nvfp4对spark兼容性不佳
网上很多人提到了做 DGX Spark 上，nvfp4兼容性不佳：


内核不兼容


illegal memory access


DeepGEMM / CUDA graph 报错


tokenizer 类不兼容


rope config 不兼容


启动能起来，但一请求就炸


Spark 不是普通显卡环境，对通用nvfp4不兼容

5. 我踩过的主要坑
5.1 通用 vLLM / SGLang 镜像，不等于 Spark 能稳跑
我最开始试过很多“看起来最标准”的方案：


vllm/vllm-openai:cu130-nightly


vllm/vllm-openai:v0.17.1-cu130


lmsysorg/sglang:dev-cu13


lmsysorg/sglang:spark


scitrera/dgx-spark-sglang:0.5.9-t5


结论：


模型能加载，推理时炸


attention backend 不对


CUDA graph / DeepGEMM 失败


tokenizer / config parser 不兼容


启动没问题，但多模态不工作


5.2 txn545 + SGLang 不是我最终能稳定用的路线
txn545/Qwen3.5-122B-A10B-NVFP4 的模型卡偏向 SGLang / modelopt_fp4，理论上很合理。
我实际试下来：


通过 lmsysorg/sglang:dev-cu13


加 --attention-backend triton


确实能把服务起起来


但问题是：

真正发请求后，还是会触发底层 CUDA 非法内存访问

5.3 RedHatAI/Qwen3.5-122B-A10B-NVFP4 卡在 tokenizer 兼容
它模型卡写的是：


llm-compressor


与 vLLM main 兼容并测试过


但我在 Spark 上实际遇到的是：

Tokenizer class TokenizersBackend does not exist

所以我最后没有继续把它当主线。
5.4 spark-vllm-122b 不是通用 NVFP4 镜像，但对qwen3.5-122b-a10b-nvfp4做了完整适配
我后来找到并跑通了：

  

      github.com
  

  
    
  

  GitHub - jilycn/spark-vllm-122b: vLLM Qwen3.5-122B NVFP4 on DGX Spark (SM121) —...

    vLLM Qwen3.5-122B NVFP4 on DGX Spark (SM121) — full Docker build with 15 patches


  

  
    
    
  

  


它确实很强，但它强在：

针对 Qwen3.5-122B-A10B-NVFP4 做过一整套 patch

但我后面拿它直接套 27B、35B 某些 NVFP4 模型时，依然会遇到：


rope parser 不兼容


config 不兼容


所以这套要明确定位：
122B 专用主力

6.2 我最终用这套跑通了什么
我最终验证这套做到了：


122B NVFP4 启动成功


视觉可用


reasoning 分离正常


tool calling 正常


多请求稳定


长上下文正常


他是一套配套的patch适配122b的启动方式

7. vllm-node:latest：我最后的官方模型主力
我自己还在网上找到了一个 Spark 优化版vllm vllm-node:latest。

  

      github.com
  

  
    
  

  GitHub - eugr/spark-vllm-docker: Docker configuration for running VLLM on dual DGX...

    Docker configuration for running VLLM on dual DGX Sparks


  

  
    
    
  

  


这套对我后来跑官方模型很重要，项目非常好用
7.1 我给它的定位


官方 Qwen3.5 全量


官方 Qwen3.5 FP8


官方 Qwen3.5 GPTQ-Int4


官方 Qwen3-VL-32B-Thinking 系列


7.2 它的优点


明

2 views05:17

About

Blog

Apps

Platform