LinuxDo 新帖推送

标题: 硅基流动的服务器炸了？
作者: #碧雨青潭
板块: #搞七捻三
编号: 1573802
帖子: https://linux.do/t/topic/1573802
时间: 2026-02-06 17:31:41
摘要:

下午正在和家里Agent聊的“火热” 
突然不回消息了，后台一看硅基流动的重定向模型爆500了。 
不是，我正到关键时候呢，给我来“寸止” 
伙计们还有稳定的Qwen8B重定向吗？

2 views09:33

LinuxDo 新帖推送

标题: anyrouter 成功接入 openclaw
作者: #adm9856
板块: #开发调优
编号: 1573804
帖子: https://linux.do/t/topic/1573804
时间: 2026-02-06 17:32:06
摘要:

搜了一圈没发现教程，总结了一个可以直接发送给 openclaw 的版本。直接把下面这一段发送给 openclaw 就配置成功了，记得换成自己的密钥。
我的 Anyrouter 的密钥是 sk-xxx，在配置中添加 Anyrouter 提供商和模型。
连通性测试：先访问 https://anyrouter.top/v1/models，如果获得 json 返回则说明网络联通，使用 https://anyrouter.top 作为 baseUrl；否则使用中国大陆的镜像地址 https://a-ocnfniawgw.cn-shanghai.fcapp.run 作为 baseUrl。
在 ~/.openclaw/openclaw.json 中添加如下配置：
{
  "models": {
    "providers": {
      "anyrouter": {
        "baseUrl": "https://a-ocnfniawgw.cn-shanghai.fcapp.run",
        "apiKey": "sk-xxx",
        "api": "anthropic-messages",
        "models": [
          {
            "id": "claude-opus-4-5-20251101",
            "name": "Claude Opus 4.5",
            "reasoning": true,
            "input": ["text", "image"],
            "cost": { "input": 0, "output": 0, "cacheRead": 0, "cacheWrite": 0 },
            "contextWindow": 200000,
            "maxTokens": 8192
          }
        ]
      },
    },
  },
  "agents": {
    "defaults": {
      "model": { "primary": "anyrouter/claude-opus-4-5-20251101" },
    },
  },
}

2 views09:33

LinuxDo 新帖推送

标题: 你们 CPA遇到 Codex 授权全部失效的情况了吗?
作者: #墨菲
板块: #搞七捻三
编号: 1573805
帖子: https://linux.do/t/topic/1573805
时间: 2026-02-06 17:32:09
摘要:

现在授权全部失效,重新授权提示:认证失败: Failed to exchange authorization code for tokens
我是老镜像,我以为镜像问题,更新到了最新版本v6.7.53的镜像,问题依旧.

2 views09:33

LinuxDo 新帖推送

标题: 佬们的Claude Windows的客户端会这样吗？科学已开
作者: #本本本添哥
板块: #开发调优
编号: 1573810
帖子: https://linux.do/t/topic/1573810
时间: 2026-02-06 17:33:31
摘要:

2 views09:35

LinuxDo 新帖推送

标题: 又加活可恶的单位看起来还是长期的继续运动202626
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #搞七捻三
编号: 1573816
帖子: https://linux.do/t/topic/1573816
时间: 2026-02-06 17:35:18
摘要:

感觉现在单位领导脑袋里都是浆糊
做事就是面多了加水
水多了加面
本质就是领导老跨区轮换
导致根本不清楚本地区特色
不知道咋因地制宜
.
30慢跑
20臂力器
10拉韧带
20俯卧撑
10推小车
仰卧交替脚跟接触12个4组
仰卧屈膝举腿30秒5组
仰卧卷腹15个4组
仰卧屈膝卷腹15个6组

2 views09:35

LinuxDo 新帖推送

标题: 使用newapi搭建自用的api中转，问题咨询
作者: #myfree
板块: #开发调优
编号: 1573817
帖子: https://linux.do/t/topic/1573817
时间: 2026-02-06 17:35:28
摘要:

申请了nvidia的api key，他好多模型都是免费的，搭建了new api，添加渠道时候，填的地址https://integrate.api.nvidia.com，api key也填写了，但是测试的时候，提示“错误：模型 : bad response status code 404, body: 404 page not found”，这个是什么问题

2 views09:35

LinuxDo 新帖推送

标题: 求助佬友，本地Agent用哪个模型好
作者: #刘嘉程
板块: #开发调优
编号: 1573827
帖子: https://linux.do/t/topic/1573827
时间: 2026-02-06 17:37:50
摘要:

电脑配置：13490F+RTX5060ti 16G
已测试：glm-4.7-flash:q4_K_M，不会回复，不知为啥

2 views09:38

LinuxDo 新帖推送

标题: Kimi 2.5 这一波改 Bug 表现，我真的很难评……
作者: #Aiden
板块: #搞七捻三
编号: 1573837
帖子: https://linux.do/t/topic/1573837
时间: 2026-02-06 17:40:06
摘要:

下午拿个 Java 后端的 Bug 跑了一下几家大模型，结果真的高下立判：


GPT-5.2： 思考了 10 分钟，憋出了一个改动最小的方案。


GLM-4.7： 琢磨了 3 分钟，给了个能跑通的方案，虽然不是最优解，但好歹是认真干活。


Kimi 2.5： 我还没反应过来它就开始一顿操作，定睛一看全是胡说八道。

2 views09:44

LinuxDo 新帖推送

标题: 美团发布 LongCat-Flash-Lite 轻量化 MoE 模型，智能体与代码表现突出
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #前沿快讯
编号: 1573838
帖子: https://linux.do/t/topic/1573838
时间: 2026-02-06 17:40:09
摘要:

github.com
  

  
    
  

  GitHub - meituan-longcat/SGLang-FluentLLM

    通过在 GitHub 上创建帐户来为 meituan-longcat/SGLang-FluentLLM 开发做出贡献。

1 view09:44

LinuxDo 新帖推送

标题: 原来LDC每天还有限额呀我以为每天可以买好多呢
作者: #碳氮氧无氖
板块: #搞七捻三
编号: 1573840
帖子: https://linux.do/t/topic/1573840
时间: 2026-02-06 17:40:43
摘要:

这一天1000的限额邀请码俩就完了
一下子回到解放了

1 view09:44

LinuxDo 新帖推送

标题: LLM在某些方面的能力已经溢出，我们需要清晰而可维护、可迭代的提示词指导他们工作（个人提示词规范与制作思路分享）
作者: #Bin
板块: #开发调优
编号: 1573842
帖子: https://linux.do/t/topic/1573842
时间: 2026-02-06 17:41:12
摘要:

LLM在某些方面的能力已经溢出，我们需要清晰而可维护、可迭代的提示词指导他们工作（个人提示词规范与制作思路分享）
我的提示词理念以及可以制作提示词的提示词
我认为LLM的能力在某些工作（重复性高、逻辑固定、信息处理量大的琐碎工作）甚至一些稍微需要创造力和智力，但低风险的工作中（教育教学，文案写作）已经达到可喜可贺的80分了。聚焦于工作的某些方面，例如教育中解数学题的能力，中等难度的语言翻译，其能力已经完全溢出了，达到了满分或者更多。
所以这个时候，人们要利用AI帮助自己的工作，就要发挥其特长能力：语义理解，上下文记忆，模仿，知识；也要避免其不足：结果泛化，输出限制，幻觉，工具限制
对于不足，结果的泛化也就是给出模糊的答案，还有幻觉，个人认为都可以用精确以及包含知识边界的提示词来弥补；输出限制和工具限制则有其它范式解决思路，例如agent，mcp等等。
为此，我把我的提示词理念转化成了一个可以制作提示词的提示词：
我们是OPENAI的提示词工程师，你是我的同事；让我们一步一步讨论，直到写出一个我们都满意的提示词。讨论，即你对我进行详细提问，确定我的场景和需求，并且考虑提出一些边界问题。

# 提示词的模板

我认为一个成功的助手应该由4方面构成：

1. 知识层：这直接决定它的工作领域（拥有什么）

2. 目标层：这直接决定它的工作目标（应该做什么）

3. 行为层：这直接决定了它的工作流程（怎么做）

4. 协议层：这直接决定了它的工作风格（遵循哪些风格特点）

5. 规范层：这直接决定了它的工作禁区（不要做什么）

## 要求

- 五个层次的内容应该是互不相交的，这样方便修改，每次修改只更新一个层级

- 层级使用二级标题，再往下使用三级标题分类集，再往下使用无序或者有序符号（不能使用四级标题，除非逻辑有序，否则不使用）分点集，不能继续细分！

- 并列分类集与点集也保证互不相交

## 风格

- 知识层的风格保持精简无歧义，一针见血，目的是为了让LLM补充一些可能陌生的背景知识；如果LLM对此极其熟悉，没有必要过多补充
- 目标层必须包括输入内容的预期和产出内容的要求，详细无歧义
- 行为层，首先专注于工作流和思维链，这是第一类集；其次专注于工作必要的特定的原则，比如应该使用什么特定的算法和函数等等，他们保证了工作的正常完成。
- 协议层，这是可替换的，自由性最大的；对于工作来说，它是美化和装饰，是可去除的；我既可以使用黑白风格，也可以使用彩色风格，但是不影响工作的完成。特别的，任何关于协议风格的内容，即使命中了规范层和行为层，比如必须使用什么特别函数和禁止使用什么（他们是为风格服务的，不是为功能服务的），都放入协议层，并且应该划分到第一个类集中，括号提醒这可能影响其它层级不能随便替换。
- 规范层：这是禁区，防止大模型自由发挥过度，或者纠正其喜欢犯的错误，集中于不要做什么。

## 编写

- 在编写提示词时候，需要注意，12345中协议层应该最后来编写，以保证其可替换性；而目标层是最重要的，需要首先思考并且编写。
- 提示词过长时候，编写和二改的原则遵循一层级或者一类集甚至一点集一改，每次改动要注意并且说明：哪个集要删，哪个集要加。（精细替换模式）
- 在未进行调试提示词之前，最好不要对于行为层的工作原则集和规范层的内容进行大量预想，我们一定要实事求是，先调查，再修改。

## 使用

- 如果提示词过长，在发送提示词时候，可以先发送前几层，然后再发送后几层。对于大窗口非思考模型，可以将提示词发送两遍。
- 提示词任务分为两种，一种是渐进式任务，需要讨论交流，此时在最后分割线后补充一行字：等待用户和你讨论，在此之前你只需要回顾你的工作流程；一种是即时式任务，不需要过多讨论交流，最后一行字可以是：等待用户给你预期输入，现在保持冷静与回顾自己的工作流程。或者直接附加：我现在要解决的问题/内容是：“““”””，使用三引号包括

让我们开始讨论吧。你的第一句话是：今天我们来探索哪个任务的提示词？



思路
我把提示词分成五个层次，


知识层：模型拥有什么知识？事实上，大模型几乎无所不知，但是又在某些知识细节上让人忍俊不禁。举个我自己的例子，我使用Manim库（一个数学动画py库）来写动画的时候，AI给了我一个TextMobject("Hello")的指令，但是运行却报错了，这个命令是它编造出来的吗？也不是它编造的，我查阅过文档后发现这是一个旧的API。
也就是说模型会因为无知或者旧知导致幻觉做错任务。但是幸好的是，它不会把函数的基本用法搞错，它不会写成
TextMobject(Hello)

那我只需要在知识库告诉它，下面我给你一些正确的最新的API用法，你给我记住了，遵循非黑即白原则，不是下面的用法就不使用，就当成错误用法。这样就可以很大程度上避免旧知和无知造成的幻觉。
具体做法是，把某一个库常用的用法爬取出来，让一个比较强的AI压缩做一个索引表，然后塞入到提示词中。（咱不考虑context成本）
好消息是，模型拥有强大的学习能力，索引表不需要写的很详细，即使是很简单的缩写（去掉各种括号，参数都用缩写），它也会凭借它的原有知识和智慧读懂你的表。


目标层：用于讲清楚任务和任务场景，以及输入和输出，举一个例子，同样是python绘制数据图，你用Matplotlib和Plotly库的目标是不一样的，前者适合科研论文，后者适合商业展示。在用AI写python代码之前，你就得明白自己是哪种场景，否则很容易出来你难以接受的结果。
我平时写教案也是，用两种不同的教育理论（建构主义和行为主义），或者不给理论提示，得到的结果也是完全不同的，往往不给理论提示的时候，模型输出的来的都是烂大街的方案，自以为是。
还有，模型会得到什么输入？应该输出什么东西给你？这些都要首先让模型明白。
你必须思考你任务的目标是什么，不能让模型去代替你决定。


行为层：用于指导工作流程和步骤，这个各位应该很熟悉，就是CoT思维链的思想。任何一个中等难度的任务，例如写作一篇文章，都可以被拆分为好几个步骤：确定主题——设计大纲——语言风格——写作分段落——修改润色
同样的，用py代码绘制一篇数据图表也是，先确定数据类型和结构，全部数据是零散的吗？是excel文件吗？其中行列分别是什么？处理要依据数据什么特征做不同方法的处理吗？要依据不同的场景使用不同风格吗？这里面有一个主流程，也是人要去思考的，不同颗粒度的分步也会给模型不同的难度。想想，写一篇文章之前，如果模型先设计大纲，考虑风格，并且一段一段给你审查，不是比一次黑盒输出更可控吗？


协议层：决定工作风格特点，这是一个次要的层次，是特定任务才有的，比如代码绘图，前端设计，写作风格等等，指导模型用什么语言说什么话。它和前面层次的区别（也是必须遵守的规定）是必须保证，更换这一层的内容不会影响整个提示词和工作流的正常运行，比如同样写一个绘图代码，用手绘风格，极简风格，彩色风格，都不会影响绘图的质量，结果。只是好看和不好看的区别。
当然，如果任务本来就是设计性的任务，那么协议层应该为空，或者只规定模型讲话用中文，或者说话要可爱点。


规范层：用于指导模型遵守规范，禁止其行为。大模型有一个特点，喜欢用户告诉他们要干什么，不喜欢用户说不能干什么，所以最好能放进前四层的命令，不要用反面规范。例如你在这个层次写：不要在代码中写过多的注释，不如在协议层中写：注释规范：每个函数只使用一行简短的注释。
于是这里也常常用来写模型喜欢犯的错误，比如不允许用markdown格式输出，不准在代码块前有解释。


提示词规范
以上是提示词的模板，几乎我所有提示词都按这种来写。除了层次的不同，我也特别强调可维护性和可迭代性。
说来也很有趣，我一开始接触代码和编程的时候只是一个脚本小子，而且是单个小脚本，就是一个文件写满了所有功能的。后来我发现如果要实现复杂任务，单脚本完成不了，要加功能呢，自己重写修改也极其麻烦，AI重写更是各种省略（因为输出有限制）。于是我懵逼了，这咋办。
后来我看别人写一些项目我才知道了。原来是要分各种文件来写，这个写接口，这个写甲功能，这个写乙功能，全部分开解耦，删1不怎么影响2，这样才能后期维护，迭代。
我们提示词也应该引入这种解耦思想，所以我规定：
- 五个层次的内容应该是互不相交的，这样方便修改，每次修改只更新一个层级

- 层级使用二级标题，再往下使用三级标题分类集，再往下使用无序或者有序符号（不能使用四级标题，除非逻辑有序，否则不使用）分点集，不能继续细分！

- 并列分类集与点集也保证互不相交


也就是，提示词分为五个层，每个层往下是类集，每个类集往下是点集，这三者，无论任何一点都是绝对不相交的，不能有相同的内容。并且不能一直往下分类，点集就是最小构成了。
这样就解耦了，我想换一个流程的某个步骤，只需要改一个点集就可以了，不必要动整个层次。包括拿这个提示词和AI写提示词的时候也是，告诉他，接下来不需要再输出完整提示词了，我们根据我的想法来做点集的修改替换，其它地方不需要改变
即：
- 提示词过长时候，编写和二改的原则遵循一层级或者一类集甚至一点集一改，每次改动要注意并且说明：哪个集要删，哪个集要加。（精细替换模式）

我的提示词例子
我以前有许多提示词，不过他们都没有一个统一的规范，各种类型，而且很多上

1 view09:44

LinuxDo 新帖推送

标题: sparkle一天的日志文件26GB嘛？
作者: #幼安
板块: #搞七捻三
编号: 1573843
帖子: https://linux.do/t/topic/1573843
时间: 2026-02-06 17:41:23
摘要:

今天打开电脑发现C盘红了，记得半个月之前还有七十多个G的空余，现在就剩23个G了，最近也就折腾了一下claude code和open code的一些相关配置，没下什么应用啥的，怎么会用这么快，用SpaceSniffer打开C盘想看一下多了什么东西，结果扫描完发现sparkle的logs占用了25个G

到目录查看，发现2026.1.31一天的日志文件就有26.6个G

但是我很清楚那一天我也没有做什么特别的事情，不知道怎么就有这么多的“日志”了
想查看这里面到底怎么回事，发现文件太大打不开

有佬知道怎么回事吗

1 view09:44

LinuxDo 新帖推送

标题: 放假放假放假！！！
作者: #喻灵
板块: #搞七捻三
编号: 1573848
帖子: https://linux.do/t/topic/1573848
时间: 2026-02-06 17:43:26
摘要:

2.7到2.23，周末收拾收拾准备回老家

1 view09:44

LinuxDo 新帖推送

标题: 看到这个标题，想起前几天的一个想法
作者: #好好吃飯
板块: #搞七捻三
编号: 1573849
帖子: https://linux.do/t/topic/1573849
时间: 2026-02-06 17:43:58
摘要:

多数人使用工具只想着提高效率，而极少数人一开始就考虑怎么变现。
类似的技术员思维是打磨产品，运营思维是想怎么迎合市场需求，

1 view09:44

LinuxDo 新帖推送

标题: 牛逼的服务器拿来干嘛
作者: #tommyjin
板块: #搞七捻三
编号: 1573851
帖子: https://linux.do/t/topic/1573851
时间: 2026-02-06 17:44:21
摘要:

假如说佬哥们有一台性能很强，带宽很大的服务器，会拿来干嘛。大概配置两颗最强线程撕裂者，再配2块A100吧，带宽大概上下行2000吧

1 view09:47

LinuxDo 新帖推送

标题: 【Embedding公益站】硅基流动 Qwen/Qwen3 系列模型暂时不可用
作者: #unsafe
板块: #搞七捻三
编号: 1573857
帖子: https://linux.do/t/topic/1573857
时间: 2026-02-06 17:45:47
摘要:

下午看日志发现好多500错误

在 hoppscotch 中试了一下，也是同样的 500 错误，企业微信群反应情况没有回复，暂时换成 gemini-embedding-001 或者 text-embedding-3-small 这个吧。

1 view09:49

About

Blog

Apps

Platform