标题: 硅基流动的服务器炸了?
作者: #碧雨青潭
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1573802
时间: 2026-02-06 17:31:41
摘要:
作者: #碧雨青潭
板块: #搞七捻三
编号:
1573802帖子: https://linux.do/t/topic/1573802
时间: 2026-02-06 17:31:41
摘要:
下午正在和家里Agent聊的“火热”
突然不回消息了,后台一看硅基流动的重定向模型爆500了。
不是,我正到关键时候呢,给我来“寸止”
伙计们还有稳定的Qwen8B重定向吗?
标题: anyrouter 成功接入 openclaw
作者: #adm9856
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1573804
时间: 2026-02-06 17:32:06
摘要:
作者: #adm9856
板块: #开发调优
编号:
1573804帖子: https://linux.do/t/topic/1573804
时间: 2026-02-06 17:32:06
摘要:
搜了一圈没发现教程,总结了一个可以直接发送给 openclaw 的版本。直接把下面这一段发送给 openclaw 就配置成功了,记得换成自己的密钥。
我的 Anyrouter 的密钥是 sk-xxx,在配置中添加 Anyrouter 提供商和模型。
连通性测试:先访问 https://anyrouter.top/v1/models,如果获得 json 返回则说明网络联通,使用 https://anyrouter.top 作为 baseUrl;否则使用中国大陆的镜像地址 https://a-ocnfniawgw.cn-shanghai.fcapp.run 作为 baseUrl。
在 ~/.openclaw/openclaw.json 中添加如下配置:
{
"models": {
"providers": {
"anyrouter": {
"baseUrl": "https://a-ocnfniawgw.cn-shanghai.fcapp.run",
"apiKey": "sk-xxx",
"api": "anthropic-messages",
"models": [
{
"id": "claude-opus-4-5-20251101",
"name": "Claude Opus 4.5",
"reasoning": true,
"input": ["text", "image"],
"cost": { "input": 0, "output": 0, "cacheRead": 0, "cacheWrite": 0 },
"contextWindow": 200000,
"maxTokens": 8192
}
]
},
},
},
"agents": {
"defaults": {
"model": { "primary": "anyrouter/claude-opus-4-5-20251101" },
},
},
}
标题: 你们 CPA遇到 Codex 授权全部失效的情况了吗?
作者: #墨菲
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1573805
时间: 2026-02-06 17:32:09
摘要:
作者: #墨菲
板块: #搞七捻三
编号:
1573805帖子: https://linux.do/t/topic/1573805
时间: 2026-02-06 17:32:09
摘要:
现在授权全部失效,重新授权提示:认证失败: Failed to exchange authorization code for tokens
我是老镜像,我以为镜像问题,更新到了最新版本v6.7.53的镜像,问题依旧.
标题: 佬们的Claude Windows的客户端会这样吗?科学已开
作者: #本本本添哥
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1573810
时间: 2026-02-06 17:33:31
摘要:
作者: #本本本添哥
板块: #开发调优
编号:
1573810帖子: https://linux.do/t/topic/1573810
时间: 2026-02-06 17:33:31
摘要:
标题: 又加活 可恶的单位 看起来还是长期的 继续运动202626
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1573816
时间: 2026-02-06 17:35:18
摘要:
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #搞七捻三
编号:
1573816帖子: https://linux.do/t/topic/1573816
时间: 2026-02-06 17:35:18
摘要:
感觉现在单位领导脑袋里都是浆糊
做事就是面多了加水
水多了加面
本质就是领导老跨区轮换
导致根本不清楚本地区特色
不知道咋因地制宜
.
30慢跑
20臂力器
10拉韧带
20俯卧撑
10推小车
仰卧交替脚跟接触12个4组
仰卧屈膝举腿30秒5组
仰卧卷腹15个4组
仰卧屈膝卷腹15个6组
标题: 使用newapi搭建自用的api中转,问题咨询
作者: #myfree
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1573817
时间: 2026-02-06 17:35:28
摘要:
作者: #myfree
板块: #开发调优
编号:
1573817帖子: https://linux.do/t/topic/1573817
时间: 2026-02-06 17:35:28
摘要:
申请了nvidia的api key,他好多模型都是免费的,搭建了new api,添加渠道时候,填的地址https://integrate.api.nvidia.com,api key也填写了,但是测试的时候,提示“错误:模型 : bad response status code 404, body: 404 page not found”,这个是什么问题
标题: 求助佬友,本地Agent用哪个模型好
作者: #刘嘉程
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1573827
时间: 2026-02-06 17:37:50
摘要:
作者: #刘嘉程
板块: #开发调优
编号:
1573827帖子: https://linux.do/t/topic/1573827
时间: 2026-02-06 17:37:50
摘要:
电脑配置:13490F+RTX5060ti 16G
已测试:glm-4.7-flash:q4_K_M,不会回复,不知为啥
标题: Kimi 2.5 这一波改 Bug 表现,我真的很难评……
作者: #Aiden
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1573837
时间: 2026-02-06 17:40:06
摘要:
作者: #Aiden
板块: #搞七捻三
编号:
1573837帖子: https://linux.do/t/topic/1573837
时间: 2026-02-06 17:40:06
摘要:
下午拿个 Java 后端的 Bug 跑了一下几家大模型,结果真的高下立判:
GPT-5.2: 思考了 10 分钟,憋出了一个改动最小的方案。
GLM-4.7: 琢磨了 3 分钟,给了个能跑通的方案,虽然不是最优解,但好歹是认真干活。
Kimi 2.5: 我还没反应过来它就开始一顿操作,定睛一看全是胡说八道。
标题: 美团发布 LongCat-Flash-Lite 轻量化 MoE 模型,智能体与代码表现突出
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/1573838
时间: 2026-02-06 17:40:09
摘要:
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #前沿快讯
编号:
1573838帖子: https://linux.do/t/topic/1573838
时间: 2026-02-06 17:40:09
摘要:
github.com
GitHub - meituan-longcat/SGLang-FluentLLM
通过在 GitHub 上创建帐户来为 meituan-longcat/SGLang-FluentLLM 开发做出贡献。
标题: 原来LDC每天还有限额呀 我以为每天可以买好多呢
作者: #碳氮氧无氖
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1573840
时间: 2026-02-06 17:40:43
摘要:
作者: #碳氮氧无氖
板块: #搞七捻三
编号:
1573840帖子: https://linux.do/t/topic/1573840
时间: 2026-02-06 17:40:43
摘要:
这一天1000的限额邀请码俩就完了
一下子回到解放了
标题: LLM在某些方面的能力已经溢出,我们需要清晰而可维护、可迭代的提示词指导他们工作(个人提示词规范与制作思路分享)
作者: #Bin
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1573842
时间: 2026-02-06 17:41:12
摘要:
作者: #Bin
板块: #开发调优
编号:
1573842帖子: https://linux.do/t/topic/1573842
时间: 2026-02-06 17:41:12
摘要:
LLM在某些方面的能力已经溢出,我们需要清晰而可维护、可迭代的提示词指导他们工作(个人提示词规范与制作思路分享)
我的提示词理念以及可以制作提示词的提示词
我认为LLM的能力在某些工作(重复性高、逻辑固定、信息处理量大的琐碎工作)甚至一些稍微需要创造力和智力,但低风险的工作中(教育教学,文案写作)已经达到可喜可贺的80分了。聚焦于工作的某些方面,例如教育中解数学题的能力,中等难度的语言翻译,其能力已经完全溢出了,达到了满分或者更多。
所以这个时候,人们要利用AI帮助自己的工作,就要发挥其特长能力:语义理解,上下文记忆,模仿,知识;也要避免其不足:结果泛化,输出限制,幻觉,工具限制
对于不足,结果的泛化也就是给出模糊的答案,还有幻觉,个人认为都可以用精确以及包含知识边界的提示词来弥补;输出限制和工具限制则有其它范式解决思路,例如agent,mcp等等。
为此,我把我的提示词理念转化成了一个可以制作提示词的提示词:
我们是OPENAI的提示词工程师,你是我的同事;让我们一步一步讨论,直到写出一个我们都满意的提示词。讨论,即你对我进行详细提问,确定我的场景和需求,并且考虑提出一些边界问题。
# 提示词的模板
我认为一个成功的助手应该由4方面构成:
1. 知识层:这直接决定它的工作领域(拥有什么)
2. 目标层:这直接决定它的工作目标(应该做什么)
3. 行为层:这直接决定了它的工作流程(怎么做)
4. 协议层:这直接决定了它的工作风格(遵循哪些风格特点)
5. 规范层:这直接决定了它的工作禁区(不要做什么)
## 要求
- 五个层次的内容应该是互不相交的,这样方便修改,每次修改只更新一个层级
- 层级使用二级标题,再往下使用三级标题分类集,再往下使用无序或者有序符号(不能使用四级标题,除非逻辑有序,否则不使用)分点集,不能继续细分!
- 并列分类集与点集也保证互不相交
## 风格
- 知识层的风格保持精简无歧义,一针见血,目的是为了让LLM补充一些可能陌生的背景知识;如果LLM对此极其熟悉,没有必要过多补充
- 目标层必须包括输入内容的预期和产出内容的要求,详细无歧义
- 行为层,首先专注于工作流和思维链,这是第一类集;其次专注于工作必要的特定的原则,比如应该使用什么特定的算法和函数等等,他们保证了工作的正常完成。
- 协议层,这是可替换的,自由性最大的;对于工作来说,它是美化和装饰,是可去除的;我既可以使用黑白风格,也可以使用彩色风格,但是不影响工作的完成。特别的,任何关于协议风格的内容,即使命中了规范层和行为层,比如必须使用什么特别函数和禁止使用什么(他们是为风格服务的,不是为功能服务的),都放入协议层,并且应该划分到第一个类集中,括号提醒这可能影响其它层级不能随便替换。
- 规范层:这是禁区,防止大模型自由发挥过度,或者纠正其喜欢犯的错误,集中于不要做什么。
## 编写
- 在编写提示词时候,需要注意,12345中协议层应该最后来编写,以保证其可替换性;而目标层是最重要的,需要首先思考并且编写。
- 提示词过长时候,编写和二改的原则遵循一层级或者一类集甚至一点集一改,每次改动要注意并且说明:哪个集要删,哪个集要加。(精细替换模式)
- 在未进行调试提示词之前,最好不要对于行为层的工作原则集和规范层的内容进行大量预想,我们一定要实事求是,先调查,再修改。
## 使用
- 如果提示词过长,在发送提示词时候,可以先发送前几层,然后再发送后几层。对于大窗口非思考模型,可以将提示词发送两遍。
- 提示词任务分为两种,一种是渐进式任务,需要讨论交流,此时在最后分割线后补充一行字:等待用户和你讨论,在此之前你只需要回顾你的工作流程;一种是即时式任务,不需要过多讨论交流,最后一行字可以是:等待用户给你预期输入,现在保持冷静与回顾自己的工作流程。或者直接附加:我现在要解决的问题/内容是:“““”””,使用三引号包括
让我们开始讨论吧。你的第一句话是:今天我们来探索哪个任务的提示词?
思路
我把提示词分成五个层次,
知识层:模型拥有什么知识?事实上,大模型几乎无所不知,但是又在某些知识细节上让人忍俊不禁。举个我自己的例子,我使用Manim库(一个数学动画py库)来写动画的时候,AI给了我一个TextMobject("Hello")的指令,但是运行却报错了,这个命令是它编造出来的吗?也不是它编造的,我查阅过文档后发现这是一个旧的API。
也就是说模型会因为无知或者旧知导致幻觉做错任务。但是幸好的是,它不会把函数的基本用法搞错,它不会写成
TextMobject(Hello)
那我只需要在知识库告诉它,下面我给你一些正确的最新的API用法,你给我记住了,遵循非黑即白原则,不是下面的用法就不使用,就当成错误用法。这样就可以很大程度上避免旧知和无知造成的幻觉。
具体做法是,把某一个库常用的用法爬取出来,让一个比较强的AI压缩做一个索引表,然后塞入到提示词中。(咱不考虑context成本)
好消息是,模型拥有强大的学习能力,索引表不需要写的很详细,即使是很简单的缩写(去掉各种括号,参数都用缩写),它也会凭借它的原有知识和智慧读懂你的表。
目标层:用于讲清楚任务和任务场景,以及输入和输出,举一个例子,同样是python绘制数据图,你用Matplotlib和Plotly库的目标是不一样的,前者适合科研论文,后者适合商业展示。在用AI写python代码之前,你就得明白自己是哪种场景,否则很容易出来你难以接受的结果。
我平时写教案也是,用两种不同的教育理论(建构主义和行为主义),或者不给理论提示,得到的结果也是完全不同的,往往不给理论提示的时候,模型输出的来的都是烂大街的方案,自以为是。
还有,模型会得到什么输入?应该输出什么东西给你?这些都要首先让模型明白。
你必须思考你任务的目标是什么,不能让模型去代替你决定。
行为层:用于指导工作流程和步骤,这个各位应该很熟悉,就是CoT思维链的思想。任何一个中等难度的任务,例如写作一篇文章,都可以被拆分为好几个步骤:确定主题——设计大纲——语言风格——写作分段落——修改润色
同样的,用py代码绘制一篇数据图表也是,先确定数据类型和结构,全部数据是零散的吗?是excel文件吗?其中行列分别是什么?处理要依据数据什么特征做不同方法的处理吗?要依据不同的场景使用不同风格吗?这里面有一个主流程,也是人要去思考的,不同颗粒度的分步也会给模型不同的难度。想想,写一篇文章之前,如果模型先设计大纲,考虑风格,并且一段一段给你审查,不是比一次黑盒输出更可控吗?
协议层:决定工作风格特点,这是一个次要的层次,是特定任务才有的,比如代码绘图,前端设计,写作风格等等,指导模型用什么语言说什么话。它和前面层次的区别(也是必须遵守的规定)是必须保证,更换这一层的内容不会影响整个提示词和工作流的正常运行,比如同样写一个绘图代码,用手绘风格,极简风格,彩色风格,都不会影响绘图的质量,结果。只是好看和不好看的区别。
当然,如果任务本来就是设计性的任务,那么协议层应该为空,或者只规定模型讲话用中文,或者说话要可爱点。
规范层:用于指导模型遵守规范,禁止其行为。大模型有一个特点,喜欢用户告诉他们要干什么,不喜欢用户说不能干什么,所以最好能放进前四层的命令,不要用反面规范。例如你在这个层次写:不要在代码中写过多的注释,不如在协议层中写:注释规范:每个函数只使用一行简短的注释。
于是这里也常常用来写模型喜欢犯的错误,比如不允许用markdown格式输出,不准在代码块前有解释。
提示词规范
以上是提示词的模板,几乎我所有提示词都按这种来写。除了层次的不同,我也特别强调可维护性和可迭代性。
说来也很有趣,我一开始接触代码和编程的时候只是一个脚本小子,而且是单个小脚本,就是一个文件写满了所有功能的。后来我发现如果要实现复杂任务,单脚本完成不了,要加功能呢,自己重写修改也极其麻烦,AI重写更是各种省略(因为输出有限制)。于是我懵逼了,这咋办。
后来我看别人写一些项目我才知道了。原来是要分各种文件来写,这个写接口,这个写甲功能,这个写乙功能,全部分开解耦,删1不怎么影响2,这样才能后期维护,迭代。
我们提示词也应该引入这种解耦思想,所以我规定:
- 五个层次的内容应该是互不相交的,这样方便修改,每次修改只更新一个层级
- 层级使用二级标题,再往下使用三级标题分类集,再往下使用无序或者有序符号(不能使用四级标题,除非逻辑有序,否则不使用)分点集,不能继续细分!
- 并列分类集与点集也保证互不相交
也就是,提示词分为五个层,每个层往下是类集,每个类集往下是点集,这三者,无论任何一点都是绝对不相交的,不能有相同的内容。并且不能一直往下分类,点集就是最小构成了。
这样就解耦了,我想换一个流程的某个步骤,只需要改一个点集就可以了,不必要动整个层次。包括拿这个提示词和AI写提示词的时候也是,告诉他,接下来不需要再输出完整提示词了,我们根据我的想法来做点集的修改替换,其它地方不需要改变
即:
- 提示词过长时候,编写和二改的原则遵循一层级或者一类集甚至一点集一改,每次改动要注意并且说明:哪个集要删,哪个集要加。(精细替换模式)
我的提示词例子
我以前有许多提示词,不过他们都没有一个统一的规范,各种类型,而且很多上
标题: sparkle一天的日志文件26GB嘛?
作者: #幼安
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1573843
时间: 2026-02-06 17:41:23
摘要:
作者: #幼安
板块: #搞七捻三
编号:
1573843帖子: https://linux.do/t/topic/1573843
时间: 2026-02-06 17:41:23
摘要:
今天打开电脑发现C盘红了,记得半个月之前还有七十多个G的空余,现在就剩23个G了,最近也就折腾了一下claude code和open code的一些相关配置,没下什么应用啥的,怎么会用这么快,用SpaceSniffer打开C盘想看一下多了什么东西,结果扫描完发现sparkle的logs占用了25个G
到目录查看,发现2026.1.31一天的日志文件就有26.6个G
但是我很清楚那一天我也没有做什么特别的事情,不知道怎么就有这么多的“日志”了
想查看这里面到底怎么回事,发现文件太大打不开
有佬知道怎么回事吗
标题: 放假放假放假!!!
作者: #喻灵
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1573848
时间: 2026-02-06 17:43:26
摘要:
作者: #喻灵
板块: #搞七捻三
编号:
1573848帖子: https://linux.do/t/topic/1573848
时间: 2026-02-06 17:43:26
摘要:
2.7到2.23,周末收拾收拾准备回老家
标题: 看到这个标题,想起前几天的一个想法
作者: #好好吃飯
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1573849
时间: 2026-02-06 17:43:58
摘要:
作者: #好好吃飯
板块: #搞七捻三
编号:
1573849帖子: https://linux.do/t/topic/1573849
时间: 2026-02-06 17:43:58
摘要:
多数人使用工具只想着提高效率,而极少数人一开始就考虑怎么变现。
类似的技术员思维是打磨产品,运营思维是想怎么迎合市场需求,
标题: 牛逼的服务器拿来干嘛
作者: #tommyjin
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1573851
时间: 2026-02-06 17:44:21
摘要:
作者: #tommyjin
板块: #搞七捻三
编号:
1573851帖子: https://linux.do/t/topic/1573851
时间: 2026-02-06 17:44:21
摘要:
假如说佬哥们有一台性能很强,带宽很大的服务器,会拿来干嘛。大概配置两颗最强线程撕裂者,再配2块A100吧,带宽大概上下行2000吧
标题: 【Embedding公益站】硅基流动 Qwen/Qwen3 系列模型暂时不可用
作者: #unsafe
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1573857
时间: 2026-02-06 17:45:47
摘要:
作者: #unsafe
板块: #搞七捻三
编号:
1573857帖子: https://linux.do/t/topic/1573857
时间: 2026-02-06 17:45:47
摘要:
下午看日志发现好多500错误
在 hoppscotch 中试了一下,也是同样的 500 错误,企业微信群反应情况没有回复,暂时换成 gemini-embedding-001 或者 text-embedding-3-small 这个吧。