标题: 今日简报 2026.4.25
作者: #anhan
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/2051144
时间: 2026-04-25 08:10:39
摘要:
作者: #anhan
板块: #前沿快讯
编号:
2051144帖子: https://linux.do/t/topic/2051144
时间: 2026-04-25 08:10:39
摘要:
标题: codex需要开全局模式才稳定,应该怎么解决
作者: #mikesky
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2051150
时间: 2026-04-25 08:12:55
摘要:
作者: #mikesky
板块: #搞七捻三
编号:
2051150帖子: https://linux.do/t/topic/2051150
时间: 2026-04-25 08:12:55
摘要:
不知道为什么这几天发现,开启 TUN 模式之后还要打开全局模式,Codex才能够比较稳定使用。使用绕过大陆模式的时候 Codex 经常会不太稳定,有各位佬友们知道怎么解决吗?
标题: codex status_code=400, The encrypted content QVhO...og== could not be verified. Reason: Encrypted content could not be decrypted or parsed.
作者: #amo
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2051155
时间: 2026-04-25 08:17:39
摘要:
作者: #amo
板块: #开发调优
编号:
2051155帖子: https://linux.do/t/topic/2051155
时间: 2026-04-25 08:17:39
摘要:
大家用codex有没有遇到过status_code=400, The encrypted content QVhO…og== could not be verified. Reason: Encrypted content could not be decrypted or parsed.报错?要怎么解决?我用cpa遇到过,用佬友的公益也遇到过。报错说加密内容无法解析。问题是我用就是codex,要加密也是它自己加密的,它自己无法解密?另外不知道和模型有没有关系,我本地有中转一层,把所有的模型统一映射成gpt-5.2,这样不用配置文件改来改去。这模型名字不一样应该没影响吧。本地中转也只是改一下api信息然后透传,应该没有问题。大家有没有遇到过相同的问题?
标题: 才24岁已经感觉老了
作者: #爱破坏的小怪兽
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2051160
时间: 2026-04-25 08:20:20
摘要:
作者: #爱破坏的小怪兽
板块: #搞七捻三
编号:
2051160帖子: https://linux.do/t/topic/2051160
时间: 2026-04-25 08:20:20
摘要:
晚上睡得晚(十一点),早上醒得早(六点多),睡眠很浅,快赶上老年人的作息。肚子也凸起来了,感觉精力不足,受伤也恢复的慢了,到了三四十岁可怎么办啊
标题: 佬友们,有没有什么办法可以判断中转站模型真假?
作者: #过路人
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2051164
时间: 2026-04-25 08:21:02
摘要:
作者: #过路人
板块: #搞七捻三
编号:
2051164帖子: https://linux.do/t/topic/2051164
时间: 2026-04-25 08:21:02
摘要:
我需要claude来帮我写代码,但是官方的实在是太贵了,根本负担不起,所以想找一些中转站来凑合着用,有什么办法判断中转站的claude真假吗?佬友们,可以给我推荐点claude渠道吗,谢谢
标题: NV上架Deepseek 4 pro
作者: #josenlou
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/2051186
时间: 2026-04-25 08:29:03
摘要:
作者: #josenlou
板块: #前沿快讯
编号:
2051186帖子: https://linux.do/t/topic/2051186
时间: 2026-04-25 08:29:03
摘要:
如标题
现在Deepseek 4 Pro可以在NV平台上用了
标题: DeepSeek V4 Flash是最强的300B级的模型吗??
作者: #tiga6367
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2051204
时间: 2026-04-25 08:35:59
摘要:
作者: #tiga6367
板块: #搞七捻三
编号:
2051204帖子: https://linux.do/t/topic/2051204
时间: 2026-04-25 08:35:59
摘要:
主要是编程,酒馆。
类似参数的模型还有
Minimax M2.7(229B)
Xiaomi Mimo 2.5 Flash(309B)
Qwen 3.6 Plus(397B)
在这个级别的模型里,能是最强的吗?
标题: GPT-5.5及GPT-5.5 Pro目前已可以通过API使用
作者: #fortuna88
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/2051217
时间: 2026-04-25 08:38:34
摘要:
作者: #fortuna88
板块: #前沿快讯
编号:
2051217帖子: https://linux.do/t/topic/2051217
时间: 2026-04-25 08:38:34
摘要:
gpt-5.5每百万输出30刀
gpt-5.5-pro每百万输出180刀
标题: GitHub Copilot上線GPT-5.5
作者: #貓
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/2051218
时间: 2026-04-25 08:38:35
摘要:
作者: #貓
板块: #前沿快讯
编号:
2051218帖子: https://linux.do/t/topic/2051218
时间: 2026-04-25 08:38:35
摘要:
GitHub Copilot
The GitHub Blog
GPT-5.5 is generally available for GitHub Copilot - GitHub Changelog
GPT-5.5, OpenAI’s latest GPT model, is now rolling out on GitHub Copilot. In our early testing, GPT-5.5 delivers its strongest performance on complex, multi-step agentic coding task and resolves real-world…
Est. reading time: 1 minute
已上線5.5 目前只有 pro+以上可以用
很可惜的是需要 點數高達 7.5x(促銷價)
這週Copilot 上了5h, 週限,停止新註冊,停止pro使用opus, opus4.7 高達 7x
reddit預測,不久將有可能下架 gpt-5.4 ,能用且用吧
标题: GitHub Copilot 的新限制实在有些难评了
作者: #悟元
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2051221
时间: 2026-04-25 08:39:25
摘要:
作者: #悟元
板块: #开发调优
编号:
2051221帖子: https://linux.do/t/topic/2051221
时间: 2026-04-25 08:39:25
摘要:
写了大概300行代码,甚至不到半个任务,直接被限速。完全到了不可用的水平。。。
GitHub你干点人事吧,你claude的模型被刷了别限gpt啊,又不是什么很聪明的模型。。。
标题: kimi接入cc工具无法调用怎么办?
作者: #梦仄
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2051259
时间: 2026-04-25 08:43:37
摘要:
作者: #梦仄
板块: #开发调优
编号:
2051259帖子: https://linux.do/t/topic/2051259
时间: 2026-04-25 08:43:37
摘要:
买了kimi的套餐,接入cc的时候调用工具总是失败怎么办?特别是WebSearch和WebFetch,求助大佬
标题: any站为什么经常让清cookie
作者: #水跳鱼
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2051266
时间: 2026-04-25 08:47:38
摘要:
作者: #水跳鱼
板块: #搞七捻三
编号:
2051266帖子: https://linux.do/t/topic/2051266
时间: 2026-04-25 08:47:38
摘要:
如题,我每天会any站登陆签到一下。
但iphone自带的safari浏览器,过一段时间就会自动退出登录,退出登录后我重新用L站账号登就会显示登录失败,需要清除cookie后再登录。一般来说也确实我设置清除后就可以正常登了,不过经常这样还是很麻烦,想问一下佬友有没有相同情况或者解决方案。
似乎用chrome浏览器就完全不会有问题,只是我手机上safari用的比较习惯。
标题: 七牛的 deepseek-v4-flash 快的吓人
作者: #不紧不慢不快不慢
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2051267
时间: 2026-04-25 08:48:05
摘要:
作者: #不紧不慢不快不慢
板块: #开发调优
编号:
2051267帖子: https://linux.do/t/topic/2051267
时间: 2026-04-25 08:48:05
摘要:
七牛的 deepseek-v4-flash 快的吓人,有 200 的吐字速度了
标题: 兄弟们有啥好的骑行头盔推荐
作者: #ZHEN
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2051270
时间: 2026-04-25 08:48:20
摘要:
作者: #ZHEN
板块: #搞七捻三
编号:
2051270帖子: https://linux.do/t/topic/2051270
时间: 2026-04-25 08:48:20
摘要:
rt,最近想慢慢入坑骑行,城市公路吧主要是,打算先买个骑行头盔,有啥性价比比较高的骑行头盔呀,最好颜值也不错 预算应该200-300内都可以接受?安全性也要比较高,最好是足够轻不费脖子
标题: 这种情况用哪个LUT啊?
作者: #Leo Lee
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2051271
时间: 2026-04-25 08:48:36
摘要:
作者: #Leo Lee
板块: #搞七捻三
编号:
2051271帖子: https://linux.do/t/topic/2051271
时间: 2026-04-25 08:48:36
摘要:
我用的是松下s5m2,在厦门山海健康步道。
现在的天气大概是这么个情况。
而我机内已经烧录的lut有这些
有没有佬友懂摄影的?希望指点指点,谢谢!
标题: gpt5.5
作者: #awsldaily
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2051275
时间: 2026-04-25 08:49:42
摘要:
作者: #awsldaily
板块: #搞七捻三
编号:
2051275帖子: https://linux.do/t/topic/2051275
时间: 2026-04-25 08:49:42
摘要:
有大佬比较实际代码效果和opus4.7比起来咋样啊?感谢
标题: 【求助】cc-switch不能打开代理该怎么解决
作者: #Merci_Yuan
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2051276
时间: 2026-04-25 08:49:57
摘要:
作者: #Merci_Yuan
板块: #搞七捻三
编号:
2051276帖子: https://linux.do/t/topic/2051276
时间: 2026-04-25 08:49:57
摘要:
各位佬友ccswitch有没有遇到过这种情况啊,不能切代理
求问该怎么解决啊
标题: harness enigneering-任务入口/窗口-随笔
作者: #xinyann
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2051277
时间: 2026-04-25 08:50:03
摘要:
作者: #xinyann
板块: #开发调优
编号:
2051277帖子: https://linux.do/t/topic/2051277
时间: 2026-04-25 08:50:03
摘要:
意义:搭建跟自身项目有关的垂直环境。常用的codex,cc等其实本身有通用harness 内核,但我们仍需根据自己的工作场景在此基础上搭建垂直场景的harness 框架,以便于agent能更好完成目标(其实就相当于给一个公司制定工作流程和员工守则)。(4.25 01:38 兴致勃勃)
记录一下第一个最主要的关口:任务入口/窗口
意义:把人类的自然语言转换成agent可执行的完整清单。变成结构化对象json文件。
核心任务:分析界定任务内容,具体可为以下几点:
(1)用户想做什么(intent classification)
(2)任务对象是什么(object)
(3)允许做什么(boundary)
(4)需要读取哪些上下文(context)
(5)要做的事情是否安全,是否有风险(risk)
(6)根据风险等级评估结果是否让人介入审批(approval)
(7)怎么验证结果(validation)
(8)最后展现什么结果,产品(deliverable)
具体分析:
1.intent
agent其实不懂到底人类到底什么意思,它更倾向于用户的请求应该进入哪一条链,哪种工作流。
因此,intent其实就像路由标签和索引一样。可随时认定和引用。
用户请求—intent分类— 选择工作链
因此必须构建完整的intent taxonomy。并且在真实场景中,intent应该分类分层设计,可以从垂直场景的不同状态划分intent类别,也可以分层控制从大类到过程到动作手段。
但如果intent taxonomy过于精细繁重就会导致无法识别,相互影响。所以要研究怎么识别intent taxonomy的方法。
方法有以下几类:
(1)自定义规则分类。直接设定捕捉具体字段,形式之类,简单方便,但复杂度上升梯度大,而且对复杂语义和意会都无法识别。
(2)利用llm结构化分类。就是利用模型帮你识别语义,但还要设定schema规范输出格式(无限套娃,一层层界定)。
(3)对以上两种混合使用。简单意义规则分类,复杂的借助llm,当然,也可以用混杂一些embedding检索,小的模型分析这些,都可以混,最后打分,靠置信度评价给出结果,或者融合结果。
根据这个我们可以获得一个结构化输出结果
分析的意图,置信度,关键词,什么分类器认证的等等所有信息,这样我们就可以完成认证标注了。
除此之外,intent classification应该能识别多意图的能力,因为人往往会提出多个要求,并且任务之间存在先后顺序。可以通过连接词识别,多词态分析比如存在多动词多名词等方式来识别,识别后进行语段切割,子任务切割,主次区分。
此外,审查和澄清也相当重要,由于harness本身要求全流程连贯,提高使用效率。所以agent应该减少和用户交互过程。因此,只应该允许置信度低,intent冲突,high risk,缺少object或者无法明确时,这种应该及时反馈交付用户审查。
另外intent模块也可以自己装配测试集,完成自我验证,增强可信度。
总结一下,intent classification的内容
1.先定义 intent taxonomy
用规则识别明显任务
用 LLM 处理复杂语义
用 Pydantic 或 JSON Schema 固定输出
支持多 intent 拆分
保留 evidence 和 confidence
低置信度或高风险时触发澄清
用测试集评估分类效果
最终通过intent classification你可以把用户请求定义到正确的workflow工作链上。
2.object
意义:明确任务作用对象。
比如帮我切个西瓜,西瓜要切成方的,越小越好。
这个就有很多对象,作用对象:西瓜,形状对象:方形,指标对象:大小
agent在得到intent后,应该能具备立刻明确具体操作对象的能力。
如果他不具备这个能力,他就会不知道切什么水果。乱切成芒果,大小形状也无法控制。
在具体的应用场景,object可以分为很多种,目标对象,文件路径对象,环境领域对象,指标对象,数据对象,想调用的工具,禁止更改对象等等,看需求添加。
因此,我们又可以针对这个得到一个结构化输出。
那怎么识别对象呢,跟intent一样,还是规则定义,形式匹配,llm识别。
除此之外还有一个要求就是可以对所提对象之间完成索引锁定,我可以直接明确你说的这个对象在哪个文件定义的,我要找到这种映射关系。这个也是通过文件名匹配,关键词搜索,ast解析类名函数名,embedding检索等等方法完成映射锁定,还是一样的套路。
object还有一个很重要的,就是他能迅速锁定boundary对象,是否有risk,要加载哪些相关的context。
当然,这里提醒一下,无论是intent还是object,用户输入的语义正确很重要,如果用户无法准确输入需求,就很容易导致执行错位,比如你说优化一下,它很难分辨是要从正确率上还是速度还是大小上,因此正确表述需求才能更好的使用ai(文科生的价值也许超乎想象)。
总结一下:
领域词典匹配
正则/模式匹配
LLM 结构化抽取
同义词标准化
仓库索引
ripgrep 搜索
AST / tree-sitter 符号索引
object → file 映射
object这一步就是在完成锁定操作对象。
3.boundary
agent边界控制。就像人一样,agent也要有自己的边界感,在做事情的时候,什么事能做什么事不能做,什么东西能碰什么不能碰,这个应该明确。boundary可以有效限制agent乱改,越权,污染文件。
当object输出后,boundary应该能根据对象立刻调出以下几点:可动文件或路径,不可动文件或路径,允许与不允许的操作,需要索取approval的操作等等。
就相当于一个目标优化问题求解,pso之类,我先给你锁定一个你可以跑的多维空间,然后你必须在这个空间里面自己寻优,操作。
之外,boundary应该贯穿整个状态:
执行前:决定哪些文件和工具可用
执行中:拦截危险动作
执行后:用 git diff 检查是否越界
boundary在每次运行中应该能接受以下信息,已确定可执行边界。
(1)intent 结果
(2)object结果
(3)项目规则,预案规则(一般用md,yaml之类写好)
(4)git differ返还结果(未提交/已提交)
(5)用户提示词(自主提高优先级)
boundary最后也会生成一个结构化输出,包括之前提到的允许/不允许操作、工具、功能、可改大小,时间限制等
boundary应该能根据不同的输入形成不同的规则模版,并且可以不断迭代更新自身规则,然后生成新边界,当然规则之间直接应有优先级,避免覆盖,遗忘等现象。
总结:
Policy 规则文件
路径白名单/黑名单
动作权限
工具权限
命令拦截
网络限制
资源限制
执行后 git diff 审计
有效的boundary应做到识别它能碰什么;不能碰什么;碰之前要不要问你;碰完后怎么检查有没有越界。
4.context
context回答的是Agent 在操作之前,要看什么资料,哪些即刻看,哪些一会看
context需要根据前面得到的 Intent + Object + Boundary 转成一组具体上下文包。
Intent 决定上下文类型
Object 决定相关文件
Boundary 决定可访问范围
例如,intent分类到画图,object指向风景图,这时候context应该能加载绘图脚本,格式规范,可用简易图标等等。
常用context:
User Context用户上下文
Task Context 任务上下文
Conversation Context 对话上下文
Product Context 垂直领域上下文
Environment Context 环境上下文
Tool Context工具上下文
Memory Context 记忆上下文
Policy / Constraint Context 约束上下文
context输出步骤
加载基础规则上下文
根据 Intent 选择上下文模板
根据 Object 找相关文件
根据 Boundary 排除禁止上下文
根据优先级和 token 预算排序
生成 ContextPlan
同时,上下文不是越多越好,很多人认为上下文多就可以懂得多,分析更全,实际因为关键信息被稀释,过期信息污染判断,模型注意力分散等等,agent会变笨,因此设计Context原则应该是足量不过量。
当上下文量达到一定程度的时候,context必须进行压缩,形成信息或结构摘要,片段检索,滑动窗口记录,或切片选择top5chunk来进行必要压缩,保留主要信息。
上下文检索一般依赖Repo Index ,就像提前画个地图。比如你想找一个淘宝上的的商品,如果没有索引,你要找半天都找不到,有了索引,你就可以直接链接转过去,这样 AI 不用凭感觉找文件,而是能先定位大概位置。
(4.25 05:32力竭了,不想写了,一晚上没睡觉,有时间继续)
除此之外,context还需要给资料排优先级,它必须在巨量的可读上下文中让agent能按必要性读到最需要注意的资