linux.do
21.1K subscribers
118K photos
195 videos
116 files
251K links
linux.do最新话题和热议话题
Download Telegram
CPA无法批量上传JSON文件了吗

RT 请教大佬们
我以前还可以CTRL+A批量上传呀
5 个帖子 - 4 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: monobo)
第一次摔车(

佬们,放学路上第一次摔车,旁边还有一辆小车,本来想换挡超过去的,结果一升牙盘,链条卡兹卡兹响一下,踏板和链条直接卡住不动了,直接失控然后摔倒。幸好我是往右边人行道摔的,且速度不快,不然就被小车爆头了QVQ
(俺很菜的)

199配的眼镜飞出去了,镜片掉了一个,发现居然一点划痕都没有owo

10 个帖子 - 8 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 『H₂O₂』)
【Harness Engineering】怎么都在说 Harness Engineering,什么是 Harness Engineering

最近一段时间 Harness Engineering 这个名词在 Agent 圈子里面绝对是 No.1
一个词的发明从来不是莫名其妙的,而是大量的生产实践,经验总结,得出了一定的现象规律,人类再加以命名。

但是一个术语诞生的时候,大家其实对其研究没有那么深厚,又或者因为竞争激烈,很多人在同一个时间对类似的现象都有研究,词语的界限就没有那么明确。
Agent 大家都已经很熟悉了,但在一年之前,拖拉拽的工作流,n8n 其实也被偶尔称作 Agent,现在大家都统一了以工具调用与环境交互的自主决策系统才叫 Agent,固定节点的都统一为工作流了
我总结了近期头部 AI 公司内部的大量实践,以及若干开源项目,希望能够准确定义一下 Agent 中的 Harness Engineering 到底是个啥?

----------------------

Harness Engineering – 马具工程 :distorted_face:

我翻找了一些资料,大多数说法都认为 Mitchell Hashimoto(米切尔·桥本)是第一个提出“Harness Engineering”概念的人。

他是 HashiCorp 的联合创始人、Terraform 的创作者。2026 年 2 月 5 日,他在个人博客中首次明确命名并系统阐述了这个理念(第 5 步:“Engineer the Harness”) 他的核心定义非常简洁:“每当发现 Agent 犯错,就花时间设计一个解决方案,让它永远不再犯同样的错误。”
六天后,OpenAI 发布工程报告《Harness Engineering: Leveraging Codex in an Agent-First World
3月24日,Anthropic 也发布针对 Harness Engineering 的研究博客

后面,这个词病毒式传播,大家都说 Claude Code 的 Agent 设计是 Harness Engineering 的典范。

总的来说:
Harness Engineering 是围绕 LLM 模型构建,并优化其持续运行过程的工程实践;它负责定义模型如何获取上下文、如何与工具和环境交互。更具体的内容还可以包括,定义模型如何被任务编排与状态管理、如何验证结果,以及如何长时间运行,从而把模型变成可稳定交付结果的 Agent。


可以从下面三层来理解:

通用 harness 层:和具体项目相对弱相关,属于 agent runtime / framework 能复用的部分。比如大多数 agent 都基于终端与环境交互,因此 tool loop 设计考虑了:权限系统、记忆、线程持久化、context compaction、hooks、任务调度、客户端协议。Agent CLI 大多是这一层。(“你在终端环境,你要基于这些工具完成任务”)
项目 harness 层:和具体项目 / 产品强相关,但仍然不是业务功能本身。比如 AGENTS.md、仓库知识布局、架构边界、lint 规则、质量标准、依赖选择原则、文档索引、设计参考、技术债追踪。OpenAI 文章的核心创新其实很大一部分都在这层。OpenAI 推荐把仓库变成整个系统的完整历史记录,并且分门别类,让 agent 能读到所有文档,但按照任务执行需要选择性的读取文档(渐进式披露),并基于这些充分的信息执行计划、遵守结构规则。(“做任务的时候要遵循这些规则,先这样再那样”)
任务/运行 harness 层:和当前这次具体工作强相关。比如 Anthropic 为了逼迫 Claude 生成特别有创意的好的产品,专门搞了两个模型对抗;为了持续执行,不遗漏任务点,设计了 planner 生成 spec、为了让 Claude 不要草率交付,设计了跨 session 文档交接、以及 QA prompt、Playwright 检查脚本。这一层涉及到具体工作部分了,但它仍然是在定义任务如何被执行与验证,不是任务具体内容本身。(说实话有些过于特定的设计意义不大,偏向于一通操作猛如虎,实际战绩 0/5)

三层由通用到最细枝末节,可以看作是不同切入点,但目的都是为了设计一个系统,给模型划定轨迹路线,让 Agent 执行任务的时候被 “稳稳地接住” 😂

个人观点:

通用 Harness 层其实已经在各大模型里面内置了,因为训练的时候已经是这样交互逻辑,大家用的时候已经习以为常了。(难道 Agent 能够不与终端交互,超出计算机范畴,从屏幕出来直接扇你一巴掌?)
OpenAI 的 Harness 最具参考价值,因为他的作用范围较广,在不同工程项目你都可以借鉴。并且最值得学习的点是:设计强制执行的检查控制 Agent 交付的产物。说白了就是测试或者代码风格检查器,但是其实效果特别好。
最后就是针对各个任务,细枝末节的板块你可以奇思妙想搞各种 Agent 搭配,组合,Handoff。但是 Harness Engineering 的目标是朝向 Agent 更高的自动化,更长的全自动工作时长,与人类随时随地过多介入是相悖的。

佬友们智慧与汗水的结晶(相关项目):

【通用 harness 层】Coding CLI 的实践(系列):深入浅出 Claude Code(一):从源码理解 CLAUDE.md,重写你的配置
【通用 harness 层】Multi-Agent,Human in the loop 非常新颖的实践: 【开源】强烈推荐管理 Codex/CC 的无限画布工具!
【通用 harness 层】Coding CLI 的实践(系列):【长期贴】 Claude-code-workflow(CCW) --使用技巧分享-自认为最工程化的harness workflow
【项目 harness 层】SPEC文档,依赖、分层代码检查与CI测试,Playwright端到端:【OpenASE】可以关掉你的 IDE 和终端了。聊几句,提几个工单,睡觉的时候也能交付代码
【项目 harness 层】帮助你形成自己的 SPEC: https://linux.do/t/topic/1445627
【任务/运行 harness 层】明确任务拆解,Sub-Agent Spawn,一句话,让 codex / claude code 创建成千上万个子agent

由此:harness 是互联网公司重新发明的新词还是有独特的创新之处?

6 个帖子 - 3 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: BosaBosa)
【Deep Resarch心得分享】佬友们,闲鱼淘宝上三十多块一年的gemini官网的pro值得买吗?

看到有些类似的帖子,发这个帖子主要是想知晓更多佬使用gemini之类的心得,和购买建议,稳定性的完善。Gemini官网的Pro貌似就比aistudio的多了些使用次数和Deep Research,萌新求问有没有专业的佬分享下自己的使用心得?Deep Research的上限有多高?大家平时用来做些什么任务捏?

12 个帖子 - 8 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 遐蝶)
较容易获取信用卡的方式

我认知范围内只推荐招商银行,不要求社保,但是要求钉钉。这个相较于社保容易的多,比如大学生大四、大五实习、研究生一般都会有。还是兼职,一般长一点的兼职都会给,自己可以找找。其次不要填写自己学生,出门在外,身份都是自己给的。办卡人只会确认钉钉的姓名是不是你,其他不会去确认。其次不要用花呗等东西,用了你就别去办了,人家银行可以查到的,你要是用了,审核会严格的多。

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: NOEL_VERMILLION)
佬,请问使用sub2api的密钥,codex需要在本地电脑打开机场吗

每次使用codex,api登录,一直都全程打开机场,导致有的网站使用不了,请问不用打开机场可以用codex吗。佬

4 个帖子 - 4 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 胡学长)
被claude code删除文档无力狂怒emo落泪后得后续补救

claude opus,我X你先人 搞七捻三
[image] 曹!!!!!!!!!!!!!!!!!!!!!!!

文件没能救回来。
草泥马!!!!!!!!!!!!!!!!!!!!!!!!!
千万不要没有隔离就开YOLO。
以下是一个补救hook,供参考。
准备延毕
 {
"hooks": {
"BashSubmit": {
"command": "bash",
"args": ["-c", "if echo \"$CLAUDE_BASH_COMMAND\" | grep -qE '\\brm\\b|\\bdel\\b|Remove-Item'; then echo
'[BLOCKED] 文件删除操作需要用户确认' >&2; exit 1; fi"]
}
}
}


1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 萨米沐浪)
opencode出新模型?

出新的模型了吗?这个是哪家的呀

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 胡哥)
网页端ai推荐(gpt,gemini,claude三选一)

想知道佬们如果用网页端ai的话,一般用的那家的呢.现在国外三家的都掉了,想搞一个稳定的网页端.
应该选择那一家呢,有什么好的渠道呢

6 个帖子 - 6 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: GeoSyntax)
AI为什么这么占C盘空间!!

😐️我用AI去做一些东西,但是过不了多久c盘就莫名其妙少好几十G,AI会有很多配置文件一系列的东西占内存,而且之前用的Cursor还有Claude留下的配置文件夹也不会删干净
想问一下佬们怎么管理自己的C盘空间的,包括C盘里一些奇奇怪怪的文件夹和火星文一样 🥲

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 素吟风)
分享一个能使用 VEO模型制作视频的接口

不知何时失效 速度蹬

api_url:http://156.67.29.80:8000

api_key:han1234

可用模型如下
gemini-2.5-flash-image-landscape
gemini-2.5-flash-image-portrait
gemini-3.0-pro-image-landscape
gemini-3.0-pro-image-portrait
gemini-3.0-pro-image-square
gemini-3.0-pro-image-four-three
gemini-3.0-pro-image-three-four
gemini-3.0-pro-image-landscape-2k
gemini-3.0-pro-image-portrait-2k
gemini-3.0-pro-image-square-2k
gemini-3.0-pro-image-four-three-2k
gemini-3.0-pro-image-three-four-2k
gemini-3.0-pro-image-landscape-4k
gemini-3.0-pro-image-portrait-4k
gemini-3.0-pro-image-square-4k
gemini-3.0-pro-image-four-three-4k
gemini-3.0-pro-image-three-four-4k
imagen-4.0-generate-preview-landscape
imagen-4.0-generate-preview-portrait
veo_2_1_fast_d_15_t2v_portrait
veo_2_1_fast_d_15_t2v_landscape
veo_2_0_t2v_portrait
veo_2_0_t2v_landscape
veo_2_1_fast_d_15_i2v_portrait
veo_2_1_fast_d_15_i2v_landscape
veo_2_0_i2v_portrait
veo_2_0_i2v_landscape
veo_3_1_t2v_fast_portrait_4k
veo_3_1_t2v_fast_4k
veo_3_1_t2v_fast_portrait_ultra_4k
veo_3_1_t2v_fast_ultra_4k
veo_3_1_t2v_fast_portrait_1080p
veo_3_1_t2v_fast_1080p
veo_3_1_t2v_fast_portrait_ultra_1080p
veo_3_1_t2v_fast_ultra_1080p
veo_3_1_i2v_s_fast_portrait_ultra_fl_4k
veo_3_1_i2v_s_fast_ultra_fl_4k
veo_3_1_i2v_s_fast_portrait_ultra_fl_1080p
veo_3_1_i2v_s_fast_ultra_fl_1080p
veo_3_1_r2v_fast_portrait_ultra_4k
veo_3_1_r2v_fast_ultra_4k
veo_3_1_r2v_fast_portrait_ultra_1080p
veo_3_1_r2v_fast_ultra_1080p

(祝我早日上2级)

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Jaky)
冰佬的邀请码1个 自取

91834277e7234bca8998df72f0804bbd 用了回复一下

码没有问题 😶‍🌫️
2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Scallions_)
抽一个GLaDOS 60天会员码

(话题已被作者删除)

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Merrick)
指纹浏览器更新,更新内容:新版垂直标签页、多实例管理、增加更多指纹、Cookie导入导出

整理发布到Github上面,目前只构建了 Docker 运行镜像
常用的功能基本都增加了,有新的需求可以提,有空会处理的
热心的佬也可以提PR
1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: tumi)
气笑了,感觉一直在浪费token

从去年11月开始一时兴起想借助 “ AI 神力” 全栈开发一套生产级的系统(具体用途就不细说了,反正蓝图很宏大,理想很丰满,现实很骨感)。

目前大概有三十万行(?,随便盘点下用到的技术栈,应该有 vue3、tailwind、golang、gin、vben admin、uniappx、openapi、pgsql、redis、minio、zitadel、openfga、grafana……

当时没什么 vibe 经验,也没有采用 harness 的演进方式,导致现在感觉项目变成了一坨超级大史山。

目前一直在让 opus4.6 和 gpt5.4 xhigh 做一些 code review 和 debug / 优化 工作,每次全量扫都能扫出来几十个大大小小的问题或者可优化点,次次不重样,感觉已经漏成筛子了。

从项目开始到现在没有完全统计了,拼拼凑凑盲猜应该至少烧了上万刀 tokens 了,感觉完全浪费。看起来没有生产级项目经验和全栈开发经验的人还是无法只靠 vibe 来驾驭一个完整项目,已力竭。。。

17 个帖子 - 11 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: wztxy)
chatgpt回复出问题了?

如图,chatgpt网页最近的回复都变得很短了,这是咋回事,我没开记忆,新对话也是这样
1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: zxc11084)
今晚硬着头皮拿codex写word有感

如题所示,本人之前多次尝试claude但是号被封怕了于是开始皈依codex.不是cs/ai科班出身,主修专业偏经管,在赶北大论坛论文的时候由于要全文转英文翻译还要改成英文期刊格式于是快速搓了一套skill出来,论坛要求必须同时提交word和pdf(非常烦人哈 😅),所以本人原本打算用latex转写结果一拍脑袋想起来latex导出的word也无比难看,于是决定痛苦的指挥codex直接开写word.
结果就是尽管有了标准的官网word template作为reference文件但是codex在本地写word文档时依旧产生非常多的错漏,尤其是行间距这种需要手动设置段落内部参数的地方尤其智障。折腾了一晚上下来其实跟手改的速度也没啥差别了。
所以在遇到这种硬性规定要交word的情况下,如何最大化提升改格式的效率呢?

9 个帖子 - 7 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 世界树)
手写涩涩的小且潦草的日记测试Gemini3.1p和豆包(不思考)的OCR能力:豆包错误率高一倍

涩涩内容还在写… 本话题未来将会引用,以及下方会附上本次测试的原文

先看原材料(如上所说,本话题暂不提供完整原文):
比较清晰的部分:

比较潦草的部分

自我感觉算是1:1 但总之整体上都是小而且潦草
不好识别,但我自己能100%识别~

<这里暂时省略对比图>

哈基米作为胜利者写了个代码进行检测:

豆包错误率接近两倍了!
每个人的字体不一样,图片分辨率不一样,模型算力不一样,各种因素都会影响,所以仅供参考~
等涩涩内容解锁,本话题将转为搞七捻三
8 个帖子 - 3 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 欣欣|林可欣)
DuckDuckgo转发问题

为什么我收到转发验证码邮件的概率越来越低了,之前注册几乎只需要发一次就能收到,现在发十几次都收不到验证码邮件。。。

3 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Kurt)