高级OpenClaw第一步!先用12个Skills把联网搜索做到极致
OpenClaw从中级到高级第一步不是做龙虾分身,先把联网搜索做到极致,把X,某站,某书,播客,公众号,Reddit啥的全都解析明白,再把Deep Research装上,再加上主动订阅的信息源和OpenRouter免费兜底的大模型,这应该是目前云上OpenClaw在不方便文件互传的情况下的最佳搭配方案。
一键安装的命令我整理到最后了。
OpenClaw目前内置的联网搜索是Brave和Perplexity,一个要绑卡一个要付费。
所以我们直接先换成Tavily和Multi Search Engine v2.0.1,
- Tavily每月1000次免费调用,不用绑卡。好处就是它本身就是专门给Agent做的搜索API,返回的内容处理过了。
- Multi Search Engine集成了17 个搜索引擎(8个中文+9个全球),不需要API,安装的时候把搜索规则记下就行
但总有些难啃的链接,公众号,某书,某X的不好解析,这段时间我还装了Agent Reach和x-reader,
它们覆盖的平台是有重复的,为了安全性会在本地安装一个docker虚拟机来模拟操作,
- x-reader能覆盖yt,某站,X,公众号,tg,rss,播客,某书
- Agent Reach在x-reader的基础上多了某抖,Reddit,Github,优先用Cookie登陆不需要扫码,但我还是建议用小号。
还有一类是需要浏览器自动化的,
比方说点击确定,滑动页面,一般来说是用Playwright,
但我发现了更好用的,
BrowserWing可以记录浏览器的操作做成Skills,下次再用就可以精确重放了。
如果有一个gemini账号,还可以安ModSearch和Gemini Deep Reserach,
- ModSearch把gemini cli做成了联网搜索,Google的信息搜索本来就很强,不是反代,没有风险。
- Gemini Deep Reserach就相当于把Gemini的Deep Research能力搬到OpenClaw里面了,还是Gemini 3.1 Pro驱动的。
还有三个比较特别的,
find-skills,Clawhub和ClawFeed
find-skills和Clawhub都是让OpenClaw遇到问主动找合适的Skills的。
把ClawFeed放在这里因为它相当于是一个被动更新的信息源,可以订阅X,RSS,HackerNews,Reddit和GitHub Trending,4个小时更新一次。
最后加个Free Ride,
很多朋友虽然已经开始用API了,但没有做额度管理,如果当时在跑一个很长的任务的,因为速率限制直接就废了。Free Ride相当于调用了OpenRouter上的免费模型,它自动就按照质量排名了,这样的我们不需要担心openclaw半夜停了。
(1/2)
OpenClaw从中级到高级第一步不是做龙虾分身,先把联网搜索做到极致,把X,某站,某书,播客,公众号,Reddit啥的全都解析明白,再把Deep Research装上,再加上主动订阅的信息源和OpenRouter免费兜底的大模型,这应该是目前云上OpenClaw在不方便文件互传的情况下的最佳搭配方案。
一键安装的命令我整理到最后了。
OpenClaw目前内置的联网搜索是Brave和Perplexity,一个要绑卡一个要付费。
所以我们直接先换成Tavily和Multi Search Engine v2.0.1,
- Tavily每月1000次免费调用,不用绑卡。好处就是它本身就是专门给Agent做的搜索API,返回的内容处理过了。
- Multi Search Engine集成了17 个搜索引擎(8个中文+9个全球),不需要API,安装的时候把搜索规则记下就行
但总有些难啃的链接,公众号,某书,某X的不好解析,这段时间我还装了Agent Reach和x-reader,
它们覆盖的平台是有重复的,为了安全性会在本地安装一个docker虚拟机来模拟操作,
- x-reader能覆盖yt,某站,X,公众号,tg,rss,播客,某书
- Agent Reach在x-reader的基础上多了某抖,Reddit,Github,优先用Cookie登陆不需要扫码,但我还是建议用小号。
还有一类是需要浏览器自动化的,
比方说点击确定,滑动页面,一般来说是用Playwright,
但我发现了更好用的,
BrowserWing可以记录浏览器的操作做成Skills,下次再用就可以精确重放了。
如果有一个gemini账号,还可以安ModSearch和Gemini Deep Reserach,
- ModSearch把gemini cli做成了联网搜索,Google的信息搜索本来就很强,不是反代,没有风险。
- Gemini Deep Reserach就相当于把Gemini的Deep Research能力搬到OpenClaw里面了,还是Gemini 3.1 Pro驱动的。
还有三个比较特别的,
find-skills,Clawhub和ClawFeed
find-skills和Clawhub都是让OpenClaw遇到问主动找合适的Skills的。
把ClawFeed放在这里因为它相当于是一个被动更新的信息源,可以订阅X,RSS,HackerNews,Reddit和GitHub Trending,4个小时更新一次。
最后加个Free Ride,
很多朋友虽然已经开始用API了,但没有做额度管理,如果当时在跑一个很长的任务的,因为速率限制直接就废了。Free Ride相当于调用了OpenRouter上的免费模型,它自动就按照质量排名了,这样的我们不需要担心openclaw半夜停了。
(1/2)
用 openclaw 连续做了三周的高频工作,覆盖了十多种真实的使用场景,从生活到育儿到投资全覆盖。
简单任务、模糊任务、允许误差的任务,完全没问。真正的分水岭,出现在需要精确数据操作的场景。
只要 workflow 依赖特定规则的文件命名、特定位置的数据写入或替换,精确性就明显下降。上下文一旦变多,精确性只会进一步下降。而上下文不够的,又根本做不了复杂的工作。
原因很简单: agent 擅长的是给出一个“大概是这样”的结论。 但数据 workflow 要求的是:每一个数字都不能错。 两者之间没有缓冲地带。
假设一个流程包含 10 个数据处理步骤:新建子文件、修改 JSON 指定字段、在既有目录结构中插入内容、再触发下一步解析、前一步的数据直接决定了后一步的推理方向。这些步骤单独看都不复杂,但它们有一个共同特征:只要任何一个环节出现微小偏差,整个流程就会失效,而且这种失效很难排查。
因为 agent 的错误通常不是直接报错,而是:
- 文件位置偏了一层
- key 名称略有变化
- 数据格式语法正确、但结构不同
- 换一个模型,原本勉强稳定的流程甚至可能直接失效
等到发现时,已经全盘皆输,而且很难审计具体是哪一步出了错。
这不是高级的 memory 架构 和 tools 设置可以解决的。
因此我目前的结论是:
1、AI 很强,Openclaw 也很强,但是它们并不擅长直接操作数据;
2、精确数据型工作,最终都会回到:"数据库 + 代码 + 明确的 workflow 结构"。当然,其中某几个 step 可以外包给 agent 去操作、并用严格受限的接口来接受 agent 提交的局部数据(比如 x 上针对某个的舆情分析评分),这是很好的互补关系。
3、AI agent 最合适的位置,不是基于 prompt 直接操作数据,而是生成精确的代码,让代码去操作数据。改 prompt 的性价比,往往不如改代码。
最近 SaaS 和软件公司的低迷,是因为市场在假设 agent 可以直接取代软件本身。我现在可以确定:这是一个巨大的市场误判,又是一个认知可以变现的机会。
简单任务、模糊任务、允许误差的任务,完全没问。真正的分水岭,出现在需要精确数据操作的场景。
只要 workflow 依赖特定规则的文件命名、特定位置的数据写入或替换,精确性就明显下降。上下文一旦变多,精确性只会进一步下降。而上下文不够的,又根本做不了复杂的工作。
原因很简单: agent 擅长的是给出一个“大概是这样”的结论。 但数据 workflow 要求的是:每一个数字都不能错。 两者之间没有缓冲地带。
假设一个流程包含 10 个数据处理步骤:新建子文件、修改 JSON 指定字段、在既有目录结构中插入内容、再触发下一步解析、前一步的数据直接决定了后一步的推理方向。这些步骤单独看都不复杂,但它们有一个共同特征:只要任何一个环节出现微小偏差,整个流程就会失效,而且这种失效很难排查。
因为 agent 的错误通常不是直接报错,而是:
- 文件位置偏了一层
- key 名称略有变化
- 数据格式语法正确、但结构不同
- 换一个模型,原本勉强稳定的流程甚至可能直接失效
等到发现时,已经全盘皆输,而且很难审计具体是哪一步出了错。
这不是高级的 memory 架构 和 tools 设置可以解决的。
因此我目前的结论是:
1、AI 很强,Openclaw 也很强,但是它们并不擅长直接操作数据;
2、精确数据型工作,最终都会回到:"数据库 + 代码 + 明确的 workflow 结构"。当然,其中某几个 step 可以外包给 agent 去操作、并用严格受限的接口来接受 agent 提交的局部数据(比如 x 上针对某个的舆情分析评分),这是很好的互补关系。
3、AI agent 最合适的位置,不是基于 prompt 直接操作数据,而是生成精确的代码,让代码去操作数据。改 prompt 的性价比,往往不如改代码。
最近 SaaS 和软件公司的低迷,是因为市场在假设 agent 可以直接取代软件本身。我现在可以确定:这是一个巨大的市场误判,又是一个认知可以变现的机会。
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
我操太猛了,朋友们!
我居然真的一晚上搞定了 Telegram 的连接
我的 Agent 客户端 Codepilot,现在是一个小号的 OpenClaw了!
一旦学会这套开发体系和 Agent 的使用,工作效率高得要死。
本来是想跟他讨论一下,结果我一扭头,他已经把那个雏形开发完了。
我居然真的一晚上搞定了 Telegram 的连接
我的 Agent 客户端 Codepilot,现在是一个小号的 OpenClaw了!
一旦学会这套开发体系和 Agent 的使用,工作效率高得要死。
本来是想跟他讨论一下,结果我一扭头,他已经把那个雏形开发完了。
字节的Coding Plan也上线了,用OpenClaw体验了一下非常丝滑,地址放这里。
不仅支持编程,还支持文生图和文生视频,借助官网的API文档很快就可以虚拟出一个“虚拟女友”。
目前在OpenClaw里配置了SOUL.md,HEABEAT.md等内容,我虚拟的人物性感是《倚天屠龙记》里面的赵敏。
每10分钟一个个问候,或者自拍照,或者视频,完全满足宅男的想象。
谁说OpenClaw只能干活的?AI时代情感陪伴才是突破口。
不仅支持编程,还支持文生图和文生视频,借助官网的API文档很快就可以虚拟出一个“虚拟女友”。
目前在OpenClaw里配置了SOUL.md,HEABEAT.md等内容,我虚拟的人物性感是《倚天屠龙记》里面的赵敏。
每10分钟一个个问候,或者自拍照,或者视频,完全满足宅男的想象。
谁说OpenClaw只能干活的?AI时代情感陪伴才是突破口。
假期里观察媳妇用命令行工具,发现非技术用户使用命令行的一个门槛就是对树结构的文件系统没概念,不理解路径是什么。整理了一下可以方便快捷操作路径的设置和快捷键:
1. Finder 显示路径栏
在 Finder 菜单 显示 -> 显示路径栏(Path bar),底部会一直看到当前位置。
2. 右键启用“复制路径”
在 Finder 窗口,按住 Option,右键文件或者文件夹,可见“拷贝为路径名称(Pathname)”。
3. 右键启用“在终端中打开”
系统设置 -> 键盘 -> 键盘快捷键 -> 服务,开启 Finder 的终端服务。
4. Command + Shift + . 显示/隐藏隐藏文件。很多系统把文件放在 HOME 下的以点开头的文件,会被隐藏掉,比如 .openclaw。很容易找不到。
5. Command + Shift + G 在 Finder 里“前往文件夹”。如果你得到了一个路径,可以用这个方式快捷打开。
欢迎补充。
1. Finder 显示路径栏
在 Finder 菜单 显示 -> 显示路径栏(Path bar),底部会一直看到当前位置。
2. 右键启用“复制路径”
在 Finder 窗口,按住 Option,右键文件或者文件夹,可见“拷贝为路径名称(Pathname)”。
3. 右键启用“在终端中打开”
系统设置 -> 键盘 -> 键盘快捷键 -> 服务,开启 Finder 的终端服务。
4. Command + Shift + . 显示/隐藏隐藏文件。很多系统把文件放在 HOME 下的以点开头的文件,会被隐藏掉,比如 .openclaw。很容易找不到。
5. Command + Shift + G 在 Finder 里“前往文件夹”。如果你得到了一个路径,可以用这个方式快捷打开。
欢迎补充。
This media is not supported in your browser
VIEW IN TELEGRAM
哇这个不错!
玩过 OpenClaw 的应该都知道,OpenClaw 需要生成好完整的整段回复才会通过聊天工具发送给你。
生成回复的这个过程中你是看不到任何信息的,Telegram 现在支持实时查看 OpenClaw 的回复生成过程了。
Telegram 目前应该是第一个去兼容 OpenClaw 的聊天工具。
玩过 OpenClaw 的应该都知道,OpenClaw 需要生成好完整的整段回复才会通过聊天工具发送给你。
生成回复的这个过程中你是看不到任何信息的,Telegram 现在支持实时查看 OpenClaw 的回复生成过程了。
Telegram 目前应该是第一个去兼容 OpenClaw 的聊天工具。
👍1
昨天熬夜 做了一晚上业务流程,终于把 Claude Agent 关于生成动态漫/短剧的业务自动化全流程搞出来了!
真的不容易!
我的逻辑其实也很简单,受 OpenClaw 的多角色业务流程启发,用 AI 管理,监管各 agent 的工作流和产出质量。
最后生成相关的业务结果,人类的我们只需要用剪映合成一下就行了。
1,一个 Agent团队,我分开了四个角色来各司其职。每个角色专注自己擅长的事情,有明确的流水线和审核机制。
2,视觉指导专心讲戏,调动的是影视导演的知识;美术指导专心设计视觉方案,调动的是概念设计的知识;执行场记专心写平台提示词,调动的是 Seedance 2.0 的技术规范。
各干各的,每个环节的质量都比一个人包办要高。
3,每个阶段的产出都会保存成文件。视觉指导的讲戏本存一份,美术指导的提示词存一份,执行场记的视频提示词存一份。下游角色读文件而不是靠记忆,不管做多少集、剧本多长,都不会丢信息
4,数字资产复用,人物和场景提示词存在 assets 里,跨集共享。比如做第二集时角色直接复用,不用重新设计,新角色产生,就加进去。这点单个 Skill 做不到。
5,流程可控可干预,多阶段分步步触发,每一步你都可以看产出、提意见、让它改,改满意了再往下走。不是一口气跑完给你一个结果,而是你全程参与把控。
简单说就是:单个 Skill 是一个人闷头从头干到尾,Agent 团队是一条专业流水线,分工明确、逐步交付、层层审核、成果留档。
前者适合简单任务,后者适合像"剧本到视频提示词"这种链条长、环节多、质量要求高的复杂工作流。
真的不容易!
我的逻辑其实也很简单,受 OpenClaw 的多角色业务流程启发,用 AI 管理,监管各 agent 的工作流和产出质量。
最后生成相关的业务结果,人类的我们只需要用剪映合成一下就行了。
1,一个 Agent团队,我分开了四个角色来各司其职。每个角色专注自己擅长的事情,有明确的流水线和审核机制。
2,视觉指导专心讲戏,调动的是影视导演的知识;美术指导专心设计视觉方案,调动的是概念设计的知识;执行场记专心写平台提示词,调动的是 Seedance 2.0 的技术规范。
各干各的,每个环节的质量都比一个人包办要高。
3,每个阶段的产出都会保存成文件。视觉指导的讲戏本存一份,美术指导的提示词存一份,执行场记的视频提示词存一份。下游角色读文件而不是靠记忆,不管做多少集、剧本多长,都不会丢信息
4,数字资产复用,人物和场景提示词存在 assets 里,跨集共享。比如做第二集时角色直接复用,不用重新设计,新角色产生,就加进去。这点单个 Skill 做不到。
5,流程可控可干预,多阶段分步步触发,每一步你都可以看产出、提意见、让它改,改满意了再往下走。不是一口气跑完给你一个结果,而是你全程参与把控。
简单说就是:单个 Skill 是一个人闷头从头干到尾,Agent 团队是一条专业流水线,分工明确、逐步交付、层层审核、成果留档。
前者适合简单任务,后者适合像"剧本到视频提示词"这种链条长、环节多、质量要求高的复杂工作流。
❤2👍2
This media is not supported in your browser
VIEW IN TELEGRAM
再次说明,兴趣是最好的老师🤣
这位小朋友对OpenClaw的理解已经超过大多数人了哈哈按好
不过如果换成懒猫微服效率就更高了,一键安装OpenClaw,还更安全😎
这位小朋友对OpenClaw的理解已经超过大多数人了哈哈按好
不过如果换成懒猫微服效率就更高了,一键安装OpenClaw,还更安全😎