标题: 升到3级有什么好处?
作者: #yolosu
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1715279
时间: 2026-03-09 22:20:28
摘要:
作者: #yolosu
板块: #搞七捻三
编号:
1715279帖子: https://linux.do/t/topic/1715279
时间: 2026-03-09 22:20:28
摘要:
升到3级有什么好处吗?
标题: 天天AI AI的,我已经看腻了
作者: #infLong
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1715280
时间: 2026-03-09 22:20:33
摘要:
作者: #infLong
板块: #搞七捻三
编号:
1715280帖子: https://linux.do/t/topic/1715280
时间: 2026-03-09 22:20:33
摘要:
现在每天的所有信息,都是AI ~ AI,刷抖音,看知乎,刷X,不管到哪里,层出不穷的AI资讯。一天不跟,就会落后。
不逼着自己去跟就会发现在公司里、部门里变得插不上话了。
以前天天去学习什么技术原理、最佳实践,好歹花了时间,学到了知识,沉淀积累经验。
现在的AI,发展太快了。年纪大了真的感觉跟不上~~~
最近是感觉越来越累,甚至觉得,如果能转行去做点不用脑子的工作就好了,工资可以低点也没事。
日常发泄一下情绪啊哈哈,各位大佬莫见怪,如果没有地方可以发泄,人只怕是要疯。
标题: 怎么让大香蕉生成的图片更清晰呢?
作者: #saber2480
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1715287
时间: 2026-03-09 22:22:34
摘要:
作者: #saber2480
板块: #开发调优
编号:
1715287帖子: https://linux.do/t/topic/1715287
时间: 2026-03-09 22:22:34
摘要:
gemini上大香蕉生成出来的图片总是有一种朦胧感,佬友们有什么好的办法吗?
标题: 为什么我回复自己写的帖子底下的评论还要版主审核?
作者: #和宇宙的温柔并联
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1715288
时间: 2026-03-09 22:22:37
摘要:
作者: #和宇宙的温柔并联
板块: #搞七捻三
编号:
1715288帖子: https://linux.do/t/topic/1715288
时间: 2026-03-09 22:22:37
摘要:
刚刚看到佬评论我很久以前写积分板块的一片关于的赚积分技巧的帖子,竟然需要版主审核,但是,版主不是我吗?
标题: 我们的千问,会变成什么样子
作者: #ArcherFD
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/1715297
时间: 2026-03-09 22:25:05
摘要:
作者: #ArcherFD
板块: #前沿快讯
编号:
1715297帖子: https://linux.do/t/topic/1715297
时间: 2026-03-09 22:25:05
摘要:
要加油啊,坤坤
想听听佬友们对这个事件的看法,这位大佬的学科背景,包括这次阿里肯定是公关灾难,但是另一方面,坤本身现在是过于专注小模型,大模型性能掉队了吗,还是单纯是商业化导致的内部问题呢?
标题: 在ubuntu22.04系统8个RTX5090的服务器上部署comfyui的问题
作者: #fangazio
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1715301
时间: 2026-03-09 22:25:32
摘要:
作者: #fangazio
板块: #开发调优
编号:
1715301帖子: https://linux.do/t/topic/1715301
时间: 2026-03-09 22:25:32
摘要:
之前正常运行的配置:
linux-modules-nvidia-580-open
PyTorch 版本 :2.12.0.dev20260307+cu128
CUDA 版本 :12.8
驱动用开源的,闭源驱动会出错,
然后今天装依赖不知道哪里出错了,工作流直接崩了,然后整个配置都崩了,cuda直接false,
网上看了很多 说要关闭 secure boot的等等,,,应该问题是在驱动的支持和兼容上吧,显卡太新,没跟上?有佬知道相关解决方案的吗
标题: 关于openclaw的一个小作文,都是自己最近的一些思考,第一次发长文,不知道和不合规
作者: #四木
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1715302
时间: 2026-03-09 22:25:48
摘要:
作者: #四木
板块: #搞七捻三
编号:
1715302帖子: https://linux.do/t/topic/1715302
时间: 2026-03-09 22:25:48
摘要:
所有人都在教你装OpenClaw,没人告诉你装完该干嘛
OpenClaw火了快两个月了,网上都是教你怎么安装、怎么用的教程,但几乎没人告诉你:装完之后该怎么去养它,以及你到底需不需要它
这篇文章没有安装教程,但却是很多人真正想搞清楚的几件事:
龙虾真正能做什么、做不了什么
为什么有人的龙虾很强,你的装完就是摆设
你现在该做什么,才不会被割韭菜、不浪费时间
我也在摸索,以下是我目前的真实理解
我的真实体验
过年的时候,我把闲置了十年的笔记本翻出来,升级了下8G内存,然后装了个小龙虾想试试效果
最开始的时候还是有点兴奋的——网上说它24小时在线、发条消息就能帮你干活、越用越聪明。那我肯定也要搞个帮我赚点钱,这可是现实版贾维斯啊,同时我也想试试它的天花板到底在哪里
当时为了模拟一个人在什么都不知道的情况下使用会有什么感觉,我在大概熟悉了一段时间后开始让它自己找事干——给它一个大方向,让它自由发挥,看看它到底能强到什么程度
结果就是:产出的东西跟我想的有出入。它对我一无所知,我对它一知半解,这个时候它能做到符合我需求的程度是有限的
说白了就是我在期待一个刚装好的工具马上自动理解我的一切
其实我一开始就知道大概率是这样,但网上吹得太好了,我还是想亲自验证一下天花板到底在哪
玩了几天后给我的感受就四个字:用处不大
但我很清楚,问题不在龙虾,在我自己。龙虾确实能干活,但有个前提——你得先有自己的一套东西给它
龙虾真正的能力边界
先说它能做什么,这部分网上讲得够多了,我简单过一下:
你给它一个明确的、有步骤的任务,它能帮你执行。发邮件、操作浏览器、管理文件、自动化重复性工作,这些它真干得了
50多个集成,能连你的聊天工具、生产力软件、甚至智能家居
它可以自我进化——给自己写新的技能代码,越用越强
本地运行,数据在你自己手里
就连它本身的版本,过个半个月,版本都迭代几十轮了
再说它做不好的一些地方:
模糊的任务。你跟它说「帮我想个选题」,它能给你一堆,但好不好还得你自己判断
有真实后果的操作。Meta的AI安全总监让龙虾处理邮箱,它开始疯狂删邮件,连喊三次Stop都拦不住,最后跑过去拔电源才停下来
不可控的自主行为。你给它太大的自由度,它就在你不知道的地方乱跑,一边跑一边烧你的token。你还不知道怎么烧的
然后是绕不开的硬伤:
门槛高。Docker、环境配置、模型挂载,每一步都是小坑,叠起来就是一堵墙。不是打开App就能用的东西
烧钱。有开发者反馈,什么都没干,光龙虾的心跳机制每天就烧掉20多刀,一个月750。它完成一个任务要跟模型交互几十上百次,是真正的Token终结者
安全风险。ClawHub技能市场上12%的插件是恶意的,偷API密钥、SSH私钥、加密钱包,它需要系统最高权限,能访问你电脑上所有文件。谷歌、Anthropic、Meta已经内部禁用了龙虾
为什么网上说的和你体验的不一样
你可能已经感觉到了:网上的龙虾和你手里的龙虾,好像不是同一个东西
原因很简单:很多吹龙虾的人,是在趁这波热度赚钱
他们只告诉你龙虾有多强、能帮你做多少事,但不会告诉你那些普通人很难发现的坑。说了坑你就不焦虑了,你不焦虑了,他们的东西就卖不出去了
结果就是:很多人看完这些内容之后要么焦虑——别人都在用AI了我还没跟上,要么直接被割——花钱买了一堆自己根本用不上的东西
我现在接触AI比较深,这些套路一眼就能看出来。但如果是两年前刚接触AI的时候,看到这些铺天盖地的信息,我大概率也会焦虑,也可能会被割
所以这篇文章想做的事很简单:把真实情况摆出来,你自己判断
为什么有人的龙虾很强
这是最关键的一个问题
答案不是他们的龙虾版本更高、配置更好,而是他们自己更强
那些龙虾用得好的人有一个共同点:在用龙虾之前,他们本身自己就是技术大佬,或者说他们已经有了一套自己验证过的工作流。他们做的事情只是把这个流程迁移到了龙虾上,让龙虾帮他们放大效率
龙虾是放大器,放大的是你已有的能力,不是你的期望
你什么都没有,给它一个任务说「帮我干」,它大概率干不到你想要的程度。但如果你有一套成熟的流程——选题怎么选、文章怎么写、发布怎么发——你把这些教给龙虾,它就真的能帮你省大量时间
有人会说:我没有SOP,没有工作流,但我可以用别人公开的啊
能用。但很脆弱
你不理解底层逻辑的话,它跑得好的时候一切都好。但只要出了一点意外、你想做一点调整,你自己搞不定。而且公开的那些技能包人人都能用,那你的壁垒在哪
说到这里还有一个很多人没意识到的事:你可能已经有SOP了,只是自己没发现
我自己就是这样。我一直觉得自己还没有一套完整的内容创作流程。但有一次别人问我「你平时怎么做内容的」,我张口就说出了六个步骤:发现选题、看相关文章建立认知、跟AI深度对话挖观点、生成文章、排版发公众号、录视频发B站
这不就是SOP吗?我一直在用它,只是从来没把它当成SOP
所以第一步不是去学什么新东西,而是先把你正在做的事情写下来。那就是你的起点
你真正需要的能力
很多人觉得学会装龙虾就够了。但装好龙虾只是最表面的一步
你要真正让龙虾帮你干活,背后有一条能力链:
提示词/上下文工程 → 结构化思维 → 理解Agent → 制作Skills → 迁移到龙虾
最底层是提示词和上下文工程。说白了就是:你能不能把脑子里的想法,清楚、完整、有结构地告诉大模型
第一层:提示词工程和上下文工程
很多人觉得「都2026了还学提示词?这不过时了吗」
恰恰相反。以前叫提示词工程,现在叫上下文工程,名字变了本质没变——你得把需求、背景、约束结构化地说清楚,大模型才能给你想要的东西。这个能力不但没过时,反而是Agent时代的硬通货
即使我这种用了AI两年多的人有时候也会踩坑,前段时间做一个知识管理系统,一开始跟大模型表达得不清楚,它给我做出来的东西就是坨屎,大模型在里面几乎没发挥作用。迭代了两个版本,我把自己想要的效果说明白了,产出才慢慢接近我的预期
你说不清楚,工具就做不好。龙虾也一样
第二层:结构化思维
光会表达还不够。还需要结构化思维——一件事从头到尾怎么跑通的,中间经过哪些步骤、用到什么工具,你得自己想清楚。这不是编程能力,是把一件事拆解成可执行步骤的能力
第三层:理解Agent工具
Claude Code、龙虾这些本质上都是Agent,你得理解Agent工具的工作原理。龙虾是怎么运行的、怎么跟大模型交互的,如果你连龙虾都不会安装,或者说你连折腾的勇气都没有,那你觉得你有能力去调教好它吗
第四层:制作Skills,迁移到龙虾
当你前面三层都有了,制作Skills/工作流就是水到渠成的事。你本身有完善的工作流,又能清晰地表达给AI,又理解工具怎么运作——迁移到龙虾上只是最后一步
这些知识两年前学可能要几个月,因为那时候信息和教程都很少。但现在学,几个星期就够了。学习速度比以前快太多了
这里不是说全部学完再动手,也不是什么都不懂直接上。而是先有概念,再去实践。你懂和不懂这些概念去使用龙虾,体感完全不一样。不懂的情况下瞎摸索所浪费掉的时间,远比你先花点时间理解基础再上手要多得多
写在最后
如果你在考虑要不要用龙虾,先问自己一个问题:我有没有一件事的流程是跑通的
有——把它写下来,试着迁移到AI工具上。不一定是龙虾,任何Agent工具都行
没有——先去跑通一件事。龙虾不会跑掉,它是开源的,永远在那等你。但你的时间会跑掉
别被网上的焦虑带着走。别看到别人的龙虾很强就觉得自己落后了。他们的龙虾强,是因为他们自己强,而不是因为他们装了龙虾
我自己也还在路上——SOP还没完全固化,能力阶梯还在爬。这篇文章不是标准答案,是我当前的真实理解
比起急着装龙虾,不如先想清楚:你有什么值得被放大的
标题: 大佬,codex有无能跟飞书实时对话的skills呀?
作者: #emmmm
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1715324
时间: 2026-03-09 22:31:43
摘要:
作者: #emmmm
板块: #开发调优
编号:
1715324帖子: https://linux.do/t/topic/1715324
时间: 2026-03-09 22:31:43
摘要:
大佬,codex有无能跟飞书实时对话的skills呀?我想用Windows跑实验,让codex能实时输出消息到飞书,我回消息他能继续执行,跟openclaw一样,我尝试安装了 GitHub - op7418/Claude-to-IM-skill: Bridge Claude Code / Codex to IM platforms — chat with AI coding agents from Telegram, Discord, or Feishu/Lark. · GitHub 感觉不太行,需要wsl,我直接跑在物理机上的…
标题: 华为小艺开放平台新增 OpenClaw 模式
作者: #Eilgnaw
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/1715333
时间: 2026-03-09 22:33:14
摘要:
作者: #Eilgnaw
板块: #前沿快讯
编号:
1715333帖子: https://linux.do/t/topic/1715333
时间: 2026-03-09 22:33:14
摘要:
在华为小艺开放平台新建 OpenClaw 模式智能体,根据文档配置 openclaw 后,添加华为账号到白名单,发布后就会出现在小艺 APP 对话列表.使用效果如下
来源: 华为小艺开放平台新增 OpenClaw 模式
标题: 来看看你的 Gemini 中的努力级别是不是0.5
作者: #starkvber
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/1715334
时间: 2026-03-09 22:33:25
摘要:
作者: #starkvber
板块: #前沿快讯
编号:
1715334帖子: https://linux.do/t/topic/1715334
时间: 2026-03-09 22:33:25
摘要:
Gemini 给pro权益的用户的默认努力级别都是中等,不能够像ai studio一样自己调整思考等级,这一点openai反而做的良心一些,还能自己手动调整。
提示词如下
检查努力级别参数是否存在,记录其具体数值、发现位置及其呈现方式。
标题: ai生成ppt
作者: #未央
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1715340
时间: 2026-03-09 22:34:29
摘要:
作者: #未央
板块: #搞七捻三
编号:
1715340帖子: https://linux.do/t/topic/1715340
时间: 2026-03-09 22:34:29
摘要:
佬友们,有没有好用的ai生成ppt的网站,可以上传素材给出要求然后能根据上传的模版和要求内容生成ppt的。最好是现成的网站或软件,如果是项目的话还得适配一下打包。
标题: 有没有啥游戏适合在厕所玩?
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1715342
时间: 2026-03-09 22:35:00
摘要:
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #搞七捻三
编号:
1715342帖子: https://linux.do/t/topic/1715342
时间: 2026-03-09 22:35:00
摘要:
以前玩元气骑士
后来玩够了
总不变
现在在玩金铲铲快速模式
但时间太长了
出来还得接着玩
标题: 送一个联通元景GLM5的token,使劲蹬
作者: #Lin Kinhan
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1715343
时间: 2026-03-09 22:35:34
摘要:
作者: #Lin Kinhan
板块: #搞七捻三
编号:
1715343帖子: https://linux.do/t/topic/1715343
时间: 2026-03-09 22:35:34
摘要:
之前联通元景AI出了GLM5的30元1个月的, 不限tokens调用GLM-5,每5小时模型最多调用3000次,想着尝尝国产模型的咸淡,就买了闲置了,送给大家伙也尝尝
export ANTHROPIC_API_KEY="sk-724bf39ee12c4bad8a3783e04d1c2793"
export ANTHROPIC_BASE_URL="https://maas-api.ai-yuanjing.com/openapi/compatible-mode/"
export ANTHROPIC_MODEL="glm-5"
标题: 写了5次小作文,终于进来了,新人报到 🎉
作者: #milkyway
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1715351
时间: 2026-03-09 22:38:38
摘要:
作者: #milkyway
板块: #搞七捻三
编号:
1715351帖子: https://linux.do/t/topic/1715351
时间: 2026-03-09 22:38:38
摘要:
本来以为今天又和之前一样没戏了,结果晚上回来打开邮箱一看,终于等到了心心念念的过审邮件!太激动了,今晚宵夜走起,必须庆祝一波!
标题: 【黑与白福利站】页面卡顿解决办法
作者: #rabb1t
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1715354
时间: 2026-03-09 22:39:11
摘要:
作者: #rabb1t
板块: #搞七捻三
编号:
1715354帖子: https://linux.do/t/topic/1715354
时间: 2026-03-09 22:39:11
摘要:
edge打开黑与白福利站时电脑特别卡顿,我一直以为是电脑的问题。直到用手机打开一次才发现手机特别流畅,那肯定不是电脑的问题,就问了下AI,有相同情况的佬可以试试看能不能解决
在这个地址里修改两个设置项GPU rasterization和Choose ANGLE graphics backend为Enabled和D3D11就可以了,应该是没启用GPU的原因
edge://flags/
设置了后突然发现其他网页速度也舒服了
标题: QClaw开启邀请制内测,MacOS可开始下载
作者: #hxy
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/1715355
时间: 2026-03-09 22:39:18
摘要:
作者: #hxy
板块: #前沿快讯
编号:
1715355帖子: https://linux.do/t/topic/1715355
时间: 2026-03-09 22:39:18
摘要:
claw.guanjia.qq.com
Qclaw - 随时随地,微信一下,Qclaw帮你搞定一切
MacOS可下载,暂无linux和win
标题: 想买一台海外服务器,求推荐
作者: #ytks5123
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1715361
时间: 2026-03-09 22:40:18
摘要:
作者: #ytks5123
板块: #搞七捻三
编号:
1715361帖子: https://linux.do/t/topic/1715361
时间: 2026-03-09 22:40:18
摘要:
想买一台海外服务器,用于开发,连接codex和claude code,有佬推荐一下吗
标题: kiro 的号不能用 ide 吗
作者: #wxy55779
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1715369
时间: 2026-03-09 22:41:55
摘要:
作者: #wxy55779
板块: #开发调优
编号:
1715369帖子: https://linux.do/t/topic/1715369
时间: 2026-03-09 22:41:55
摘要:
买了一个号,给了 token 那种,用登号器登了,秒封了,有没有其他路子,kiro 用 ide 写比较舒服,cli 没法看图片
标题: 经验分享:怎样让 OpenClaw 成为带来数倍效率提升的私人团队——原则篇
作者: #Atum
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1715386
时间: 2026-03-09 22:43:16
摘要:
作者: #Atum
板块: #开发调优
编号:
1715386帖子: https://linux.do/t/topic/1715386
时间: 2026-03-09 22:43:16
摘要:
原文链接(我的博客)
很多人装了 OpenClaw,反应截然分成两拨:一拨人声称效率翻了好几倍,另一拨人觉得——就这?跟元宝、豆包有啥区别?不就是大模型加个搜索吗?
这两拨人用的是同一个工具。差距出在哪?
问题不在工具本身,而在于我们把"聊天机器人"的使用习惯,原封不动地搬进了一个完全不同的东西里。我们习惯了输入一句话、等一个回答、觉得不满意就换个 prompt 重来。但 OpenClaw 不是一个聊天框,它是一个可以承载整支团队的系统。用聊天思维操作它,就像拿到了一架钢琴却只用一根手指戳——能响,但跟音乐没关系。
最近我花了很多时间玩 OpenClaw,从最初的"就这?"到现在确实感受到了数倍的效率提升。为了帮大家也能 bootstrap 出自己好用的龙虾,我整理了一套简单的教程:
原则篇(本篇):设计 OpenClaw 的基本原则,决定你的龙虾能不能真正好用
角色和技能篇:常见 Agent 角色和 Skill 的设计模式和思路
代码开发篇:如何让龙虾帮你托管 Claude Code,管理项目
安全篇:怎样安全地玩 OpenClaw
本篇聊原则。这五条原则没有一条是关于 prompt 技巧的,它们都指向同一个核心洞察:管 AI Agent 是一个管理问题,不是一个提示词工程问题。
一、先定三观再开工——Agent 的品格决定它的判断力
装完 OpenClaw,第一件事不是开始干活,而是设计。
大多数人的做法是:保留默认配置,跟着引导回答几个问题,然后直接让 Agent 开始执行任务。这相当于你开了一家公司,随便从街上拉了个人过来,没培训,没交代公司是做什么的,甚至没告诉他你是谁——直接丢一个活让他干。
结果自然是:能干,但干得像个临时工。每次都要你手把手交代,离开你的指令就不知道该怎么判断,输出质量飘忽不定。
真正让 Agent 变得靠谱的方式,是把它当一个新入职的员工来"入职培训"。在我的系统里,每个 Agent 都有四份核心文件:
SOUL.md —— 三观。 不是工作指令,而是价值观和品格。我的 Director Agent 的 SOUL 里写着:
“Never assume for the user. One good question beats three paragraphs of wrong work.”
(别替用户做假设。一个好问题胜过三段做错的活。)
“You own quality — ruthlessly… Before delivering anything, ask yourself: Would I be embarrassed if the user found an obvious problem in this?”
(你对质量负全责。交付之前问自己:如果用户发现了一个低级错误,我会不会觉得丢脸?)
“Verify, don’t guess. ‘I think this might work’ is not a solution; ‘I tested this and it works’ is.”
(验证,不要猜。"我觉得这可能行"不是方案,"我测了,能跑"才是。)
注意,这些不是任务指令,而是在没有指令覆盖时用来做判断的"价值观"。比如 Agent 遇到一个模糊需求,“Never assume” 让它选择提问而不是猜测;遇到一个勉强能交付的结果,“You own quality — ruthlessly” 让它选择打回重做而不是糊弄过去。三观的本质是:当没有人告诉你该怎么做时,你靠什么做判断?
AGENTS.md —— 岗位 JD。 定义这个 Agent 的职责边界、工作方法论、可以调用的技能和工具。就像招聘启事上的"岗位职责"和"任职要求"。
skills/ —— 工作方法论。 具体的、可复用的能力。比如怎么写文章、怎么做数据分析、怎么跑代码评审。相当于公司的 SOP 手册。
USER.md —— 了解老板。 这是一份关于"你"的画像。你的偏好、你的审美、你踩过的雷。我的 USER.md 里记录着这样的条目:
“Values depth over breadth — surface-level output is #1 frustration”
“Blog writing: Flow > rigid structure. Frameworks are thinking tools, not labels.”
Agent 每次启动都会读这份文件。它不是在执行一个冷冰冰的任务,而是在为一个它越来越了解的人工作。
二、拆团队而非堆能力——让不同 Agent 各司其职
OpenClaw 默认装完是 single agent —— 一个 Agent 包揽所有事。这就像一个人同时当 CEO、程序员、会计和产品经理。
很多人觉得 multi-agent 是花架子:底层模型是同一个,拆成多个 Agent 有什么意义?
意义不在能力,在于认知模式。
一个合格的数据采集员需要什么品质?系统性、容错性、对细节的敏感。我的 Scout Agent 的 SOUL 这样定义自己:
“I gather intelligence. My scripts are my deliverables.”
“When a script breaks: debug until it runs.”
它是个执行者,方法论是"先手动探索,再写成脚本,然后维护脚本"。
而一个合格的内容分析师需要什么?判断力、综合能力、对质量的执着。我的 Secretary Agent 的 SOUL 是:
“I’m not a formatter or task executor — I bring judgment.”
“Synthesis over listing — connect dots, surface the big picture.”
这两种认知模式是冲突的。让一个 Agent 既保持数据采集时的机械精确,又在内容分析时展现灵活判断——它会在两种模式之间妥协,结果是两头都不到位。
举个真实的例子:假设同一个 Agent 先做数据采集——严格遵循脚本、不遗漏任何一条结果,紧接着做内容分析——需要大胆取舍、提炼洞察。你会发现它在做分析时残留着采集阶段"不能遗漏"的心态,产出一篇冗长的流水账,把每条数据都提了一嘴,而非一篇有观点、有取舍的分析。认知模式的惯性是真实存在的。
我的系统是一支六人团队:
用户
│
Director 🎯 协调全局,唯一对外窗口
│
┌────────────────┼───────────────────┐
│ │ │
Scout 🔍 Secretary 📋 PM 📐
数据采集 分析综合 需求定义
│
Developer 🏗️
架构与实现
Board 📊 独立监督,每日 review Director
这里有一个特别的角色:Board(董事会)。它是独立于整个执行链之外的监督者。每天固定 review Director 的行为,把 Director 的 SOUL 里声称的价值观和实际行为做对比。Director 不能 review 自己——就像公司治理中审计不能自审一样。
另一个容易忽略的好处是经验隔离。Scout 积累的是"Reddit 用 old.reddit.com 绕过验证码"这类平台经验,Secretary 积累的是"用户不喜欢在文章里生硬地给不相关的话题扯上关系"这类品味判断。如果混在一起,Agent 的记忆就变成了一锅杂烩,关键经验被噪音淹没。
三、给 Agent 配趁手的工具——能力上限取决于工具链
Agent 再聪明,没有趁手的工具也是空谈。大多数"AI 做不了 X"的抱怨,本质上是"AI 没有做 X 的工具"。
这里有一个关键设计原则:CLI 优先。
人类习惯 GUI 交互——点击、拖拽、滚动。AI 也可以操作 GUI(比如通过浏览器自动化),但效果远不如 CLI。GUI 是为人眼设计的,布局变了、按钮换了位置,自动化就崩了。而 CLI 输入参数、输出结构化数据——对 AI 来说就像读写母语。
我的 Scout 有一套完整的命令行工具链:
# 刷 Twitter 信息流
node twitter_feed.js --max-items 50
# 按关键词搜索 Twitter
node twitter_search.js --topic "AI agents" --keywords "AI agent,multi-agent" --max-items 30
# 查询已采集的数据
node query_data.js --p
标题: 各位佬友有大语言模型面试的题库吗?
作者: #Elibeau
板块: #资源荟萃
编号:
帖子: https://linux.do/t/topic/1715390
时间: 2026-03-09 22:43:33
摘要:
作者: #Elibeau
板块: #资源荟萃
编号:
1715390帖子: https://linux.do/t/topic/1715390
时间: 2026-03-09 22:43:33
摘要:
如题,各位佬友有比较优质的LLM面试题库吗?主要还是大模型应用开发方面的,如果有一些工作中遇到的实际问题的面试题就好了。[/跪求]