在VSCODE里用CODEX,如何加入规则?
我在VSCODE里好像没看到在哪添加CODEX的规则?请问在哪添加?谢谢
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: RL)
我在VSCODE里好像没看到在哪添加CODEX的规则?请问在哪添加?谢谢
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: RL)
如何能联系上域名持有者
最近看上一个域名,点进去看发现没联系方式,只有一个not found的标志,看起来没在用,想买这个域名却又无从下手 😭
5 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: Matcha)
Invalid media: image
最近看上一个域名,点进去看发现没联系方式,只有一个not found的标志,看起来没在用,想买这个域名却又无从下手 😭
5 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: Matcha)
Invalid media: image
GPT K12教师降智到正常
今天买了个GPTK12账号,登进去之后就发现降智了,想着怎么解决,一开始用的是万人骑的机场,同机场的IP全都不行,然后又去研究了下家宽(之前从来没用过家宽)+指纹浏览器的解决方法,用了之后效果立竿见影,同一个账号同时在用机场IP的浏览器上登录和用家宽的指纹浏览器上登录,问出来一个是GPT4,一个是GPT5.2,随后在指纹浏览器上打开在机场IP的对话,问了下,立刻也变成5.2。甚至切换到个人版也是同样的效果
所以各位买了K12账号的佬一定要试试家宽 🧐
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 墨殇)
Invalid media: image
今天买了个GPTK12账号,登进去之后就发现降智了,想着怎么解决,一开始用的是万人骑的机场,同机场的IP全都不行,然后又去研究了下家宽(之前从来没用过家宽)+指纹浏览器的解决方法,用了之后效果立竿见影,同一个账号同时在用机场IP的浏览器上登录和用家宽的指纹浏览器上登录,问出来一个是GPT4,一个是GPT5.2,随后在指纹浏览器上打开在机场IP的对话,问了下,立刻也变成5.2。甚至切换到个人版也是同样的效果
所以各位买了K12账号的佬一定要试试家宽 🧐
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 墨殇)
Invalid media: image
国产编程模型里选GLM4.7 还是 MiniMax2.1?
都是在cc里面用 哪个编程能力最强呢?
Click to view the poll.
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Az0809)
都是在cc里面用 哪个编程能力最强呢?
Click to view the poll.
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Az0809)
我宣布 Gemini3就是最棒的Roleplay模型!附调教指南
gemini3玩rp的体验真的惊艳到我了 在剧情一致性 以及人物的性格方面比2.5p都是质的飞跃
这三天高强度体验下来(浅浅玩了十几Mtokens)感觉又找到了了第一次接触LLM roleplay的新鲜感
gemini3我感觉最强的一点就是 上下文情景一致性 并且叙事不只是根据现有场景无限续写 有主动引入新元素的能力 这是我遇到的第一个会这么做的模型
另一个惊艳的点就是文笔了,gemini3已经很少出现 石投湖 之类的奇怪八股文了,看文的体验真的好了很多
情节一致性和捡伏笔的能力很强,不过这个我到没有在别的模型上测试过(上次玩冒险类rp已经是gpt3.5时代了),gemini3对情节设计的把控非常到位 非常推荐玩冒险向文字游戏
当然… 最最最令人爽的一点是,卡掉CoT不仅能避免Gemini原生思维链过度思考导致注意力涣散从而影响上下文一致性,还能 大幅 提高输出速度,在控制100k上下文 平均每次500tokens输出的情况下 Gemini3能够以 100tks/s 首token延迟小于0.2s的速度 在5s左右完成一次交互(速度上能与之相比的就是Claude了,但是Claude 4.5o的模型我个人体感不如Gemini3),相比于关闭CoT前每次动辄思考二三十秒,体验上就是质的飞跃
关于调教:
之前看到有佬友测试角色设定容易崩 经过我个人测试 卡掉gemini的原生思维链才能达到我上面说的那样的非常强大的效果
关于如何卡掉思维链可见: 【思路分享】关闭gemini3的思维链
最近发现一种新的卡掉CoT的方法,你可以在支持设置消息模板的chat前端(比如rikkahub中)设置如下的消息模板
然后我们可以通过提示词引导Gemini按照我们定义的方式进行简短但有效的思考来提高输出质量
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 无水硫酸铜)
Invalid media:
image
image
gemini3玩rp的体验真的惊艳到我了 在剧情一致性 以及人物的性格方面比2.5p都是质的飞跃
这三天高强度体验下来(浅浅玩了十几Mtokens)感觉又找到了了第一次接触LLM roleplay的新鲜感
gemini3我感觉最强的一点就是 上下文情景一致性 并且叙事不只是根据现有场景无限续写 有主动引入新元素的能力 这是我遇到的第一个会这么做的模型
另一个惊艳的点就是文笔了,gemini3已经很少出现 石投湖 之类的奇怪八股文了,看文的体验真的好了很多
情节一致性和捡伏笔的能力很强,不过这个我到没有在别的模型上测试过(上次玩冒险类rp已经是gpt3.5时代了),gemini3对情节设计的把控非常到位 非常推荐玩冒险向文字游戏
当然… 最最最令人爽的一点是,卡掉CoT不仅能避免Gemini原生思维链过度思考导致注意力涣散从而影响上下文一致性,还能 大幅 提高输出速度,在控制100k上下文 平均每次500tokens输出的情况下 Gemini3能够以 100tks/s 首token延迟小于0.2s的速度 在5s左右完成一次交互(速度上能与之相比的就是Claude了,但是Claude 4.5o的模型我个人体感不如Gemini3),相比于关闭CoT前每次动辄思考二三十秒,体验上就是质的飞跃
关于调教:
之前看到有佬友测试角色设定容易崩 经过我个人测试 卡掉gemini的原生思维链才能达到我上面说的那样的非常强大的效果
关于如何卡掉思维链可见: 【思路分享】关闭gemini3的思维链
最近发现一种新的卡掉CoT的方法,你可以在支持设置消息模板的chat前端(比如rikkahub中)设置如下的消息模板
<think></think>{{ message }}然后我们可以通过提示词引导Gemini按照我们定义的方式进行简短但有效的思考来提高输出质量
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 无水硫酸铜)
Invalid media:
image
image
现在注册的dnshe 不能配置NS了吗?
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: sddxsm)
Invalid media: image
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: sddxsm)
Invalid media: image
十二月廿五日,熬夜补“练字作业”有感,信笔而出
写下这一段的时候时间为01点41分喵,本人还有三页没写完喵
天杀的喵,明天早上要检查喵
预计两点十几分才能睡觉喵
----------------------
正文
平安好圣诞,宽案灯火暗,
足寒腕僵字迹散,miku赛博伴。
太白歌行过,又誊诗圣作,
心焦气燥乱抄没,成效能何说?
----------------------
或许是渔家傲吧,但没注意什么平仄
补:查了一下,只有字数相同了,笑(
祝大家安眠喵
PS:补一个miku自习网页
Study With Miku
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: LaFanCYC)
写下这一段的时候时间为01点41分喵,本人还有三页没写完喵
天杀的喵,明天早上要检查喵
预计两点十几分才能睡觉喵
----------------------
正文
平安好圣诞,宽案灯火暗,
足寒腕僵字迹散,miku赛博伴。
太白歌行过,又誊诗圣作,
心焦气燥乱抄没,成效能何说?
----------------------
或许是渔家傲吧,但没注意什么平仄
补:查了一下,只有字数相同了,笑(
祝大家安眠喵
PS:补一个miku自习网页
Study With Miku
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: LaFanCYC)
转让一台 netcup
转移码:693ce0837ecf4b97a856c5e0468866b8
具体型号:RS 1000 G9.5 iv PRO NUE JUN25
AMD EPYC™ 7702
CPU cores: 4 dedicated
Main memory DDR4 ECC: 8 GB
Server location: Nuremberg, Germany
Hard disk:
320 GB SSD (instead of 160 GB)
6.25欧
4 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: Kank)
转移码:693ce0837ecf4b97a856c5e0468866b8
具体型号:RS 1000 G9.5 iv PRO NUE JUN25
AMD EPYC™ 7702
CPU cores: 4 dedicated
Main memory DDR4 ECC: 8 GB
Server location: Nuremberg, Germany
Hard disk:
320 GB SSD (instead of 160 GB)
6.25欧
4 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: Kank)
【大功能更新】LLM 轻量高性能智能答题服务
适用于OCS网课助手的LLM轻量高性能智能答题服务 开发调优
【功能征询】LLM教育平台智能答题服务 开发调优
增加了联网搜索和置信度评估的功能。
置信度评估参考了这篇论文。arXiv.org
Can LLMs Express Their Uncertainty? An Empirical Evaluation of Confidence...
Empowering large language models to accurately express confidence in their answers is essential for trustworthy decision-making. Previous confidence elicitation methods, which primarily rely on white-box access to internal model information or model...
可以看图, Self-Probing方式效果很明显。
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 黯绛)
Invalid media:
image
image
image
适用于OCS网课助手的LLM轻量高性能智能答题服务 开发调优
[17665386000344481933410315224902] 这个项目是佬友的一个项目的重新实现,对我来说原来佬友的实在太难用了日志没有debug没有,还有鲁棒性问题题目也不能导出,答案都经常无法正常获取,还没有开源于是自己花几小时做了个。 原项目:不打磨了,先开源再说!利好学生党!AI题库自动答题,支持公益站使用-狗库 不过还是感谢佬友开发这个项目。 才发现已经有了,不过我这…
【功能征询】LLM教育平台智能答题服务 开发调优
从适用于OCS网课助手的LLM轻量高性能智能答题服务 继续讨论 增加了一点小功能发布了 0.2版本 问一些大家还可以添加什么功能优化体验。 联网搜索怎么构建比较合适,能保持轻量化。 对于仪表盘这类有没有必要?
增加了联网搜索和置信度评估的功能。
置信度评估参考了这篇论文。arXiv.org
Can LLMs Express Their Uncertainty? An Empirical Evaluation of Confidence...
Empowering large language models to accurately express confidence in their answers is essential for trustworthy decision-making. Previous confidence elicitation methods, which primarily rely on white-box access to internal model information or model...
可以看图, Self-Probing方式效果很明显。
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 黯绛)
Invalid media:
image
image
image
顶部tab最新去哪了
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: Que2333)
Invalid media: image
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: Que2333)
Invalid media: image
手机浏览器登录L站问题
在手机端safari浏览器和google浏览器登录L站,一直在加载登录图标,点击没有反应是什么原因?提示用google账号登录页不行,在电脑端浏览器登录是正常的。
7 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: root-tm)
Invalid media: image
在手机端safari浏览器和google浏览器登录L站,一直在加载登录图标,点击没有反应是什么原因?提示用google账号登录页不行,在电脑端浏览器登录是正常的。
7 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: root-tm)
Invalid media: image
洛天依又又又上cctv了
[朝闻天下]我国虚拟数字人领域首个国家标准正式发布
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 多玩幻灵qwq)
Invalid media: image
[朝闻天下]我国虚拟数字人领域首个国家标准正式发布
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 多玩幻灵qwq)
Invalid media: image
PTT站在马年元旦开放注册1天(需答题),需要注册邀请码
届时需要的佬友可以蹲蹲
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: NEFF)
届时需要的佬友可以蹲蹲
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: NEFF)
大晚上的内存条寄了,难受啊
在床上用平板串流玩着游戏,突然发现连不上了,机箱亮着屏幕灰屏,本来以为重启一下就好了,结果win11每次重启都报不同的错,猜测内存问题,进BIOS关expo,依然进不去win11。还好有个Ubuntu的移动硬盘,进去装了个memtester,28G直接卡死,换成4G一开始就各种报错,于是确定是内存问题了。
然后拆开机箱,拔下内存条擦擦,互换了下位置,这下能进win11了,运行Windows的memtester,一秒后直接系统报错……再进Ubuntu,这下4G跑了挺久,换成16G中间在block sequential卡住。
试着开expo,直接Ubuntu和Windows都进不去……
内存是五月东子那买的光威龙武弈,459买的现在点进去看要两千……希望东哥能痛快点给我售后
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 宫野志保)
在床上用平板串流玩着游戏,突然发现连不上了,机箱亮着屏幕灰屏,本来以为重启一下就好了,结果win11每次重启都报不同的错,猜测内存问题,进BIOS关expo,依然进不去win11。还好有个Ubuntu的移动硬盘,进去装了个memtester,28G直接卡死,换成4G一开始就各种报错,于是确定是内存问题了。
然后拆开机箱,拔下内存条擦擦,互换了下位置,这下能进win11了,运行Windows的memtester,一秒后直接系统报错……再进Ubuntu,这下4G跑了挺久,换成16G中间在block sequential卡住。
试着开expo,直接Ubuntu和Windows都进不去……
内存是五月东子那买的光威龙武弈,459买的现在点进去看要两千……希望东哥能痛快点给我售后
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 宫野志保)
【Agent开发】搭建与开发略懂帖
简述
“搭建(Building)”与“开发(Developing)”AI Agent,实则指向了两种截然不同但又互为补充的技术路径与工程范式。
搭建”更多指向基于 Coze 、Dify 等低代码平台的业务逻辑编排与产品化落地,强调对模型能力的理解与工作流(Workflow)的设计;而“开发”则指基于 LangChain 、LangGraph 等代码框架进行的底层工程构建,涉及状态管理、工具链集成及复杂推理回路的实现。两者虽有交集,但在技术栈深度、交付目标及架构上完全不同。
搭建
一、低代码编排与业务侧落地
1. 岗位
关键词:Dify、Prompt、SOP、AIOps
不要求从零编写复杂的底层代码,而是依托于成熟的LLM Ops平台。依赖平台,通过平台提供的可视化画布,可以通过拖拽来定义agent的工作chain。
核心能力是将业务逻辑转化为DAG(面试高端用词),例如一个客服Agent可以转化为:“用户意图识别 → 知识库检索 → 答案生成 → 满意度评估” 的节点流程。其中可以涉及stt、RAG检索、LLM、API调用(tools)等等,当然这些都是有现成的SDK或者框架提供,无需注意技术实现用就可以了。
逃不掉的一个就是RAG配置,注意这里是配置而不是优化(检索算法),更多的工作室:上传文档、选择分块策略、调整检索阈值。
2. 画像
AI架构师、AI产品经理,核心是业务理解、模型调优(非微调、训练),关注的是问题解决率(效率、成功率、失败率),体感响应延迟,幻觉率(关键词触发:上下文相关性、忠诚度、答案相关性),RAGAS。这里的一些名词若有不懂可以配合AI学习,我就不展开了。
开发
岗位
关键词: Python、LangChain、FastAPI、VectorDB、Docker等等
● 顾名思义直接操作代码来控制LLM行为,构建自定义运行环境。LangChain应该属于霸主地位了,有些岗位要求有开发经验甚至阅读源码,深入理解框架源码。
● Custom Tools(自定义工具),这个可以类比cc里面的内置工具,例如编写一个查询企业私有SQL数据库并进行数据清洗的Tool(langchain sql agent二开)。
● 状态管理,需要自行设计长短期记忆(Memory),解决多轮对话中的上下文问题。
● 部署与运维,涉及将Agent封装为微服务,要处理三高问题,要掌握容器化技术。企业平台研发、架构分析,垂直类Agent商业化应用落地。
● RAG优化,非结构化数据解析处理、向量化、检索算法优化
高阶
熟悉Transformer架构、主流大模型技术栈、LLM微调、推理优化、多智体系统和通讯协议。不仅能开发功能,还能定位agent能力、llm能力的不足之处,提供改进意见,提供改进数据集。例如:
web agent方向:需要全栈能力是必须的,爬虫技术这这里有很大的用处。
code agent方向: 程序语言语法、代码结构分析、自动化代码生成(掌握语言越多越好,掌握编译原理),这个能力一般干过插桩技术、编译器能力都是顶级满足的。
LangChain 与 类OpenHands 区别
LangChain
组合
LangChain不仅仅是一个库,他是开发的胶水层和标准库。它的核心价值在于抽象,把llm开发拆分成了几个模块,使得开发者通过组合的方式构建复杂系统。
Chain:定义最基础的线性逻辑,例如RetrievalQAChain封装了“检索文档 → 拼接 Prompt → 询问 LLM”的全过程,掌握预置Chain是必须的。
Agents:上面我提过langchain的sql agent,当然还有其他多种Agent,你可以把这些agent作为subagent来理解。
Memory:多轮对话的核心,开发者需要根据自己的业务选择将记忆存储在什么地方。
Tools:这个我们都很熟悉,他是agent的手,langchain定义了Tool的标准接口,你可以把任何可以调用的方式都写成tool来实现功能拓展。
LangGraph
解决langchain调试困难,逻辑黑盒问题,状态管理问题。推出了langGraph。想要构建长周期任务、有容错能力,而不是简单的问答机器人,大部分技术开始转向LangGraph。
类OpenHands(OpenDevin)
PC使用能力
特征:CLI First、系统权限、工具链、权限模型
我们的体感就是这类agent直接跑在我们电脑中,有各种权限、技能、工具,可以作为助手角色来辅助你解决一些pc上的事务。例如写代码、整理文件。
特点
● 定位 :开源的 AI 软件工程师(应用/平台)。
● 类比 :它是一个已经造好的、全副武装的机器人 ,你只要对它说“把这面墙刷白”,它自己就会去拿工具干活。
● 作用 :它是一个完整的产品 。它不仅包含 Agent(大脑),还包含了一个沙箱环境(电脑系统) ,它能真的打开终端运行 ls -la,能真的打开 VS Code 编辑文件,能真的打开浏览器查 StackOverflow。
● 特点 :开箱即用,面向最终用户或开发者辅助,而不是用来开发的库。
总结
LangChain是基建,定位底层开发框架,它提供了构建 LLM 应用的基本组件,通用性极强,你想造个狗窝还是摩天大楼(Agent)都可以用它,但它本身不是agent,需要你去搭建。
OpenHands是造好的开箱即用Agent,专注于编程特定领域。
是否可以利用LangChain来实现一个OpenDevin? 可以,实际上OpenDevin核心逻辑就是由类似 LangChain 这样的“胶水层”和 Agent 逻辑组成的。
MCP与沙箱
支撑 Agent 运行的新兴基础设施。这部分内容是区分初级开发者与高级架构师的分水岭。
传统方式 vs MCP
传统 LangChain 开发: 如果你要让 Agent 访问 Google Drive,你需要去 LangChain 的库里找
MCP 方式: 开发者编写一个符合 MCP 标准的 MCP Server(例如一个连接 Postgres 的 Server)。任何支持 MCP 的 Client(如 Claude Code)都可以直接连接这个 Server,自动获取工具定义和资源接口。
所以现在出现了一些岗位是MCP开发,已经从agent开发出来了一个新的分支。
安全沙箱
Agent运行时环境,可以利用Docker容器化、Firecracker 微虚机。总之agent开发职位中也是常有提及的一个技能,同时这个部分在agent评测里面也会再次提到,这里就埋下一个坑位到那边再讲。
场景
企业内部知识问答
偏向于搭建,利用dify + 钉钉/飞书 (目前这种落地场景很多)。业务逻辑清晰,无复杂推理,核心在于知识库的质量。
自动化采购
LangChain + Python + Crawler + ERP API,涉及多轮决策,需要精确控制流程状态,且需要深度集成内部老旧系统。
这里可能还会有CI、CD提效,DevOps等等的集成需求。
辅助研发、提效
claude code(同类开源or自研or二开)+ 私有化模型(api)+ MCP,这里的二开有很多是基于vscode,举例说明cline,antigravity都是一样的表现形式不一样。私有化模型开源llm例如qwen 235b。api就简单了去买就好了(这里有涉及一个pii脱敏的问题,防止内部代码外泄)。
未来
搭建的门槛将进一步降低,因为llm能力越来越强,把一些通过langchain硬编码的逻辑,被llm的CoT取代了。
开发将继续下沉到基础设施,评测工程师目前开始出现岗位,负责构建自动化测试集,评估agent,为dpo、sft提供专业帮助。Mcp工程师刚刚已经提到。优化工程师优化推理速度,优化资源调度,优化算法等等。
先讲到这里吧,感觉把搭建和开发讲清楚,拿岗位来描述职责,以及提到搭建和开发可能接触到的技术栈,应该扫盲了。
下一篇我们来讲Agent评测的扫盲内容,从不同的测试集讲起,以及目前的一些跑分好为什么就是不好用现象的简单解析。
33 posts - 25 participants
Read full topic
via LINUX DO - 热门话题 (author: beingS)
Invalid media: image
简述
“搭建(Building)”与“开发(Developing)”AI Agent,实则指向了两种截然不同但又互为补充的技术路径与工程范式。
搭建”更多指向基于 Coze 、Dify 等低代码平台的业务逻辑编排与产品化落地,强调对模型能力的理解与工作流(Workflow)的设计;而“开发”则指基于 LangChain 、LangGraph 等代码框架进行的底层工程构建,涉及状态管理、工具链集成及复杂推理回路的实现。两者虽有交集,但在技术栈深度、交付目标及架构上完全不同。
搭建
一、低代码编排与业务侧落地
1. 岗位
关键词:Dify、Prompt、SOP、AIOps
不要求从零编写复杂的底层代码,而是依托于成熟的LLM Ops平台。依赖平台,通过平台提供的可视化画布,可以通过拖拽来定义agent的工作chain。
核心能力是将业务逻辑转化为DAG(面试高端用词),例如一个客服Agent可以转化为:“用户意图识别 → 知识库检索 → 答案生成 → 满意度评估” 的节点流程。其中可以涉及stt、RAG检索、LLM、API调用(tools)等等,当然这些都是有现成的SDK或者框架提供,无需注意技术实现用就可以了。
逃不掉的一个就是RAG配置,注意这里是配置而不是优化(检索算法),更多的工作室:上传文档、选择分块策略、调整检索阈值。
2. 画像
AI架构师、AI产品经理,核心是业务理解、模型调优(非微调、训练),关注的是问题解决率(效率、成功率、失败率),体感响应延迟,幻觉率(关键词触发:上下文相关性、忠诚度、答案相关性),RAGAS。这里的一些名词若有不懂可以配合AI学习,我就不展开了。
开发
岗位
关键词: Python、LangChain、FastAPI、VectorDB、Docker等等
● 顾名思义直接操作代码来控制LLM行为,构建自定义运行环境。LangChain应该属于霸主地位了,有些岗位要求有开发经验甚至阅读源码,深入理解框架源码。
● Custom Tools(自定义工具),这个可以类比cc里面的内置工具,例如编写一个查询企业私有SQL数据库并进行数据清洗的Tool(langchain sql agent二开)。
● 状态管理,需要自行设计长短期记忆(Memory),解决多轮对话中的上下文问题。
● 部署与运维,涉及将Agent封装为微服务,要处理三高问题,要掌握容器化技术。企业平台研发、架构分析,垂直类Agent商业化应用落地。
● RAG优化,非结构化数据解析处理、向量化、检索算法优化
高阶
熟悉Transformer架构、主流大模型技术栈、LLM微调、推理优化、多智体系统和通讯协议。不仅能开发功能,还能定位agent能力、llm能力的不足之处,提供改进意见,提供改进数据集。例如:
web agent方向:需要全栈能力是必须的,爬虫技术这这里有很大的用处。
code agent方向: 程序语言语法、代码结构分析、自动化代码生成(掌握语言越多越好,掌握编译原理),这个能力一般干过插桩技术、编译器能力都是顶级满足的。
LangChain 与 类OpenHands 区别
LangChain
组合
LangChain不仅仅是一个库,他是开发的胶水层和标准库。它的核心价值在于抽象,把llm开发拆分成了几个模块,使得开发者通过组合的方式构建复杂系统。
Chain:定义最基础的线性逻辑,例如RetrievalQAChain封装了“检索文档 → 拼接 Prompt → 询问 LLM”的全过程,掌握预置Chain是必须的。
Agents:上面我提过langchain的sql agent,当然还有其他多种Agent,你可以把这些agent作为subagent来理解。
Memory:多轮对话的核心,开发者需要根据自己的业务选择将记忆存储在什么地方。
Tools:这个我们都很熟悉,他是agent的手,langchain定义了Tool的标准接口,你可以把任何可以调用的方式都写成tool来实现功能拓展。
LangGraph
解决langchain调试困难,逻辑黑盒问题,状态管理问题。推出了langGraph。想要构建长周期任务、有容错能力,而不是简单的问答机器人,大部分技术开始转向LangGraph。
类OpenHands(OpenDevin)
PC使用能力
特征:CLI First、系统权限、工具链、权限模型
我们的体感就是这类agent直接跑在我们电脑中,有各种权限、技能、工具,可以作为助手角色来辅助你解决一些pc上的事务。例如写代码、整理文件。
特点
● 定位 :开源的 AI 软件工程师(应用/平台)。
● 类比 :它是一个已经造好的、全副武装的机器人 ,你只要对它说“把这面墙刷白”,它自己就会去拿工具干活。
● 作用 :它是一个完整的产品 。它不仅包含 Agent(大脑),还包含了一个沙箱环境(电脑系统) ,它能真的打开终端运行 ls -la,能真的打开 VS Code 编辑文件,能真的打开浏览器查 StackOverflow。
● 特点 :开箱即用,面向最终用户或开发者辅助,而不是用来开发的库。
总结
LangChain是基建,定位底层开发框架,它提供了构建 LLM 应用的基本组件,通用性极强,你想造个狗窝还是摩天大楼(Agent)都可以用它,但它本身不是agent,需要你去搭建。
OpenHands是造好的开箱即用Agent,专注于编程特定领域。
是否可以利用LangChain来实现一个OpenDevin? 可以,实际上OpenDevin核心逻辑就是由类似 LangChain 这样的“胶水层”和 Agent 逻辑组成的。
MCP与沙箱
支撑 Agent 运行的新兴基础设施。这部分内容是区分初级开发者与高级架构师的分水岭。
传统方式 vs MCP
传统 LangChain 开发: 如果你要让 Agent 访问 Google Drive,你需要去 LangChain 的库里找
GoogleDriveRetriever,或者自己写 API 封装。每接一个新服务,就要写一遍适配代码。MCP 方式: 开发者编写一个符合 MCP 标准的 MCP Server(例如一个连接 Postgres 的 Server)。任何支持 MCP 的 Client(如 Claude Code)都可以直接连接这个 Server,自动获取工具定义和资源接口。
所以现在出现了一些岗位是MCP开发,已经从agent开发出来了一个新的分支。
安全沙箱
Agent运行时环境,可以利用Docker容器化、Firecracker 微虚机。总之agent开发职位中也是常有提及的一个技能,同时这个部分在agent评测里面也会再次提到,这里就埋下一个坑位到那边再讲。
场景
企业内部知识问答
偏向于搭建,利用dify + 钉钉/飞书 (目前这种落地场景很多)。业务逻辑清晰,无复杂推理,核心在于知识库的质量。
自动化采购
LangChain + Python + Crawler + ERP API,涉及多轮决策,需要精确控制流程状态,且需要深度集成内部老旧系统。
这里可能还会有CI、CD提效,DevOps等等的集成需求。
辅助研发、提效
claude code(同类开源or自研or二开)+ 私有化模型(api)+ MCP,这里的二开有很多是基于vscode,举例说明cline,antigravity都是一样的表现形式不一样。私有化模型开源llm例如qwen 235b。api就简单了去买就好了(这里有涉及一个pii脱敏的问题,防止内部代码外泄)。
未来
搭建的门槛将进一步降低,因为llm能力越来越强,把一些通过langchain硬编码的逻辑,被llm的CoT取代了。
开发将继续下沉到基础设施,评测工程师目前开始出现岗位,负责构建自动化测试集,评估agent,为dpo、sft提供专业帮助。Mcp工程师刚刚已经提到。优化工程师优化推理速度,优化资源调度,优化算法等等。
先讲到这里吧,感觉把搭建和开发讲清楚,拿岗位来描述职责,以及提到搭建和开发可能接触到的技术栈,应该扫盲了。
下一篇我们来讲Agent评测的扫盲内容,从不同的测试集讲起,以及目前的一些跑分好为什么就是不好用现象的简单解析。
33 posts - 25 participants
Read full topic
via LINUX DO - 热门话题 (author: beingS)
Invalid media: image
小地方结婚早原来这么普遍
回老家发现很多同龄人娃都比我高了🥲还碰到几个三十多岁就当爷爷奶奶的,简直比大城市的同龄人要领先十多年
131 posts - 119 participants
Read full topic
via LINUX DO - 热门话题 (author: bb_aa)
回老家发现很多同龄人娃都比我高了🥲还碰到几个三十多岁就当爷爷奶奶的,简直比大城市的同龄人要领先十多年
131 posts - 119 participants
Read full topic
via LINUX DO - 热门话题 (author: bb_aa)
公益站看过来 造一个轮子 newapi-tool
公益站佬们,还有哪些要添加的功能吗
因为自己开放公益站数据库端口被敲诈勒索了 3次 😭
很早就想早这个轮子
github.com
GitHub - james-6-23/new_api_tools
通过在 GitHub 上创建帐户来为 james-6-23/new_api_tools 开发做出贡献。
超级简单一键部署脚本
脚本自动检测newapi安装目录和 newapi网络
需要部署newapi
兼容pgsql和mysql spoiler
60 posts - 53 participants
Read full topic
via LINUX DO - 热门话题 (author: 不过减速带)
Invalid media:
image
image
image
image
image
公益站佬们,还有哪些要添加的功能吗
因为自己开放公益站数据库端口被敲诈勒索了 3次 😭
很早就想早这个轮子
github.com
GitHub - james-6-23/new_api_tools
通过在 GitHub 上创建帐户来为 james-6-23/new_api_tools 开发做出贡献。
超级简单一键部署脚本
bash <(curl -sSL https://raw.githubusercontent.com/james-6-23/new_api_tools/main/install.sh)
脚本自动检测newapi安装目录和 newapi网络
需要部署newapi
兼容pgsql和mysql spoiler
60 posts - 53 participants
Read full topic
via LINUX DO - 热门话题 (author: 不过减速带)
Invalid media:
image
image
image
image
image
Antigravity Opus 遇到错误曲线救国的办法
在 Antigravy 里用 opus 聊需求,聊的嗨,最后要落地的时候就经常遇到如下异常:
无数次重试都没有效果。这时候就需要曲线救国了。
两个步骤:
1. opus 下,让他输出所有操作,不要执行操作。
参考提示词:
2. 切换到 gemini 模型,执行变更,并提示不要做其他操作,因为gemini真的很喜欢写代码
参考提示词:
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: ShakaRover)
在 Antigravy 里用 opus 聊需求,聊的嗨,最后要落地的时候就经常遇到如下异常:
Agent execution terminated due to error.
无数次重试都没有效果。这时候就需要曲线救国了。
两个步骤:
1. opus 下,让他输出所有操作,不要执行操作。
参考提示词:
你把你要做的内容全部展示给我,先不改文件2. 切换到 gemini 模型,执行变更,并提示不要做其他操作,因为gemini真的很喜欢写代码
参考提示词:
现在按你说的修改文件,不做其他操作2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: ShakaRover)
Alist vs Openlist
user story:
● 管理员可以挂载多个网盘账号/目录
● 访客可以下载/上传网盘文件
● 访客可以在线阅读/播放网盘文件
● 支持302(只使用百度云和夸克云),不想占用太多服务器流量/内存
需求是这些,目前在纠结使用alist还是openlist
两者优点是都能满足需求
alist缺点是疑似投毒+商业化前科
openlist缺点是为爱发电、能力有限
两者共同缺点是,都有还没解决的内存泄露问题
想听一下佬友们的意见
Click to view the poll.
7 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: kvchiu)
user story:
● 管理员可以挂载多个网盘账号/目录
● 访客可以下载/上传网盘文件
● 访客可以在线阅读/播放网盘文件
● 支持302(只使用百度云和夸克云),不想占用太多服务器流量/内存
需求是这些,目前在纠结使用alist还是openlist
两者优点是都能满足需求
alist缺点是疑似投毒+商业化前科
openlist缺点是为爱发电、能力有限
两者共同缺点是,都有还没解决的内存泄露问题
想听一下佬友们的意见
Click to view the poll.
7 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: kvchiu)
佬友们,我这开着窗户,是不是大半夜进脏东西了啊!
莫名其妙Ipad笔失灵了,然后搞半天没搞好,突然几个显示器就连接异常,开始跳屏。大晚上开着窗户,是不是飞进来什么脏东西!有佬友,帮我算算看吗!
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: HollowKnight)
莫名其妙Ipad笔失灵了,然后搞半天没搞好,突然几个显示器就连接异常,开始跳屏。大晚上开着窗户,是不是飞进来什么脏东西!有佬友,帮我算算看吗!
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: HollowKnight)