看新闻忽然注意到量子技术已经是高附加值产业了
我对量子的认知还停留在实验室理论和炒概念的阶段。搜索了一下相关的产业链,有点不真实的感觉,普通人什么时候能用上呢
7 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: loldoe3)
我对量子的认知还停留在实验室理论和炒概念的阶段。搜索了一下相关的产业链,有点不真实的感觉,普通人什么时候能用上呢
7 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: loldoe3)
爱情就跟小时候过家家一样,她当妈妈,他当爸爸…他当狗,他当狗,他当狗 :tieba_025:
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 夏天爱吃菠萝大西瓜🍉)
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 夏天爱吃菠萝大西瓜🍉)
Clash Verge Mac版本开规则模式很卡,全局模式流畅,怎么解决
关闭TUN也没用
最近出现的问题
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: Mozi)
关闭TUN也没用
最近出现的问题
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: Mozi)
终于把论文草稿交了,可以学go咯,求学go和实习意见
如题终于把那篇从大二开始做的文章草稿写好给导师了,从四页到十二页,真的实验做到想死了。这周就是等老大改文章,远程操控我了。
终于可以开始全力学习go语言为寒假实习做准备了,各位佬友有关于学go的意见不,我现在还在 00 开篇词 这样入门Go,才能少走弯路这个网站里面的go语言36讲,应该这两周可以看完这三十六讲。我准备同步开始hot100的训练,之前是用python做的。后面我打算复现一个GitHub - marmotedu/iam: 企业级的 Go 语言实战项目:认证和授权系统(带配套课程) 这个项目作为我的项目,可以填充一下我的简历。哇哈哈哈哈哈终于把草稿交上去了。 😆 😁 😆
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 赵子龙)
如题终于把那篇从大二开始做的文章草稿写好给导师了,从四页到十二页,真的实验做到想死了。这周就是等老大改文章,远程操控我了。
终于可以开始全力学习go语言为寒假实习做准备了,各位佬友有关于学go的意见不,我现在还在 00 开篇词 这样入门Go,才能少走弯路这个网站里面的go语言36讲,应该这两周可以看完这三十六讲。我准备同步开始hot100的训练,之前是用python做的。后面我打算复现一个GitHub - marmotedu/iam: 企业级的 Go 语言实战项目:认证和授权系统(带配套课程) 这个项目作为我的项目,可以填充一下我的简历。哇哈哈哈哈哈终于把草稿交上去了。 😆 😁 😆
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 赵子龙)
逃离鸭科夫-纯外挂选手申请出战
全是科技与狠活,感谢Mod和风灵月影。
生活已经够苦了,在游戏里就不能再苦了。
唯一死的一次是新手刚入零号区遇见Boss
随后发奋图强,积极寻找外挂和Mod终成外挂大神
装备起来就关了,然后就开始虐菜。
小游戏虽说有点单调但是很上头。
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 八嘎小天皇)
Invalid media: image
全是科技与狠活,感谢Mod和风灵月影。
生活已经够苦了,在游戏里就不能再苦了。
唯一死的一次是新手刚入零号区遇见Boss
随后发奋图强,积极寻找外挂和Mod终成外挂大神
装备起来就关了,然后就开始虐菜。
小游戏虽说有点单调但是很上头。
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 八嘎小天皇)
Invalid media: image
有没有大佬帮忙解决vscode的codex插件问题。
windows下 vscode 里的codex插件在创建会话时报如下错误:
[error] Error creating local task: Error: Timeout
PS:和git 、bash无关,都已验证过了。
在已有的会话打开继续是没问题的。
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Winge)
windows下 vscode 里的codex插件在创建会话时报如下错误:
[error] Error creating local task: Error: Timeout
PS:和git 、bash无关,都已验证过了。
在已有的会话打开继续是没问题的。
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Winge)
太搞了linus人格
太搞了这个linus人格😁linuxdo佬推荐的好啊
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: user2500)
Invalid media: image
太搞了这个linus人格😁linuxdo佬推荐的好啊
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: user2500)
Invalid media: image
😁1
记一次谷歌账号起死复生
Read full topic
via LINUX DO - 最新话题 (author: 肖深刻的九叔)
Invalid media:
image
image
image
image
[!failure] 被风控
应该是之前创建了一个droid的抽奖,关联了这个gmail账号,抽奖结束第二天就触发了风控
[!warning] 机会
大善人给了申诉的机会,我此前给这个账号开了四种不同的验证登录方式,让chatGPT写了一封声情并茂的申诉邮件,
[!success] 恢复
发过去等了一天,收到了大善人的回复,账号restored
[!example] 插曲
点击上面的ASAP,验证登录的时候,注册账号用的+86手机收不到码,重复尝试了几次又被风控了,冷却了24小时后,今天下午尝试了下,终于接到验证码,成功恢复了账号。
[!quote] 供佬友参考8 posts - 5 participants
这个号不是机器人注册的,我手动在claude.ai页面下注册的,当时用+86号码接的码,注册后立马注册了droid,其他啥服务都没注册过,唯一触发风控的可能就是这个环节了,抽奖不应该抽账号,而应该是api key,这样关联的邮箱被风控的可能性就比较小了。
Read full topic
via LINUX DO - 最新话题 (author: 肖深刻的九叔)
Invalid media:
image
image
image
image
征集 KISS Translator 的 LOGO/截图/宣传图设计
开源项目 简约翻译 KISS Translator 征集以下设计资源:
LOGO:
● 主色:#209CEE
● 像素16、32、48、128、192、300px,PNG和SVG格式
● 彩色/灰色/单色/反色
宣传视频:
● 中文/英文/全球通用
● YouTube 视频网址
屏幕截图:
● 6 张 1280x800 或 640x400 JPEG 或 24 位 PNG(无 alpha 透明层)
● 中文/英文/全球通用
小型宣传图块:
● 440x280 画布 JPEG 或 24 位 PNG(无 alpha 透明层)
顶部宣传图块:
● 1400x560 画布 JPEG 或 24 位 PNG(无 alpha 透明层)
有兴趣欢迎提供建议、提交作品: 征集优化LOGO/截图/宣传图设计 · Issue #352 · fishjar/kiss-translator · GitHub
Read full topic
via LINUX DO - 最新话题 (author: Gabe)
开源项目 简约翻译 KISS Translator 征集以下设计资源:
LOGO:
● 主色:#209CEE
● 像素16、32、48、128、192、300px,PNG和SVG格式
● 彩色/灰色/单色/反色
宣传视频:
● 中文/英文/全球通用
● YouTube 视频网址
屏幕截图:
● 6 张 1280x800 或 640x400 JPEG 或 24 位 PNG(无 alpha 透明层)
● 中文/英文/全球通用
小型宣传图块:
● 440x280 画布 JPEG 或 24 位 PNG(无 alpha 透明层)
顶部宣传图块:
● 1400x560 画布 JPEG 或 24 位 PNG(无 alpha 透明层)
有兴趣欢迎提供建议、提交作品: 征集优化LOGO/截图/宣传图设计 · Issue #352 · fishjar/kiss-translator · GitHub
注:没有报酬,自由发挥1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Gabe)
【𝓼𝓾𝓭𝓪】签署了一份协议,望佬友们监督(周一中午-晚上)
和女朋友签署的协议,不知道她明天会不会遵守嘞 :bili_040:
Click to view the poll.
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 别名小𝓼𝓾𝓭𝓪)
Invalid media: image
和女朋友签署的协议,不知道她明天会不会遵守嘞 :bili_040:
Click to view the poll.
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 别名小𝓼𝓾𝓭𝓪)
Invalid media: image
人生第一个属于自己的luoli域名
该部署点啥好呢QAQ
5 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: 郑超舰)
Invalid media: image
该部署点啥好呢QAQ
5 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: 郑超舰)
Invalid media: image
免费的GLM
24号白嫖了智普的GLM,因为自己用不上。就共享出来了
地址:
https://api.282626.xyz {CloudFlare}
https://eo.282626.xyz {腾讯云Eo}
https://esa.282626.xyz {阿里云ESA}
21 posts - 8 participants
Read full topic
via LINUX DO - 热门话题 (author: chuyu5762)
Invalid media:
image
image
24号白嫖了智普的GLM,因为自己用不上。就共享出来了
地址:
https://api.282626.xyz {CloudFlare}
https://eo.282626.xyz {腾讯云Eo}
https://esa.282626.xyz {阿里云ESA}
21 posts - 8 participants
Read full topic
via LINUX DO - 热门话题 (author: chuyu5762)
Invalid media:
image
image
一直有朋友来问 CE 和 RAG 的区别,我这边举个例子简单说一下
RAG 是实现 CE 的手段之一
context engineering,简称 CE,指的就是使用各种各样的方法来为大模型或者 agent 系统注入额外的上下文,从而实现你的业务场景。
比如你要做一个公司的财务系统 agent,大模型肯定不知道你家的各类信息呀,那么这个时候就需要注入额外的专业信息或者私密信息来让 agent 做出“只有知道这些私有信息才能做到的事情”。系统化地、优雅地、健全地实现这样一套“额外信息”/“上下文”注入的大模型组件,就叫做 CE。
所以显然,RAG 是实现 CE 的手段之一,这两玩意儿属于包含关系,CE 包含了 RAG,都是应对大模型不能了解场景专属信息,设计出的外挂组件。那么为什么最近又开始强调起了 CE,而非过去的 RAG 了呢?很简单,因为在很多专业场景中,大家发现 RAG 非常不好用,所以开始寻找一些其他的方法来实现上下文注入,这些方法的系统讨论,在过去半年被我们慢慢总结为 “CE”。
CE 技术最为典型的代表场景就是 AI Coding,而这个场景中,使用 CE 最为出色的代表就是 claude code。
RAG 为啥难用
RAG 的难用是一线工程师们有目共睹的。使用 RAG 有一个非常典型的场景,那就是专业领域的AI咨询,在 The RAG Obituary: Killed by Agents, Buried by Context Windows 中,金融 AI 平台 Fintool 的架构师 Nicolas 举了几个他在开发 fintool 时,采用 RAG 遇到了的坑。
1. 上下文碎片化(Context Fragmentation):存入向量数据库的 chunk 往往是被分割开来的,但是真实查询一个问题对应的原文信息,可能横跨了连续的20页文档(真实案例),rag 的切分破坏了信息的连续,即便很多 rag 切分策略(比如 langchain 内置的 repeat 参数)可以让切分块直接存在重叠,但是仍然无法从根本上解决这个问题。
2. 语义搜索对数字失效(Semantic Search Fails on Numbers):"45.2M 美元"和"45,200,000 美元"的嵌入向量完全不同;“收入增加了 10%”和“收入增加了十成”的嵌入向量也不同;表格中的数字无法有效提取它对应行头和列头的说明文字组合成有效的信息。这些都严重影响了查询结果的召回率。
3. **缺乏因果理解(No Causal Understanding):**图表,表格,公式,段落,往往会在别的文档中被引用,从而扩充本段的逻辑和信息,且这种引用是递归的,RAG 的算法无法挖掘这种文档内部的因果关系,从而导致搜到的有效信息变少很多。
4. **术语不匹配问题(The Vocabulary Mismatch Problem):**专业术语在语义空间训练得很差,且不同公司对相同概念使用不同术语,导致没有在私有数据集充分训练的 RAG 表现很差。可能出现相似术语离得很远,不同术语靠得很近,从而让查询结果出现概念性错误。
5. **时间盲区(Temporal Blindness):**无法可靠区分2024年Q3和2023年Q3的数据,经常混淆当期与前期对比。本质上是因为特定领域的某些因素的搜索权重并没有同步到 RAG 中。没有专业领域知识也无法事先将这些权重设计到 RAG 中。
这些令人感到恶心的点,也开始让我们不得不回到起点,去思考一切的起点,不能为了 rag 而 rag,我们最初做 rag 是为了什么?
我们当初为什么要做 rag?
对,是为了把垂类知识(domain specific knowledge)塞入大模型,从而让大模型或基于大模型的应用能解答私有领域知识的。
那为什么要用 rag 呢?
因为大模型处理文本就会先进行嵌入,把句子转化成向量组,而 word2vec 实验让 nlp 领域慢慢形成了,嵌入空间能够反映一定的语义相关性,我们只是复用了这套逻辑,将大模型的“前端”构造成了一个搜索器,这就是 rag 的由来。
但是随着我们对大模型在具体执行任务上能力和相关落地技术的探索,也就是 agent,我们开始思考一个根本问题——既然大模型的各项能力都是和人类对齐的,那么我们是不是应该使用人也能使用的工具来增强大模型了解垂类数据的能力?
CE:让大模型像人一样,用工具搜索答案
想象一个场景:一个中科大毕业的高材生,进入了一家新能源公司从事能源技术的研发,他了解内部文档的方法是通过向量嵌入和语义空间的最近邻吗?显然不是。那么依靠的是什么呢?大部分是系统自己的搜索引擎,少部分是他对能源技术本身的理解以及和同事的交流。根据计算机的二八定律,职业工程师只看主要矛盾,那么我们是否也应该让大模型通过我们提供好的内部文档的搜索引擎,让它自己来用这个搜索引擎不断搜索,接受反馈,执行剩下来的任务,也就是我在 锦恢的 AI Agent 小白教程(一)Agent 的基本概念与分类 中提到 Agent Loop:
答案是不确定的,所以我们和许多同行在上半年进行了大量的实验。我们惊喜地看到在几个应用上,这项技术被证明可行了,最典型的例子就是 claude code,claude code 的 Coding Agent 在根据我们的需求写代码时,就并不依靠向量数据库来了解和需求文本语义最靠近的代码片段,而是像一个程序员一样,通过查看当前项目的文件结构,全字匹配,正则表达式等等现成工具来“搜出”领域的上下文,从而完美完成代码工作。
显然,这套逻辑并不简单,它是一个工程任务,而这个任务的最终产物是塞入大模型 messages 数组的上下文,所以我们把这个工程大任务称为 context engineering,而在后续的文字中,虽然 rag 本质是 ce 的一个部分,但是显然这套方法论和 rag 是不一样的,所以为了更好区分,我们一般把给大模型提供额外工具“像人一样去专业领域搜索信息”的系统技术称为 agentic 或者干脆就叫 ce。
当我们不加上下文地说我们的这套系统是 ce 地实现的时候,默认我们就没有使用 e2e 的 rag。
为什么 CE 在 AI Coding 这个任务能成功
虽然我信奉奥卡姆剃刀,但是奥卡姆剃刀的哲学并非教我们踩一捧一,我这篇文章也不是来宣判 RAG 的死刑的,任何技术都需要具体情况具体分析,这才能体现工程师的专业感。
为什么相比于 rag,ce 可以更好在 Coding 这个任务成功?很简单,因为一个代码项目中,符合特定字段的条目 90% 的情况下都不会太多,比如你在 vscode 里面全局搜索 “realm”(一种特殊的嵌入式数据库),再大的项目搜到的结果一般也不会超过100条,比如下面是我开发的 Lagrange.onebot 的搜索结果。这些上下文对于大模型来说一点也不大。
如果结果太多,我们会勾选右侧的“区分大小写”或者“全字匹配模式”,或者干脆使用正则表达式。我敢打包票,我写过这么多项目,这个经验大部分情况都适用。
而这些逻辑,都是可以包装成一个个工具塞入 MCP 服务器中,让大模型自己在 Agent Loop 中去调用的。
当然,这套逻辑并不是银弹,要具体情况具体分析。claude code 这么做一个很大的原因也是在写代码这个任务下,基于关键词的全字匹配精度往往比基于向量的最近邻匹配靠谱且计算成本更低。放到别的下游场景中我想,就未必了,比如我最近在做的一个场景就是聊天软件的智能助手。聊天的历史信息在 x% 的情况下使用类似的方法就能搜到有效信息,这个 x 到底有多大呢?这就是我和 peacesheep 的工作了,我们最近正在真实场景下进行算法验证,后续我们不介意通过论文的形式向社区分享这一结果。
结论
总之,我想,通过这篇文章,你至少应该明白 CE 和 RAG 的区别到底是什么,以及,在新的agent系统一线开发中,我们又总结了哪些行业的“黑话”。
github.com
GitHub - LSTM-Kirigaya/openmcp-client: All in one vscode plugin for mcp developer
All in one vscode plugin for mcp developer
原文转载自我自己的博客:
汇尘轩 - 锦恢的博客
RAG 和 CE 是什么关系?我们真的需要 RAG 吗?
contextengineering,简称CE,指的就是使用各种各样的方法来为大模型或者agent系统注入额外的上下文,从而实现你的业务场景。比如你要做一个公司的财务系统agent,大模型肯定不知道你
12 posts - 10 participants
Read full topic
via LINUX DO - 热门话题 (author: 锦恢)
Invalid media:
image
image
image
image
image
image
image
RAG 是实现 CE 的手段之一
context engineering,简称 CE,指的就是使用各种各样的方法来为大模型或者 agent 系统注入额外的上下文,从而实现你的业务场景。
比如你要做一个公司的财务系统 agent,大模型肯定不知道你家的各类信息呀,那么这个时候就需要注入额外的专业信息或者私密信息来让 agent 做出“只有知道这些私有信息才能做到的事情”。系统化地、优雅地、健全地实现这样一套“额外信息”/“上下文”注入的大模型组件,就叫做 CE。
所以显然,RAG 是实现 CE 的手段之一,这两玩意儿属于包含关系,CE 包含了 RAG,都是应对大模型不能了解场景专属信息,设计出的外挂组件。那么为什么最近又开始强调起了 CE,而非过去的 RAG 了呢?很简单,因为在很多专业场景中,大家发现 RAG 非常不好用,所以开始寻找一些其他的方法来实现上下文注入,这些方法的系统讨论,在过去半年被我们慢慢总结为 “CE”。
CE 技术最为典型的代表场景就是 AI Coding,而这个场景中,使用 CE 最为出色的代表就是 claude code。
我在 L 站的粉丝朋友有人问我为啥迟迟不更新 cursor apply 算法的内部解析,一来我最近在忙毕业论文和新的投稿的事情,二来,cursor 内部的一些算法已经过时,比如为啥 cursor 的运行内存占用那么大?因为内部运行了一个向量数据库。但是半年的实践下来,cursor 向量数据库的技术方案已经被 claude code 的基于 agentic 的 CE 爆了金币,你让我怎么继续写?
RAG 为啥难用
RAG 的难用是一线工程师们有目共睹的。使用 RAG 有一个非常典型的场景,那就是专业领域的AI咨询,在 The RAG Obituary: Killed by Agents, Buried by Context Windows 中,金融 AI 平台 Fintool 的架构师 Nicolas 举了几个他在开发 fintool 时,采用 RAG 遇到了的坑。
1. 上下文碎片化(Context Fragmentation):存入向量数据库的 chunk 往往是被分割开来的,但是真实查询一个问题对应的原文信息,可能横跨了连续的20页文档(真实案例),rag 的切分破坏了信息的连续,即便很多 rag 切分策略(比如 langchain 内置的 repeat 参数)可以让切分块直接存在重叠,但是仍然无法从根本上解决这个问题。
2. 语义搜索对数字失效(Semantic Search Fails on Numbers):"45.2M 美元"和"45,200,000 美元"的嵌入向量完全不同;“收入增加了 10%”和“收入增加了十成”的嵌入向量也不同;表格中的数字无法有效提取它对应行头和列头的说明文字组合成有效的信息。这些都严重影响了查询结果的召回率。
3. **缺乏因果理解(No Causal Understanding):**图表,表格,公式,段落,往往会在别的文档中被引用,从而扩充本段的逻辑和信息,且这种引用是递归的,RAG 的算法无法挖掘这种文档内部的因果关系,从而导致搜到的有效信息变少很多。
4. **术语不匹配问题(The Vocabulary Mismatch Problem):**专业术语在语义空间训练得很差,且不同公司对相同概念使用不同术语,导致没有在私有数据集充分训练的 RAG 表现很差。可能出现相似术语离得很远,不同术语靠得很近,从而让查询结果出现概念性错误。
5. **时间盲区(Temporal Blindness):**无法可靠区分2024年Q3和2023年Q3的数据,经常混淆当期与前期对比。本质上是因为特定领域的某些因素的搜索权重并没有同步到 RAG 中。没有专业领域知识也无法事先将这些权重设计到 RAG 中。
这些令人感到恶心的点,也开始让我们不得不回到起点,去思考一切的起点,不能为了 rag 而 rag,我们最初做 rag 是为了什么?
我们当初为什么要做 rag?
对,是为了把垂类知识(domain specific knowledge)塞入大模型,从而让大模型或基于大模型的应用能解答私有领域知识的。
那为什么要用 rag 呢?
因为大模型处理文本就会先进行嵌入,把句子转化成向量组,而 word2vec 实验让 nlp 领域慢慢形成了,嵌入空间能够反映一定的语义相关性,我们只是复用了这套逻辑,将大模型的“前端”构造成了一个搜索器,这就是 rag 的由来。
但是随着我们对大模型在具体执行任务上能力和相关落地技术的探索,也就是 agent,我们开始思考一个根本问题——既然大模型的各项能力都是和人类对齐的,那么我们是不是应该使用人也能使用的工具来增强大模型了解垂类数据的能力?
CE:让大模型像人一样,用工具搜索答案
想象一个场景:一个中科大毕业的高材生,进入了一家新能源公司从事能源技术的研发,他了解内部文档的方法是通过向量嵌入和语义空间的最近邻吗?显然不是。那么依靠的是什么呢?大部分是系统自己的搜索引擎,少部分是他对能源技术本身的理解以及和同事的交流。根据计算机的二八定律,职业工程师只看主要矛盾,那么我们是否也应该让大模型通过我们提供好的内部文档的搜索引擎,让它自己来用这个搜索引擎不断搜索,接受反馈,执行剩下来的任务,也就是我在 锦恢的 AI Agent 小白教程(一)Agent 的基本概念与分类 中提到 Agent Loop:
答案是不确定的,所以我们和许多同行在上半年进行了大量的实验。我们惊喜地看到在几个应用上,这项技术被证明可行了,最典型的例子就是 claude code,claude code 的 Coding Agent 在根据我们的需求写代码时,就并不依靠向量数据库来了解和需求文本语义最靠近的代码片段,而是像一个程序员一样,通过查看当前项目的文件结构,全字匹配,正则表达式等等现成工具来“搜出”领域的上下文,从而完美完成代码工作。
显然,这套逻辑并不简单,它是一个工程任务,而这个任务的最终产物是塞入大模型 messages 数组的上下文,所以我们把这个工程大任务称为 context engineering,而在后续的文字中,虽然 rag 本质是 ce 的一个部分,但是显然这套方法论和 rag 是不一样的,所以为了更好区分,我们一般把给大模型提供额外工具“像人一样去专业领域搜索信息”的系统技术称为 agentic 或者干脆就叫 ce。
当我们不加上下文地说我们的这套系统是 ce 地实现的时候,默认我们就没有使用 e2e 的 rag。
为什么 CE 在 AI Coding 这个任务能成功
虽然我信奉奥卡姆剃刀,但是奥卡姆剃刀的哲学并非教我们踩一捧一,我这篇文章也不是来宣判 RAG 的死刑的,任何技术都需要具体情况具体分析,这才能体现工程师的专业感。
为什么相比于 rag,ce 可以更好在 Coding 这个任务成功?很简单,因为一个代码项目中,符合特定字段的条目 90% 的情况下都不会太多,比如你在 vscode 里面全局搜索 “realm”(一种特殊的嵌入式数据库),再大的项目搜到的结果一般也不会超过100条,比如下面是我开发的 Lagrange.onebot 的搜索结果。这些上下文对于大模型来说一点也不大。
如果结果太多,我们会勾选右侧的“区分大小写”或者“全字匹配模式”,或者干脆使用正则表达式。我敢打包票,我写过这么多项目,这个经验大部分情况都适用。
而这些逻辑,都是可以包装成一个个工具塞入 MCP 服务器中,让大模型自己在 Agent Loop 中去调用的。
当然,这套逻辑并不是银弹,要具体情况具体分析。claude code 这么做一个很大的原因也是在写代码这个任务下,基于关键词的全字匹配精度往往比基于向量的最近邻匹配靠谱且计算成本更低。放到别的下游场景中我想,就未必了,比如我最近在做的一个场景就是聊天软件的智能助手。聊天的历史信息在 x% 的情况下使用类似的方法就能搜到有效信息,这个 x 到底有多大呢?这就是我和 peacesheep 的工作了,我们最近正在真实场景下进行算法验证,后续我们不介意通过论文的形式向社区分享这一结果。
结论
总之,我想,通过这篇文章,你至少应该明白 CE 和 RAG 的区别到底是什么,以及,在新的agent系统一线开发中,我们又总结了哪些行业的“黑话”。
行业黑话的本质在于降低熟练工之间的交流成本,你也不想每天和我交流都先交代一万个词条的术语吧?我咖啡都做了不知道多少杯了。最后,对 agent 开发感兴趣的朋友欢迎为我的 openmcp 点个免费的 star:
github.com
GitHub - LSTM-Kirigaya/openmcp-client: All in one vscode plugin for mcp developer
All in one vscode plugin for mcp developer
原文转载自我自己的博客:
汇尘轩 - 锦恢的博客
RAG 和 CE 是什么关系?我们真的需要 RAG 吗?
contextengineering,简称CE,指的就是使用各种各样的方法来为大模型或者agent系统注入额外的上下文,从而实现你的业务场景。比如你要做一个公司的财务系统agent,大模型肯定不知道你
12 posts - 10 participants
Read full topic
via LINUX DO - 热门话题 (author: 锦恢)
Invalid media:
image
image
image
image
image
image
image
Privnode.com 主贴、更新日志、以及其他
建一个主贴 贴一些公告
长期更新 主要是接受问题/反馈/建议 并且不希望为了小更新专门发帖
PS: 抽奖贴回复不太看 如果有问题建议群里或者这里留言
----------------------
更新日志(最新在最前)
2025/10/26 Opus 回归
Claude 特价与后备分组回归 Opus 模型
2025/10/26 免费模型上线
免费分组上线,不保证稳定性。支持 GLM 4.6 等。
----------------------
当前活动
抽奖:Privnode 狂送 $1250 | 上线 Gemini, Claude, OpenAI, Grok 系列模型 | Claude 最低 0.35 倍率 | 不止于 Vibe Coding
特价:0.35 倍率分组可在 Claude 外使用,支持 Opus
----------------------
联系我们
售前/售后Q群:1031336189
官网:https://privnode.com
33 posts - 30 participants
Read full topic
via LINUX DO - 热门话题 (author: 铎)
建一个主贴 贴一些公告
长期更新 主要是接受问题/反馈/建议 并且不希望为了小更新专门发帖
PS: 抽奖贴回复不太看 如果有问题建议群里或者这里留言
----------------------
更新日志(最新在最前)
2025/10/26 Opus 回归
Claude 特价与后备分组回归 Opus 模型
2025/10/26 免费模型上线
免费分组上线,不保证稳定性。支持 GLM 4.6 等。
----------------------
当前活动
抽奖:Privnode 狂送 $1250 | 上线 Gemini, Claude, OpenAI, Grok 系列模型 | Claude 最低 0.35 倍率 | 不止于 Vibe Coding
特价:0.35 倍率分组可在 Claude 外使用,支持 Opus
----------------------
联系我们
售前/售后Q群:1031336189
官网:https://privnode.com
33 posts - 30 participants
Read full topic
via LINUX DO - 热门话题 (author: 铎)
「海外支付」胎教级Fiat24注册教程,助你开通GPT(无AFF)
出一期Fiat24的教程
● 大陆用户线上免费开通,没有年费或管理费,并且还附带一个与你同名的
● 支持绑定微信支付宝在内地消费
● 也支持订阅海外服务,比如
注册 Fiat24 瑞士 IBAN 账户
下载链接:Bitget Wallet
1)在 Bitget Wallet 的“钱包”页面,选择“银行卡”,点击“开通更多账户”;
2)点击“申请借记卡”,注册 Fiat 24 账户,注册后点击“去认证”;
3)进入 Fiat24 登录页面
● 根据提示点击对应按钮,使用“身份证”或“护照”进行认证,这里以“身份证”认证为例;
4)如实填写你的个人信息
● 点击“Next”,填写你的邮箱账号,选择“Submit”提交;
5)进入下一个验证页面
● 按照提示复制 Request ID,保存二维码,点击“Click when you finish it”;
6)打开应用商店搜索:身份见证
7)登录后,选择“点击开始”和“同意”
● 按页面提示将身份证贴至手机背面顶部(请先取下手机壳)
● 直到识别成功。信息显示后,确认无误,点击“下一步”;
8)点击“下一步”完成人脸识别,即可完成整个 KYC 过程
● 你将在 Bitget Wallet 中收到申请通过的信息,成功开通银行卡。
9)激活银行卡
● 目前只支持充值
● 打开银行卡,点击“充值”,建议充值金额填写为 11 USDC(扣除链上 Gas 费后大于 10 USDC)
● 点击“确认”即可完成充值。
10)支付使用
点击“去激活”,跳转页面后选择
11)支付币种
● 所有 Fiat24 账户支持四种货币:
● 你可以为这些货币启用直接支付功能。启用后,交易时将优先从相应货币余额中扣除,帮助用户避免外汇手续费。
● 如图,通过
12)绑定至APP
点击按钮,查看卡信息,支持ApplePay、微信、支付宝等等
33 posts - 17 participants
Read full topic
via LINUX DO - 热门话题 (author: Ling_Jing)
Invalid media:
image
image
image
image
image
image
image
image
image
image
image
出一期Fiat24的教程
● 大陆用户线上免费开通,没有年费或管理费,并且还附带一个与你同名的
IBAN账户● 支持绑定微信支付宝在内地消费
● 也支持订阅海外服务,比如
ChatGPT、Twitter、Youtube注册 Fiat24 瑞士 IBAN 账户
下载链接:Bitget Wallet
1)在 Bitget Wallet 的“钱包”页面,选择“银行卡”,点击“开通更多账户”;
2)点击“申请借记卡”,注册 Fiat 24 账户,注册后点击“去认证”;
3)进入 Fiat24 登录页面
● 根据提示点击对应按钮,使用“身份证”或“护照”进行认证,这里以“身份证”认证为例;
4)如实填写你的个人信息
● 点击“Next”,填写你的邮箱账号,选择“Submit”提交;
5)进入下一个验证页面
● 按照提示复制 Request ID,保存二维码,点击“Click when you finish it”;
[!Warning]如果是安卓,直接截图小程序二维码,微信里面认证就行,不用管第六步
6)打开应用商店搜索:身份见证
7)登录后,选择“点击开始”和“同意”
● 按页面提示将身份证贴至手机背面顶部(请先取下手机壳)
● 直到识别成功。信息显示后,确认无误,点击“下一步”;
8)点击“下一步”完成人脸识别,即可完成整个 KYC 过程
● 你将在 Bitget Wallet 中收到申请通过的信息,成功开通银行卡。
9)激活银行卡
● 目前只支持充值
USDC(Arbitrum链)● 打开银行卡,点击“充值”,建议充值金额填写为 11 USDC(扣除链上 Gas 费后大于 10 USDC)
● 点击“确认”即可完成充值。
10)支付使用
点击“去激活”,跳转页面后选择
Activate Card → Active11)支付币种
● 所有 Fiat24 账户支持四种货币:
美刀、欧元、法郎、RMB● 你可以为这些货币启用直接支付功能。启用后,交易时将优先从相应货币余额中扣除,帮助用户避免外汇手续费。
● 如图,通过
Default Card Currency选项进行切换12)绑定至APP
点击按钮,查看卡信息,支持ApplePay、微信、支付宝等等
33 posts - 17 participants
Read full topic
via LINUX DO - 热门话题 (author: Ling_Jing)
Invalid media:
image
image
image
image
image
image
image
image
image
image
image
关于Manus诈骗
我在两个月之前,就买了Manus Pro,第一个月的时候我只用了一个星期就已经把他们所说的"Quality"Usage用完了,之后第一个月的时候我已经跟他们在吵了,现在第二个月了,我竟然只用了四天就已经把Quality Usage用完了我只能用他们的"speed"模式,但是这个模式根本就跟废了一样,
而且我统计了一下他们之前写的一篇文章说的,Pro User至少可以用78,000积分,但实际上是没有
,所以我决定写一篇帖子来曝光他们还有劝大家不要订阅Manus,还有我也想问一下,如果我想在X这种国外的媒体曝光的话,我可以怎么样呢, 谢谢
49 posts - 29 participants
Read full topic
via LINUX DO - 热门话题 (author: Sol)
Invalid media:
image
image
我在两个月之前,就买了Manus Pro,第一个月的时候我只用了一个星期就已经把他们所说的"Quality"Usage用完了,之后第一个月的时候我已经跟他们在吵了,现在第二个月了,我竟然只用了四天就已经把Quality Usage用完了我只能用他们的"speed"模式,但是这个模式根本就跟废了一样,
而且我统计了一下他们之前写的一篇文章说的,Pro User至少可以用78,000积分,但实际上是没有
,所以我决定写一篇帖子来曝光他们还有劝大家不要订阅Manus,还有我也想问一下,如果我想在X这种国外的媒体曝光的话,我可以怎么样呢, 谢谢
49 posts - 29 participants
Read full topic
via LINUX DO - 热门话题 (author: Sol)
Invalid media:
image
image
[KYX API 公益站] 红绿榜也来了 kunkun 背景也加上了 是ikun就来抽 不限流了
quota.kyx03.de
KYX API Refueling Station
KYX API 公益加油站
你干嘛 嗨嗨呦~~
65 posts - 48 participants
Read full topic
via LINUX DO - 热门话题 (author: 不过减速带)
Invalid media: image
quota.kyx03.de
KYX API Refueling Station
KYX API 公益加油站
你干嘛 嗨嗨呦~~
65 posts - 48 participants
Read full topic
via LINUX DO - 热门话题 (author: 不过减速带)
Invalid media: image
大家千万不要染上赌博
今天刚两级我就去包子铺梭哈了,小亏30刀乐,千万不要染上此恶习
47 posts - 34 participants
Read full topic
via LINUX DO - 热门话题 (author: 生花)
Invalid media: image
今天刚两级我就去包子铺梭哈了,小亏30刀乐,千万不要染上此恶习
47 posts - 34 participants
Read full topic
via LINUX DO - 热门话题 (author: 生花)
Invalid media: image
codex能像claude code那样生成commit 提交代码吗?
头都大了,cc的就非常好用
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: southsala)
头都大了,cc的就非常好用
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: southsala)
关于macbook的购买相关
最近发现macbookair M4 13寸,丐中丐,叠叠卷之后,最低可以4400左右买到,有点心动,但是M5也要出了,又开始犹豫了
在想是双11买个air m4还是等M5出来,看M5相关的活动价格(有可能M5出来没有这种优惠力度的东西,我可能就不买了)
(不是刚需,但是目前这个优惠力度让我有点心动)
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 单杀路西法)
最近发现macbookair M4 13寸,丐中丐,叠叠卷之后,最低可以4400左右买到,有点心动,但是M5也要出了,又开始犹豫了
在想是双11买个air m4还是等M5出来,看M5相关的活动价格(有可能M5出来没有这种优惠力度的东西,我可能就不买了)
(不是刚需,但是目前这个优惠力度让我有点心动)
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 单杀路西法)