linux.do
19.9K subscribers
78.4K photos
173 videos
79 files
194K links
linux.do最新话题和热议话题
Download Telegram
Gemini不可用的问题

Gemini是怎么了吗 我才发现我的API都变成了不可用了 删除KEY和项目 重新新建项目添加KEY依然是不可用 有什么解决办法吗

4 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: PiKaLeo)
[福利]免费帮绑cursor账号试用pro

私聊发我user的token,或者评论区发也可以,不要发绑卡链接🔗,绑卡链接要看ip的

第一步:如何获取 WorkosCursorSessionToken?

1. 登录 Cursor 官方网站
2. 打开浏览器开发者工具(F12 或右键-检查)
3. 切换到 Application(应用程序)或 Storage(存储)标签
4. 在左侧找到 Cookies,并选择 cursor.com
5. 找到名为 "WorkosCursorSessionToken" 的 Cookie
6. 复制它的值发送给我

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 白菜)
以 Nginx 为反代服务端时以 Certbot 自动申请 HTTPS 证书的流程

小时候,我对 HTTPS 证书的印象还停留在“我自己只要 80 端口开着,其余就给平台处理吧”的阶段。随着阅历的提升,我越发意识到完全由自己网站掌握 HTTPS 通信链路的重要性,不然诸如 CDN 或者反代之类的优化手段就无法使用了。

下面是我在 Nginx 为反代服务端时以 Certbot 自动申请 HTTPS 证书的流程。

1. 安装 Nginx 与 Certbot

这里我以 Ubuntu 系统作例子,别的发行版的方法大同小异。先更新一下包管理器:
# 国内建议选用镜像源,例如可以使用 https://linuxmirrors.cn 的换源脚本
sudo apt update
sudo apt upgrade

然后安装 Nginx 与 Certbot:
sudo apt install nginx certbot -y

确保 Nginx 服务已经启动:
sudo systemctl start nginx
这里有个小坑,建议systemctl 作为 daemon (守护进程) 启动 nginx,这样它才能有权限正常操作 /etc/nginx 目录下的内容。不要直接用 nginx 命令启动,否则很可能会导致权限问题、nginx 无权读取配置文件。


2. 配置 Nginx 以临时给 .well-known 目录开口

Certbot 会在申请证书时,通过让对面的鉴权服务器访问 http://xxx.com/.well-known/ 来验证你对该域名的控制权,所以我们需要配置 Nginx 以临时给 .well-known 目录开口。

我们先在 /etc/nginx/conf.d/ 下新建一个专门只开 80 端口的配置文件,例如 site.conf
server {
listen 80;
server_name xxx.com;

location ~ ^/\.well-known/ {
root /usr/share/nginx/html;
}

location / {
return https://xxx.com$uri;
}
}

然后重启 Nginx 服务,开始监听:
nginx -s reload
可以先用 nginx -t 检查一下配置文件是否有语法错误。


3. 申请 HTTPS 证书

现在我们可以用 Certbot 申请第一次的 HTTPS 证书了:
certbot certonly --webroot -w /usr/share/nginx/html -d xxx.com -m email@xxx.com --agree-tos

其中,-w 参数指定了 webroot 的路径,-d 参数指定了域名,-m 参数指定了邮箱。
后续的证书更新,只需要执行 certbot renew 即可,不需要打完整指令。


4. 启动后台服务,例如 docker 容器

例如,后台开一个 wordpress 的 docker 容器,放在 3000 端口:
docker run -d -p 3000:80 --name wordpress wordpress:latest

这里的 -d 是放在后台运行,跑完指令之后容器不会直接原地退出; -p 3000:80 是将容器中的 80 端口映射到宿主机的 3000 端口;--name 参数是给容器起个名字,方便后续操作。

这里的 3000 端口是随便取的,只要不和宿主机的其他端口冲突就行;后续给服务器设置防火墙时,不要放行 3000 端口,以免直接暴露容器。


5. 配置 Nginx 以使用 HTTPS 证书

/etc/nginx/conf.d/ 下新增一个专门开 443 端口的配置文件,例如 site-ssl.conf
server {
listen 443 ssl;
server_name xxx.com;

ssl_certificate /etc/letsencrypt/live/xxx.com/fullchain.pem;
ssl_certificate_key /etc/letsencrypt/live/xxx.com/privkey.pem;

location ~ ^/\.well-known/ {
root /usr/share/nginx/html;
}

location ~ .* {
proxy_redirect off;
proxy_set_header Host $host;
proxy_set_header X-Ssl on;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;

proxy_pass http://localhost:3000;
}
}

然后重新加载 Nginx 配置:
nginx -s reload


6. 增加计划任务

最后,我们可以增加一个计划任务,每个月自动更新一次证书。

首先准备一个脚本,例如放在 /home/cert-update.sh,先以 Certbot 更新证书,然后通知 Nginx 更新证书:
#!/bin/bash
certbot renew
nginx -s reload

然后增加一个计划任务,每个月执行一次。先打开计划任务编辑器:
crontab -e

选择完编辑器后,在打开的编辑器中增加一行:
0 0 1 * * /bin/bash /home/cert-update.sh
这里的 0 0 1 * * 是指每个月的第一天零点零分执行一次。


后记

这篇文章虽说很基础,但应该也挺有用,应该能带着之前用面板服的同学入真正的手动配置的坑,摆脱脚本小子身份🐵(这句划掉

看了下这里应该没人用 nginx + certbot 直接在宿主机部署的方案说事,我发在这应该不重复。

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 伊欧)
完全颠覆现今写真网站,完全本地化,美女图片生成,单手操作。

操作界面展示

主页面,输入提示词

后台总无限生成

历史回顾

左右滑动,开始查看

向上滑动,快速查看列表

遇到不喜欢的直接删除

特性

1. 完全本地化,无须联网
2. 支持对接comfyui工作流
3. 支持单手操作
4. 无需掌握生图提示词规则,直接使用自然语言就可以
5. 输入提示词,后台自动生成,随时查看,打把游戏就有大量图片可以看了,美滋滋。

10 posts - 7 participants

Read full topic

via LINUX DO - 最新话题 (author: liuhua)

Invalid media:
image
image
image
image
image
image
因为Claude封号太凶狠了,想请问各位佬,有没有订阅GPT PRO的?实际体验如何?

如题,主要是想知道Codex限量情况以及开发效果如何?

8 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: NOspy)
关于cto-2api补充使用方法级宝塔搭建教程

首先宝塔需要先创建一个python的虚拟环境。

然后到/www 目录里面打开终端,拉取仓库代码:
git clone https://github.com/1420970597/fucto.git

拉取完就可以回到宝塔创建网站了,不需要装环境啥的。

然后一次选择拉取代码的根目录。填写启动命令(如果想换端口要在代码里改一下)。填写变量。

启动命令:
python openai_api_server.py --host 0.0.0.0 --port 8000

环境变量:这个不一定要填写,看你能不能启动。我两台VPS都提示SSL证书问题,所以我强制指认了个证书。记得填写你自己实际的路径。
SSL_CERT_FILE=/www/server/pyporject_evn/cto/lib/python3.13/site-packages/certifi/cacert.pem

启动用户选择:root

选择安装依赖包:

然后点击确认安装部分就结束了。

最后是配置 cookies.txt 和 域名。

访问:c 登录账户-打开F12打开控制台-点击网络-筛选
cookie-domain:.clerk.cto.new cookie-name:__client

然后把复制到文本里面保存。

然后是域名: 填写域名后点击外网映射就可以访问了。

然后我顺带增加了个密匙认证,跨站防护就不加了,但是密匙最起码要有。
github.com

GitHub - zhaiiker/fucto: 自建cto中转,2api,open-ai格式,支持多号轮询

自建cto中转,2api,open-ai格式,支持多号轮询

4 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: Ker Zhai)

Invalid media:
image
image
image
image
image
image
image
看新闻忽然注意到量子技术已经是高附加值产业了

我对量子的认知还停留在实验室理论和炒概念的阶段。搜索了一下相关的产业链,有点不真实的感觉,普通人什么时候能用上呢

7 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: loldoe3)
爱情就跟小时候过家家一样,她当妈妈,他当爸爸…他当狗,他当狗,他当狗 :tieba_025:

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 夏天爱吃菠萝大西瓜🍉)
Clash Verge Mac版本开规则模式很卡,全局模式流畅,怎么解决
关闭TUN也没用
最近出现的问题

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: Mozi)
终于把论文草稿交了,可以学go咯,求学go和实习意见

如题终于把那篇从大二开始做的文章草稿写好给导师了,从四页到十二页,真的实验做到想死了。这周就是等老大改文章,远程操控我了。
终于可以开始全力学习go语言为寒假实习做准备了,各位佬友有关于学go的意见不,我现在还在 00 开篇词 这样入门Go,才能少走弯路这个网站里面的go语言36讲,应该这两周可以看完这三十六讲。我准备同步开始hot100的训练,之前是用python做的。后面我打算复现一个GitHub - marmotedu/iam: 企业级的 Go 语言实战项目:认证和授权系统(带配套课程) 这个项目作为我的项目,可以填充一下我的简历。哇哈哈哈哈哈终于把草稿交上去了。 😆 😁 😆

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 赵子龙)
逃离鸭科夫-纯外挂选手申请出战

全是科技与狠活,感谢Mod和风灵月影。
生活已经够苦了,在游戏里就不能再苦了。
唯一死的一次是新手刚入零号区遇见Boss
随后发奋图强,积极寻找外挂和Mod终成外挂大神
装备起来就关了,然后就开始虐菜。
小游戏虽说有点单调但是很上头。

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 八嘎小天皇)

Invalid media: image
有没有大佬帮忙解决vscode的codex插件问题。

windows下 vscode 里的codex插件在创建会话时报如下错误:
[error] Error creating local task: Error: Timeout
PS:和git 、bash无关,都已验证过了。
在已有的会话打开继续是没问题的。

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: Winge)
太搞了linus人格

太搞了这个linus人格😁linuxdo佬推荐的好啊
1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: user2500)

Invalid media: image
😁1
TG必备的搜索引擎,极搜帮你精准找到,想要的群组、频道、音乐 、视频

👇👇👇点击下方按钮,进行搜索
记一次谷歌账号起死复生

[!failure] 被风控
应该是之前创建了一个droid的抽奖,关联了这个gmail账号,抽奖结束第二天就触发了风控
[!warning] 机会
大善人给了申诉的机会,我此前给这个账号开了四种不同的验证登录方式,让chatGPT写了一封声情并茂的申诉邮件,
[!success] 恢复
发过去等了一天,收到了大善人的回复,账号restored
[!example] 插曲
点击上面的ASAP,验证登录的时候,注册账号用的+86手机收不到码,重复尝试了几次又被风控了,冷却了24小时后,今天下午尝试了下,终于接到验证码,成功恢复了账号。
[!quote] 供佬友参考
这个号不是机器人注册的,我手动在claude.ai页面下注册的,当时用+86号码接的码,注册后立马注册了droid,其他啥服务都没注册过,唯一触发风控的可能就是这个环节了,抽奖不应该抽账号,而应该是api key,这样关联的邮箱被风控的可能性就比较小了。
8 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: 肖深刻的九叔)

Invalid media:
image
image
image
image
征集 KISS Translator 的 LOGO/截图/宣传图设计

开源项目 简约翻译 KISS Translator 征集以下设计资源:

LOGO:

主色:#209CEE
像素16、32、48、128、192、300px,PNG和SVG格式
彩色/灰色/单色/反色

宣传视频:

中文/英文/全球通用
YouTube 视频网址

屏幕截图:

6 张 1280x800 或 640x400 JPEG 或 24 位 PNG(无 alpha 透明层)
中文/英文/全球通用

小型宣传图块:

440x280 画布 JPEG 或 24 位 PNG(无 alpha 透明层)

顶部宣传图块:

1400x560 画布 JPEG 或 24 位 PNG(无 alpha 透明层)

有兴趣欢迎提供建议、提交作品: 征集优化LOGO/截图/宣传图设计 · Issue #352 · fishjar/kiss-translator · GitHub
注:没有报酬,自由发挥
1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: Gabe)
【𝓼𝓾𝓭𝓪】签署了一份协议,望佬友们监督(周一中午-晚上)

和女朋友签署的协议,不知道她明天会不会遵守嘞 :bili_040:

Click to view the poll.

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 别名小𝓼𝓾𝓭𝓪)

Invalid media: image
人生第一个属于自己的luoli域名

该部署点啥好呢QAQ

5 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: 郑超舰)

Invalid media: image
免费的GLM

24号白嫖了智普的GLM,因为自己用不上。就共享出来了

地址:
https://api.282626.xyz {CloudFlare}
https://eo.282626.xyz {腾讯云Eo}
https://esa.282626.xyz {阿里云ESA}
21 posts - 8 participants

Read full topic

via LINUX DO - 热门话题 (author: chuyu5762)

Invalid media:
image
image
一直有朋友来问 CE 和 RAG 的区别,我这边举个例子简单说一下

RAG 是实现 CE 的手段之一

context engineering,简称 CE,指的就是使用各种各样的方法来为大模型或者 agent 系统注入额外的上下文,从而实现你的业务场景。

比如你要做一个公司的财务系统 agent,大模型肯定不知道你家的各类信息呀,那么这个时候就需要注入额外的专业信息或者私密信息来让 agent 做出“只有知道这些私有信息才能做到的事情”。系统化地、优雅地、健全地实现这样一套“额外信息”/“上下文”注入的大模型组件,就叫做 CE。

所以显然,RAG 是实现 CE 的手段之一,这两玩意儿属于包含关系,CE 包含了 RAG,都是应对大模型不能了解场景专属信息,设计出的外挂组件。那么为什么最近又开始强调起了 CE,而非过去的 RAG 了呢?很简单,因为在很多专业场景中,大家发现 RAG 非常不好用,所以开始寻找一些其他的方法来实现上下文注入,这些方法的系统讨论,在过去半年被我们慢慢总结为 “CE”。

CE 技术最为典型的代表场景就是 AI Coding,而这个场景中,使用 CE 最为出色的代表就是 claude code。
我在 L 站的粉丝朋友有人问我为啥迟迟不更新 cursor apply 算法的内部解析,一来我最近在忙毕业论文和新的投稿的事情,二来,cursor 内部的一些算法已经过时,比如为啥 cursor 的运行内存占用那么大?因为内部运行了一个向量数据库。但是半年的实践下来,cursor 向量数据库的技术方案已经被 claude code 的基于 agentic 的 CE 爆了金币,你让我怎么继续写?


RAG 为啥难用

RAG 的难用是一线工程师们有目共睹的。使用 RAG 有一个非常典型的场景,那就是专业领域的AI咨询,在 The RAG Obituary: Killed by Agents, Buried by Context Windows 中,金融 AI 平台 Fintool 的架构师 Nicolas 举了几个他在开发 fintool 时,采用 RAG 遇到了的坑。

1. 上下文碎片化(Context Fragmentation):存入向量数据库的 chunk 往往是被分割开来的,但是真实查询一个问题对应的原文信息,可能横跨了连续的20页文档(真实案例),rag 的切分破坏了信息的连续,即便很多 rag 切分策略(比如 langchain 内置的 repeat 参数)可以让切分块直接存在重叠,但是仍然无法从根本上解决这个问题。
2. 语义搜索对数字失效(Semantic Search Fails on Numbers):"45.2M 美元"和"45,200,000 美元"的嵌入向量完全不同;“收入增加了 10%”和“收入增加了十成”的嵌入向量也不同;表格中的数字无法有效提取它对应行头和列头的说明文字组合成有效的信息。这些都严重影响了查询结果的召回率。
3. **缺乏因果理解(No Causal Understanding):**图表,表格,公式,段落,往往会在别的文档中被引用,从而扩充本段的逻辑和信息,且这种引用是递归的,RAG 的算法无法挖掘这种文档内部的因果关系,从而导致搜到的有效信息变少很多。
4. **术语不匹配问题(The Vocabulary Mismatch Problem):**专业术语在语义空间训练得很差,且不同公司对相同概念使用不同术语,导致没有在私有数据集充分训练的 RAG 表现很差。可能出现相似术语离得很远,不同术语靠得很近,从而让查询结果出现概念性错误。
5. **时间盲区(Temporal Blindness):**无法可靠区分2024年Q3和2023年Q3的数据,经常混淆当期与前期对比。本质上是因为特定领域的某些因素的搜索权重并没有同步到 RAG 中。没有专业领域知识也无法事先将这些权重设计到 RAG 中。

这些令人感到恶心的点,也开始让我们不得不回到起点,去思考一切的起点,不能为了 rag 而 rag,我们最初做 rag 是为了什么?

我们当初为什么要做 rag?

对,是为了把垂类知识(domain specific knowledge)塞入大模型,从而让大模型或基于大模型的应用能解答私有领域知识的。

那为什么要用 rag 呢?

因为大模型处理文本就会先进行嵌入,把句子转化成向量组,而 word2vec 实验让 nlp 领域慢慢形成了,嵌入空间能够反映一定的语义相关性,我们只是复用了这套逻辑,将大模型的“前端”构造成了一个搜索器,这就是 rag 的由来。

但是随着我们对大模型在具体执行任务上能力和相关落地技术的探索,也就是 agent,我们开始思考一个根本问题——既然大模型的各项能力都是和人类对齐的,那么我们是不是应该使用人也能使用的工具来增强大模型了解垂类数据的能力?

CE:让大模型像人一样,用工具搜索答案

想象一个场景:一个中科大毕业的高材生,进入了一家新能源公司从事能源技术的研发,他了解内部文档的方法是通过向量嵌入和语义空间的最近邻吗?显然不是。那么依靠的是什么呢?大部分是系统自己的搜索引擎,少部分是他对能源技术本身的理解以及和同事的交流。根据计算机的二八定律,职业工程师只看主要矛盾,那么我们是否也应该让大模型通过我们提供好的内部文档的搜索引擎,让它自己来用这个搜索引擎不断搜索,接受反馈,执行剩下来的任务,也就是我在 锦恢的 AI Agent 小白教程(一)Agent 的基本概念与分类 中提到 Agent Loop:

答案是不确定的,所以我们和许多同行在上半年进行了大量的实验。我们惊喜地看到在几个应用上,这项技术被证明可行了,最典型的例子就是 claude code,claude code 的 Coding Agent 在根据我们的需求写代码时,就并不依靠向量数据库来了解和需求文本语义最靠近的代码片段,而是像一个程序员一样,通过查看当前项目的文件结构,全字匹配,正则表达式等等现成工具来“搜出”领域的上下文,从而完美完成代码工作。

显然,这套逻辑并不简单,它是一个工程任务,而这个任务的最终产物是塞入大模型 messages 数组的上下文,所以我们把这个工程大任务称为 context engineering,而在后续的文字中,虽然 rag 本质是 ce 的一个部分,但是显然这套方法论和 rag 是不一样的,所以为了更好区分,我们一般把给大模型提供额外工具“像人一样去专业领域搜索信息”的系统技术称为 agentic 或者干脆就叫 ce。

当我们不加上下文地说我们的这套系统是 ce 地实现的时候,默认我们就没有使用 e2e 的 rag。

为什么 CE 在 AI Coding 这个任务能成功

虽然我信奉奥卡姆剃刀,但是奥卡姆剃刀的哲学并非教我们踩一捧一,我这篇文章也不是来宣判 RAG 的死刑的,任何技术都需要具体情况具体分析,这才能体现工程师的专业感。

为什么相比于 rag,ce 可以更好在 Coding 这个任务成功?很简单,因为一个代码项目中,符合特定字段的条目 90% 的情况下都不会太多,比如你在 vscode 里面全局搜索 “realm”(一种特殊的嵌入式数据库),再大的项目搜到的结果一般也不会超过100条,比如下面是我开发的 Lagrange.onebot 的搜索结果。这些上下文对于大模型来说一点也不大。

如果结果太多,我们会勾选右侧的“区分大小写”或者“全字匹配模式”,或者干脆使用正则表达式。我敢打包票,我写过这么多项目,这个经验大部分情况都适用。

而这些逻辑,都是可以包装成一个个工具塞入 MCP 服务器中,让大模型自己在 Agent Loop 中去调用的。

当然,这套逻辑并不是银弹,要具体情况具体分析。claude code 这么做一个很大的原因也是在写代码这个任务下,基于关键词的全字匹配精度往往比基于向量的最近邻匹配靠谱且计算成本更低。放到别的下游场景中我想,就未必了,比如我最近在做的一个场景就是聊天软件的智能助手。聊天的历史信息在 x% 的情况下使用类似的方法就能搜到有效信息,这个 x 到底有多大呢?这就是我和 peacesheep 的工作了,我们最近正在真实场景下进行算法验证,后续我们不介意通过论文的形式向社区分享这一结果。

结论

总之,我想,通过这篇文章,你至少应该明白 CE 和 RAG 的区别到底是什么,以及,在新的agent系统一线开发中,我们又总结了哪些行业的“黑话”。
行业黑话的本质在于降低熟练工之间的交流成本,你也不想每天和我交流都先交代一万个词条的术语吧?我咖啡都做了不知道多少杯了。
最后,对 agent 开发感兴趣的朋友欢迎为我的 openmcp 点个免费的 star:
github.com

GitHub - LSTM-Kirigaya/openmcp-client: All in one vscode plugin for mcp developer

All in one vscode plugin for mcp developer

原文转载自我自己的博客:
汇尘轩 - 锦恢的博客

RAG 和 CE 是什么关系?我们真的需要 RAG 吗?

contextengineering,简称CE,指的就是使用各种各样的方法来为大模型或者agent系统注入额外的上下文,从而实现你的业务场景。比如你要做一个公司的财务系统agent,大模型肯定不知道你

12 posts - 10 participants

Read full topic

via LINUX DO - 热门话题 (author: 锦恢)

Invalid media:
image
image
image
image
image
image
image
Privnode.com 主贴、更新日志、以及其他

建一个主贴 贴一些公告
长期更新 主要是接受问题/反馈/建议 并且不希望为了小更新专门发帖

PS: 抽奖贴回复不太看 如果有问题建议群里或者这里留言

----------------------

更新日志(最新在最前)

2025/10/26 Opus 回归

Claude 特价与后备分组回归 Opus 模型

2025/10/26 免费模型上线

免费分组上线,不保证稳定性。支持 GLM 4.6 等。

----------------------

当前活动

抽奖:Privnode 狂送 $1250 | 上线 Gemini, Claude, OpenAI, Grok 系列模型 | Claude 最低 0.35 倍率 | 不止于 Vibe Coding
特价:0.35 倍率分组可在 Claude 外使用,支持 Opus

----------------------

联系我们

售前/售后Q群:1031336189

官网:https://privnode.com

33 posts - 30 participants

Read full topic

via LINUX DO - 热门话题 (author: 铎)