LinuxDo 新帖推送
192 subscribers
254K photos
318K links
Download Telegram
标题: Codex App 为啥问个你好就要用18K Token?有优化的方法吗?
作者: #WANGXIANRU
板块: #开发调优
编号: 2220035
帖子: https://linux.do/t/topic/2220035
时间: 2026-05-21 16:56:23
摘要:
这也太抽象了。我的自定义指令就一两句话。难道是内置的提示词占用的吗?能否精简?
标题: 【实践分享】25年到26年,我的NL2SQL智能体是如何迭代的
作者: #踏雪寻玫
板块: #开发调优
编号: 2220040
帖子: https://linux.do/t/topic/2220040
时间: 2026-05-21 16:56:58
摘要:
【实践分享】25年到26年,我的NL2SQL智能体是如何迭代的
前言
之前写过一篇《如何手搓一个RAG》,当时主要讲的是知识库问答。
引流:https://linux.do/t/topic/2187051
这篇讲另一个更痛苦的东西:NL2SQL。
先叠甲:


我不是底层模型开发,也不是论文选手,我是AI应用开发,现在人们叫AI应用落地工程师(有点想补一个黄豆流汗)。


这篇不讲特别高大上的理论,主要讲我自己从老项目到新项目的工程迭代。


里面很多东西可能现在看起来很土,很笨,很原始。


因为很多东西不是一开始就长成现在这个样子的。
现在大家都很懂智能体、tool call、workflow、planner、memory、MCP,但我第一次认真把这套东西串起来的时候,企业应用里还没有这么成熟的说法。那时候更多叫机器人、助手、问答系统,或者更朴素一点:大模型接口外面套一圈业务逻辑。
先说时间线
老项目是一个早期业务问答助手,这里就不写真实项目名了。
下面会附上老项目的git记录,其实实际时间比git更早,但有git记录就已经能说明老了。
老项目的Java服务模块最早能追到:
2025-08-04 11:00:49 早期数据问答基线上传

Python智能问答模块也是同一天开始:
2025-08-04 11:00:49 早期数据问答基线上传

然后到了2025-08-14,提交记录里已经出现了这种东西:
意图识别时校验问题中的数据表是否存在
生成SQL时判断问题中的字段是否存在
生成SQL提示词优化,增加自校验逻辑
SQL执行错误给出友好提示

再到2025-08-19,又有:
报表问答准确率提升:修改生成SQL提示词结构,采用少样本提示的标准写法

也就是说,至少在2025年8月,这个东西已经不是“我接个模型接口玩一下”了,而是在认真处理意图识别、表识别、字段校验、SQL生成、错误兜底这些问题。
新项目是2026年重做的一套业务智能体系统。
它的项目初始化是:
2026-04-20 14:45:08 项目初始化

数据问答正式落到新项目里,是:
2026-04-23 15:44:44 新增数据问答前后端能力并完成会话链路语义解析接口与数据库表落库

所以这篇讲的不是“我最近看agent火了,赶紧包装一个概念”。
更准确地说,是:
我在智能体概念还没有被企业应用完全标准化的时候,先用一种很土的方式把它做出来了;然后到2026年,我又把这套土办法重新工程化了一遍。
老数据问答:先把链路跑通
老数据问答主要看两个部分:


Java服务模块


Python智能问答模块


虽然用户入口、会话记录、前后端接口在Java应用里,但真正干NL2SQL脏活累活的是Python侧的问答模块。
当时的链路大概是这样:
用户提问
-> 问题重写
-> 意图识别
-> 判断要查哪张表
-> 权限校验
-> 拼表结构和few-shot样例
-> 让大模型生成SQL
-> 从模型返回里抠出SQL
-> 执行SQL
-> 让大模型总结结果
-> 如果用户要图表,再让大模型生成Echarts配置
-> 流式返回给前端

现在看起来,这不就是一个智能体么?
有意图识别,有工具选择,有工具执行,有结果加工,有流式输出,甚至还有图表工具。
但当时我不会这么说。
我只会说:这是数据问答。
或者说得更土一点:这是一个会查数据库的机器人。
问题重写
老链路里第一步就是问题重写。
这个东西在知识问答里重要,在NL2SQL里更重要。
因为用户不会每次都把问题说完整。
比如:
第一轮:今年杭州有多少商机?
第二轮:按行业分一下

如果第二轮直接拿去生成SQL,大模型可能知道“按行业分一下”是什么意思,也可能不知道。它不知道的时候,就开始表演了。
所谓表演,就是一本正经地胡说八道。
所以老项目里先把历史问题压缩成当前独立问题。这个思路没错,到现在也没错。
只是当时实现比较朴素:把最近几轮对话塞进提示词,让模型判断要不要改写。能用,但依赖模型稳定性。
意图识别
老项目里有一个很典型的东西:函数式意图识别。
它会让模型返回类似这样的结构:
{
"function_call": {
"name": "search_sql",
"arguments": {
"table": "项目表",
"char": "柱状图"
}
}
}

这其实已经很接近现在大家说的tool call了。
只不过那个时候不是标准工具协议,也不是框架自动帮你做。就是自己写提示词,自己解析JSON,自己判断name是什么,自己决定下一步走哪里。
有人会问了,这不就是手搓function calling么?
是的。
很土,但能跑。
SQL生成
老链路真正刺激的地方是SQL生成。每次演示就好像上战场一样。
当时的思路很直接:


根据用户问题识别要查哪张表。


找到这张表的字段说明和相似问法。


把表结构、字段含义、few-shot样例、SQL生成规则一起塞给模型。


让模型返回SQL。


程序再把SQL抠出来执行。


这里的核心其实是few-shot。
例如“今年杭州新签约合同数量是多少”这种问题,对人来说很简单,对模型来说不一定简单。因为它要知道:


“今年”对应哪个时间字段。


“新签约”对应哪个状态或日期。


“杭州”对应城市字段,而且可能还要处理“杭州市”“杭州分公司”这种说法。


“数量”是count,不是把某个金额字段求和。


所以当时靠大量样例去教模型。
这条路是有效的。
但它有一个问题:越做越像补丁。
你发现“城市”识别不准,就加城市规则。
你发现“字段不存在”会乱生成,就加字段存在性校验。
你发现SQL报错太难看,就包装友好提示。
你发现用户想看图,就让模型再生成Echarts配置。
你发现“省、市、区县”容易混,就再写一个地名修正。
最后系统当然能跑,而且效果还可以。但你心里知道,这东西有点像用胶带把飞机粘起来。
飞是能飞。
但每次上线都要默念一句:千万别问奇怪问题。
老在哪里
这里我要强调一下,“老”不是贬义。
很多老办法在当时就是正确答案。
因为业务要结果,用户要能用,领导要演示,项目要交付。你不可能坐在那里说:等我设计一个完美语义层,半年后再说。
不现实。
老项目确实就是有很明显的时代痕迹。
第一,模型直接生成SQL
老链路里,模型承担的任务太重了。
它不仅要理解用户问题,还要理解表结构,还要选择字段,还要生成SQL,还要自己判断字段是否存在。
这就像让一个实习生同时当产品经理、数据库工程师、测试和客服。
他有时候很聪明,有时候也真的离谱。
最简单的例子:字段名。
你给他一张表,里面有“合同金额”“签约金额”“中标金额”“预算金额”。用户问“金额是多少”,他到底该用哪个?
如果业务口径稳定,模型可能猜对。
如果业务口径不稳定,模型猜对了也只是运气。
第二,提示词越来越长
为了让模型不犯错,我们会不断往提示词里加规则。
不能select *。
日期要怎么转换。
城市要去后缀。
字段别名不能当查询条件的值。
枚举值模型不能自己发明。
SQL生成前后要判断字段是否存在。
SQL生成后再自检一下字段是否存在。
听起来很严谨,对吧?
但提示词不是法律。
提示词更像劝告。
你说了一百条规则,模型不一定真的每条都遵守。特别是表结构一长、样例一多、用户问题一复杂,它就开始挑自己记得住的部分执行。
这就是老链路让人很痛苦地方。
第三,解析靠字符串和正则
老项目里会从模型返回中提取JSON、提取SQL、提取Echarts配置。
这也是当时很常见的做法。
模型返回:
sql
select ... from ...

我们就用正则把他抠出来。
模型返回:
json
{"sql": "select ..."}

我们就转JSON。
问题是,模型有时候会多说一句“好的,以下是SQL”。
也有时候会少一个引号。
也有时候会把中文标点、代码块、换行混在一起。
然后你就开始写各种清洗逻辑。
写到最后,你都分不清自己是在做NL2SQL,还是在做大模型输出垃圾回收。
第四,安全边界后置
老链路也做了不少安全处理,比如权限校验、表名校验、SQL错误兜底、结果数量限制。
但整体上,它还是先让模型生成SQL,再在后面拦。
这个顺序在生产里会带来心理压力。
因为模型生成SQL这件事本身就是不稳定的。
你可以拦掉delete、update、drop,也可以限制只查某些表,但只要SQL是模型自由生成的,它就总有一些奇怪路径。
比如字段错了。
比如条件错了。
比如时间字段错了。
比如聚合口径错了。
这些不一定是安全事故,但一定是业务事故。
用户不一定知道SQL错了,他只会觉得你的机器人在胡言乱语。
第五,业务口径藏在提示词里
这是我后来最深的感受。
NL2SQL最难的不是SQL。
是业务口径。
“今年新增项目数”到底按创建时间、立项时间、签约时间,还是入库时间?
“中标金额”用预算金额、中标公告金额,还是合同签约金额?
“商机数量”算草稿、已发布、已中标,还是全部?
这些东西不应该藏在提示词里。
因为提示词不适合承载业务制度。
提示词适合表达任务,业务口径应该进配置、进表、进规则、进校验的结构。
这也是我从老项目走到新项目
标题: Cloudflare 域名邮箱的快速 AI 部署
作者: #Hardess
板块: #搞七捻三
编号: 2220051
帖子: https://linux.do/t/topic/2220051
时间: 2026-05-21 16:57:41
摘要:
看到大家都在抢英伟达的VPS,我也想跟下风,想着凌晨4点来搞没有什么人了应该不会出问题,可惜不给开了 白嫖失败,白天再看

我在部署域名邮箱时发现一个更快捷的方法,希望大家能用到。我是使用服务器连接AI来完成的,苹果的我没设备,不知道可不可以,但原理上应该没问题,如果要依赖AI会自动解决
正文开始
需要准备
1 Cloudflare 账号
2 已托管到 Cloudflare 的域名
3 可访问 GitHub /npm/ Cloudflare 的网络环境
4 Codex PS:不用都对不起它

首先问AI在Cloudflare用API部署这个项目需要的权限(我是看教程说要几个API权限找了半天没有找到正好看到有Cloudflare有AI功能就试了试)

再进入Cloudflare 账号去问问人工智能,这里忘记问连接的ID了,记得补上一句

允许

它会给你要的东西,记得先复制,我碰到过切换页面后就不见了的,还有它有点卡,等或者输入继续就好

然后拿着上面的API和ID给AI,告诉它,先写方案,注意一下有没有不符合常识的,没有问题就叫他开始部署
我部署的时候要了以下权限:

Account: D1 Edit
Account: Workers Scripts Edit
Account: Cloudflare Pages Edit
Account: Account Settings Read
Zone: Zone Read
Zone: DNS Edit
Zone: Zone Settings Edit
Zone: Workers Routes Edit
Zone: Email Routing Rules Edit
还缺一个:


但不影响使用,后面再找AI要网页地址和设置密码

然后就可以用了

记得删除API

点3个小点删除就好了
第一次发帖,还很陌生,排版问题请多多谅解
参考:https://linux.do/t/topic/1801403
项目地址:GitHub - dreamhunter2333/cloudflare_temp_email
标题: 【开源推广】不想回答 grill-with-docs 的问题?交给subagent!
作者: #Caphhh
板块: #开发调优
编号: 2220056
帖子: https://linux.do/t/topic/2220056
时间: 2026-05-21 16:58:22
摘要:
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

我的帖子已经打上 开源推广 标签: 是
我的开源项目完整开源,无未开源部分: 是
我的开源项目已链接认可 LINUX DO 社区: 是
我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
以上选择我承诺是永久有效的,接受社区和佬友监督: 是

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出

项目链接:


github.com






GitHub - Caph-dev/delegate-grill-with-docs: A skill to delegate grill-with-docs sessions to a...

A skill to delegate grill-with-docs sessions to a subagent that answers the grilling questions on the user's behalf.













如果你用过 mattpocock 的 grill-with-me 或者 grill-with-docs 并且总是认同 LLM 基于这两个skills给出的推荐做法,与此同时对于一直回复“认同”“同意”“可以” 感到厌烦的话,这个skill一定适合你!
这个skill会派生一个subagent,代替你为每个问题给出最佳回答;主agent接受subagent结果后,会继续推进讨论。最后把结论写回文档中。

使用方法(需要显式调用,不会自动触发)
使用 $delegate-grill-with-docs 对 @xxx-doc.md 做一次深入讨论,并把最终结论回写到原文档。

安装方法:
让你的agent帮你安装, 在对话框内输入:
安装这个skill: https://github.com/Caph-dev/delegate-grill-with-docs
标题: MIMO 分享 还有 7 个 e
作者: #frankad
板块: #福利羊毛
编号: 2220060
帖子: https://linux.do/t/topic/2220060
时间: 2026-05-21 16:58:42
摘要:
模型支持: MiMo-V2.5-Pro、MiMo-V2.5、MiMo-V2-Pro、MiMo-V2-Omni、
Base64:dHAtY3U3aWg3YmU0cG05b3FrazQ2cHA2MDQ5MXpyczVkNGoyajRoYzduOXl4cmV1NGJv
兼容 OpenAI 接口协议: https://token-plan-cn.xiaomimimo.com/v1
兼容 Anthropic 接口协议: https://token-plan-cn.xiaomimimo.com/anthropic
标题: 英伟达已在 2026 年 5 月 20 日财报电话会上正式确认:Vera Rubin 从 2026 年 Q3 开始量产出货,Q4 放量,2027 年上半年持续扩产。
作者: #马哥-扫地僧
板块: #前沿快讯
编号: 2220066
帖子: https://linux.do/t/topic/2220066
时间: 2026-05-21 16:59:38
摘要:
标题: 那个发深夜福利的男人,他还能坚持多久?
作者: #呀哈哈
板块: #搞七捻三
编号: 2220079
帖子: https://linux.do/t/topic/2220079
时间: 2026-05-21 17:01:15
摘要:
他已经坚持4天了,今夜他还会不会来?    
https://linux.do/t/topic/2216294/129
标题: 【黑与白】5月21日种地价格参考
作者: #Nick
板块: #搞七捻三
编号: 2220080
帖子: https://linux.do/t/topic/2220080
时间: 2026-05-21 17:01:15
摘要:
截止目前5.21 17:00七日彩莲还是收益第一,但是需要注意的是要卡点收菜,不然就被佬友们偷走了哦




排名
名称
单位售价 ($)
昨日均价 ($)
涨跌幅
产量
生长时间 (h)
总收益 (单块地)
每天收获次数
每小时收益 ($)
每天总收益 ($)




1
七日彩莲
$53.40
$60.91
▼12.33%
20
168
$1068.00
0.14
$6.36
$152.57


2
杨桃
$4.29
$4.32
▼0.73%
10
10
$42.90
2.40
$4.29
$102.96


3
南瓜
$1.38
$1.39
▼0.95%
6
2
$8.28
12.00
$4.14
$99.36


4
彩虹凤梨
$22.56
$23.40
▼3.59%
12
72
$270.72
0.33
$3.76
$90.24


5
番茄
$0.75
$0.75
▲0.16%
5
1
$3.75
24.00
$3.75
$90.00


6
草莓
$2.41
$2.42
▼0.33%
6
4
$14.46
6.00
$3.62
$86.76


7
胡萝卜
$0.81
$0.81
▼0.09%
2
0.5
$1.62
48.00
$3.24
$77.76


8
玉露蓝玫瑰
$8.00
$8.07
▼0.83%
8
24
$64.00
1.00
$2.67
$64.00


9
火龙果
$5.27
$5.28
▼0.21%
4
8
$21.08
3.00
$2.64
$63.24


10
金苹果
$4.24
$4.23
▲0.18%
6
12
$25.44
2.00
$2.12
$50.88


11
西瓜
$1.54
$1.54
▲0.30%
8
6
$12.32
4.00
$2.05
$49.28


12
黄金麦穗
$1.03
$1.08
▼5.46%
30
20
$30.90
1.20
$1.55
$37.08


13
榴莲
$0.54
$0.54
▲0.02%
25
12
$13.50
2.00
$1.13
$27.00


14
蓝莓
$0.11
$0.11
▼0.09%
30
3
$3.30
8.00
$1.10
$26.40


15
翡翠卷心菜
$1.00
$1.04
▼3.87%
25
24
$25.00
1.00
$1.04
$25.00


16
芒果
$0.15
$0.15
▲0.35%
35
7
$5.25
3.43
$0.75
$18.00


17
玉米
$0.04
$0.04
▲2.15%
25
1.5
$1.00
16.00
$0.67
$16.00


18
水晶葡萄
$1.07
$1.07
▲0.26%
10
30
$10.70
0.80
$0.36
$8.56


19
月光花
$1.24
$1.24
▼0.01%
10
48
$12.40
0.50
$0.26
$6.20
标题: codex达到限额后任务没完成也停了?
作者: #牛马青年人
板块: #搞七捻三
编号: 2220083
帖子: https://linux.do/t/topic/2220083
时间: 2026-05-21 17:01:52
摘要:
之前看到有佬说GPT即使达到限额也会跑完当前任务,怎么我这没跑完就直接断了,等晚上五小时刷新了GPT是继续接着干还是又重头再跑一次
标题: CC又整新活了。
作者: #lin
板块: #开发调优
编号: 2220091
帖子: https://linux.do/t/topic/2220091
时间: 2026-05-21 17:03:24
摘要:
人麻了,日常新活。
标题: 【求助】为什么我自己搭建的sub2api首字token慢 而且不稳 我全是plus号
作者: #雾隐千川
板块: #搞七捻三
编号: 2220112
帖子: https://linux.do/t/topic/2220112
时间: 2026-05-21 17:07:03
摘要:
如标题 求助一下  并发上来可能 好几秒才出首字 而且很容易断。我们是自己使用  我懵逼了  为什么其他中转站那么问。
标题: 网上看到个对话,笑死我了!
作者: #小浣熊2020
板块: #搞七捻三
编号: 2220119
帖子: https://linux.do/t/topic/2220119
时间: 2026-05-21 17:07:58
摘要:
正在来**的路上了。请问一家三口带40000够不够玩5天?
楼下的回复:你是住同济还是住协和啊~
看到这个对话,我又活过来了。等待下班ing
标题: 请问如何判断Kiro Pro是不是掉了
作者: #麋鹿叔叔
板块: #开发调优
编号: 2220145
帖子: https://linux.do/t/topic/2220145
时间: 2026-05-21 17:09:49
摘要:
请教一下佬 之前用0刀卡免费薅的Kiro Pro,我使用反代一直提示

我登录Kiro能看到Pro还在 账号是不是被封了啊?
标题: 本科生求问计算机行业现状
作者: #Monkeypox
板块: #搞七捻三
编号: 2220146
帖子: https://linux.do/t/topic/2220146
时间: 2026-05-21 17:09:54
摘要:
我是计算机专业的本科生,离工业和产业界比较远,现在身边弥漫着两种相反的气氛,一种是裁员减薪的焦虑,一种是屡出大包的激动,我知道这两个可能并不矛盾,但还是感觉自己对行业社会了解太少,真心想向佬友们了解一下计算机行业的现状,是否变动真的如此剧烈,大模型的影响有多深入,以及佬友们是否看好未来的计算机行业
标题: 有没有免费的服务器耍耍
作者: #超人不会飞
板块: #搞七捻三
编号: 2220148
帖子: https://linux.do/t/topic/2220148
时间: 2026-05-21 17:10:11
摘要:
请问佬们,有没有免费或者便宜的服务器,想自己用来部署项目玩玩,