linux.do

GPT K12教师降智到正常

今天买了个GPTK12账号，登进去之后就发现降智了，想着怎么解决，一开始用的是万人骑的机场，同机场的IP全都不行，然后又去研究了下家宽（之前从来没用过家宽）＋指纹浏览器的解决方法，用了之后效果立竿见影，同一个账号同时在用机场IP的浏览器上登录和用家宽的指纹浏览器上登录，问出来一个是GPT4，一个是GPT5.2，随后在指纹浏览器上打开在机场IP的对话，问了下，立刻也变成5.2。甚至切换到个人版也是同样的效果

所以各位买了K12账号的佬一定要试试家宽 🧐
1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 墨殇)

Invalid media: image

57 views17:39

linux.do

国产编程模型里选GLM4.7 还是 MiniMax2.1？

都是在cc里面用哪个编程能力最强呢？

Click to view the poll.

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: Az0809)

57 views17:39

linux.do

我宣布 Gemini3就是最棒的Roleplay模型！附调教指南

gemini3玩rp的体验真的惊艳到我了在剧情一致性以及人物的性格方面比2.5p都是质的飞跃
这三天高强度体验下来（浅浅玩了十几Mtokens）感觉又找到了了第一次接触LLM roleplay的新鲜感
gemini3我感觉最强的一点就是上下文情景一致性并且叙事不只是根据现有场景无限续写有主动引入新元素的能力这是我遇到的第一个会这么做的模型
另一个惊艳的点就是文笔了，gemini3已经很少出现石投湖之类的奇怪八股文了，看文的体验真的好了很多
情节一致性和捡伏笔的能力很强，不过这个我到没有在别的模型上测试过（上次玩冒险类rp已经是gpt3.5时代了），gemini3对情节设计的把控非常到位非常推荐玩冒险向文字游戏

当然… 最最最令人爽的一点是，卡掉CoT不仅能避免Gemini原生思维链过度思考导致注意力涣散从而影响上下文一致性，还能大幅提高输出速度，在控制100k上下文平均每次500tokens输出的情况下 Gemini3能够以 100tks/s 首token延迟小于0.2s的速度在5s左右完成一次交互（速度上能与之相比的就是Claude了，但是Claude 4.5o的模型我个人体感不如Gemini3），相比于关闭CoT前每次动辄思考二三十秒，体验上就是质的飞跃

关于调教：

之前看到有佬友测试角色设定容易崩经过我个人测试卡掉gemini的原生思维链才能达到我上面说的那样的非常强大的效果

关于如何卡掉思维链可见：【思路分享】关闭gemini3的思维链

最近发现一种新的卡掉CoT的方法，你可以在支持设置消息模板的chat前端（比如rikkahub中）设置如下的消息模板
<think></think>{{ message }}

然后我们可以通过提示词引导Gemini按照我们定义的方式进行简短但有效的思考来提高输出质量

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 无水硫酸铜)

Invalid media:
image
image

88 views17:39

linux.do

现在注册的dnshe 不能配置NS了吗？

3 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: sddxsm)

Invalid media: image

66 views18:06

linux.do

十二月廿五日，熬夜补“练字作业”有感，信笔而出

写下这一段的时候时间为01点41分喵，本人还有三页没写完喵
天杀的喵，明天早上要检查喵
预计两点十几分才能睡觉喵

----------------------

正文

平安好圣诞，宽案灯火暗，
足寒腕僵字迹散，miku赛博伴。

太白歌行过，又誊诗圣作，
心焦气燥乱抄没，成效能何说？

----------------------

或许是渔家傲吧，但没注意什么平仄
补：查了一下，只有字数相同了，笑（

祝大家安眠喵

PS：补一个miku自习网页
Study With Miku

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: LaFanCYC)

61 views18:06

linux.do

转让一台 netcup

转移码：693ce0837ecf4b97a856c5e0468866b8
具体型号：RS 1000 G9.5 iv PRO NUE JUN25
AMD EPYC™ 7702
CPU cores: 4 dedicated
Main memory DDR4 ECC: 8 GB
Server location: Nuremberg, Germany
Hard disk:
320 GB SSD (instead of 160 GB)
6.25欧

4 posts - 3 participants

Read full topic

via LINUX DO - 最新话题 (author: Kank)

63 views18:06

linux.do

【大功能更新】LLM 轻量高性能智能答题服务

适用于OCS网课助手的LLM轻量高性能智能答题服务开发调优

[17665386000344481933410315224902] 这个项目是佬友的一个项目的重新实现，对我来说原来佬友的实在太难用了日志没有debug没有，还有鲁棒性问题题目也不能导出，答案都经常无法正常获取，还没有开源于是自己花几小时做了个。原项目：不打磨了，先开源再说！利好学生党！AI题库自动答题，支持公益站使用-狗库不过还是感谢佬友开发这个项目。才发现已经有了，不过我这…

【功能征询】LLM教育平台智能答题服务开发调优

从适用于OCS网课助手的LLM轻量高性能智能答题服务继续讨论增加了一点小功能发布了 0.2版本问一些大家还可以添加什么功能优化体验。联网搜索怎么构建比较合适，能保持轻量化。对于仪表盘这类有没有必要？

增加了联网搜索和置信度评估的功能。
置信度评估参考了这篇论文。arXiv.org

Can LLMs Express Their Uncertainty? An Empirical Evaluation of Confidence...

Empowering large language models to accurately express confidence in their answers is essential for trustworthy decision-making. Previous confidence elicitation methods, which primarily rely on white-box access to internal model information or model...

可以看图， Self-Probing方式效果很明显。

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 黯绛)

Invalid media:
image
image
image

57 views18:06

linux.do

顶部tab最新去哪了

3 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: Que2333)

Invalid media: image

66 views18:37

linux.do

手机浏览器登录L站问题

在手机端safari浏览器和google浏览器登录L站，一直在加载登录图标，点击没有反应是什么原因？提示用google账号登录页不行，在电脑端浏览器登录是正常的。

7 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: root-tm)

Invalid media: image

66 views18:37

linux.do

洛天依又又又上cctv了

[朝闻天下]我国虚拟数字人领域首个国家标准正式发布
1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: 多玩幻灵qwq)

Invalid media: image

60 views18:37

linux.do

PTT站在马年元旦开放注册1天（需答题），需要注册邀请码
届时需要的佬友可以蹲蹲

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: NEFF)

48 views19:06

linux.do

大晚上的内存条寄了，难受啊

在床上用平板串流玩着游戏，突然发现连不上了，机箱亮着屏幕灰屏，本来以为重启一下就好了，结果win11每次重启都报不同的错，猜测内存问题，进BIOS关expo，依然进不去win11。还好有个Ubuntu的移动硬盘，进去装了个memtester，28G直接卡死，换成4G一开始就各种报错，于是确定是内存问题了。

然后拆开机箱，拔下内存条擦擦，互换了下位置，这下能进win11了，运行Windows的memtester，一秒后直接系统报错……再进Ubuntu，这下4G跑了挺久，换成16G中间在block sequential卡住。

试着开expo，直接Ubuntu和Windows都进不去……

内存是五月东子那买的光威龙武弈，459买的现在点进去看要两千……希望东哥能痛快点给我售后

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 宫野志保)

53 views19:06

linux.do

【Agent开发】搭建与开发略懂帖

简述

“搭建（Building）”与“开发（Developing）”AI Agent，实则指向了两种截然不同但又互为补充的技术路径与工程范式。

搭建”更多指向基于 Coze 、Dify 等低代码平台的业务逻辑编排与产品化落地，强调对模型能力的理解与工作流（Workflow）的设计；而“开发”则指基于 LangChain 、LangGraph 等代码框架进行的底层工程构建，涉及状态管理、工具链集成及复杂推理回路的实现。两者虽有交集，但在技术栈深度、交付目标及架构上完全不同。

搭建

一、低代码编排与业务侧落地

1. 岗位

关键词：Dify、Prompt、SOP、AIOps
不要求从零编写复杂的底层代码，而是依托于成熟的LLM Ops平台。依赖平台，通过平台提供的可视化画布，可以通过拖拽来定义agent的工作chain。
核心能力是将业务逻辑转化为DAG（面试高端用词），例如一个客服Agent可以转化为：“用户意图识别 → 知识库检索 → 答案生成 → 满意度评估” 的节点流程。其中可以涉及stt、RAG检索、LLM、API调用（tools）等等，当然这些都是有现成的SDK或者框架提供，无需注意技术实现用就可以了。
逃不掉的一个就是RAG配置，注意这里是配置而不是优化（检索算法），更多的工作室：上传文档、选择分块策略、调整检索阈值。

2. 画像

AI架构师、AI产品经理，核心是业务理解、模型调优（非微调、训练），关注的是问题解决率（效率、成功率、失败率），体感响应延迟，幻觉率（关键词触发：上下文相关性、忠诚度、答案相关性），RAGAS。这里的一些名词若有不懂可以配合AI学习，我就不展开了。

开发

岗位

关键词: Python、LangChain、FastAPI、VectorDB、Docker等等

● 顾名思义直接操作代码来控制LLM行为，构建自定义运行环境。LangChain应该属于霸主地位了，有些岗位要求有开发经验甚至阅读源码，深入理解框架源码。
● Custom Tools（自定义工具），这个可以类比cc里面的内置工具，例如编写一个查询企业私有SQL数据库并进行数据清洗的Tool（langchain sql agent二开）。
● 状态管理，需要自行设计长短期记忆（Memory），解决多轮对话中的上下文问题。
● 部署与运维，涉及将Agent封装为微服务，要处理三高问题，要掌握容器化技术。企业平台研发、架构分析，垂直类Agent商业化应用落地。
● RAG优化，非结构化数据解析处理、向量化、检索算法优化

高阶

熟悉Transformer架构、主流大模型技术栈、LLM微调、推理优化、多智体系统和通讯协议。不仅能开发功能，还能定位agent能力、llm能力的不足之处，提供改进意见，提供改进数据集。例如：
web agent方向：需要全栈能力是必须的，爬虫技术这这里有很大的用处。
code agent方向: 程序语言语法、代码结构分析、自动化代码生成（掌握语言越多越好，掌握编译原理），这个能力一般干过插桩技术、编译器能力都是顶级满足的。

LangChain 与类OpenHands 区别

LangChain

组合

LangChain不仅仅是一个库，他是开发的胶水层和标准库。它的核心价值在于抽象，把llm开发拆分成了几个模块，使得开发者通过组合的方式构建复杂系统。
Chain：定义最基础的线性逻辑，例如RetrievalQAChain封装了“检索文档 → 拼接 Prompt → 询问 LLM”的全过程，掌握预置Chain是必须的。
Agents：上面我提过langchain的sql agent，当然还有其他多种Agent，你可以把这些agent作为subagent来理解。
Memory：多轮对话的核心，开发者需要根据自己的业务选择将记忆存储在什么地方。
Tools：这个我们都很熟悉，他是agent的手，langchain定义了Tool的标准接口，你可以把任何可以调用的方式都写成tool来实现功能拓展。

LangGraph

解决langchain调试困难，逻辑黑盒问题，状态管理问题。推出了langGraph。想要构建长周期任务、有容错能力，而不是简单的问答机器人，大部分技术开始转向LangGraph。

类OpenHands（OpenDevin）

PC使用能力

特征：CLI First、系统权限、工具链、权限模型
我们的体感就是这类agent直接跑在我们电脑中，有各种权限、技能、工具，可以作为助手角色来辅助你解决一些pc上的事务。例如写代码、整理文件。

特点

● 定位 ：开源的 AI 软件工程师（应用/平台）。
● 类比 ：它是一个已经造好的、全副武装的机器人 ，你只要对它说“把这面墙刷白”，它自己就会去拿工具干活。
● 作用 ：它是一个完整的产品。它不仅包含 Agent（大脑），还包含了一个沙箱环境（电脑系统） ，它能真的打开终端运行 ls -la，能真的打开 VS Code 编辑文件，能真的打开浏览器查 StackOverflow。
● 特点 ：开箱即用，面向最终用户或开发者辅助，而不是用来开发的库。

总结

LangChain是基建，定位底层开发框架，它提供了构建 LLM 应用的基本组件，通用性极强，你想造个狗窝还是摩天大楼（Agent）都可以用它，但它本身不是agent，需要你去搭建。
OpenHands是造好的开箱即用Agent，专注于编程特定领域。
是否可以利用LangChain来实现一个OpenDevin？ 可以，实际上OpenDevin核心逻辑就是由类似 LangChain 这样的“胶水层”和 Agent 逻辑组成的。

MCP与沙箱

支撑 Agent 运行的新兴基础设施。这部分内容是区分初级开发者与高级架构师的分水岭。

传统方式 vs MCP

传统 LangChain 开发： 如果你要让 Agent 访问 Google Drive，你需要去 LangChain 的库里找 GoogleDriveRetriever，或者自己写 API 封装。每接一个新服务，就要写一遍适配代码。
MCP 方式： 开发者编写一个符合 MCP 标准的 MCP Server（例如一个连接 Postgres 的 Server）。任何支持 MCP 的 Client（如 Claude Code）都可以直接连接这个 Server，自动获取工具定义和资源接口。
所以现在出现了一些岗位是MCP开发，已经从agent开发出来了一个新的分支。

安全沙箱

Agent运行时环境，可以利用Docker容器化、Firecracker 微虚机。总之agent开发职位中也是常有提及的一个技能，同时这个部分在agent评测里面也会再次提到，这里就埋下一个坑位到那边再讲。

场景

企业内部知识问答

偏向于搭建，利用dify + 钉钉/飞书（目前这种落地场景很多）。业务逻辑清晰，无复杂推理，核心在于知识库的质量。

自动化采购

LangChain + Python + Crawler + ERP API，涉及多轮决策，需要精确控制流程状态，且需要深度集成内部老旧系统。
这里可能还会有CI、CD提效，DevOps等等的集成需求。

辅助研发、提效

claude code（同类开源or自研or二开）+ 私有化模型（api）+ MCP，这里的二开有很多是基于vscode，举例说明cline，antigravity都是一样的表现形式不一样。私有化模型开源llm例如qwen 235b。api就简单了去买就好了（这里有涉及一个pii脱敏的问题，防止内部代码外泄）。

未来

搭建的门槛将进一步降低，因为llm能力越来越强，把一些通过langchain硬编码的逻辑，被llm的CoT取代了。
开发将继续下沉到基础设施，评测工程师目前开始出现岗位，负责构建自动化测试集，评估agent，为dpo、sft提供专业帮助。Mcp工程师刚刚已经提到。优化工程师优化推理速度，优化资源调度，优化算法等等。

先讲到这里吧，感觉把搭建和开发讲清楚，拿岗位来描述职责，以及提到搭建和开发可能接触到的技术栈，应该扫盲了。
下一篇我们来讲Agent评测的扫盲内容，从不同的测试集讲起，以及目前的一些跑分好为什么就是不好用现象的简单解析。

33 posts - 25 participants

Read full topic

via LINUX DO - 热门话题 (author: beingS)

Invalid media: image

60 views19:17

linux.do

小地方结婚早原来这么普遍

回老家发现很多同龄人娃都比我高了🥲还碰到几个三十多岁就当爷爷奶奶的，简直比大城市的同龄人要领先十多年

131 posts - 119 participants

Read full topic

via LINUX DO - 热门话题 (author: bb_aa)

42 views19:17

linux.do

公益站看过来造一个轮子 newapi-tool

公益站佬们，还有哪些要添加的功能吗

因为自己开放公益站数据库端口被敲诈勒索了 3次 😭

很早就想早这个轮子
github.com

GitHub - james-6-23/new_api_tools

通过在 GitHub 上创建帐户来为 james-6-23/new_api_tools 开发做出贡献。

超级简单一键部署脚本

bash <(curl -sSL https://raw.githubusercontent.com/james-6-23/new_api_tools/main/install.sh)

脚本自动检测newapi安装目录和 newapi网络

需要部署newapi

兼容pgsql和mysql spoiler

60 posts - 53 participants

Read full topic

via LINUX DO - 热门话题 (author: 不过减速带)

Invalid media:
image
image
image
image
image

44 views19:17

linux.do

Antigravity Opus 遇到错误曲线救国的办法

在 Antigravy 里用 opus 聊需求，聊的嗨，最后要落地的时候就经常遇到如下异常：

Agent execution terminated due to error.

无数次重试都没有效果。这时候就需要曲线救国了。
两个步骤：

1. opus 下，让他输出所有操作，不要执行操作。
参考提示词：你把你要做的内容全部展示给我，先不改文件
2. 切换到 gemini 模型，执行变更，并提示不要做其他操作，因为gemini真的很喜欢写代码
参考提示词：现在按你说的修改文件，不做其他操作

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: ShakaRover)

43 views19:38

linux.do

Alist vs Openlist

user story:

● 管理员可以挂载多个网盘账号/目录
● 访客可以下载/上传网盘文件
● 访客可以在线阅读/播放网盘文件
● 支持302（只使用百度云和夸克云），不想占用太多服务器流量/内存

需求是这些，目前在纠结使用alist还是openlist

两者优点是都能满足需求

alist缺点是疑似投毒+商业化前科

openlist缺点是为爱发电、能力有限

两者共同缺点是，都有还没解决的内存泄露问题

想听一下佬友们的意见

Click to view the poll.

7 posts - 5 participants

Read full topic

via LINUX DO - 最新话题 (author: kvchiu)

48 views19:38

linux.do

佬友们，我这开着窗户，是不是大半夜进脏东西了啊！

莫名其妙Ipad笔失灵了，然后搞半天没搞好，突然几个显示器就连接异常，开始跳屏。大晚上开着窗户，是不是飞进来什么脏东西！有佬友，帮我算算看吗！

2 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: HollowKnight)

50 views19:38

linux.do

刷贴时差点弄混绿坝和六五

刚才在论坛里闲逛，看见了一个文文头像的人在维护帖子的归类和标签。我第一眼看过去以为是六五，但是仔细一瞧发现文本是繁体字，也没有标志性的口癖。抬眼一看才发现原来是绿坝。

两个文文，真是的……w

7 posts - 4 participants

Read full topic

via LINUX DO - 最新话题 (author: 八六)

51 views20:08

linux.do

【内测公益】MetaUI一句话生成20+高可用设计图

meta-ui.info

AI Canvas

AI-powered canvas application

1225版本更新内容如下
1.UI版本更新

2.新增主题设置

3.新增节点链接用户UX页面跳转

4.最牛逼功能模仿-大家可以去美叶上下载截图让他来仿照一次20张应该没问题

在次送上1500积分激活码
1d91ad3c0c5b9c38
61f3326f76581b16
c8d3dba33ce5dc38
f27bac10cae52831
0b146e69db54b63f
223f8c0b90907c47
71312987d3902e9b
d566da1855dd00f5
84dc1e462f66002f
16d33c83e5040ead
b80d62aa8cf29a9c
af328e3d0223ec2d
366f7cee289ad596
abb9a9ec740496ed
135c2c89029d1f4d
473ec9436ad09d03
7e819e3f76f6ecc6
e4d65eb233cf9bbb
35e81143d117435e
61bac06be6acfa13
62e3dc55d0c47fa1
b54b63e991bfdece
87669a0dac06b73c
90ef299aeca68caf
ab20d087e3a57d71
aae767ed9496e01b
4feb63f4e8cf0a13
ab85fda503b6c404
255def6d6211992b
4657d42221a6be3b
868b09a012365eb6
3875eab0b9791caa
034ed56cbfe42d02
f516f17f207ab35d
25318cc47f39c8ed
f9c824285c3e8edd
b2098260ead64a21
9952e44120842e86
bee78d6f93d7462b
12587542aab8e752
324c77c363bbedac
356ff53dc2aedbee
cc5d219ce531d149
0607a35c846e82d5
3350adf328a8a775
c9570ec1062a782d
215d57bd7733da04
6c810d58ff3192dc
0894ae6ae1e5a8be
d10de561d281695f
d49ff362d9313322
2f30928ca1bbf419
fad81979c5eb47ee
6ae7bac9a613f934
cdbeb1a9d6b8a15b
d6ab0c612fd630cc
3edc0c1c635ef7b5
f38feb0d40ba2008
ce40c6171364786e
a074210962b6beb6
d9c278c6541f70bf
0caf1e55449899ca
0f96c6e9553815e2
91213e817762fd3b
69581be3598ecc78
7c694f524dc74090
630ad876455b6a5b
b7bb60f0bd240d60
946e8350d1454e81
fb7844fdc86f29e1
a36415bcfa1695e1
445f61d9a34e9ec9
15b0f7330a92eafd
774cf5bed6e357ab
0ca82de98ebc9df6
0e056a4cafb21498
f6083b3b41288577
61e81942536e201b
5904eadf5fedb736
23b704d55f6828ac
d366a499cf564db3
fda8450dce55237e
50ce4f0007a752a0
3da5228856409e3e
07be1334cdcf5f3c
f3122d531cc92e1b
284535a627123b88
5ecdbc554a4b61b4
ecdffe2be77edf85
6d7154c1aef2640a
f688d098d7aadfe0
baf71cfaf0332cdc
4e2aebb4a1dfffee

3 posts - 2 participants

Read full topic

via LINUX DO - 最新话题 (author: 诺河)

Invalid media:
image
image
image
image
image

❤1

51 views21:04

linux.do

让 AI 写的界面如何降 AI 味

以下讨论的是web开发

目前用 codex 比较多

各家的AI coding工具都有界面和ui稀烂、不美观的问题，有些人觉得漂亮，但我这种细节党是完全无法接受的细节和交互方面

而且让ai参考现有项目的代码风格和ui也是问题，ai有自己的一套，你的ui他不遵守，比如太爱用6px、8px；……我项目要求用 5px 和 10px

然后就导致我不关心代码实现，这方面基本（80%）是没问题的，后期修改的情况少。但是ui部分总是我花最多时间的，去微调和调试 😀 我太喜欢抠细节了，页面强迫症患者，1px的不对齐就非常难受（flex是我的福音）为了外皮好看完全不考虑里面的style和code乱七八糟的

ai有一个很严重的问题，写的ui紧凑性太差太差了，太爱用 margin加padding而且还套娃好几层

例如这个openai官方的示例，这个ai生成的界面就有很多问题，可用性很差

而且是超级难看

1 post - 1 participant

Read full topic

via LINUX DO - 最新话题 (author: Rebot)

Invalid media: image

43 views21:04

About

Blog

Apps

Platform