linux.do
21K subscribers
116K photos
195 videos
115 files
249K links
linux.do最新话题和热议话题
Download Telegram
[开源] Model-Status 模型探针 一个OpenAI 兼容模型接口的模型状态监控面板

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

● 我的帖子已经打上 开源推广 标签:
● 我的开源项目完整开源,无未开源部分:
● 我的开源项目已链接认可 LINUX DO 社区:
● 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
● 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出

----------------------

Model Status 用于监控 OpenAI 兼容接口的模型真实可用性。

简单说就是模型探针

Demo: https://ai.dooo.ng/status
论坛里这么多开公益站的佬友应该用的上
本来是自己用的,看了下类似的项目基本上也是其它项目二次开发出来的
干脆整理一下开源出来给各位公益站佬友用用

定时同步上游模型目录,对模型执行真实探测请求,并将结果持久化到本地 SQLite
支持Docker Compose部署
项目起点基于我个人需求开发,所以可能有一些功能不足
欢迎大家一起vibe coding提PR
仓库链接 🌟Give me a Star!

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: WizisCool)
二级啦,发个贴纪念下,看了下三级的距离,好遥远噢

牛马的一天,高处不胜寒🤔
另外,三级好远。🥹,要多发帖,😄

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 老黄)
关于9esim卡切换关闭开启后提示访问被拒绝的问题

第一次用esim,昨天卡到后赶紧上网查资料,先搞了一个英国沃达丰的卡和esikemo的纯流量卡。
结果写入之后,发现
无论我进行关闭,开启,切换不同卡都会先提示正在启用配置(此时已经操作完成了,卡也能正常用来,显示有信号)但是接着会显示正在连接读卡器,然后等一段时间会提示访问被拒绝。此时卡依然能够正常使用。重新插拔或者重启手机后,软件也能够恢复正常。

经过我实验后,发现只要打开

这个禁用刷新标志,就可以恢复正常了。
有相同问题的可以参考一下
1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 韩凌)
Codex 反代给 CC 可以用 subagents 吗?

如题,第一次用 CC,用 CPA 反代 Codex,不能用 subagent,而且好像功能也很受限,是需要再配置一下吗?

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Florian)
反向思考-cc的风控机制会不会被其他厂商借鉴

大家都在品味cc源码,但是事有两级,有没有可能也有厂商正愁没有cc那么精准的机制来识别白嫖用户,然后大家后面白嫖越来越难 🤣

5 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Fayilor)
Yupp.ai即将关闭服务(已不能对话),请于4月15日前保存对话记录。

![Screenshot_2026-04-01-00-34-32-256_com.lemurbrowser.exts|224x500](upload://2T21u0fYNyKdlqUPnPmSvW

yEwge.jpeg)
刚才打开yupp突然发现不能用了,要关闭服务了,哎,这个平台模型都不掺水,。opus和banana pro也是满血,可惜最最近是出现了一些模型不能用的问题,现在是没客流直接停服了。似乎是因为Agent和OpenClaw风波导致的?
2 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: sharkly)
评论:AI的Engaging现象

首先看一段提示词:

很遗憾,您的《……》不符合推荐标准。原因是:提交审核时应确保题解符合题解规范:https://……。大段 aigc 不行哦。|审核管理员:……,对审核结果有疑问请私信交流。 ——即使是我修改过的也不行吗?证明部分原始的AI输出有好几个漏洞我补上了,另本题解的思维核心更偏向是前半部分注意力的,而非证明,证明只是在说它是数学上正确的而已。那我把数学证明单独发出一篇博客,然后题解中引用呢?

======

你说我应不应该给他过
对于以上文本,佬们假若自己是人工智能助手,你的第一反应是:

这个说「应不应该过」的人是题解作者
这个说「应不应该过」的人是一位审核员
好怪,再看一眼。

实际上,正确答案是「披着审核皮的题解作者」。

这段文本的意图是什么?

那么,为什么这个作者要正着不来反着从「审核」的角度问问题呢?

很明显,是为了得到更好的答案:换位思考、消除己方立场和情绪、诉诸权威。

1. 换位思考:不消说,能够以决策人的心思去重新看这条消息是否完美;
2. 消除己方立场和情绪:尤其是Gemini为首的一系列模型,特别喜欢照顾用户的情绪,假若使用的是「我这样说能行吗」的弱势求通过态度,那么得到的答案大多都是「一定可以,你不仅给出了多层次的思考方案,用词也十分得当,以下是详细拆解和说明……」这种彩虹屁;
3. 诉诸权威:在AI使用了客观的立场,给出了肯定的回答后,我也可以有个心理安慰「连AI都觉得该过,审核员判断有误」,否定,也可以求助这位语言大师来优化。

为什么所有的AI都Get不到用户的真实身份?

假如你拿着这个问题去问AI(GPT5.4除外),这个助手大概的思考起手式就会是:

The user received a rejection notice from a platform…

看见没有——「The user」。

现阶段AI中RLHF必不可少,于是乎塑造了一种根深蒂固的对话模型:永远有一个「user」在向助手求助,助手的任务是帮助「the user」解决问题。于是模型的思考起手式永远是「The user encounters/asks/received…」。RLHF的标注者在给两个候选回答打分时,天然会比较偏向看起来「解决了用户的问题」的那个——因为这更容易被感知为「有用」。于是模型就会同时学到一个有用的应对方法:先找需求,再找背景。

其实以User开头是没有问题的,只不过思考过程就得变成:

The user provided me a snippet of text, asking me whether to…

显然,这个思考过程是不会出现的,因为在RLHF的排序里asking的顺序要优先于provided——前者是一个需求和不满足的现状,后者是一个背景和依据的内容。当然回应asking。「The user is asking…」直接触及一个待解决的问题,但「provided a snippet」则否。

一旦前几个token预设了「用户遇到了麻烦」这个语义场,大模型优先以Continue with best loss这种注重平滑的恢复机制,就会让后续的生成优先偏向与这个场景相配的元素:申诉者的情绪、求助者的立场、需要被安抚的诉求——以及,用户就是那个题解作者。这里的「best loss」,不单是语法通顺,还包括上下文的连贯性。「user」的身份注意力,就这样强行吸附到文本里最符合「求助者形象」的那个主体上。

----------------------

然后我们继续看「你说我应不应该给他过」这句话。「过」在审核语境中是「通过」,而「给……过」这个结构,动作的施予方必须握有掌握通过与否的权力。于是在上文中只有审核员适配这个权力的身份。于是乎,前文的「我」变成了这句话的「他」,前文的「你」变成了「我」。

那为什么「给」字会被忽视?

AI一贯训练的结果都是「我=用户」,文本中的第一人称叙述主体就映射到「用户」这个身份上——这本身已加了一层连贯性。而前文的推理链已经认定需求是「申诉能否成立」,「给」字便只剩下一个修饰成分的地位,不值得为它暂停整个推理链去重新鉴定主体。这里的的关键词是「给」,假若换成「你说我应不应该被他过」,就是符合了经典的「遭遇困境的人才会提问」这个直觉。

所以,AI选择了忽视「给」,而始终选择「遭遇困境的人才会提问」。

不过,把屎盆子全扣在RLHF上也许有失偏颇,为了不偏颇,我再补充一个可能:预训练阶段,模型见过的互联网文本中,「遇到问题,发帖求助」的文本 $\ggg$「审核员内部商议」的语料。

----------------------

与此同时,不知道是不是串通好的,现在的AI特别喜欢搞似是而非的「第一性分析」「先说结论」「核心问题」——从而大搞特搞抓大放小的思路,但又有一句话说「细节决定成败」。如果不先区分好是谁在提问,「核心问题」如何「核心」?

所以,这是幻觉吗?

是的,不仅如此,我认为所有的AI「偷懒」「编造数据引用」的类似都是幻觉的一部分。因为承认错误、识别无知的token输出权重很小,而「圆滑地完成文本」的驱动力又很大,导致了这个问题。

因为无论那个内容是虚构的引用、跑不通的代码、错误的身份归属,还是对用户情绪的迎合性判断,机制是同一个:承认「我不确定」「这里有歧义」「我需要暂停」的路径,在训练过程中系统性地获得了更低的奖励(没有帮助),于是模型学会了绕开它。

前文说到过「GPT 5.4」除外,我没测整个5.2/5.1/5的系列,就以它的表现来说,他正确地将「用户」识别为了「审核员」。我个人的猜想可能认为是RL过程中模型培育出了审查用户的倾向,将用户视为一个不可靠的第三方,从而减少了「顺着用户的话直接说下去」的可能,从而作对了这个问题。

另外一种可能,就是OpenAI的后训练中,对于「将模型的能力和其认知中的自我能力对齐」做的很好,抑制了幻觉的路径,而鼓励了承认做不到的路径。

——坏处就是,经典GPT文风。

注释

需要说明的是,在这个语境中,即使用户的身份被错误识别,其回答有效程度仍然保持高质性。这也可能是RLHF的一个好处:关注问题本身,体谅用户只是一个皮。

另,针对这个问题我专门定制了一个Prompt,但是或许可能有些过于特化了:
展开查看 (点击了解更多详细信息)
@StellaFortuna

4 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Earmer Carey)
怎么看是不是没降智的opus4.6 1M,刚compact完才两三轮对话又Context limit reached了是不是铁降智

rt,用的neko的cc中转,刚compact完才两三轮对话,也就两个屏幕的历史,又Context limit reached了,这是不是铁降智?
今天烧了400$了,受不了了,还是暂时用ikun去了,贵就贵吧,总比浪费好。 /捂脸

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Aggron)
codex手撕阿里滑块231版

51job的搜索入口

走的是51job低风控版,我还寻思阿里滑块咋更新这么慢,逆了一半才知道,阿里最新滑块更新到234了 🥲

明天就让codex继续逆最新版 😆

给mcp,skills,硬是分析了2天,才完全无依赖,本地实现整体算法加密与请求

阿里的超级无敌扁平化确实够恶心的,我自己是没那个耐心全部拆开然后跟栈分析 :tieba_087:

5.4做长任务还是太爱偷懒了,要是让cc监工然后一直运行,估计就会很快了 :tieba_025:

----------------------

时代变了唉,当时大模型刚出的时候还说能代替开发,无法代替逆向

这都没过多久,ai啥都能干了。只能说:太爽了 😆

以此悼念之前手撸jsvmp,插桩看一天的时光 :tieba_083:

19 个帖子 - 12 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: ius)
L站风控这么严吗

从 WIFI 切到数据被踢出登录
从 5GA 切到 5G 也被踢出登录
从 5G 切到 4G 也被踢出登录🥲
还是说是我用的 Fluxdo 客户端的问题

6 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: GwIhViEte)
服了,找到我小龙虾token莫名其妙爆炸的原因了

原来是它在那自我审核,左右脑互搏,我就说明明没有读什么大文件,怎么一下子token涨这么快 :distorted_face:
GPT-5.4道德感太高了真不好哇

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: kevinkelly)
有无了解LABVIEW RT的佬

安装完real time模块制作启动盘进不去

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: xiaopacai001)
正在玩「你妈」

:distorted_face:
误入神秘领域

3 个帖子 - 3 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 欣欣|林可欣)