LinuxDo 新帖推送
184 subscribers
253K photos
316K links
Download Telegram
标题: 【新人报道】顺利入站,ping以下各位佬友~
作者: #yoyou
板块: #搞七捻三
编号: 1800898
帖子: https://linux.do/t/topic/1800898
时间: 2026-03-23 13:00:36
摘要:
本人还是学生一枚,久仰L站大佬如云,今日顺利注册,甚是激动!
遂发帖留念,并问给位佬友下午好~
标题: 新人报道来学习
作者: #喻琨
板块: #搞七捻三
编号: 1800910
帖子: https://linux.do/t/topic/1800910
时间: 2026-03-23 13:02:29
摘要:
大家好,我是嗋玏,学生一枚,关注 AI 和 Linux,来社区学习交流。
标题: 一种检查特定 API 模型是否为原始官方模型的技术方案
作者: #M1n9X
板块: #开发调优
编号: 1800916
帖子: https://linux.do/t/topic/1800916
时间: 2026-03-23 13:04:22
摘要:
最近看到一篇论文 [2603.01919v2] Real Money, Fake Models: Deceptive Model Claims in Shadow APIs
里面介绍了几种方案来检查特定 API 的模型是否为原始官方模型。


主动指纹识别检测,使用开箱即用的 LLMmap 框架:

原理:LLMmap 是一个主动指纹识别框架。它的核心原理是通过向模型发送一组精心设计的查询集,分析模型的输出特征,并计算其与参考数据库中官方模型输出的余弦距离 (Cosine Distance),从而精准分类并识别模型的真实身份。
自行检测标准:论文建议使用至少 24 个探针向端点发起查询。如果计算出的余弦距离超过官方基准的 1.2倍,或者框架识别出的 Top-1 模型与 API 宣称的模型不符,则可以直接判定该 API 存在欺骗行为。



统计学分布检测,使用开箱即用的 MET (模型等价性测试) 框架:

原理:部分 API 可能在指纹特征上伪装得很好(例如没有替换模型,但修改了推理参数或截断了上下文窗口),此时可以使用 MET (Model Equality Testing)。这是一种统计测试方法,通过双样本假设检验来判断第三方 API 的输出与官方 API 的输出是否来自同一分布。它与 LLMmap 是互补关系。
自行检测标准:论文建议使用至少 500 个样本在显著性水平 \alpha = 0.05 下进行假设检验。如果测试结果拒绝了分布相等的原假设,即表明两者输出存在统计学上的显著差异,说明模型并不等价。



元信息与稳定性分析 (Meta Information Analysis):

原理:除了依赖外部框架,还可以通过对比 API 的推理延迟时间 (Inference Latency) 和 生成 Token 数量来进行判断。面对同一个问题,官方 API 通常会表现出稳定的延迟和 Token 输出数,而影子 API 由于频繁更换上游模型或路由策略混乱,这些指标会出现无规律的剧烈波动,变异性通常会超过官方 API 的 1.2 倍甚至 2.0 倍。
自行检测标准:在预留的测试集上进行至少三次独立的会话测试。如果发现准确率的标准差超过 5 个百分点,或者推理延迟的变异系数超过 0.15,则说明该 API 的后端极不稳定或存在动态模型替换现象。



考虑到后面 2 种方案的复杂度,我基于第一种方案,也就是 LLMmap 做了些魔改与测试,发现这种方案确实可以一定程度上识别出来不同 Endpoint 上的模型是否属于同一个模型。
简单来说,我使用自行搭建的中转站中的 grok-4.1-mini 与 grok-3-mini 来进行对比

实验 A:快速冒烟检查:当使用 2 rounds x 1 prompt conf 时,无法得到确定结论
实验 B:中等强度验证:增大样本数,4 rounds x 1 prompt conf 时,结果显示 likely_same_model,也就说算法判断 2 个模型可能是同一种模型
实验 C:更强采样下的正式验证:继续增大样本数到 6 rounds x 2 prompt confs 时已经可以明确得出 likely_different_model 结论了,也就是说算法检测出来属于 2 种不同的模型了。详细的实验报告可以参考 LLMmap/docs/experiment.zh.md

在实验 C 中,一共调用了 192 轮 API 请求,理论上继续增大样本数,结论会更有说服力。实验 B 中的结论很可能是随机噪声权重依然比较大导致的错误结论。
目前整体试验还比较简单,佬友们可以参考代码,继续测试一些其他场景,看看这种方法是否真的能够检测出来不同模型的指纹。
魔改的代码库详见 GitHub - M1n9X/LLMmap · GitHub
标题: 海外有那种10年低价域名吗?
作者: #Koala
板块: #搞七捻三
编号: 1800919
帖子: https://linux.do/t/topic/1800919
时间: 2026-03-23 13:05:21
摘要:
我在国内公有云注册过 180¥/10年 的低价域名,不过海外有没有类似的。
标题: [抽奖]:腾讯QClaw内测邀请码 * 1(截至到3.23 21:00)
作者: #GoAndRun
板块: #福利羊毛
编号: 1800921
帖子: https://linux.do/t/topic/1800921
时间: 2026-03-23 13:05:31
摘要:
腾讯QClaw内测邀请码 * 1,有需要的佬友可以积极评论哦
抽奖工具:https://lottery.linux.do/
标题: Google AI Studio 现在与 Firebase 集成
作者: #stevessr
板块: #前沿快讯
编号: 1800924
帖子: https://linux.do/t/topic/1800924
时间: 2026-03-23 13:05:46
摘要:
Google – 18 Mar 26





Introducing the new full-stack vibe coding experience in Google AI Studio

Start building real apps for the modern web with the Antigravity coding agent and Firebase integration now in Google AI Studio.













对,现在有 Next.js 了





The Firebase Blog





From prompt to production: Build full-stack apps faster with Google AI Studio...

Today, we’re announcing that Firebase is now integrated with Google AI Studio, accelerating your path from prompt to production so you can turn your vibe-coded ideas into fully functional apps with robust backends. Read on to learn how this works and...
标题: 为什么现在雪山救狐狸酱板鸭复仇的视频突然火了
作者: #Sienna Smith
板块: #搞七捻三
编号: 1800928
帖子: https://linux.do/t/topic/1800928
时间: 2026-03-23 13:06:39
摘要:
在网上看到很多版本,有人知道提示词么?
标题: 有个关于公益站的问题想请教一下
作者: #payy
板块: #搞七捻三
编号: 1800930
帖子: https://linux.do/t/topic/1800930
时间: 2026-03-23 13:07:03
摘要:
第一次用这些公益站,我用的是Cherry Studio,它有绘图功能吗,还是纯文字的,因为我想用它生成图片,它提示“非常抱歉!因为当前对话窗口的系统限制,外部的图片链接没能成功加载显示。”
标题:🐟上,代注册,代写小作文,是否已经严重违反了社区准则
作者: #無名 山河
板块: #运营反馈
编号: 1800932
帖子: https://linux.do/t/topic/1800932
时间: 2026-03-23 13:07:40
摘要:
社区欢迎新鲜的血液,注册小作文本质也是一种筛选,某些3级用户,已经出现代写小作文等服务,是否应该视为严重违反社区准则。这真的好吗
标题: 最近用Nas搭建了一个OpenClaw,结果很痛啊
作者: #nank
板块: #搞七捻三
编号: 1800933
帖子: https://linux.do/t/topic/1800933
时间: 2026-03-23 13:07:42
摘要:
用的是绿联Nas 4800Plus,Nas 官方给的是MiniMax2.1 享用一个月。
劣势:只能文字、不能图片,导致昨晚绑定个微信的OpenClaw Channel
会导致和微信握手的二维码显示不正确,码渲染有问题,折腾一晚上没弄好,放弃了。
建议最近有这台机器的同学别操作了,因为会导致docker容器反复重启,导致容器废掉。
我最后在应用商店重装了openclaw,我的定时任务都没了。
标题: 现在ai好像都搞agent去了,数学来讲o哥还是天花板
作者: #Myallure
板块: #搞七捻三
编号: 1800934
帖子: https://linux.do/t/topic/1800934
时间: 2026-03-23 13:07:44
摘要:
o哥是怎么做到这么全面的,数学逻辑推理、代码、agent一把抓,幻觉还不高,实在难以想象这是一个规模不是特别大的模型。国模k2.5 glm5 mimo数学感觉都对比前版本退化了
标题: 佬们,有没有好用的扫描版pdf处理流程可以分享一下
作者: #卖女孩的小火柴
板块: #搞七捻三
编号: 1800937
帖子: https://linux.do/t/topic/1800937
时间: 2026-03-23 13:08:29
摘要:
最近正好准备换一个电子书管理软件,就想着把存的电子书重新处理一遍,之前一直都是下完扔进wps/abbyy扫一下就完了,因为扫描件的质量参差不齐,ocr的质量也就一般,不知道佬们有没有思路可以分享一下
标题: 祈祷新编程语言的发明
作者: #Xushengfeng
板块: #搞七捻三
编号: 1800940
帖子: https://linux.do/t/topic/1800940
时间: 2026-03-23 13:08:52
摘要:
现在越來越觉得只有在基础设施搭配好的情况下ai才能编得更好,利好人类就是利好ai
诸如ts、rust以及它们的编译前检查等现代特性的效果大家有目共睹
下面开始幻想出现一门新的编程语言

自动推理几乎所有类型
可以添加或者自动添加数学证明,保证程序绝对正确
有了近乎完美的类型和数学属性作为提示后,编译器可以尽情发挥其聪明才智
自动处理多线程,自动根据运行复杂等拆分
自动优化算法,比如某个数据分布是几乎随机的,那自动优化为快排,如果分布有规律就使用冒泡
临时运行统计,进行优化
可以像写脚本语言一样,但是编译后达到原生语言的水平(配合算法优化不敢想

尽管上面充满了幻想,但是每个部分都有相关实现
比如数学证明,微软就有个 Dafny 语言,可以书写数学证明来保证下面的代码正确性,不会出现意料之外的情况
又如自动优化算法,有个 Herbie 项目,可以找到数学上等价,但是对于计算机来说精度更高的公式
我们经常会发现高性能的代码与高可维护的代码有些相悖,一些简洁的代码性能不够好,性能高的就难以看清其逻辑。有了上面幻想的编程语言,无论是古法编程还是vibe,都有更多信息去处理和实现业务逻辑,减少对底层的理解,并且可以写出高性能的代码
希望且期待着