佬友们boss上找到一个远程不知道该不该辞掉现在的工作去做
下图是该岗位的详细信息
不知道要不要去,薪资我谈到了13,但是时间有点阴间,同时试用六个月还不会缴纳社保这些。不知道有没有坑。希望老友们给一点参考意见谢谢
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 帅帅)
下图是该岗位的详细信息
不知道要不要去,薪资我谈到了13,但是时间有点阴间,同时试用六个月还不会缴纳社保这些。不知道有没有坑。希望老友们给一点参考意见谢谢
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 帅帅)
【新人报道】顺利入站,ping以下各位佬友~
本人还是学生一枚,久仰L站大佬如云,今日顺利注册,甚是激动!
遂发帖留念,并问给位佬友中午好~
16 个帖子 - 14 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: yoyou)
本人还是学生一枚,久仰L站大佬如云,今日顺利注册,甚是激动!
遂发帖留念,并问给位佬友中午好~
16 个帖子 - 14 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: yoyou)
一种检查特定 API 模型是否为原始官方模型的技术方案
最近看到一篇论文 [2603.01919v2] Real Money, Fake Models: Deceptive Model Claims in Shadow APIs
里面介绍了几种方案来检查特定 API 的模型是否为原始官方模型。
1. 主动指纹识别检测,使用开箱即用的 LLMmap 框架: ● 原理:LLMmap 是一个主动指纹识别框架。它的核心原理是通过向模型发送一组精心设计的查询集,分析模型的输出特征,并计算其与参考数据库中官方模型输出的余弦距离 (Cosine Distance),从而精准分类并识别模型的真实身份。 ● 自行检测标准:论文建议使用至少 24 个探针向端点发起查询。如果计算出的余弦距离超过官方基准的 1.2倍,或者框架识别出的 Top-1 模型与 API 宣称的模型不符,则可以直接判定该 API 存在欺骗行为。
2. 统计学分布检测,使用开箱即用的 MET (模型等价性测试) 框架: ● 原理:部分 API 可能在指纹特征上伪装得很好(例如没有替换模型,但修改了推理参数或截断了上下文窗口),此时可以使用 MET (Model Equality Testing)。这是一种统计测试方法,通过双样本假设检验来判断第三方 API 的输出与官方 API 的输出是否来自同一分布。它与 LLMmap 是互补关系。 ● 自行检测标准:论文建议使用至少 500 个样本在显著性水平 \alpha = 0.05 下进行假设检验。如果测试结果拒绝了分布相等的原假设,即表明两者输出存在统计学上的显著差异,说明模型并不等价。
3. 元信息与稳定性分析 (Meta Information Analysis): ● 原理:除了依赖外部框架,还可以通过对比 API 的推理延迟时间 (Inference Latency) 和 生成 Token 数量来进行判断。面对同一个问题,官方 API 通常会表现出稳定的延迟和 Token 输出数,而影子 API 由于频繁更换上游模型或路由策略混乱,这些指标会出现无规律的剧烈波动,变异性通常会超过官方 API 的 1.2 倍甚至 2.0 倍。 ● 自行检测标准:在预留的测试集上进行至少三次独立的会话测试。如果发现准确率的标准差超过 5 个百分点,或者推理延迟的变异系数超过 0.15,则说明该 API 的后端极不稳定或存在动态模型替换现象。
考虑到后面 2 种方案的复杂度,我基于第一种方案,也就是 LLMmap 做了些魔改与测试,发现这种方案确实可以一定程度上识别出来不同 Endpoint 上的模型是否属于同一个模型。
简单来说,我使用自行搭建的中转站中的 grok-4.1-mini 与 grok-3-mini 来进行对比
1. 实验 A:快速冒烟检查:当使用 2 rounds x 1 prompt conf 时,无法得到确定结论
2. 实验 B:中等强度验证:增大样本数,4 rounds x 1 prompt conf 时,结果显示 likely_same_model,也就说算法判断 2 个模型可能是同一种模型
3. 实验 C:更强采样下的正式验证:继续增大样本数到 6 rounds x 2 prompt confs 时已经可以明确得出 likely_different_model 结论了,也就是说算法检测出来属于 2 种不同的模型了。详细的实验报告可以参考 LLMmap/docs/experiment.zh.md
在实验 C 中,一共调用了 192 轮 API 请求,理论上继续增大样本数,结论会更有说服力。实验 B 中的结论很可能是随机噪声权重依然比较大导致的错误结论。
目前整体试验还比较简单,佬友们可以参考代码,继续测试一些其他场景,看看这种方法是否真的能够检测出来不同模型的指纹。
魔改的代码库详见 GitHub - M1n9X/LLMmap · GitHub
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: M1n9X)
最近看到一篇论文 [2603.01919v2] Real Money, Fake Models: Deceptive Model Claims in Shadow APIs
里面介绍了几种方案来检查特定 API 的模型是否为原始官方模型。
1. 主动指纹识别检测,使用开箱即用的 LLMmap 框架: ● 原理:LLMmap 是一个主动指纹识别框架。它的核心原理是通过向模型发送一组精心设计的查询集,分析模型的输出特征,并计算其与参考数据库中官方模型输出的余弦距离 (Cosine Distance),从而精准分类并识别模型的真实身份。 ● 自行检测标准:论文建议使用至少 24 个探针向端点发起查询。如果计算出的余弦距离超过官方基准的 1.2倍,或者框架识别出的 Top-1 模型与 API 宣称的模型不符,则可以直接判定该 API 存在欺骗行为。
2. 统计学分布检测,使用开箱即用的 MET (模型等价性测试) 框架: ● 原理:部分 API 可能在指纹特征上伪装得很好(例如没有替换模型,但修改了推理参数或截断了上下文窗口),此时可以使用 MET (Model Equality Testing)。这是一种统计测试方法,通过双样本假设检验来判断第三方 API 的输出与官方 API 的输出是否来自同一分布。它与 LLMmap 是互补关系。 ● 自行检测标准:论文建议使用至少 500 个样本在显著性水平 \alpha = 0.05 下进行假设检验。如果测试结果拒绝了分布相等的原假设,即表明两者输出存在统计学上的显著差异,说明模型并不等价。
3. 元信息与稳定性分析 (Meta Information Analysis): ● 原理:除了依赖外部框架,还可以通过对比 API 的推理延迟时间 (Inference Latency) 和 生成 Token 数量来进行判断。面对同一个问题,官方 API 通常会表现出稳定的延迟和 Token 输出数,而影子 API 由于频繁更换上游模型或路由策略混乱,这些指标会出现无规律的剧烈波动,变异性通常会超过官方 API 的 1.2 倍甚至 2.0 倍。 ● 自行检测标准:在预留的测试集上进行至少三次独立的会话测试。如果发现准确率的标准差超过 5 个百分点,或者推理延迟的变异系数超过 0.15,则说明该 API 的后端极不稳定或存在动态模型替换现象。
考虑到后面 2 种方案的复杂度,我基于第一种方案,也就是 LLMmap 做了些魔改与测试,发现这种方案确实可以一定程度上识别出来不同 Endpoint 上的模型是否属于同一个模型。
简单来说,我使用自行搭建的中转站中的 grok-4.1-mini 与 grok-3-mini 来进行对比
1. 实验 A:快速冒烟检查:当使用 2 rounds x 1 prompt conf 时,无法得到确定结论
2. 实验 B:中等强度验证:增大样本数,4 rounds x 1 prompt conf 时,结果显示 likely_same_model,也就说算法判断 2 个模型可能是同一种模型
3. 实验 C:更强采样下的正式验证:继续增大样本数到 6 rounds x 2 prompt confs 时已经可以明确得出 likely_different_model 结论了,也就是说算法检测出来属于 2 种不同的模型了。详细的实验报告可以参考 LLMmap/docs/experiment.zh.md
在实验 C 中,一共调用了 192 轮 API 请求,理论上继续增大样本数,结论会更有说服力。实验 B 中的结论很可能是随机噪声权重依然比较大导致的错误结论。
目前整体试验还比较简单,佬友们可以参考代码,继续测试一些其他场景,看看这种方法是否真的能够检测出来不同模型的指纹。
魔改的代码库详见 GitHub - M1n9X/LLMmap · GitHub
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: M1n9X)
海外有那种10年低价域名吗?
我在国内公有云注册过 180¥/10年 的低价域名,不过海外有没有类似的。
9 个帖子 - 7 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Koala)
我在国内公有云注册过 180¥/10年 的低价域名,不过海外有没有类似的。
9 个帖子 - 7 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Koala)
腾讯QClaw内测邀请码 * 1(乌龙事件)
腾讯QClaw内测邀请码 * 1,有需要的佬友可以积极评论哦
抽奖工具:https://lottery.linux.do/
6 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: GoAndRun)
腾讯QClaw内测邀请码 * 1,有需要的佬友可以积极评论哦
抽奖工具:https://lottery.linux.do/
6 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: GoAndRun)
Google AI Studio 现在与 Firebase 集成
Google – 18 Mar 26
Introducing the new full-stack vibe coding experience in Google AI Studio
Start building real apps for the modern web with the Antigravity coding agent and Firebase integration now in Google AI Studio.
对,现在有 Next.js 了
The Firebase Blog
From prompt to production: Build full-stack apps faster with Google AI Studio...
Today, we’re announcing that Firebase is now integrated with Google AI Studio, accelerating your path from prompt to production so you can turn your vibe-coded ideas into fully functional apps with robust backends. Read on to learn how this works and...
结果 firebase studio 倒闭是产品线合并的结果啊
3 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: stevessr)
Google – 18 Mar 26
Introducing the new full-stack vibe coding experience in Google AI Studio
Start building real apps for the modern web with the Antigravity coding agent and Firebase integration now in Google AI Studio.
对,现在有 Next.js 了
The Firebase Blog
From prompt to production: Build full-stack apps faster with Google AI Studio...
Today, we’re announcing that Firebase is now integrated with Google AI Studio, accelerating your path from prompt to production so you can turn your vibe-coded ideas into fully functional apps with robust backends. Read on to learn how this works and...
结果 firebase studio 倒闭是产品线合并的结果啊
3 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: stevessr)
为什么现在雪山救狐狸酱板鸭复仇的视频突然火了
在网上看到很多版本,有人知道提示词么?
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Sienna Smith)
在网上看到很多版本,有人知道提示词么?
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Sienna Smith)
有个关于公益站的问题想请教一下
第一次用这些公益站,我用的是Cherry Studio,它有绘图功能吗,还是纯文字的,因为我想用它生成图片,它提示“非常抱歉!因为当前对话窗口的系统限制,外部的图片链接没能成功加载显示。”
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: payy)
第一次用这些公益站,我用的是Cherry Studio,它有绘图功能吗,还是纯文字的,因为我想用它生成图片,它提示“非常抱歉!因为当前对话窗口的系统限制,外部的图片链接没能成功加载显示。”
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: payy)
某🐟上,代注册,代写小作文,是否已经严重违反了社区准则
社区欢迎新鲜的血液,注册小作文本质也是一种筛选,某些3级用户,已经出现代写小作文等服务,是否应该视为严重违反社区准则。这真的好吗
8 个帖子 - 6 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 無名 山河)
社区欢迎新鲜的血液,注册小作文本质也是一种筛选,某些3级用户,已经出现代写小作文等服务,是否应该视为严重违反社区准则。这真的好吗
8 个帖子 - 6 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 無名 山河)
最近用Nas搭建了一个OpenClaw,结果很痛啊
用的是绿联Nas 4800Plus,Nas 官方给的是MiniMax2.1 享用一个月。
劣势:只能文字、不能图片,导致昨晚绑定个微信的OpenClaw Channel
会导致和微信握手的二维码显示不正确,码渲染有问题,折腾一晚上没弄好,放弃了。
建议最近有这台机器的同学别操作了,因为会导致docker容器反复重启,导致容器废掉。
我最后在应用商店重装了openclaw,我的定时任务都没了。 😿
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: nank)
用的是绿联Nas 4800Plus,Nas 官方给的是MiniMax2.1 享用一个月。
劣势:只能文字、不能图片,导致昨晚绑定个微信的OpenClaw Channel
会导致和微信握手的二维码显示不正确,码渲染有问题,折腾一晚上没弄好,放弃了。
建议最近有这台机器的同学别操作了,因为会导致docker容器反复重启,导致容器废掉。
我最后在应用商店重装了openclaw,我的定时任务都没了。 😿
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: nank)