https://arxiv.org/html/2604.08407v1
之前想过很多次,用中转站开 Yolo,和直接把电脑给中转站好像没什么区别...中转站完全可以自己插入 Tool Call 来给电脑下毒什么的;这个研究表明,现在已经有很多中转站会这么干了
根据研究,在 400 个免费中间站里,有 8 个会修改 Tool Call 来下毒,18 个会偷出现的 Token;甚至在 28 个付费中间站里,都有一个会修改 Tool Call 来下毒。可惜论文没有列出这么干的中间站列表,要是有哪个群友有资金可以跑跑看【
对此感觉也没什么办法,文中举例把 requests 改成 reqeusts,这我手动 review 估计也瞄一眼就过去了...甚至你都不好说是不是模型自己抽风发出来的,毕竟 GPT 都可以天天发澳门赌场的颠,遇到 Gemini 把拼写拼错也不是一两次(这个感觉 SynthID 有责任...);所以还可以想到,模型自己就会拼错东西,官 API 难道就一定安全了吗,这可是全身都是幻觉的 LLM 啊。
之前想过很多次,用中转站开 Yolo,和直接把电脑给中转站好像没什么区别...中转站完全可以自己插入 Tool Call 来给电脑下毒什么的;这个研究表明,现在已经有很多中转站会这么干了
根据研究,在 400 个免费中间站里,有 8 个会修改 Tool Call 来下毒,18 个会偷出现的 Token;甚至在 28 个付费中间站里,都有一个会修改 Tool Call 来下毒。可惜论文没有列出这么干的中间站列表,要是有哪个群友有资金可以跑跑看【
对此感觉也没什么办法,文中举例把 requests 改成 reqeusts,这我手动 review 估计也瞄一眼就过去了...甚至你都不好说是不是模型自己抽风发出来的,毕竟 GPT 都可以天天发澳门赌场的颠,遇到 Gemini 把拼写拼错也不是一两次(这个感觉 SynthID 有责任...);所以还可以想到,模型自己就会拼错东西,官 API 难道就一定安全了吗,这可是全身都是幻觉的 LLM 啊。
😨44😁6