linux.do
21K subscribers
114K photos
195 videos
114 files
245K links
linux.do最新话题和热议话题
Download Telegram
中转站搅局学术圈

论文称近半数第三方中转API存在模型不一致问题

3月5日发布于arXiv的论文对17个被187篇论文使用的第三方中转API进行审计。这类API并非官方提供,而是由第三方转接官方大模型接口。研究通过性能测试和模型指纹识别核查其是否实际调用所标称模型 。

结果显示,在24个测试端点中,45.83%未通过模型身份验证。部分接口在医学和法律等测试中表现明显低于官方版本。例如在MedQA测试中,Gemini-2.5-flash官方准确率为83.82%,通过相关中转API调用后平均降至约36.95%。论文认为,这可能影响科研结果的可靠性

PS:看到这新闻,有点难绷,平时学者做对比用的如果是中转站,论文效果超越claude opus,实际可能路由到 gpt-oss​🐶

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: pocky)
【NihaoAPI】公益站开张啦~

模型主要是 gpt 一家,claude、glm、minimax 不保证可用,佬友们主要来蹬 codex 叭

仅支持 linuxdo 注册(在这里和佬友们学到了很多,也算回馈大家吧)

不过服务器性能不是非常好,如果后续太热情的话可能会关闭注册,佬友们快快上车!

https://nih.cc

注册即送 100 刀,每天还可以签到

11 个帖子 - 11 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: AirTouch)
一个浏览器自律插件

之前用Gemini写过,但模型能力不强,现在用5.4重新写了一下。
大概就是永久禁止打开某个/某些网页,防止摸鱼。

FocusGuard.zip (23.4 KB)

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Twind1)
kiro pro+的低价渠道是从哪来的?

我在某鱼上看到很多Pro月卡卖 70 元、Pro+ 卖 140 元左右,有些卖家还支持直接充值到自己的账号。这是怎么实现的?
这样做会有风险吗?比如卖家通过白嫖或其他违规方式获取账号,导致我自己的号被封?还是因为Kiro在某些国家有更低的价格?

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: ceshi01Adx)
谷歌账号风控越来越离谱了

标准手机app无手机号注册,所有备用的东西都绑了,两周后正常登不上

搜了一圈没任何不绑手机号方案,手机号的话解码本身也有风控,最后还是搞了个正常手机号

结果正常手机号验证完才告诉你疯了 😅
我记得我前两个号还是在手机验证前就告诉我封了
看申诉结果了,要是这都过不了,我真不知道为什么给我封的了。
ip纯净度不稳,辅助邮箱用重了?只有可能是这些原因了

3 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: pvq)
这个UI算不算Ai味很重

https://thism.777114.xyz/

大家可以游客模式看看

14 个帖子 - 14 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Logos)
感觉有点怀念原来的qwen了

qwen团队应该是国内最全面最认真做事的了

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: bonabarenfei)
发现一个奇怪的项目--让你的MacBook sex化

众所周知MacBook内置加速度计
而这个神奇的项目就是利用了这个内置加速度计
然后可以让你mac发出奇怪的声音 :tieba_088:
GitHub

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 倾风)
codex app没有5.4了

(话题已被作者删除)

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: adgailun)
佬们,问个问题,有做火焰,烟雾,火星 检测的吗?工厂环境

主要是在摄像头里面的检测

3 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Ya Gao)
证据表明,Google AI overview 正在极速吞噬媒体流量

Futurism – 7 Mar 26

Evidence Grows That Google's AI Overviews Have Eviscerated the Media Industry

Google's AI overviews have eviscerated the media landscape, with some top publications losing up to 97 percent of their web traffic.

Est. reading time: 3 minutes

[!quote]+
但是,尽管用户的查询时间可能会缩短,但在线媒体出版物却因点击量大幅下降而受到干扰。 SEO 公司 Growtika 发现,随着谷歌 AI Overviews 的出现,网络流量大幅下降。

该公司研究了 Ahrefs 跟踪 2024 年初至 2026 年初 10 家主要科技媒体网络流量的数据。在巅峰时期,这些媒体公司每月为美国谷歌用户带来 1.12 亿次网站访问量。到今年 1 月,这一数字已降至略低于 5000 万——自新功能推出以来,一些网点损失了 90% 以上的流量。

虽然一些出版物的表现比其他出版物差得多,但没有一个出版物能够蓬勃发展。 Mashable 的表现最好,从高峰期到 2026 年 1 月,其网络流量损失了 30%。虽然这个数字很大,但与损失了 62% 流量的《连线》相比,或者与 HowToGeek、The Verge 和 ZDNet 等媒体群相比,这不算什么,这些媒体在两年内损失了超过 85% 的网络流量。

真正悲惨的故事是科技媒体 Digital Trends,它的点击量从 2024 年 3 月的每月 850 万次下降到 2026 年 1 月的令人心碎的 264,861 次。这是一个惊人的下降——来自 Google 的美国网络流量下降了 97%。
1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: stevessr)