LinuxDo 新帖推送

标题: 哇，今夕是何年
作者: #pie z
板块: #搞七捻三
编号: 2119636
帖子: https://linux.do/t/topic/2119636
时间: 2026-05-06 15:59:59
摘要:

这是什么年代的界面，感觉比我年龄都要大了

4 views08:00

LinuxDo 新帖推送

标题: cursor续杯
作者: #Lliuyunhao
板块: #搞七捻三
编号: 2119653
帖子: https://linux.do/t/topic/2119653
时间: 2026-05-06 16:01:29
摘要:

某鱼上的cursor插件30天的可以理会吗 佬友们

3 views08:02

LinuxDo 新帖推送

标题: 估值近 450 亿美元，DeepSeek 首轮融资获“国家大基金”领投磋商
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #前沿快讯
编号: 2119656
帖子: https://linux.do/t/topic/2119656
时间: 2026-05-06 16:01:47
摘要:

估值近 450 亿美元，DeepSeek 首轮融资获“国家大基金”领投磋商 - IT之家

1 view08:02

LinuxDo 新帖推送

标题: 求教：CPA rt 刷新失败是啥情况呀？
作者: #janfengye
板块: #搞七捻三
编号: 2119658
帖子: https://linux.do/t/topic/2119658
时间: 2026-05-06 16:01:52
摘要:

之前好像看到帖子说CPA会自动刷新rt，今天看CPA的日志很多这样的
[2026-05-06 15:59:47] [--------] [warn ] [openai_auth.go:295] Token refresh attempt 1 failed with non-retryable error: token refresh failed with status 401: {
“error”: {
“message”: “Your refresh token has already been used to generate a new access token. Please try signing in again.”,
“type”: “invalid_request_error”,
“param”: null,
“code”: “refresh_token_reused”
}
}
这意思是free号也只能用一个月吗 ？

2 views08:02

LinuxDo 新帖推送

标题: 为什么我的xiaomimimo使用的时候不支持MiMo-V2.5-Pro？？？
作者: #Ava
板块: #开发调优
编号: 2119668
帖子: https://linux.do/t/topic/2119668
时间: 2026-05-06 16:02:41
摘要:

2 views08:09

LinuxDo 新帖推送

标题: cpa中free账户调用image2被连坐
作者: #flowingmoon
板块: #开发调优
编号: 2119671
帖子: https://linux.do/t/topic/2119671
时间: 2026-05-06 16:03:06
摘要:

还没生成图片就中断了，我还以为额度不够了，登陆上CPA一看发现全部401了。。。。

后续即使是使用别的路径的调用也会出现

即被标记了。
各位调用的时候还是要小心，别踩到我已经踩过的坑。。。。。

1 view08:09

LinuxDo 新帖推送

标题: 讨论一下国产模型蒸馏问题
作者: #无敌战神
板块: #搞七捻三
编号: 2119679
帖子: https://linux.do/t/topic/2119679
时间: 2026-05-06 16:04:31
摘要:

最近我因为说了一句国产模型蒸馏问题，就被举报删帖。在某音平台评论一句国产模型蒸馏，被追着骂，仿佛这种话题就是谈都不能谈的滑梯，但是我还是想在此聊一下关于模型蒸馏的问题，
比如
国产模型是否蒸馏了
模型蒸馏比例
经典洗白文案等
首先，我们要明确一些事实
1、蒸馏是中性词
2、国产模型大都为开源模型
3、闭源模型大都禁止其他人或组织蒸馏数据
4、人工大量采集模型的数据集十分困难，需要巨大的人力成本和资金成本
ok，我们从以上事实进行推导
1、数据处理成本
首先，当年OPENAI雇了一大批人去做了数据处理和标注。
如：https://time.com/6247678/openai-chatgpt-kenya-workers/

OpenAI 这类公司不是只靠自家员工标注，而是会用外包/供应商。早期 ChatGPT 安全数据就被报道使用 Sama 的肯尼亚工人做有害内容标注；后来整个行业还大量使用 Scale AI、Mercor、Turing、Surge AI 这类 RLHF/专家标注供应链。

但是网络上并没有查找到 Deepseek 的数据标注团队人数和来源，仅仅能看到一些如医院数据这种的行业少量数据的标注招聘：https://www.scmp.com/tech/big-tech/article/3313335/deepseek-job-ads-call-interns-label-medical-data-improve-ai-use-hospitals
并且还有文章表示，Deepseek团队其团队仅有32名标注员，但是这篇文章有失偏颇所以我们只做参考：https://ideas.repec.org/p/hal/wpaper/hal-04952735.html
Deepseek 论文中，写有训练的数据量为：671B 总参数、每 token 激活 37B 参数，预训练用了 14.8T tokens。
https://arxiv.org/html/2412.19437v1
那么问题来了，仅靠 30 多人 清洗14.8T tokens 有可能吗？
来一个假设：




假设
每人每天处理
30 人总耗时




精读标注
5万 token
约 2.7 万年


快速审核
50万 token
约 2700 年


极快抽检
500万 token
约 270 年


每人每天看 5000 万 token
约 27 年




每人清洗五千万 tokens 要 27 年才能清洗完毕。
当然，“人数少还能做出来” 本身不能直接证明它蒸馏 OpenAI，只能说大概率使用了一些强大的模型，进行了数据处理和标注。但是无法直接证明蒸馏。
但是有一点，OPENAI 虽然允许第三方调用 API 进行数据标注，但是禁止用 GPT/ 输出训练通用大模型和禁止 用GPT输出蒸馏竞品模型。
如果 DeepSeek 使用了 openai 进行标注，显然是违反了openai的条款。
2、幻觉
通过蒸馏的模型，基本上幻觉率都很高，原理是模型不了解某些知识只能靠编，而真正靠数据集训练出来的模型是不需要靠编的
我们可以在本文中看到
https://www.vectara.com/blog/why-does-deepseek-r1-hallucinate-so-much




模型
幻觉率




GPT-4
约 1.8%


GPT-4o
约 1.49%


DeepSeek-V3
3.9%～6.1%


DeepSeek-R1
14.3%



DeepSeek 的模型幻觉率比 GPT 同时期的模型要高上一倍。
3、模型自称
这就不用多说了，只要训练的数据集多了，就会认为自己是别人
如：https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/
还有一些某国产模型说自己是 claude
https://linux.do/t/topic/1921500
4、模型蒸馏比例
claude 也说自己蒸馏过其他模型，但是比例呢，如果一个模型百分之 80 是蒸馏，和一个模型百分之 1 是蒸馏，那么肯定是有区别的。
以上我说的，均不能证明国产模型蒸馏，只是为大家开拓一下视野。目的是抵制非法蒸馏，尊重知识产权。
人都是自私的，便宜的 token 谁都想用，但是如果真的把认真搞模型的人搞死了，那就是劣币驱逐良币，最终都没 token 用了。
你们可以继续骂我了

3 views08:09

LinuxDo 新帖推送

标题: 原来3级还有活跃要求
作者: #846994183
板块: #搞七捻三
编号: 2119682
帖子: https://linux.do/t/topic/2119682
时间: 2026-05-06 16:04:36
摘要:

今天登录发现3级掉了，这才发现有一个互动指标。。主要是获赞差的多，可能是我平常看得多不发帖。佬友们能帮帮忙吗

3 views08:09

LinuxDo 新帖推送

标题: 开工第一天，迎来一个魔幻又无奈的培训
作者: #akaisuingu
板块: #搞七捻三
编号: 2119739
帖子: https://linux.do/t/topic/2119739
时间: 2026-05-06 16:10:16
摘要:

坐标某十八线城市，某全员使用麒麟操作系统的基层小单位…
此刻，全国各省市县兄弟单位视频培训，请了帝都某高校教授，给大家培训AI，课讲的不错，举了时下各种例子，介绍了各种AI工具，很适合绝大多数老领导理解…
然而，教授电脑右下角惊现小飞机图标，全程使用谷歌搜索链接打开suno等网站，用claude，gemini，gpt，grok，当然也有各种国内AI进行各种演示…绘图，做ppt，写歌，做视频，等等…
领导们疯狂讨论，觉得今年可以压迫小年轻们大搞特搞，讲到国外模型的时候因为记不住英文单词，特地在本子上记下来…
他们并不知道这些网我们登不上去的，也不知道搞点类似雪山飞狐的搞笑视频也是要花钱的
回头领导找我下任务搞宣传片的时候，不知道“领导，这些网我死活上不去啊”“领导我开不起即梦会员啊”这些说辞能不能搞定这些啥也不懂但是急功近利的老家伙呢

3 views08:12

LinuxDo 新帖推送

标题: gopay渠道导致OAI服务器炸了？
作者: #我是李小黑
板块: #搞七捻三
编号: 2119741
帖子: https://linux.do/t/topic/2119741
时间: 2026-05-06 16:10:36
摘要:

tg上看到的，真的话有点搞了

3 views08:12

LinuxDo 新帖推送

标题: 后悔啊，昨天HUB站充值LDC充少了，佬们昨天都充了多少啊
作者: #云天明
板块: #搞七捻三
编号: 2119751
帖子: https://linux.do/t/topic/2119751
时间: 2026-05-06 16:11:43
摘要:

HUB站昨天五一活动1LDC=0.05平台币，今天恢复到1LDC=0.02平台币了，今天充800LDC差不多只等于昨天的300LDC ，
佬们昨天都充了多少啊，
事情往往就是这样，机会来了，犹犹豫豫，最后错失 ，
HUB站：https://hub.linux.do
引用：

好东西啊！L站的活跃佬友永远也不缺token花了，token自由已实现！佬友牛逼，始皇威武！ - 搞七捻三 - LINUX DO

3 views08:12

LinuxDo 新帖推送

标题: 请教佬友codex模拟gpt 网页版的方法
作者: #GUWJ
板块: #开发调优
编号: 2119752
帖子: https://linux.do/t/topic/2119752
时间: 2026-05-06 16:12:20
摘要:

codex 写代码固然给给力，但是探讨科研问题的时候感觉输出傻傻的，公式推导等没网页版体验好。想请问有无类似网页版的 prompt 提示词或其他方法调教一下？
ps：那么多 pro 渠道号但从未见过 pro 模型网页版的反代？要是能利用下就好了

2 views08:12

LinuxDo 新帖推送

标题: codex的生图怎么感觉好奇怪
作者: #布鲁斯·韦恩
板块: #搞七捻三
编号: 2119756
帖子: https://linux.do/t/topic/2119756
时间: 2026-05-06 16:12:37
摘要:

想换个动态的头像

1 view08:15

LinuxDo 新帖推送

标题: Deepseek API调用究竟会不会拿用户的对话数据去训练呢？
作者: #V_Arrow
板块: #搞七捻三
编号: 2119757
帖子: https://linux.do/t/topic/2119757
时间: 2026-05-06 16:12:42
摘要:

虽然Deepseek官方隐私协议里提到用户可以关闭“数据用于优化” 但这个显然是针对网页和APP的，API调用没有这种选项，不清楚是否会拿去训练，至少OpenRouter上是把Deepseek标注上了可能用于训练

2 views08:15

LinuxDo 新帖推送

标题: Wong 公益的站的 deepseek 如何通过 CCS 导入 Claude Code?
作者: #Peter_Liu
板块: #搞七捻三
编号: 2119769
帖子: https://linux.do/t/topic/2119769
时间: 2026-05-06 16:14:50
摘要:

之前, 有幸在 Wong 佬的公益站使用佬的 gpt, 可惜环境变了, 五一回来发现 gpt 已经无了, 听说 deepseek 的 v4 也不错, 但是我通过 ccs 导入一直报错, 希望有经验的佬友可以指导我下 

具体信息如何:

key 采用默认分组
Json 配置:

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://wzw.pp.ua",
    "ANTHROPIC_MODEL": "deepseek-ai/deepseek-v4-pro [1m]",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "deepseek-ai/deepseek-v4-flash",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "deepseek-ai/deepseek-v4-pro [1m]",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "deepseek-ai/deepseek-v4-pro [1m]",
    "CLAUDE_CODE_SUBAGENT_MODEL": "deepseek-v4-flash",
    "ANTHROPIC_AUTH_TOKEN": "1a-----------------",
    "CLAUDE_CODE_EFFORT_LEVEL": "max"
  }
}

2 views08:15

About

Blog

Apps

Platform