标题: 被曝蒸馏DeepSeek还造假!Mistral塌方了
作者: #Leon
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/870469
时间: 2025-08-14 18:44:02
摘要:
作者: #Leon
板块: #搞七捻三
编号:
870469帖子: https://linux.do/t/topic/870469
时间: 2025-08-14 18:44:02
摘要:
新闻转自 量子位
离职掀桌!Mistral被曝“蒸馏”DeepSeek。
网友在推特上爆料,一位Mistral离职女员工群发邮件,直指公司多项黑幕。
其中最劲爆的就是:Mistral最新模型疑似直接蒸馏自DeepSeek,却对外包装成RL成功案例,并刻意歪曲基准测试结果。
说到Mistral,这家公司被誉为欧洲版OpenAI,是全球开源明星玩家之一,模型性能一直备受好评。
也正因为声誉突出,这次爆料才显得格外震撼。
早在今年6月,就有博主通过“语言指纹”分析,发现Mistral-small-3.2和DeepSeek-v3很像。
有意思的是——今年2月,还有网友调侃DeepSeek是“中国的Mistral”。
结果半年过去,剧情反转:Mistral不仅没跑赢DeepSeek,还被曝“借”了人家的成果。
这波啊,这波叫回旋镖自带GPS,绕半圈又精准扎回自己身上。
Mistral蒸馏DeepSeek实锤
就像我们开头提到的,推特博主Sam Peach通过分析模型输出中过度使用的词汇模式(Slop),发现了Mistral-small-3.2与DeepSeek-v3之间令人惊讶的高度相似性。
这种相似性通常很难通过独立训练偶然出现,所以很可能就是蒸馏(distillation)的结果:
Mistral-small-3.2“学习”了DeepSeek-v3的输出风格。
具体来说,Sam Peach是这样做的。
他先统计了模型在创意写作(creativewriting)的输出中,比人类文本更常出现的词和n-gram(词组)。
然后他把这些大数据整合起来,形成一个特征集。
最后把这些高频特征进行层次聚类(hierarchicalclustering),生成了一张“相似性图”。
通过比较相似性图中模型的远近位置,就可以发现Mistral-small-3.2和DeepSeek-v3在图中非常接近,这就表明了它们的输出模式高度相似。
最新的爆料则进一步指明,Mistral模型和DeepSeek相似不是巧合,而是可能使用了蒸馏。
由于爆料人Susan Zhang的推特设置可见范围,更多爆料信息暂时无从得知。
但这里需要说明,蒸馏并不是一件违规的事,现在很多模型都是通过这一方法快速提升能力。
Mistral的问题在于,可能隐藏了这部分事实。
离职员工说,Mistral这样做是在假装自家模型的强化学习有效 ,这不仅歪曲了基准测试结果,而且误导公众。
不少人也认同这一观点:蒸馏模型必须标注,保持透明性才是关键。
此外还有网友表示,蒸馏实际上为模型开发开辟了一条捷径,好让大家不用再重复造轮子。
官方暂无回应
这事儿颇具争议,除了事件本身,主要还在于Mistral在开源AI圈的地位不低。
它成立于2023年,base法国巴黎,一直被称为欧洲版OpenAI。由前Google DeepMind的Arthur Mensch和前Meta的Guillaume Lample与Timothée Lacroix联合创立。
在今年8月,Mistral被曝估值达到100亿美元,且正在筹集新一轮10亿美元融资。
而在上一轮融资中(2024年6月),Mistral完成了一轮由General Catalyst领投的6亿欧元(6.45亿美元)的融资,这使其估值上升至58亿欧元(62亿美元),排名全球第四(美国湾区外排名第一)。
从公司成立以来,Mistral一直保持开源路线,今年开源的模型就包括轻量级模型Mistral Small和主打编程的Mistral Code等。
相较于主流的大语言模型,主打开源、小快灵的Mistral,在多语言处理和推理能力方面具备相当的竞争力,在大模型市场中占据着独特的地位。
同时他们也推出了自家聊天机器人LeChat,对标ChatGPT,内置深度研究模式、原生多语言推理和高级图像编辑等功能。
截至目前,Mistral官方还没有回应,就在昨天他们还发布了新模型Mistral Medium V3.1。
标题: 美团 冰淇淋兑换券 5张 蜜雪冰城
作者: #cc
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/870494
时间: 2025-08-14 18:56:54
摘要:
作者: #cc
板块: #福利羊毛
编号:
870494帖子: https://linux.do/t/topic/870494
时间: 2025-08-14 18:56:54
摘要:
http://dpurl.cn/1xkbEevz 需要自取
标题: 这是真的吗??? Google AI Studio现在 随时 随地 复制代码!
作者: #欣雨落
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/870500
时间: 2025-08-14 19:00:13
摘要:
作者: #欣雨落
板块: #前沿快讯
编号:
870500帖子: https://linux.do/t/topic/870500
时间: 2025-08-14 19:00:13
摘要:
再也不用为必须划到第一行才能复制而烦恼啦~
(上方从左到右第二个功能开启后将无法使用这个功能)
最近真是亮点频频,Gemini3暂时不来也没关系啦
标题: akile是不是炸了
作者: #BosaBosa
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/870524
时间: 2025-08-14 19:11:23
摘要:
作者: #BosaBosa
板块: #开发调优
编号:
870524帖子: https://linux.do/t/topic/870524
时间: 2025-08-14 19:11:23
摘要:
今天凌晨开始断断续续VPS总是挂掉,佬友们有知道怎么回事的吗?
标题: 佬友们推荐下靠谱的claude code中转站
作者: #Doss
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/870541
时间: 2025-08-14 19:17:32
摘要:
作者: #Doss
板块: #开发调优
编号:
870541帖子: https://linux.do/t/topic/870541
时间: 2025-08-14 19:17:32
摘要:
有没有佬推荐个比较靠谱些的CC中转站,可以包月
标题: 新人不知道送什么,来点「认知图解」邀请码
作者: #MournInk
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/870551
时间: 2025-08-14 19:22:56
摘要:
作者: #MournInk
板块: #福利羊毛
编号:
870551帖子: https://linux.do/t/topic/870551
时间: 2025-08-14 19:22:56
摘要:
cdk.linux.do
LINUX DO CDK
Linux Do 社区 CDK 快速分享平台 - 让分享变得更简单
标题: 闪购你是认真的嘛?
作者: #纯色
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/870556
时间: 2025-08-14 19:26:50
摘要:
作者: #纯色
板块: #搞七捻三
编号:
870556帖子: https://linux.do/t/topic/870556
时间: 2025-08-14 19:26:50
摘要:
我就想吃个晚饭,这个劵满90-11就过分了吧
标题: 问,国内的edu注册学生包,总会跳出不在学校的选择
作者: #cn0514
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/870557
时间: 2025-08-14 19:28:02
摘要:
作者: #cn0514
板块: #开发调优
编号:
870557帖子: https://linux.do/t/topic/870557
时间: 2025-08-14 19:28:02
摘要:
国外的edu却没这样的提示。都是苹果手机虚拟定位。什么原因,ip已经基本是当地的学校城市的ip。国外的对ip还没什么要求,只要是edu国家的ip
标题: 想求助下各位大佬,有没有印尼的梯可以分享下吗?
作者: #HEWEIWEN
板块: #资源荟萃
编号:
帖子: https://linux.do/t/topic/870560
时间: 2025-08-14 19:29:12
摘要:
作者: #HEWEIWEN
板块: #资源荟萃
编号:
870560帖子: https://linux.do/t/topic/870560
时间: 2025-08-14 19:29:12
摘要:
想求助下各位大佬,有没有印尼的梯可以分享下吗?
标题: 完美世界(2021)4K 臻彩 更至228【含剧场版】
作者: #当二哈来敲门
板块: #资源荟萃
编号:
帖子: https://linux.do/t/topic/870572
时间: 2025-08-14 19:38:18
摘要:
作者: #当二哈来敲门
板块: #资源荟萃
编号:
870572帖子: https://linux.do/t/topic/870572
时间: 2025-08-14 19:38:18
摘要:
通过百度网盘分享的文件:完.美.世.界(2021)
链接:https://pan.baidu.com/s/1c0e3rtJuRgCLIzOJ76p2ZQ?pwd=oioi
提取码:oioi
复制这段内容打开「百度网盘APP 即可获取」
标题: 一点无聊的碎碎念
作者: #liu juntao
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/870574
时间: 2025-08-14 19:40:36
摘要:
作者: #liu juntao
板块: #搞七捻三
编号:
870574帖子: https://linux.do/t/topic/870574
时间: 2025-08-14 19:40:36
摘要:
本年度最值得的知识付费应该就是汤质看本质的课程了。
这么形容吧,如果说一般的知识付费是饼干,优秀的知识付费是压缩饼干,那么他的课程的知识浓度,就是压缩饼干的压缩饼干。
最可贵的一点就是提供了一种完全不一样的视角,看问题的思维会产生潜移默化的影响。
当然,话说回来,这种事情是见仁见智的,如果不有人赞同我的看法,那就是你对。
标题: 请问我这个U盘在diskgenius里怎么设置才能正常使用?
作者: #𝕪𝕟𝕝
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/870589
时间: 2025-08-14 20:00:04
摘要:
作者: #𝕪𝕟𝕝
板块: #搞七捻三
编号:
870589帖子: https://linux.do/t/topic/870589
时间: 2025-08-14 20:00:04
摘要:
标题: L 站刚才挂了??
作者: #Gongzhongsou
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/870941
时间: 2025-08-14 20:18:45
摘要:
作者: #Gongzhongsou
板块: #搞七捻三
编号:
870941帖子: https://linux.do/t/topic/870941
时间: 2025-08-14 20:18:45
摘要:
刚才打不开是咋回事?
标题: [新人第一帖]telegram版权规避和频道复制
作者: #kltu
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/871734
时间: 2025-08-14 20:22:05
摘要:
作者: #kltu
板块: #开发调优
编号:
871734帖子: https://linux.do/t/topic/871734
时间: 2025-08-14 20:22:05
摘要:
问题描述
我用 Telegram 来分享电视剧,现在的解决方法是:
设置一个私密频道,把资源发到频道里面。
让一个机器人将资源先转发到一个账号。
再用那个账号转发到用户。
问题 1
这样的话,频道有被版权封号的风险吗?
问题 2
如果可以的话,我想要将这个频道复制一份作为备用,有什么方法吗?
(使用gpt转化为Markdown格式,内容不是AI生成)
标题: 求武汉美食😍
作者: #kai11
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/872508
时间: 2025-08-14 20:25:17
摘要:
作者: #kai11
板块: #搞七捻三
编号:
872508帖子: https://linux.do/t/topic/872508
时间: 2025-08-14 20:25:17
摘要:
最近想在武汉玩两天,有没有佬推荐一些好吃的呀
标题: GPT5的更新简直是灾难!
作者: #clows
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/873252
时间: 2025-08-14 20:28:52
摘要:
作者: #clows
板块: #搞七捻三
编号:
873252帖子: https://linux.do/t/topic/873252
时间: 2025-08-14 20:28:52
摘要:
之前一直用GPT o3+4.5 的方案,无论工作还是写东西都蛮方便的,现在的GPT5感觉效果太差了,plus都充了,一声不吭被强制升到5,这波属于是被奥特曼被刺了。
佬友们有没有好的代替方案,用token的话价格怎么样,或者有其他好用的ai推荐吗
标题: 快点锻炼2025814
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/873551
时间: 2025-08-14 20:31:25
摘要:
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #搞七捻三
编号:
873551帖子: https://linux.do/t/topic/873551
时间: 2025-08-14 20:31:25
摘要:
开完会了
类似
累死
做做运动
慢跑30分 热身
五分臂力器
五分韧带
10推小车
20俯卧撑
标题: 贪官挖出327枚比特币? 贵州省纪委辟谣
作者: #TechnologyStar
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/873571
时间: 2025-08-14 20:42:58
摘要:
作者: #TechnologyStar
板块: #前沿快讯
编号:
873571帖子: https://linux.do/t/topic/873571
时间: 2025-08-14 20:42:58
摘要:
原文:http://mp.weixin.qq.com/s?__biz=MjM5MjA4MjA4MA==&mid=2655267913&idx=1&sn=946cf597d546e099e5cba55a9b2f6ddc
大家怎么看?