字节跳动大模型训练被实习生攻击,涉事者已被辞退
10月18日,多个微信群流传一则消息:“某头部大厂的大模型训练被实习生入侵,注入了破坏代码,导致其训练成果不可靠,可能需要重新训练。据称遭到入侵的代码注入了8000多张卡,带来的损失可能超过千万美元。”
界面新闻从知情人士处获悉,该头部大厂为字节跳动。此事发生在今年6月,起因是某高校的博士在字节跳动商业化技术团队实习,因对团队资源分配不满,使用攻击代码破坏团队的模型训练任务。
界面新闻向字节跳动方面求证此事,截至目前,官方未进行回应。
传闻显示,该田姓实习生利用了HF(huggingface)的漏洞,在公司的共享模型里写入破坏代码,导致模型的训练效果忽高忽低,无法产生预期的训练效果,而且AML团队无法核查原因。但传闻曝出之后,该实习生还在某微信群里辟谣称,自己发完论文后就从字节跳动离职,这个当口有另一个人钻漏洞改模型代码,把锅扣到自己头上。
界面新闻从知情人士处了解到,字节跳动内部已经调查明确此事为田姓实习生所为。目前,该实习生已被辞退,字节跳动同时把此事同步给阳光诚信联盟和企业反舞弊联盟,以及该实习生所在的学校。但这名实习生被辞退后到处“辟谣”甩锅,称是其他人所为。
但该实习生攻击的并不是豆包大模型,而是商业化技术团队的模型训练任务,影响了该技术团队的一些业务进展,但整体对公司造成的损失并没有传闻中的超过千万美元那么大。
一位技术安全专家告诉界面新闻,HF漏洞产生肯定是单一性集中训练,此事暴露了字节跳动技术训练存在安全管理问题。公司既没做权限隔离,也没有做好共用代码的审计。正常情况下,每次大的代码变动必须做审计,无论谁做操作都有痕迹记录,一个人想动代码是不可能的。
上述技术安全专家表示,目前行业通用的做法是做三级隔离导向性部署,每一级只有镜像,每次先扫描。调用按次算、必须密钥。每一级完成后,才能进入下一级,而上一级自动删除,进行分级训练。
10月18日,多个微信群流传一则消息:“某头部大厂的大模型训练被实习生入侵,注入了破坏代码,导致其训练成果不可靠,可能需要重新训练。据称遭到入侵的代码注入了8000多张卡,带来的损失可能超过千万美元。”
界面新闻从知情人士处获悉,该头部大厂为字节跳动。此事发生在今年6月,起因是某高校的博士在字节跳动商业化技术团队实习,因对团队资源分配不满,使用攻击代码破坏团队的模型训练任务。
界面新闻向字节跳动方面求证此事,截至目前,官方未进行回应。
传闻显示,该田姓实习生利用了HF(huggingface)的漏洞,在公司的共享模型里写入破坏代码,导致模型的训练效果忽高忽低,无法产生预期的训练效果,而且AML团队无法核查原因。但传闻曝出之后,该实习生还在某微信群里辟谣称,自己发完论文后就从字节跳动离职,这个当口有另一个人钻漏洞改模型代码,把锅扣到自己头上。
界面新闻从知情人士处了解到,字节跳动内部已经调查明确此事为田姓实习生所为。目前,该实习生已被辞退,字节跳动同时把此事同步给阳光诚信联盟和企业反舞弊联盟,以及该实习生所在的学校。但这名实习生被辞退后到处“辟谣”甩锅,称是其他人所为。
但该实习生攻击的并不是豆包大模型,而是商业化技术团队的模型训练任务,影响了该技术团队的一些业务进展,但整体对公司造成的损失并没有传闻中的超过千万美元那么大。
一位技术安全专家告诉界面新闻,HF漏洞产生肯定是单一性集中训练,此事暴露了字节跳动技术训练存在安全管理问题。公司既没做权限隔离,也没有做好共用代码的审计。正常情况下,每次大的代码变动必须做审计,无论谁做操作都有痕迹记录,一个人想动代码是不可能的。
上述技术安全专家表示,目前行业通用的做法是做三级隔离导向性部署,每一级只有镜像,每次先扫描。调用按次算、必须密钥。每一级完成后,才能进入下一级,而上一级自动删除,进行分级训练。
👍2
⌨️ 程序员是怎么练手速的?typing.io 编程打字速度练习
之前有观众说视频节奏过快,所以我换了声音大的键盘,避免自动剪辑无声片段 🤣
至于封面,哈哈哈哈 是最近跟老婆在磕的#高雅CP #心动的信号7
Invalid media: video
之前有观众说视频节奏过快,所以我换了声音大的键盘,避免自动剪辑无声片段 🤣
至于封面,哈哈哈哈 是最近跟老婆在磕的#高雅CP #心动的信号7
Invalid media: video
创业这几年,是职场上最舒服和闪光的状态,是因为选对了事,还是找对了人?下意识以为是“创业”这件事,仔细想想还是因为“找对了人”。想清楚这个的话,有些答案会更清楚。
❤1👍1
👀最近深度体验了几个AI Coding的项目,Bolt,cursor和Claude Dev(Cline)。Bolt和Cursor 这段时间广告打得震天响(不得不说是真有钱),免费额度我也都用完了,虽说有限额使用起来没有被阉割。但我还是更看好开源的 Claude Dev。
🟣Claude Dev 可以随心所欲地查看、修改甚至重新分发代码。还可以用 OpenRouter 和 OpenAI 适配的中转(情感上支持正版)选择任何模型,包括免费的。
🟣而且Claude Dev是可以搭载在自己的IDE上,没有附加的学习和迁移成本。以上这些上面两款闭源的项目都是做不到的。
🟣Claude Dev 作为一个开源项目,背后有一个强大的社区,全世界的开发者都在为它添砖加瓦。 你遇到的问题,别人可能早就解决了;你想实现的功能,别人可能已经写好了代码。 Claude Dev 最近就增加了对 AWS Bedrock、OpenRouter 和图像上传功能的支持,还优化了提示缓存和任务历史视图,这都是开源社区的魅力所在。
更重要的是,开源充满了人文关怀, 开源软件的理念就是自由、分享和协作,开发者们把自己辛苦写出来的代码免费分享出来,就为了让更多人能用上好工具,一起学习进步。 就像 Claude Dev 的开发者,直接把代码放在了 GitHub 上,谁都能看、都能用。
当然,开源不等于免费,更不等于不能赚钱。 很多成功的开源项目都找到了合适的商业模式。 比如 Red Hat 和 MongoDB,他们一边保持开源,一边也赚得盆满钵满。 他们提供付费的企业版、专业的技术支持、定制化开发服务,满足不同用户的需求,也让开源项目能够持续发展。
🟣Claude Dev 可以随心所欲地查看、修改甚至重新分发代码。还可以用 OpenRouter 和 OpenAI 适配的中转(情感上支持正版)选择任何模型,包括免费的。
🟣而且Claude Dev是可以搭载在自己的IDE上,没有附加的学习和迁移成本。以上这些上面两款闭源的项目都是做不到的。
🟣Claude Dev 作为一个开源项目,背后有一个强大的社区,全世界的开发者都在为它添砖加瓦。 你遇到的问题,别人可能早就解决了;你想实现的功能,别人可能已经写好了代码。 Claude Dev 最近就增加了对 AWS Bedrock、OpenRouter 和图像上传功能的支持,还优化了提示缓存和任务历史视图,这都是开源社区的魅力所在。
更重要的是,开源充满了人文关怀, 开源软件的理念就是自由、分享和协作,开发者们把自己辛苦写出来的代码免费分享出来,就为了让更多人能用上好工具,一起学习进步。 就像 Claude Dev 的开发者,直接把代码放在了 GitHub 上,谁都能看、都能用。
当然,开源不等于免费,更不等于不能赚钱。 很多成功的开源项目都找到了合适的商业模式。 比如 Red Hat 和 MongoDB,他们一边保持开源,一边也赚得盆满钵满。 他们提供付费的企业版、专业的技术支持、定制化开发服务,满足不同用户的需求,也让开源项目能够持续发展。
👍1
#自媒体运营频道 #@yunying23
个人IP时代已经来临,每个人都应该致力于将自己打造成为IP,成为一个内容产品,成为一个流量阵地,成为一个能承接粉丝的个人品牌。
支撑这一观点的主要有两个理论:第一个叫做15分钟定律,“在未来,每个人都能成名15分钟;每个人都可能在15分钟内出名”,这是20世纪最著名的艺术家之一、波普艺术领袖安迪·沃霍尔说的。
第二个是1000个粉丝定律,“一个人只要拥有1000个铁杆粉丝,这辈子几乎可以衣食无忧”,这是《连线》杂志创始主编,网络文化的发言者和观察者凯文·凯利说的。
个人IP时代已经来临,每个人都应该致力于将自己打造成为IP,成为一个内容产品,成为一个流量阵地,成为一个能承接粉丝的个人品牌。
支撑这一观点的主要有两个理论:第一个叫做15分钟定律,“在未来,每个人都能成名15分钟;每个人都可能在15分钟内出名”,这是20世纪最著名的艺术家之一、波普艺术领袖安迪·沃霍尔说的。
第二个是1000个粉丝定律,“一个人只要拥有1000个铁杆粉丝,这辈子几乎可以衣食无忧”,这是《连线》杂志创始主编,网络文化的发言者和观察者凯文·凯利说的。
别人吃瓜快乐 我吃瓜心疼
之前也听说过占着学校集群几百张卡的事情感觉很不合理 但是用这种手段搞破坏真是太坏了
https://github.com/JusticeFighterDance/JusticeFighter110
之前也听说过占着学校集群几百张卡的事情感觉很不合理 但是用这种手段搞破坏真是太坏了
https://github.com/JusticeFighterDance/JusticeFighter110
自己的开源项目第一次有国际贡献者主动参与
有点小激动hh
今早起来惊喜的发现有来自日本的开发者将 LangGPT 项目翻译了日文版本并提交了合并请求!
真意外,因为平时接触日本开发者并不多,从 star 来说也是国内开发者和少量国外开发者为主。
虽然多了一个语言版本的维护负担,但是要是真的有朋友在关注,有价值,我还是很乐意的。
顺带提一嘴,我们的项目已经 6k ⭐了 hh,一开始给它定的目标是 500 来着,现在实际上我们已经把这个目标放大了十几倍!
在了解更多关于日本本土社区,尤其是开源社区的信息中,有了解的朋友欢迎分享!
有点小激动hh
今早起来惊喜的发现有来自日本的开发者将 LangGPT 项目翻译了日文版本并提交了合并请求!
真意外,因为平时接触日本开发者并不多,从 star 来说也是国内开发者和少量国外开发者为主。
虽然多了一个语言版本的维护负担,但是要是真的有朋友在关注,有价值,我还是很乐意的。
顺带提一嘴,我们的项目已经 6k ⭐了 hh,一开始给它定的目标是 500 来着,现在实际上我们已经把这个目标放大了十几倍!
在了解更多关于日本本土社区,尤其是开源社区的信息中,有了解的朋友欢迎分享!