互联网从业者充电站
25.9K subscribers
22.4K photos
1.04K videos
820 files
13.5K links
互联网从业者专属
内容多为技术、产品、设计、运营等不同话题内容;
目标人群为程序员、设计师、产品经理、运营管理等不同职能。
投稿/合作: @inside1024_bot


内容来源网络
Download Telegram
京东这事儿向着越来越奇怪的方向发展了…
字节跳动大模型训练被实习生攻击,涉事者已被辞退

10月18日,多个微信群流传一则消息:“某头部大厂的大模型训练被实习生入侵,注入了破坏代码,导致其训练成果不可靠,可能需要重新训练。据称遭到入侵的代码注入了8000多张卡,带来的损失可能超过千万美元。”

界面新闻从知情人士处获悉,该头部大厂为字节跳动。此事发生在今年6月,起因是某高校的博士在字节跳动商业化技术团队实习,因对团队资源分配不满,使用攻击代码破坏团队的模型训练任务。

界面新闻向字节跳动方面求证此事,截至目前,官方未进行回应。

传闻显示,该田姓实习生利用了HF(huggingface)的漏洞,在公司的共享模型里写入破坏代码,导致模型的训练效果忽高忽低,无法产生预期的训练效果,而且AML团队无法核查原因。但传闻曝出之后,该实习生还在某微信群里辟谣称,自己发完论文后就从字节跳动离职,这个当口有另一个人钻漏洞改模型代码,把锅扣到自己头上。

界面新闻从知情人士处了解到,字节跳动内部已经调查明确此事为田姓实习生所为。目前,该实习生已被辞退,字节跳动同时把此事同步给阳光诚信联盟和企业反舞弊联盟,以及该实习生所在的学校。但这名实习生被辞退后到处“辟谣”甩锅,称是其他人所为。

但该实习生攻击的并不是豆包大模型,而是商业化技术团队的模型训练任务,影响了该技术团队的一些业务进展,但整体对公司造成的损失并没有传闻中的超过千万美元那么大。

一位技术安全专家告诉界面新闻,HF漏洞产生肯定是单一性集中训练,此事暴露了字节跳动技术训练存在安全管理问题。公司既没做权限隔离,也没有做好共用代码的审计。正常情况下,每次大的代码变动必须做审计,无论谁做操作都有痕迹记录,一个人想动代码是不可能的。

上述技术安全专家表示,目前行业通用的做法是做三级隔离导向性部署,每一级只有镜像,每次先扫描。调用按次算、必须密钥。每一级完成后,才能进入下一级,而上一级自动删除,进行分级训练。
👍2
我这几年搞app的思路:看看哪些巷子没啥摆摊的/有发展潜质,那留个分身就地摆个摊,看它能不能在时间的沉淀下形成有品质的店铺,不能就算
⌨️ 程序员是怎么练手速的?typing.io 编程打字速度练习

之前有观众说视频节奏过快,所以我换了声音大的键盘,避免自动剪辑无声片段 🤣

至于封面,哈哈哈哈 是最近跟老婆在磕的#高雅CP #心动的信号7

Invalid media: video
创业这几年,是职场上最舒服和闪光的状态,是因为选对了事,还是找对了人?下意识以为是“创业”这件事,仔细想想还是因为“找对了人”。想清楚这个的话,有些答案会更清楚。
1👍1
韩寒:我为什么不开微博

有多少做社交的产品能有韩寒这般信息敏感、能够决绝地知道什么是好体验呢?
如果有一项技术可以让人类以光速传送到指定地点,互联网还会有多少价值?
👀最近深度体验了几个AI Coding的项目,Bolt,cursor和Claude Dev(Cline)。Bolt和Cursor 这段时间广告打得震天响(不得不说是真有钱),免费额度我也都用完了,虽说有限额使用起来没有被阉割。但我还是更看好开源的 Claude Dev。

🟣Claude Dev 可以随心所欲地查看、修改甚至重新分发代码。还可以用 OpenRouter 和 OpenAI 适配的中转(情感上支持正版)选择任何模型,包括免费的。

🟣而且Claude Dev是可以搭载在自己的IDE上,没有附加的学习和迁移成本。以上这些上面两款闭源的项目都是做不到的。

🟣Claude Dev 作为一个开源项目,背后有一个强大的社区,全世界的开发者都在为它添砖加瓦。 你遇到的问题,别人可能早就解决了;你想实现的功能,别人可能已经写好了代码。 Claude Dev 最近就增加了对 AWS Bedrock、OpenRouter 和图像上传功能的支持,还优化了提示缓存和任务历史视图,这都是开源社区的魅力所在。

更重要的是,开源充满了人文关怀, 开源软件的理念就是自由、分享和协作,开发者们把自己辛苦写出来的代码免费分享出来,就为了让更多人能用上好工具,一起学习进步。 就像 Claude Dev 的开发者,直接把代码放在了 GitHub 上,谁都能看、都能用。

当然,开源不等于免费,更不等于不能赚钱。 很多成功的开源项目都找到了合适的商业模式。 比如 Red Hat 和 MongoDB,他们一边保持开源,一边也赚得盆满钵满。 他们提供付费的企业版、专业的技术支持、定制化开发服务,满足不同用户的需求,也让开源项目能够持续发展。
👍1
#自媒体运营频道 #@yunying23

个人IP时代已经来临,每个人都应该致力于将自己打造成为IP,成为一个内容产品,成为一个流量阵地,成为一个能承接粉丝的个人品牌。
支撑这一观点的主要有两个理论:第一个叫做15分钟定律,“在未来,每个人都能成名15分钟;每个人都可能在15分钟内出名”,这是20世纪最著名的艺术家之一、波普艺术领袖安迪·沃霍尔说的。

第二个是1000个粉丝定律,“一个人只要拥有1000个铁杆粉丝,这辈子几乎可以衣食无忧”,这是《连线》杂志创始主编,网络文化的发言者和观察者凯文·凯利说的。
ANKER的选址和自己的定位一样稳。
别人吃瓜快乐 我吃瓜心疼
之前也听说过占着学校集群几百张卡的事情感觉很不合理 但是用这种手段搞破坏真是太坏了
https://github.com/JusticeFighterDance/JusticeFighter110
#自媒体运营频道 #@yunying23

这算是在小红书又跑出来一个品类。👻👻👻
吃了字节实习生的瓜。

修改集群 pytorch 源码随机种子,随机 kill 进程,专门参加故障排查会,根据别人的修复思路迭代攻击方式。

我都能想象他同事奔溃的样子:计算机学不存在了???
看我女儿和豆包的聊天
所有陪伴类产品给她体验

我都会很快从她的“厌弃”
知道这款产品的陪伴效果
👍2
下午参加@少数派sspai 举办的 demoday 活动,了解到了很多厉害的创作者和有趣的项目,特别是 00 后小伙@Vincent-oswin 做的社交卡片项目,太有意思了👍
1
自己的开源项目第一次有国际贡献者主动参与

有点小激动hh

今早起来惊喜的发现有来自日本的开发者将 LangGPT 项目翻译了日文版本并提交了合并请求!

真意外,因为平时接触日本开发者并不多,从 star 来说也是国内开发者和少量国外开发者为主。

虽然多了一个语言版本的维护负担,但是要是真的有朋友在关注,有价值,我还是很乐意的。

顺带提一嘴,我们的项目已经 6k 了 hh,一开始给它定的目标是 500 来着,现在实际上我们已经把这个目标放大了十几倍!

在了解更多关于日本本土社区,尤其是开源社区的信息中,有了解的朋友欢迎分享!