微博精选
#中国人# 能聊天、代写论文、作诗编程样样不在话下,ChatGPT发布不到一周便收获了百万用户。其锋芒从美国席卷到中国,但在地球另一边的非洲大陆上,一群为OpenAI工作的外包数据标注员,曾遭受过非人的精神折磨。坐在电脑前、阅读一段文本、给出相应的标注、紧接着切换到下一段……这就是数据标注员的日常。在这场席卷中美两个市场的资本狂欢中,他们是边缘化的、被遗忘的却又至关重要的一个群体。美国《时代周刊》报道显示,为了训练ChatGPT,OpenAI雇佣了时薪不到2美元的外包肯尼亚劳工,他们所负责的工作就是数据标…
数据标注是新时代的套利第三世界的新殖民了(殖民是中性),背后是新的贸易壁垒
1. 大家都说数据是水电煤一样的基础材料,其实不尽然,经过标注后的大规模数据才是,一个是同等目标下的样本量集合,一个是被标注过,这也是在目前条件下, AI 也好,AGI 也好没可能超过人类的原因,他本质上还是效率工具,拟合的上限也是人的认知,只是比你快,比你更全面,所谓运动的更高更快更强(说不定也更团结,bushi),就是一个非线性突破人类自我上限的过程;
2. 数据标注背后是数据所有权,数据所有权背后的代表的数据安全和数据主权问题,这个就是新时代的贸易壁垒,世界新秩序一定程度上会围绕着这件事情重新洗牌,只是目前还没有看到有人拿出威尔逊十四条,也没有英国人站出来主导国联
1. 大家都说数据是水电煤一样的基础材料,其实不尽然,经过标注后的大规模数据才是,一个是同等目标下的样本量集合,一个是被标注过,这也是在目前条件下, AI 也好,AGI 也好没可能超过人类的原因,他本质上还是效率工具,拟合的上限也是人的认知,只是比你快,比你更全面,所谓运动的更高更快更强(
2. 数据标注背后是数据所有权,数据所有权背后的代表的数据安全和数据主权问题,这个就是新时代的贸易壁垒,世界新秩序一定程度上会围绕着这件事情重新洗牌,只是目前还没有看到有人拿出威尔逊十四条,也没有英国人站出来主导国联
👍5
Forwarded from 风向旗参考快讯
淘宝抖音和京东的快递地址数据已被泄露,基本确认是新数据。建议做好个人反诈骗防护。用某些查询工具时不要查自己和身边人,它可能会收集你的TG标识并且和查询信息做进一步绑定,至少他们能够推测用这些号码的人可能使用TG并且有访问外网的能力。
本次泄露的危害很大,因为它可以通过手机号码查询到某人的诸多实际地址。在互联网上乃至线下暴露手机号码的后果变得更为严重了。结合此前一些应用泄露的数据,犯罪分子也能够编造更逼真的谎言,如果家中有老人又邮寄过东西的建议做好提醒。
另外这也说明了使用单独的虚拟手机号码收件的重要性,虽然现在有些晚了。
最后,千万不要在墙内分享这些数据或工具,根据以往经验,警察可能抓不到泄密者,但是抓传播者他们还是会的。
本次泄露的危害很大,因为它可以通过手机号码查询到某人的诸多实际地址。在互联网上乃至线下暴露手机号码的后果变得更为严重了。结合此前一些应用泄露的数据,犯罪分子也能够编造更逼真的谎言,如果家中有老人又邮寄过东西的建议做好提醒。
另外这也说明了使用单独的虚拟手机号码收件的重要性,虽然现在有些晚了。
最后,千万不要在墙内分享这些数据或工具,根据以往经验,警察可能抓不到泄密者,但是抓传播者他们还是会的。
Forwarded from 风向旗参考快讯
你需要知道的近年来重要的数据泄露事件,为什么有人能够通过外网社交平台也能够定位某些人
我们处于一个数据的时代,历年来泄露的数据为黑客和其它组织提供了一个强大的工具,而你需要了解这些信息的来源。
2018年QQ用户数据泄露事件暴露了8亿条QQ用户信息,主要涉及QQ用户的手机绑定信息。
2019年11月起,某学生对淘宝实施了长达八个月的数据爬取并盗走大量用户数据。在阿里巴巴注意到这一问题前,已经有超过11亿8千多万条用户信息泄露。
2020年3月4日,5.38亿条微博用户信息泄露,其中1.72 亿有账号基本信息,含绑定手机号数据。
2020年11月23日,有用户在黑客论坛放出了一个44.65GB社工库信息包,该库就包含了此前所泄露的大约5.38亿微博用户数据、8亿条QQ用户数据、75万条车主信息、某保险公司10万条数据、70万条企业数据、部分快递信息和某贷视频照片。这些信息被众多的人广泛获取。
2021年12月,中国初创公司Socialarks(笨鸟社交)泄露了400GB数据,由于ElasticSearch数据库设置错误,泄露了超过3.18亿条用户记录,涉及到Instagram、领英、Facebook等多个社交平台的用户信息。
2022年3月,超过2亿条国内个人信息在国外暗网论坛兜售,可能来自微博、QQ等多个社交媒体,包括姓名、手机号、邮箱、密码等信息。
2022年9月,某地方公安局的一个数据库暴露于公网且未设置密码从而被黑客入侵,这批泄露自公安局的数据由总计逾23TB的多个部分构成,涉及逾十亿中国大陆居民,包含姓名、地址、出生地、身份证号码、照片、手机号码和刑事案件资讯。在外媒大量报道后的一段时间后该数据库才下线。此次泄露被认为是有史以来最大的中国公民信息泄密事件。
2023年2月,约45亿条中国快递地址库内个人信息被泄露,包括姓名、地址、手机号等信息。该事件是近年来最危险的泄密事件。
如下是部分外网社交媒体重要的泄露事件,显然也会被利用来关联中国用户的信息。
2019年12月,一个黑客组织获取了超过3亿个Facebook账号的数据,包括姓名、电话号码、Facebook ID等信息,这些数据被发现在一个未加密的数据库中。
2021年4月,Facebook的一项数据泄露事件影响了超过5.3亿用户,包括姓名、电话号码、生日、电子邮件地址等信息,这些数据被发现在暗网论坛上免费提供。
2020年5月,Telegram的一个数据库被发现在暗网论坛上出售,包含了约7000万个用户的电话号码和Telegram唯一用户ID,这些数据可能来自于2019年的一次数据泄露事件,当时黑客利用了Telegram的联系人导入功能,获取了用户的信息。
2020年6月,Telegram遭到又一次数据泄露事件,未知的黑客在暗网论坛上公开了其用户的个人信息,包括电话号码、Telegram唯一用户ID和其他敏感信息,据称影响了约4000万用户。
2022年7月,Twitter确认了一次数据泄露事件,是由一个已经修复的零日漏洞导致的,该漏洞允许黑客将电子邮件地址和电话号码与用户账号关联,从而编制了一个包含540万个用户账号信息的列表。
2023年1月,一个自称StayMad的黑客声称泄露了超过2亿推特个用户的个人数据,包括一些高调的账号,如谷歌CEO Sundar Pichai, Donald Trump Jr., SpaceX, CBS Media, NBA, WHO等,这些数据包括姓名、电话号码、电子邮件地址、密码等信息。
显然我们正处于一个数据“大繁荣”的时代,泄密事件从来没有停止过。这也告诉我们在互联网上没有谁可以保证信息是安全的。
我们处于一个数据的时代,历年来泄露的数据为黑客和其它组织提供了一个强大的工具,而你需要了解这些信息的来源。
2018年QQ用户数据泄露事件暴露了8亿条QQ用户信息,主要涉及QQ用户的手机绑定信息。
2019年11月起,某学生对淘宝实施了长达八个月的数据爬取并盗走大量用户数据。在阿里巴巴注意到这一问题前,已经有超过11亿8千多万条用户信息泄露。
2020年3月4日,5.38亿条微博用户信息泄露,其中1.72 亿有账号基本信息,含绑定手机号数据。
2020年11月23日,有用户在黑客论坛放出了一个44.65GB社工库信息包,该库就包含了此前所泄露的大约5.38亿微博用户数据、8亿条QQ用户数据、75万条车主信息、某保险公司10万条数据、70万条企业数据、部分快递信息和某贷视频照片。这些信息被众多的人广泛获取。
2021年12月,中国初创公司Socialarks(笨鸟社交)泄露了400GB数据,由于ElasticSearch数据库设置错误,泄露了超过3.18亿条用户记录,涉及到Instagram、领英、Facebook等多个社交平台的用户信息。
2022年3月,超过2亿条国内个人信息在国外暗网论坛兜售,可能来自微博、QQ等多个社交媒体,包括姓名、手机号、邮箱、密码等信息。
2022年9月,某地方公安局的一个数据库暴露于公网且未设置密码从而被黑客入侵,这批泄露自公安局的数据由总计逾23TB的多个部分构成,涉及逾十亿中国大陆居民,包含姓名、地址、出生地、身份证号码、照片、手机号码和刑事案件资讯。在外媒大量报道后的一段时间后该数据库才下线。此次泄露被认为是有史以来最大的中国公民信息泄密事件。
2023年2月,约45亿条中国快递地址库内个人信息被泄露,包括姓名、地址、手机号等信息。该事件是近年来最危险的泄密事件。
如下是部分外网社交媒体重要的泄露事件,显然也会被利用来关联中国用户的信息。
2019年12月,一个黑客组织获取了超过3亿个Facebook账号的数据,包括姓名、电话号码、Facebook ID等信息,这些数据被发现在一个未加密的数据库中。
2021年4月,Facebook的一项数据泄露事件影响了超过5.3亿用户,包括姓名、电话号码、生日、电子邮件地址等信息,这些数据被发现在暗网论坛上免费提供。
2020年5月,Telegram的一个数据库被发现在暗网论坛上出售,包含了约7000万个用户的电话号码和Telegram唯一用户ID,这些数据可能来自于2019年的一次数据泄露事件,当时黑客利用了Telegram的联系人导入功能,获取了用户的信息。
2020年6月,Telegram遭到又一次数据泄露事件,未知的黑客在暗网论坛上公开了其用户的个人信息,包括电话号码、Telegram唯一用户ID和其他敏感信息,据称影响了约4000万用户。
2022年7月,Twitter确认了一次数据泄露事件,是由一个已经修复的零日漏洞导致的,该漏洞允许黑客将电子邮件地址和电话号码与用户账号关联,从而编制了一个包含540万个用户账号信息的列表。
2023年1月,一个自称StayMad的黑客声称泄露了超过2亿推特个用户的个人数据,包括一些高调的账号,如谷歌CEO Sundar Pichai, Donald Trump Jr., SpaceX, CBS Media, NBA, WHO等,这些数据包括姓名、电话号码、电子邮件地址、密码等信息。
显然我们正处于一个数据“大繁荣”的时代,泄密事件从来没有停止过。这也告诉我们在互联网上没有谁可以保证信息是安全的。
Forwarded from 在无尽长河的尽头
示威是一种政治博弈的手段,博弈的目标是迫使妥协而不是消灭。把群体性运动狭隘化成暴力革命的,要么是被列宁主义叙事忽悠傻了,要么是小说电影看太多看傻了。
👍6
El Camino Real Bell Ringing
听说王毅参加完慕尼黑安全会议之后,要公布中国对待俄乌战争的方案 盲猜 不管支持不支持俄罗斯,一定是支持战争持续下去 #神棍言论
所谓支持就是,你不反对什么,就是鼓励什么,从来就是这样
Forwarded from flypig’s list
This media is not supported in your browser
VIEW IN TELEGRAM
《掠夺行为》。
😁2🤮1
Media is too big
VIEW IN TELEGRAM
这个完整版真的是搞笑
可见你国现在的宣传部门工作,也是看公众号也网上的有屁主们做视频来了解世界认知世界
这些宣传话语,想必在红色简体中文内容农场里已经看了千百遍了
上下滑的产品~哈宁哦~
可见你国现在的宣传部门工作,也是看公众号也网上的有屁主们做视频来了解世界认知世界
这些宣传话语,想必在红色简体中文内容农场里已经看了千百遍了
上下滑的产品~哈宁哦~
😁1
Forwarded from 竹新资料库
Media is too big
VIEW IN TELEGRAM
Forwarded from Time经济观察
所有领域的公共责任私人化进程的潜在逻辑其实都可以总结为一句话:责任都是你的,权力都是我的,负债都是你的,资产都是我的,负担都是你的,好处都是我的。
Time经济观察
所有领域的公共责任私人化进程的潜在逻辑其实都可以总结为一句话:责任都是你的,权力都是我的,负债都是你的,资产都是我的,负担都是你的,好处都是我的。
只开放责任,不开放权利,别人也不是傻子
最差的情况当成生意做也行(然而当成生意做并不是最差的情况,甚至是好的情况)
现在灵活用工的人没有保障,我相信市面上能提供这类保障服务的私营部门企业应该有很多,难点在于如何保证服务兑付
信任、信用、信心
说来说去什么都没有
最差的情况当成生意做也行(然而当成生意做并不是最差的情况,甚至是好的情况)
现在灵活用工的人没有保障,我相信市面上能提供这类保障服务的私营部门企业应该有很多,难点在于如何保证服务兑付
信任、信用、信心
说来说去什么都没有
🤨1