微博新闻,記錄中國 China🇨🇳
672 subscribers
25.8K photos
9.49K videos
472 files
34.5K links
Download Telegram
爬虫玩得好,监狱进得早。数据玩得溜,牢饭吃个够。

这里说的爬虫是指网络爬虫,也叫网络蜘蛛。我平常用的谷歌搜索和百度搜索就是爬虫中的一种。

爬虫技术本身没有问题,出问题是人。使用这项技术的人。就好不刀本身没错,错的是你用刀杀人。

对爬虫技术使用不当,你可能会违法。

一是侵犯公民个人信息罪。如果你爬取了个人隐私的数据,非法获取,非法使用必然导致入狱。

二是构成非法获取计算机信息系统数据罪。若在爬取数据时,存在危害计算机信息系统安全的行为,包括破解被爬企业的防抓取措施、加密算法、技术保护措施等,则很有可能被认定为“侵入或以其他技术手段获取计算机信息系统数据”。

三是非法侵入计算机信息系统罪。有些系统你是不能进入的,比如提供数据信息的网站为国家事务、国防建设、尖端科学技术领域的计算机信息系统等,不论结果,入侵就是犯罪。

学习技术本身没有错,错的是使用技术的人。所以想要活的久,必须做个遵纪守法的好公民。
________________END______________

via 简书
原来如此⊙﹏⊙

昨天“导演合集”的标签又乱套了,我整理一下发现在这已经是我第三次调整了,第一次是是编写的过程中前面漏掉了一个,每次出现标签错误的时候我又开始重新检查,从到头尾重新编号。为什么已经整理好的标签总是出现错误呢?

我突然想到两个“细节” ,细节1: 沃卓斯基无辜躺枪,标签编号被平台无故封了三次,这三次还都是已经正常发布后被封锁了。 细节2 : 许鞍华 一个谜一样的操作,  发布后平台同步秒锁文, 几乎没有给你任何喘息的机会。 我不禁发出疑问:“许导这是招谁惹谁了?” 当天早上分文大概下午解除锁文。 你在给导演贴上编号,放入专栏合集,文章锁定,这样来说原本加入专栏的文章因为锁定就会看不到了。那么标签自然就会全部打乱。 所以顺序全部打乱。 归根结底问题的主因还是在于平台不明缘由的锁文,重点不是作者在文章中存在明显错误而是大概率平台对文章内容出现的的误判,这种明显的“误差”让我百思不得其解。 明明有的文章已经正常发布了,可还是会中招!你能想象那是有多么糟心吗? 提高平台对文章的误判是重中之重。 建立完善的关键词机制,从数据上来看减少用户文章的误判行为眼下才是当务之急

via 简书
读懂生活这本书

文章不需要刻意去读,随手捡起一片落叶欣赏它的姿态也是在读文章,读关于一个秋季的文章。听见鸟儿啁啾你不由自主地驻足观赏,也是在读一篇文章,读关于生灵的热闹非凡。一声汽笛刹车,接着是小狗的惨叫声不觉入耳,不用去看,你万般揪心,读出了生命的悲悯和无常。所有一切,都是上天给我们的恩赐和领悟的资本。这些无形的有形的文章需要我们一辈子去参悟去品读。生活本身就是一本书,而我们,需要用一辈子的时间去读,去体味。如此想来,何必抱怨纸质印刷的读物没有读几本呢?

      今天又做了好事,给另一个徒弟喝了我的小黑小白。她也说很好喝。可惜两个徒弟都没想着买。但也没关系,好东西迟早会被发现,被别人想拥有的。他们不需要的话,只能是他们的遗憾。我也只不过是少了三十块钱而已。

      明天要开始忙碌状态了。赶紧睡,积蓄能量。

via 简书
Forwarded from 華聲日報 VOCN
This media is not supported in your browser
VIEW IN TELEGRAM
标题: “这算哪门子正义?”印度强奸未成年人案罪犯获准保释与受害者结婚,引发众怒
0:23
逾 2% 美国人服用 GLP-1 减肥药

根据 FAIR Health 的数据,逾 2% 美国人在服用流行减肥药 GLP-1。FAIR Health 拥有逾 510 亿条商业医保索赔记录,其数据显示,减肥药 GLP-1 药物使用量激增,半数用户在使用。在各种 GLP-1 药物中,诺和诺德的 Ozempic 最流行,其次是礼来的 Mounjaro。服用 GLP-1 药物但未接受减肥手术的成年人比例从 2019 年的 2.5% 升至 2024 年的 11.2%,接受减肥手术的成年患者比例同期下降了 41.8%。GLP-1 药物使用过去六年增加了近 600%。

via 奇客Solidot–传递最新科技情报
特朗普政府考虑对留学生进行社交媒体审查

特朗普政府正在考虑要求所有申请到美国留学的国际学生接受社交媒体审查,为准备实施这一审查要求,政府已指示全球各地美国使领馆暂停为学生和交流访问学者签证申请者安排新的面谈。此前已经预约好的签证面谈仍然可以进行。如果美国政府实施这一审查计划,可能会严重减缓学生签证的处理速度,也可能对许多依赖国际学生来增加财政收入的美国大学造成不利影响。

via 奇客Solidot–传递最新科技情报
免疫反应在白天更强

众所周知,昼夜节律混乱会削弱免疫系统。一项利用透明斑马鱼的研究发现,对细菌感染的免疫反应强度在白天达到峰值。研究人员认为这是一种演化反应,因为人类和斑马鱼等昼行性动物在白天最活跃,也更容易受到细菌感染。研究人员针对的是中性粒细胞,属于白细胞的一种,专门消灭细菌,是感染的第一反应者,也是人体内最丰富的免疫细胞。但是中性粒细胞寿命极短,从人体血液中分离中性粒细胞非常困难,研究人员因此使用了透明斑马鱼,观察中性粒细胞在一天中不同时间杀灭细菌的效率。结果显示它们在白天的效率比夜晚更高。进一步研究发现,中性粒细胞有一个内部受光调节的生物钟,提醒它们在白天增强杀灭细菌的能力。

via 奇客Solidot–传递最新科技情报
重大科学突破越来越难以实现

重大科学突破可能正变得愈发难以实现。2023 年的一项数据分析显示,1945-2010 年间,虽然学术论文总量激增,但颠覆性论文的数量却并不多。换言之,科研投入的倍增并未带来相应水平的颠覆性成果。研究显示,1956-2020 年间,美国研发经费实际增长 11 倍,论文数量呈指数级攀升,但诺贝尔奖级别的突破却未见相应增长。是什么束缚了科学创新向前迈进的脚步?首先,科学家正沦为“表格填手”。荷兰一项研究发现,大学教授仅有不到 20% 的时间用于科研,其余精力都被行政事务、教学和经费申请占据。其次,学术生涯和资助结构僵化限制了研究者自由探索的空间。此外,“论文通胀”稀释科研质量。再次,知识壁垒日益高筑,创新难度与日俱增。最后,信息过载导致注意力涣散。在算法推荐和热点追逐中,科学家正陷入“信息茧房”,可能错过那些冷门却具有颠覆潜力的研究方向。

via 奇客Solidot–传递最新科技情报
牙本质起源于古鱼外骨骼中的感觉组织

芝加哥大学的一项新研究表明,牙本质——即牙齿的内层,负责将感觉信息传递到牙髓内的神经——最初是作为古代鱼类装甲外骨骼中的感觉组织进化而来的。对于牙齿如何起源,有两种观点。一种是“由内而外”假说,认为牙齿先出现,后来才适应外骨骼。新研究支持第二种“由外而内”假说,该假说认为敏感结构首先在外骨骼上发育,并且在某个时期,动物也利用相同的基因工具产生了敏感的牙齿。

via 奇客Solidot–传递最新科技情报
苹果收购了第一家游戏工作室 RAC7

苹果历史上首次收购了一家游戏工作室。该工作室 RAC7 规模很小,只有两个人,它开发了 Apple Arcade 热门游戏《Sneaky Sasquatch》。RAC7 此前的作品包括了《Dark Echo》和《Splitter Critters》。Sneaky Sasquatch 于 2019 年推出,为 Apple Arcade 独占,发布之后一直稳定更新。收购之后 RAC7 将作为内部工作室与苹果继续合作。此次收购并不意味着苹果将亲自涉足游戏业务,苹果表示收购有助于 RAC7 在 Apple Arcade 上进一步发展游戏。

via 奇客Solidot–传递最新科技情报
几乎所有成年美国人盐摄入量都超过建议量

根据发表在《美国心脏协会期刊》上的最新研究,几乎所有成年美国人的钠(盐)摄取量都高于建议摄取量。摄取过多盐分可能会增加罹患高血压和心血管疾病的风险。 成年美国人平均每天摄取约 3,400 毫克的钠,这些钠通常来自预制食品,如披萨、墨西哥玉米饼、墨西哥卷饼、冷盘午餐肉、罐装汤及面包。 美国心脏协会推荐每天摄取不超过 2,300 毫克的钠,也就是约一茶匙的盐。最新研究发现:无论人种和民族如何,披萨、汤和鸡肉都是人们摄取钠的最大来源。 在成年的亚裔美国人中,四种独属于这一文化的食物来源占据了每日钠摄取量的 14% 以上:以大豆为主的调味品(酱油)、鱼、炒饭和捞面、拌面,以及炒菜/以大豆为主的酱汁混合物。 而对成年的墨西哥裔美国人来说,墨西哥混合料里,如安吉拉卷、塔马利、墨西哥卷饼、普普沙、厚玉米饼 (gorditas)、恰米强克卷、墨西哥起司馅饼、卷饼碗、墨西哥烤肉、填馅红辣椒以及汁拉贵司 (chilaquiles) 是独属于他们的最大钠来源。成年黑人摄入钠的最大来源则是鸡肉饼、炸鸡块和炸鸡柳。 亚裔美国人最倾向于在烹饪时用盐,但这一群体也最不倾向于在餐桌上给食物放盐。

via 奇客Solidot–传递最新科技情报
海洋在变暗

过去 20 年里全球 1/5 以上的海洋——面积超过 7500 万平方公里,经历了海洋变暗现象。海洋变暗是指海洋光学特性发生变化导致其透光区深度减少。透光区是 90% 的海洋生物的家园,也是阳光和月光驱动生态互动的区域。研究人员将卫星数据和数值模拟相结合,分析了全球透光区深度的年度变化。他们发现,在 20030-2022 年间,全球 21% 的海洋——包括大片沿海地区和开阔海洋,变得更暗了。超过 9% 的海洋——面积超过 3200 万平方公里、与非洲大陆大小相似的透光区深度减少了 50 多米,而 2.6% 的海洋的透光区减少了 100 多米。大约 10% 的海洋——面积超过 3700 万平方公里,在过去的 20 年里变得更亮了。

via 奇客Solidot–传递最新科技情报
我们如何失去互联网?

曾经有一个美好的互联网,但本世纪初 Web 2.0 时代兴起之后,围墙花园们杀死了它。以 Google 为例,一开始上面没有多少广告,Google 投入了大量人力财力打造了一个高质量的搜索引擎,吸引用户使用。但与此同时,它也投入了大量金钱贿赂每一项带有搜索框的服务,确保其搜索主导地位无人能动摇。到了 2020 年代,Google 在这方面的支出每 18 个月就相当于马斯克收购 Twitter 的费用。今天的科技巨头们都是这么做的:一开始对用户非常友好,但同时想方设法锁定用户,当用户难以离开之后它就露出了残忍的一面:广告越来越多,质量越来越差,它在竭尽全力获取金钱。我们还在使用 Google,就像很多人还在使用 X/Twitter,是因为被束缚在平台上,即使该平台日益衰败。科技巨头们为所欲为的背后是政策环境发生了变化。以美国为例,40 多年前的里根政府改变了对垄断的解读,垄断被认为是高效的,如果 Google 占据九成市场份额,意味着它理应获得垄断位置,因为没有人能在搜索方面做得更好。没有竞争对手出现,是因为在 Google 擅长的领域没有改进的空间。于是美国在许多领域都出现了垄断者。即使出现了竞争对手,现有的垄断者也能凭借无与伦比的财力收购对手。Meta 就是其中的典型。世界各地的政府最近开始注意到了这一情况,反垄断比以往任何时候都高涨。打破美国科技巨头的围墙花园创造一个新的美好互联网仍然是可能的,但这需要我们每个人的努力。

via 奇客Solidot–传递最新科技情报
xAI 支付 3 亿美元让 Telegram 集成 Grok

Telegram 与马斯克(Elon Musk)旗下的 xAI 公司达成了为期一年的合作协议,xAI 将向 Telegram 支付 3 亿美元现金和股权,换取在 Telegram 中集成 Grok 聊天机器人。如果 Telegram 用户订阅了 Grok 的服务,那么该平台还将能获得五成收入。根据 Telegram CEO Pavel Durov 的演示,Grok 可以固定在应用内聊天窗口的顶部,用户还可以通过搜索栏向 Grok 提问。

via 奇客Solidot–传递最新科技情报
网络新词

1、工资现在叫------窝囊费

2、能力不行现在叫------小趴菜

3、上当现在叫------智商税

4、追求平淡现在叫------佛系

5、一对现在叫------CP

6、画大饼现在叫-----PUA

7、分手现在叫------及时止损

8、随波逐流现在叫----躺平

9、做事不靠谱的人现在叫------老六

10、眼高手低现在叫----当代孔乙己

11、炫耀现在叫------凡尔赛

12、深情现在叫------舔狗

13、崩溃现在叫------破防

14、偷懒现在叫------摸鱼

15、没工作现在叫-----灵活就业

16、生闷气现在叫-----情绪内耗

via 简书
纯洁浪漫的年少遐想 作者序

该系列始于2016年08月21日发布我在豆瓣上的一篇短文《单车者说》,终于2025年5月16日完稿的小说《如墟》。这个系列以宿溪城——一个以我的家乡为原型的虚构小城——为舞台,以宿溪城中各式人物为主人公,一共囊括了13篇短篇小说。回看这些文章,大多数已显笔力幼稚,只是年少时期的习作,甚至已称不上“小说”,不过亦不乏个别新奇有趣、别具一格的篇章,但如下三篇是笔者想特别强调的:

        第一篇是2021年8月14日发布的《蹚过茫然的河》,第二篇是2022年12月1日发布的《弃入尘寰》,第三篇便是这篇2025年5月16日刚刚完稿的《如墟》。

        这三篇在剧情、人物上前后呼应,主题上有所延伸发展,整体浑然一体。故在这个系列完结之际,将这三篇小说单独摘出来,在简书平台重新校对发布,以告慰自己,以飨读者。

        需要补充的几个技术性细节是:

        第一,简书平台的单篇文章有字数上限,在我写作《如墟》时就遇到了字数超上限无法保存的情况。因此这三篇小说其中的部分或全部只能分成上下两集发布,并非小说本身分上下集,仅仅是平台技术原因导致的。

        第二,因为一些众所周知的原因,最后一篇文章《如墟》中可能有一些争议片段无法在平台发出,如果确有需要修改的地方我会将文章修改得合适后尝试发出,前两篇文章因为已经在豆瓣平台上发过,已经审核,因此应该不存在什么问题。

        第三,重新校对发布前两篇文章的过程中,笔者只会对其中明显的错字或者语法错误进行修改,对其笔力不足或者有其他形式矛盾的地方便予以保留吧,毕竟这个系列的文章正如其系列标题:是笔者在年少时期的纯洁浪漫的遐想的合集,有幼稚、不完满和缺憾也十分正常。正如村上春树所言:没有十全十美的文章,正如不存在彻头彻尾的绝望。

        将三篇文章按创作时间顺序校对发出之后还会写一篇访谈录作跋,届时本系列将会寿终正寝,完成它的历史使命,也算是有始有终,全须全尾。

via 简书