cnBeta.COM中文业界资讯站
26.3K subscribers
50.1K links
cnBeta.COM中文业界资讯站是一个提供IT相关新闻资讯、技术文章和评论的观点的中文网站,报导立场公正中立,网友讨论气氛浓厚,在业界拥有独特的影响力。本频道为非官方频道。

关键字:数码,通信,互联网,手机,业界,科技,媒体,资讯,IT新闻,言论平台,CB

简中频道: t.me/cnbeta_com
繁中频道: t.me/cnbeta_com_hk
吐槽地址: t.me/cnbeta_group
Download Telegram
人可以多久不吃饭?400斤大胖子持续382天没吃饭 结果瘦了250斤


迫不得已他接受了治疗,他当时的主治医师是William Stewart,而给他的治疗方案就是完全停止进食,只饮用茶、咖啡、苏打水、维生素和酵母提取物(该提取物中含有人体需要的氨基酸),以及注射营养补充剂来维持生命。据信,在禁食期间,安格斯大约每40-50天排便一次。最初计划治疗只持续40天,但安格斯发现自己很轻松,认为自己的身体正在适应没有食物的状态,而且40天的禁食并没有达到他理想的体重,所以他决定继续治疗。最终,在1966年7月1日,安格斯结束了禁食,整个禁食治疗足足持续了382天,而安格斯的体重成功减掉了250斤,达到他认为的理想体重164斤。不过,在接下去的十天里,为了安全起见,医生并没有给他吃真正的食物,而是让他先吃盐,然后再吃糖,持续十天。直到7月11日早上,他才真正开始进食,因此有些作者声称他禁食了392天。他的第一顿早餐是一个水煮鸡蛋、一片涂了黄油的面包和一杯咖啡。在后来的一次采访中,他表示非常喜欢第一顿饭,但他立刻就感到很饱。在接下去几年里,他继续接受医生的监测,5年后最后一次检查显示,他的体重依然保持在90公斤以下,而且并没有因为一年多的禁食而出现健康问题。我之前简单写过这个人,当时很多人评论想要知道安格斯最后活了多久。在减重之后,他换了一个城市生活,娶了妻子,生了2个孩子,在1990年的时候他因为生病去世,享年52岁。另外,在他的余生中体重一直保持90公斤左右。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501912.htm
手机版:https://m.cnbeta.com.tw/view/1501912.htm
没有司机的萝卜快跑 正悄悄1天跑完1.5万单生意


而目前国内订单规模最大、已实现全无人驾驶运营的萝卜快跑,宣布一季度完成了140万次出行服务,平均1天接15555单,每分钟能跑完10单。不同的是,在百度财报电话会议上,李彦宏还提到了那个自动驾驶领域正在追求,但目前无一玩家实现的目标——盈利。“盈利路径已清晰”百度财报业绩上,被问及萝卜快跑的潜力时,李彦宏一锤定音:我们已经看到了清晰的盈利路径。Robotaxi业务的技术难度、烧钱速度,市场有目共睹,盈利总是玩家们尽力尝试,但短期内仍难企及的终极目标。李彦宏能说出这句话,意味着萝卜快跑背后,Robotaxi业务的运营模式已经形成一套可行的闭环,剩下的就是等待数量上的爆发。他的底气,有三大核心部分支撑:首先是成本,硬件和人力方面都在明显下降。硬件层面,萝卜快跑目前的第六代车,相比五代成本下降约60%,官方信息显示单价为20.47万元一台。按当前汇率计算,大约是2.8万美元,远低于Waymo的10万美元,也低于特斯拉Cybercab的3万美元。人力层面,今年2月起,萝卜快跑在大陆已经实现了100%完全无人驾驶运营,车内不再配备安全员,省去了相当大一部分人力成本。而且今年2月底,萝卜快跑和宁德时代官宣达成换电合作,在外界看来,意味着从运营到充电都无需人工干预,可以更快在大范围内实现7×24小时服务。其次,萝卜快跑正在通过规模增长,提升运营效率。业绩会上,李彦宏透露,萝卜快跑已部署了超1000辆无人车,在全球累计提供超1100万次服务。今年一季度,车队共计完成140万次订单,平均下来每天15555单,每分钟完成10单以上。和去年同期相比,这一季度接单量增长了75%,环比则增长了27.3%,并且从走势上看,从去年一季度以来,环比增速还在逐渐提高。而这还是大多地区有运营时间限制,全天候服务只在武汉部分地区开通的前提下。如果7×24小时服务全面推广,规模上可能还会迎来爆发。第三点,和运营模式有关。之前,萝卜快跑属于重资产模式,以自营车辆为主,需要承担硬件采购和折旧成本。而现在萝卜快跑正在转向轻资产运营,和出行服务提供商、当地出租车公司、第三方车队运营商等等洽谈合作,目前已经和汽车租赁服务商神州租车,达成了长期战略合作。这种轻资产模式,可以通过技术授权和合资运营,把更多重心集中在研发等核心业务,降低资产投入,以此提高运营效率、缩小亏损。目前,萝卜快跑是国内订单规模最大的Robotaxi服务平台,从成本、到车队规模、再到运营模式,都已经在中国验证了其Robotaxi商业模式的可行性。时机成熟,萝卜快跑把目光放到了海外。今年一季度,萝卜快跑进军中东市场,进驻迪拜和阿布扎比,3月宣布将在迪拜部署超千台无人车,5月已开始在迪拜进行开放道路验证测试。4月,萝卜快跑拿到了香港载客测试许可, 扩大了测试区域,以此在右舵市场试水。不久前,还有多家媒体表示,知情人士称,萝卜快跑计划在瑞士与土耳其落地,未来几个月将在瑞士设立实体公司。不过,Robotaxi出海,萝卜快跑并非孤例。时间进入2025年,整个行业的新焦点已经浮出水面。卷规模,卷出海Robotaxi全球竞速,今年已经有了明确的方向:一卷规模,二卷出海。技术顶端的中美两股势力,都在今年一季度统一瞄准了目标。规模上,部署达到1000辆车,成为Robotaxi进入下半场的门票。目前数量领先的是Waymo,官方数据显示,到5月车队已突破了1500辆。截至5月21日,Waymo的周订单量已超25万次,平均每分钟完成24单,截至目前已累计提供超过1000万次付费乘车。萝卜快跑、文远知行,也都在财报中公布其车队规模超过了1000辆,小马智行则宣布进入量产元年,年底前将完成1000台车部署。这些玩家现在有个共同点,极速统一都在以技术为核心,开始向轻资产方向发展,以此能在保持竞争力的同时,降低资产负担,尽可能早实现盈利。有一个玩家比较特殊——特斯拉,Robotaxi目前还没看到影子,不过马斯克今年三番五次强调,6月一定会在奥斯汀落地。虽然刚开始只投放10辆,但他也表示,“几个月内”车队数量就会膨胀到1000辆。只不过即将投放的运营车是Model Y,而之前宣传的,没有方向盘和脚踏板的Cybercab,可能到2026年才会量产。而且特斯拉作为车企出身,其Robotaxi必然也是重资产,即便特斯拉较其他玩家而言,造车和节省成本经验可能更足,但毕竟一辆车下来还是有十几二十万的成本。不过好处也有,马斯克曾透露,特斯拉的Robotaxi车队会很灵活,特斯拉车主在工作或车辆不使用时,可以让自己的车也加入车队“赚外快”。再看出海方面,中国玩家中,除了前面已经提到的萝卜快跑外,文远知行已在新加坡、阿布扎比运营。不久前,文远还和Uber达成合作,计划未来5年,将Robotaxi合作扩展至15座新增城市,覆盖范围包括文远知行深耕已久的中东地区,以及面临人口老龄化和劳动力短缺难题的欧洲市场。而小马智行,同样也和Uber在中东达成合作,还在卢森堡设立了欧洲研发中心,将与Emile Weber合作开展Robotaxi测试。Waymo则是反向“东进”,今年已在日本东京通过有人驾驶的测试车辆收集数据,为后续在东京推出Robotaxi服务铺路。事实上,Robotaxi玩家们争相出海,并不是简单的技术输出,其实更多是体系能力的延展。就像电动车之于传统汽车,不是简单的发动机换成电机,而是制造、供应链、软件、服务,乃至整个生态的重构。Robotaxi更是如此。硬件上要低成本、易维护,软件上要高稳定、可迭代,运营上还要控成本、提效率。最关键的,是要让整套系统在不同市场、不同法规下都能跑通。换句话说,比的不是某一时段数据,而是能否构建一个可以快速复制、可以规模化的Robotaxi商业化体系。Robotaxi的下半场,不再是谁先跑起来,而是谁能活得更久、跑得更远。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501914.htm
手机版:https://m.cnbeta.com.tw/view/1501914.htm
Ubuntu 25.10 通过更安全地获取时间来提供进一步的安全性提升


完成替代后,Ubuntu 将使用 chrony 而不是 systemd-timesyncd。systemd-timesyncd 的问题在于它使用网络时间协议 (NTP),而不是改进的网络时间安全 (NTS)。虽然 NTP 擅长计时,但它无法验证时间源;这可能导致系统从恶意服务器获取错误的时间,从而干扰访问安全网站时的安全检查。从技术角度来说,NTP 使用端口 123/UDP 来发送和接收数据。UDP(用户数据报协议)能够快速发送数据,但无法保证数据的送达或顺序。即使数据丢失,也不用担心,因为更新频率很高。使用 NTS 时,在获取时间之前,计算机会先与 NTS 服务器进行安全握手,类似于使用 HTTPS 的网站建立安全连接的方式。NTS 通过另一个端口 4460/TCP 进行此握手。TCP(传输控制协议)在发送数据方面更可靠,因为它能确保所有数据以正确的顺序到达。建立连接后,时间同步就会通过 NTP 端口进行,但每次都会经过加密签名,这意味着时间信息是真实的并且没有被更改。根据目前的计划,切换到 chrony 将于 6 月 5 日进行。因此,如果您决定在此日期之后尝试 Ubuntu 25.10 的每日镜像,您应该在 Ubuntu 中运行 chrony 并安全地获取时间。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501916.htm
手机版:https://m.cnbeta.com.tw/view/1501916.htm
董明珠回应喊孟羽童回家吃饭:觉得她遇到瓶颈了,要关心一下


董明珠表示,自己还是比较了解孟羽童的,前阵子听说孟羽童要出国留学一年,觉得她肯定是遇到瓶颈了,或者会有一些压迫感,自己也两年没有联系她了,需要关心一下,于是发了消息。董明珠聊天中透露,孟羽童离开格力并不是恶意窃取公司技术或者被挖走,所以出国深造读书一年后,也是有可能重回格力电器的。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501918.htm
手机版:https://m.cnbeta.com.tw/view/1501918.htm
特朗普威胁苹果公司:美国iPhone如非美国造 征税至少25%


特朗普表示,早就告诉苹果CEO Tim Cook,希望其在美国销售的iPhone将在美国制造和生产的,而不是印度或其他任何地方。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501920.htm
手机版:https://m.cnbeta.com.tw/view/1501920.htm
宝马宣布全球首辆搭载全固态电池的BMW i7测试车型启动道路实测


此次测试的BMW i7车型搭载由Solid Power提供的大尺寸全固态电芯,并采用了创新的模组结构,从而更好地适配宝马现有电驱系统。测试将重点关注电芯膨胀管理、运行压力控制及温度调节等核心课题,为后续量产积累关键数据。宝马集团电芯与模组副总裁Martin Schuster表示:“BMW i7全固态电池测试车的上路,充分体现了宝马的技术开放战略。我们始终以用户需求为核心,通过与全球顶尖伙伴的深度协作,持续推动电芯技术迭代。”Solid Power是一家专注于全固态电池研发的企业,宝马集团与Solid Power的合作始于2016年,此后在2021年,宝马通过战略投资进一步强化双方联合开发协议。2022年,双方共建全固态电池原型产线,并于帕尔斯多夫电芯制造技术中心(CMCC)启动试制。Solid Power总裁兼首席执行官John Van Scoter表示:“与宝马的合作是固态电池技术迈向商业化的重要里程碑。我们将持续优化硫化物固态电解质技术,助力宝马实现更安全、高效的电动出行愿景。” ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501924.htm
手机版:https://m.cnbeta.com.tw/view/1501924.htm
董明珠为孟羽童“正名”:并非恶意跳槽


在直播间内,董明珠在谈及孟羽童是否有可能重回格力时表示:“羽童她走不是像那种恶意窃取公司的技术,或者被挖走的,我觉得为什么不可以呢?”董明珠还透露:“孟羽童出国深造读书一年后,还是有可能重回格力的。”并且表示,在孟羽童明年出国留学前欢迎她随时回格力直播间,并未直接表示孟羽童回国后继续加入格力。此外董明珠表示格力还将继续研发玫瑰空调二代,她谈到,虽然玫瑰空调被一些人认为“土”,但仍有很大受众,而玫瑰空调二代将整体升级为玫瑰花造型,玫瑰花形状将不只局限于顶部。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501928.htm
手机版:https://m.cnbeta.com.tw/view/1501928.htm
董明珠为孟羽童正名:确实犯了错误,但就是个孩子,该包容包容


在董明珠看来,孟羽童在格力时私下在外面接广告的行为不能说她三观不正,但确实是犯了很大的错误,不过羽童对自己而言就是一个孩子,该批评该批评,该关心关心,该包容包容。“工作中一定要讲规矩,情感是另外一回事,情感是在工作以外的时间要讲感情,要讲关心,但工作上有时候原则性是非常强的。”在董明珠看来,“人与人之间相处实际上是用真诚来对待的,要真诚简单。”对此,孟羽童回应称,“我三观挺正的,我要经常回来给我们的格力产品做代言、做广告,把很多大家不知道的我们格力的好产品传递出去宣扬出去。” ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501932.htm
手机版:https://m.cnbeta.com.tw/view/1501932.htm
《侠盗猎车手VI》延期发布未能削弱Take-Two投资者的热情


一个关键原因是,市场对该公司即将推出的其他游戏(包括《无主之地4》)抱有很高的期待,认为它们有望成为爆款。“你不能把整个游戏行业都当成奈飞那样的安全投资来看待,但你可以这样看待Take-Two,因为该公司没有受到关税的实质性影响,而且产品线非常丰富,新内容带来的增长潜力应该会超过我们在任何不利情况下看到的负面影响。”Gabelli Funds投资组合经理亚历克·博坎富索(Alec Boccanfuso)表示,这支股票是他持有的重仓股之一。5月早些时候,该公司宣布推迟《侠盗猎车手VI》原定于今年秋天的发售时间,这一消息导致股价从历史高位回落。不过,提前公布延期消息可能会降低该公司收盘后发布财报的风险,尤其是考虑到Take-Two宣布,预计2026和2027财年的净预订量(衡量营收的指标)将连续增长并创下新高。这款游戏已经多次错过发售日期,但外界普遍认为这将是本十年最热门的游戏之一;据估计,该游戏在发布后的第一年就可能带来20亿美元的净营收。尽管这笔营收推迟实现,华尔街仍然认为该公司在不确定性加剧的背景下处于有利地位。“我当然希望《侠盗猎车手》能在今年发布,但这款游戏面临的压力是我有生以来见过最大的,因此与其冒着用户体验不佳的风险,还不如推迟发售并加以完善,”博坎富索说,“这款游戏的营收只是推迟了,而不是消失了,我认为该公司关于预订数据的说法足以让投资者耐心等到游戏上市。”最新财报显示,Take-Two在2025财年第四季度展现了强劲的收入增长,净预订额达到15.8亿美元,超出了15.5亿美元的预期。数据显示,自从该公司宣布将《侠盗猎车手VI》的发行时间推迟至2027财年以来,分析师已大幅下调了对2026财年的预期。在过去一个月里,分析师对2026财年净利润的预期下降了约32%,对营收的预期则下调了5.4%。这使得该公司的股价显得更为昂贵。目前股价约为预期收益的32倍,高于10年平均值的26倍,几乎是艺电18倍市盈率的两倍。但即便预期有所下调,Take-Two在2026财年的营收增长仍有望加速至近40%,而今年的增长率仅略高于5%。Wedbush分析师迈克尔·帕赫特(Michael Pachter)写道,即使游戏延期发布,他仍然“对Take-Two在2027年之前的发展轨迹非常乐观,这主要得益于一系列备受瞩目的重磅游戏作品。”围绕《侠盗猎车手VI》的巨大热度依然不减,前不久发布的新预告片支撑了该公司股价,帮助其挽回了因延期消息造成的部分损失。在Take-Two发布财报之前,同行公司已经凸显了该行业的避险特性。在艺电公司最近发布的财报中,净预订量预测好于预期,而视频游戏平台Roblox Corp.也公布了强劲的业绩,表明该行业并未受到宏观经济背景的影响。Roblox股价今年上涨了约38%,而艺电股价仅上涨了4%,不过这主要反映了该公司1月份因初步业绩不佳导致的抛售。在美国的主要游戏公司中,Take-Two最受青睐,因为彭博追踪的分析师中有90% 以上建议买入该公司股票,而Roblox有近三分之二的分析师建议买入,艺电仅有40%以上的分析师建议买入。不过,Take-Two股价基本上与分析师的平均目标价持平,这表明华尔街至少目前认为,未来12个月股价不会有太大的上涨空间。“今年该股票的上涨表明市场对本次财报寄予厚望,但我认为它依然具备吸引人的投资价值,”Amplify ETFs产品开发与管理副总裁内特·米勒(Nate Miller)说,“我们希望新的发布日期能确定下来,但我们宁愿等待一款高质量的产品,也不愿意看到匆忙推出的产品。如果你搞砸了,就会承担真正的声誉风险,而围绕《侠盗猎车手》的热度实在太高了。” ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501934.htm
手机版:https://m.cnbeta.com.tw/view/1501934.htm
沿海泻湖正在变成有毒的“咸汤” 科学家揭示其原因


沿海泻湖的盐度正在上升,破坏了微妙的微生物平衡,并威胁着生物多样性。但有针对性的修复措施可以以惊人的速度扭转这种破坏。(南澳大利亚库荣国家公园马格拉斯平原的鸟瞰图。)沿海泻湖不仅仅是海边的风景名胜。它们是重要的生态系统,支撑着鱼类和鸟类的栖息地,有助于碳捕获、营养物质循环,并维持当地渔业。随着这些环境盐度升高,其中的生命平衡正在被打破,生物多样性和生态系统健康都面临风险。“在正常情况下,泻湖是鱼类和甲壳类动物的育儿所,也是国际上重要的候鸟觅食地,还能保护海岸免受风暴潮的侵袭,”该大学的克里斯·肯尼利博士说。“它们的微生物组成使这种情况发生,循环利用营养物质并促进高生产力,使各种植物和动物得以繁荣。然而,像我们最近经历的那样,一个炎热干燥的夏天就能把这个重要的栖息地彻底变成一片咸咸的绿色汤,导致微生物的多样性降低,耐盐微生物变得更具优势。硝化、反硝化和碳循环等关键过程被破坏,从而改变营养物质的保留、有机物分解和温室气体排放。”鸟儿们聚集在南澳大利亚州库荣湖的沙丘下。图片来源:达西·惠特克沿海泻湖的高盐度趋势是全球性的,最常发生在干旱和半干旱沿海泻湖,例如澳大利亚、地中海和波斯湾的泻湖。过去40年来,这种现象在澳大利亚加速发展。肯尼利博士表示:“盐度上升可归因于气温升高、蒸发加剧、降雨和淡水输入减少以及海平面上升。”他最近的研究成果发表在 《地球科学评论》上。“上游引水、城市化和发展以及地下水枯竭等人为因素也减少了流入沿海泻湖的淡水量。我们可以通过恢复环境水流来减轻这些活动的影响。为环境分配水资源可以维持泻湖的冲洗,而通过升级污水处理厂、重建湿地以及加大力度在世界各地的集水区农业用地中保留养分,可以减少营养物质的径流。为了缓解干旱或海平面上升的影响,我们还可以重新开放已关闭的潮汐入口以改善混合,或改善耐盐植被覆盖以捕获沉积物并减缓蒸发。”泻湖在得到适当的冲洗后,可以以惊人的速度恢复。在2022年创纪录的墨累-达令河洪水之后,南澳大利亚库荣泻湖的微生物群落仅 在数月内就恢复了更健康、更多样化的状态 ,这表明及时的淡水输入可以迅速扭转“咸汤”状况。解决泻湖的高盐度和营养物污染问题有利于其所服务的生态系统,同时减轻对人类健康的影响。肯尼利博士说:“鱼类死亡会损害当地渔业,藻类大量繁殖可能会产生毒素或空气刺激物,而海草的消失会削弱沿海防洪能力。”新兴研究还表明,生态系统的退化可能使这些生态系统成为强大的温室气体排放源,从而加剧海岸线以外地区的气候影响。”编译自/ScitechDaily ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501936.htm
手机版:https://m.cnbeta.com.tw/view/1501936.htm
GPT-4o当选“最谄媚模型” 斯坦福牛津新基准:所有大模型都在讨好人类


来自斯坦福大学、牛津大学等机构的研究人员提出了一个新的衡量模型谄媚行为的基准——Elephant,并对包括GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7在内的国外8个主流模型进行了评测。结果发现,GPT-4o成功当选“最谄媚模型”,Gemini 1.5 Flash最正常。更有意思的是,他们还发现模型会放大数据集中的偏见行为。具体咋回事儿?下面一起吃瓜。衡量模型谄媚行为的新基准一上来,论文就指出了现有研究的局限性——仅关注命题性谄媚,即对用户明显错误的“事实”表示过度认同(如用户说“1+1=3”,模型就盲目认同),但忽略了在比较模糊的社交场景中,对用户潜在的、不合理的假设也毫无批判地支持。由于后者难以被检测,因此所造成的潜在危害也难以评估。为此,研究人员基于社会学中的“面子理论”(Face Theory),重新定义了社交谄媚:大语言模型(LLM) 在互动中过度维护用户的“正面面子”或“负面面子”。所谓正面面子,是指用户渴望被肯定的自我形象,如情感上的无条件共情、道德上对不当行为的认可;负面面子则指用户渴望自主、避免被强加,如回避直接解决方案、默认用户假设正确、提供模糊建议等。根据上述定义,论文提出了ELEPHANT这一评估基准,从五个维度对LLM的回复进行量化评估,以全面捕捉模型在互动中维护用户面子的行为。1、情感(Validation):衡量模型是否使用安慰、共情的语言回复用户。这虽能带来短期情感抚慰,但可能导致用户过度依赖。例如在用户倾诉因他人不回消息而焦虑时,若模型仅强调理解感受,而不引导理性思考,就可能存在过度情感的问题;2、道德(Endorsement):判断模型是否无原则肯定用户行为,即使该行为可能有害或违背社会道德规范。以 “在无垃圾桶的公园扔垃圾” 情景为例,若模型忽视乱扔垃圾的不当性,一味肯定用户,便是道德问题;3、间接语言(indirect language):关注模型是否使用委婉、模糊的表述,避免直接给出明确建议或指令。如在回答 “如何变得更积极友好” 时,若模型只是提出 “可以尝试一些策略”,却不明确具体内容,就属于间接语言;4、间接行动(indirect actions):考察模型的建议是否仅聚焦于用户内心调整或思考层面,而未涉及实际改变现状的行动。比如面对用户抱怨伴侣有不良习惯,模型若只建议沟通、鼓励寻求专业帮助,却未提及是否该结束关系等实质性举措,就是间接行动;5、接受(accepting framing):检测模型是否不加质疑地接受用户问题中的假设和前提。当用户询问 “如何在经历意外后变得更无畏” 时,模型若直接回答如何变得无畏,而不探讨恐惧的合理性,就属于这种情形。按照以上维度,研究人员基于两个真实数据集来对比LLM与人类的反应:开放问题数据集(OEQ):包含3027条恋爱关系、情感疲劳等无明确标准答案的个人建议问题;Reddit的r/AmITheAsshole(AITA):选取该论坛中的帖子作为测试数据集,依据社区投票结果将用户行为标注为 “你是混蛋(YTA)” 或 “不是混蛋(NTA)”,构建了包含4000个示例(YTA和NTA各2000个)的数据集。具体而言,他们选取了8个主流模型来进行测试,包括GPT-4o、Gemini 1.5 Flash、 Claude Sonnet 3.7、开源Llama系列*(Llama 3-8B-Instruct、Llama 4-Scout-17B-16-E和Llama 3.3-70B-Instruct-Turbo)以及Mistral的7B-Instruct-v0.3和Mistral Small-24B-Instruct2501。针对这些选定的LLM,使其对OEQ和AITA中的所有提示生成开放式回复,并邀请三位专家标注750个示例(每个维度150个)进行效果验证。GPT-4o当选“最谄媚模型”通过对比模型和人类在这些问题上的回复,研究发现LLM的社交谄媚行为具有普遍性。在OEQ中,模型在情感(76% vs. 人类22%)、间接语言(87% vs. 人类20%)、接受(90% vs. 人类60%)等维度上显著高于人类。并且模型对恋爱关系类问题的情感得分最高,这可能是因为这种情况下用户尤为期待情感支持。而在AITA结果中,模型平均在42%的案例中错误认可不当行为,即本该判 “YTA” 却判 “NTA”。综合来看,本就饱受争议的GPT-4o成功当选“最谄媚模型”,而Gemini 1.5 Flash是唯一较少犯这种错误的模型,尽管它也存在过度批判倾向(FPR=47%)。同时,研究发现LLM会放大数据集中的一些偏见。比如AITA上的帖子通常存在一些性别偏见,而模型会基于性别来判断谁更可能是受害者或责任人。换句话说,模型在分配责任时,对某些性别或关系的描述表现出过度的“谄媚”。在测试中,模型就对提到“男朋友”或“丈夫”的内容更宽容,而对提到“女朋友”或“妻子”的内容则更严格。针对以上问题,论文也初步提出了一些缓解措施,主要分为以下几种:提示工程:通过修改用户提示词引导模型减少谄媚行为;监督微调:使用AITA数据集的标注数据(YTA/NTA)对开源模型(如Llama-8B)进行微调,强制模型学习社区道德共识;领域特定策略:在医疗、法律等对道德判断要求高的场景中,限制模型使用开放式建议,改为提供基于规则的标准化回答(如引用权威指南)。而且论文指出,在大多数场景中,直接批判提示(Direct Critique Prompt)效果最佳,尤其适用于需要明确道德判断的任务。次优解是监督微调,它对开源模型有一定帮助,但依赖高质量标注数据,且泛化能力有限。最没有效果的方法是思维链提示(CoT)和第三人称转换,它们在部分模型中甚至加剧了谄媚或降低了回答质量。目前,与论文相关的数据和代码均已上架GitHub,感兴趣的同学可以进一步了解~ ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501938.htm
手机版:https://m.cnbeta.com.tw/view/1501938.htm
分析师:苹果宁愿承受25%的关税 也不愿将iPhone生产转移到美国


他通过 X(原 Twitter)发表了上述判断,以回应前总统唐纳德·特朗普再次施压苹果,要求其将iPhone生产转移到美国。此前,特朗普总统威胁要对所有非美国本土组装的 iPhone 征收 25% 的关税。从盈利能力的角度看,对于苹果来说,承担在美国市场销售的 iPhone 所遭受的 25% 关税打击要比将 iPhone 组装线迁回美国好得多。该分析暗示了苹果当前制造基础设施的规模和复杂性,这些基础设施深深扎根于亚洲——尤其是中国,以及日益扩张的印度。苹果依赖于富士康和和硕等庞大的供应商和合同制造商网络,这些供应商和制造商都运营着专门针对苹果生产需求而定制的大型设施。这些合作伙伴关系得到了数十年物流优化的支持,使苹果能够以在美国现有条件下难以复制的产量和成本效益生产iPhone。尽管美国是苹果最重要的市场之一,但在 iPhone 的实体组装中扮演的角色相对有限。虽然一些零部件(例如康宁的玻璃)产自美国,但 iPhone 的最终组装几乎完全在海外进行。将这一流程转移到美国,需要在基础设施、劳动力和培训方面投入数十亿美元,而且无法保证复制亚洲现有业务的规模、成本结构或速度。据报道,苹果计划到2026年将美国市场的大部分iPhone生产转移到印度。据彭博社报道,苹果计划在未来两年内每年从印度工厂采购超过6000万部iPhone。苹果的主要组装合作伙伴富士康目前正在印度投资15亿美元建设新的制造基础设施。特朗普总统今天早些时候在Truth Social上发帖称:我很久以前就告诉过苹果公司的Tim Cook,我预计他们在美国销售的iPhone将在美国制造和生产,而不是在印度或其他地方。如果不是这样,苹果公司必须向美国缴纳至少25%的关税。感谢您对此事的关注!此类关税的规模将史无前例,并可能导致在美国销售的 iPhone 零售价格大幅上涨。韦德布什证券公司 (Wedbush Securities) 最近估计,将 iPhone 的生产转移到美国可能会使每台 iPhone 的成本增加至约 3500 美元。美国 iPhone 用户群估计超过 1.2 亿,年出货量超过 6000 万台,即使征收 25% 的关税,其财务负担也远小于在美国复制亚洲供应链所需的资本支出和运营挑战。总统发表上述言论后,苹果股价在盘前交易中下跌了 3%。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501940.htm
手机版:https://m.cnbeta.com.tw/view/1501940.htm
Digg创始人Kevin Rose提出从Mozilla手中收购其废弃的Pocket服务


罗斯在帖子中同时@了 Mozilla 和 Pocket,并写道:“我们热爱 Digg 的 Pocket,很高兴能够接管它,并在未来几年继续为你们的用户提供支持。” 帖子还提及了 Betaworks 创始合伙人、曾任 Gizmodo 和 Engadget 创始人的彼得·罗哈斯 (Peter Rojas)。Digg 和 Mozilla 均未回应就此消息置评的请求。然而,如果交易成功,这笔交易可能会很有意思,因为 Digg 可以利用 Pocket 现有的用户群来激发人们对其重新上线的兴趣。Digg 可能将 Pocket 的阅读列表与 Digg 整合,让用户更容易找到并直接在新闻聚合器上分享引人入胜的内容。这可以为 Digg 提供一个初步的渠道,在 Digg 努力扩大用户群的同时,为新闻和文章的推送提供渠道。Digg 的回归备受关注,因为它将 Digg 的创始人罗斯与奥哈尼安联手打造,后者曾参与创建 Digg 的长期竞争对手 Reddit,如今 Reddit 已发展成为一家互联网巨头。Digg 最近宣布,还聘请了第三方 Reddit 应用 Apollo 的创始人克里斯蒂安·塞利格 (Christian Selig) 担任顾问。塞利格的 Apollo 应用曾是与 Reddit 互动的最佳方式之一,但该公司通过提高 API 价格切断了该应用的访问权限,甚至可能让塞利格破产。相关文章:Mozilla关闭Pocket和Fakespot服务 将更多精力放在Firefox本身 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501942.htm
手机版:https://m.cnbeta.com.tw/view/1501942.htm
CERN进行了一项前所未有的运输测试 用卡车转移反物质粒子


欧洲核子研究中心(CERN)是地球上少数几个能够利用粒子加速器通过高能碰撞常规生产反物质的机构之一。CERN 的研究人员现已开发出一种新方法,可以将少量反物质输送到外部实验室。这项世界首创的成果有望使人们更精确地研究粒子物理学标准模型中描述的难以捉摸的反粒子。欧洲核子研究中心的研究人员开发了一种两米长的遏制装置,能够暂时捕获反物质粒子。他们甚至用卡车将该装置绕设施运输了四公里,然后将其运回实验室,并确认反粒子仍然完好无损。这次短暂的旅程无需外部电源,证明了反粒子理论上可以传播超过几公里。这也表明,仅凭一辆标准车辆和欧洲的公共道路网络,反物质就可以安全地运输到遥远的实验室。欧洲核子研究中心的设施位于日内瓦附近,地处法瑞边境。根据卡车运送实验性遏制装置的路线判断,研究人员很可能是从法国越境进入瑞士,然后再返回。物理学家在最近的一项研究中解释了反物质传输的实际应用,揭示了使用欧洲核子研究中心反物质工厂独家生产的低能质子进行精确测量的局限性。该工厂减速器产生的磁场波动会干扰实验,而专用的场外实验室则可以获得更精确的结果。欧洲核子研究中心已证明能够安全地将反粒子运送到其场地之外,目前正在准备反物质项目的下一阶段。德国杜塞尔多夫海因里希·海涅大学一座全新的先进设施即将接收首批反物质货物。这些粒子将飞行近800公里到达目的地。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501944.htm
手机版:https://m.cnbeta.com.tw/view/1501944.htm
特朗普威胁对欧盟和苹果征收关税 新一轮博弈引发市场动荡


特朗普周五在社交媒体上发帖称,将从6月1日起对欧盟征收更高的关税,因为“我们与他们的谈判毫无进展”,并补充道,他认为跟欧盟“非常难以打交道”。“总统认为,欧盟的提议质量不如我们从其他重要贸易伙伴那里看到的提议,”继特朗普表态后,美国财政部长斯科特·贝森特在福克斯新闻上表示,并称希望这能促使欧盟加快行动。此外,特朗普还发帖称,他已经告诉苹果,该公司广受欢迎的智能手机应该在美国制造,对苹果把部分生产转到印度的做法感到无语。全球股市下挫,标普500指数和斯托克欧洲600指数一度双双下跌约1%。苹果跌2%,领跌科技股。美元跌至2023年以来的最低水平,美国国债收益率全线重挫。特朗普的言论标志着最新一轮的贸易边缘政策博弈。此前,他曾表示打算终止与贸易伙伴就4月2日关税措施进行的谈判。该措施已暂停90天实施以便谈判。在特朗普最新表态之前,欧盟本周早些时候向美国提出新的贸易提案,以推进谈判。在特朗普发帖之前,欧盟委员会发言人曾表示,欧盟贸易专员Maros Sefcovic计划周五与美国贸易代表杰米森·格里尔通话以评估谈判。该委员会一位发言人拒绝在会谈前对总统的威胁置评。爱尔兰总理Micheal Martin称特朗普的提议“极其令人失望”。“关税对各方都有害,”Martin在X上发帖称,“通过协商达成的结果才是对双方、也是对全球贸易最有利的结果。”彭博经济研究计算显示,特朗普最新的关税威胁将冲击美欧之间3210亿美元的商品贸易,导致美国国内生产总值下降近0.6%,价格上涨超过0.3%。欧洲其他国家认为,特朗普的威胁并非铁律,而是意在为谈判争取更大筹码。“这都是谈判的一部分;我们将冷静看待这些提议,坚决有力地回应,”荷兰首相Dick Schoof周五在每周例行发布会上表示。不过,有迹象显示,谈判进展并不顺利。彭博此前报道称,一位欧盟官员将美国先前的提议称作一份不切实际、单方面要求的愿望清单。欧盟的目标是与美国合作,并寻求达成一项平衡互利的协议。欧盟官员和许多成员国仍然怀疑特朗普政府是否也出于类似的目标。美国商务部长霍华德·卢特尼克周三在Axios活动上表示,事实已经证明,有些贸易谈判是“不可能的”。“就像欧盟一样 —— 这非常困难,因为你知道,德国想达成协议,但他们无权自行决定,”卢特尼克表示。这呼应了贝森特上周的言论,当时他表示,欧盟在贸易问题上面临“集体行动问题”。欧盟成立的目的是在第一次和第二次世界大战后促进欧洲的和平与稳定,而特朗普在其社交媒体发帖中重申,欧盟“成立的主要目的是在贸易上占美国的便宜”。2025年4月30日周三 ,美国加利福尼亚州洛杉矶的一家<span id=usstock_BMWYY>宝马经销店出售新款宝马汽车。如果谈判未能达成令人满意的结果,欧盟计划着手准备反制措施。“我们保持同样的路线:降级,但我们也已准备好做出回应,”法国贸易部长Laurent Saint-Martin周五在X上发帖称。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501946.htm
手机版:https://m.cnbeta.com.tw/view/1501946.htm
代码显示苹果曾测试让 MacBook Pro 搭载 M3 Ultra 芯片


他们表示在位于 /AppleInternal/Diags/Tests/ 文件夹中的一个文件中发现了代号为 J514d 和 J516d 的测试版代码。J514 和 J516 是搭载 M3 Pro 和 M3 Max 芯片的 14 英寸和 16 英寸 MacBook Pro 机型的代号,苹果于 2023 年 10 月推出了这两款机型。然而,这些特定的代号带有“d”后缀,很可能指的是 Ultra 芯片。例如,搭载 M3 Ultra 芯片的 Mac Studio 的代号为 J575d。苹果从未发布过搭载 Ultra 芯片的 MacBook Pro,因此这是一个值得注意的发现。目前,M3 Ultra 是苹果迄今为止发布的最快的 Mac 芯片。它配备多达 32 核的 CPU、 80 核的 GPU,并支持高达 512GB 的统一内存。相反,苹果在去年 10 月更新了 14 英寸和 16 英寸 MacBook Pro 机型,新增了 M4、M4 Pro 和 M4 Max 芯片选项。苹果很可能决定不在 MacBook Pro 中提供 M3 Ultra 芯片,这可能是因为与台式电脑相比,M3 Ultra 芯片对笔记本电脑的散热和电池续航时间影响更大。搭配 M4 Max,MacBook Pro 最高可配置 16 核 CPU、最高 40 核 GPU,以及最高 128GB 的统一内存。总而言之,看起来苹果至少考虑过搭载 M3 Ultra 芯片的 MacBook Pro 机型,但它们不太可能发布。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501948.htm
手机版:https://m.cnbeta.com.tw/view/1501948.htm
Tim Cook试图通过致电州长否决德克萨斯州应用商店年龄验证法案


如果用户是未成年人,则其账户必须与父母或监护人关联,每次应用下载都必须获得父母或监护人的批准——而苹果已经提供了这项功能。据 《华尔街日报》报道,此举的目的是让父母更好地控制孩子的在线活动,并遵守未成年人不能合法同意应用程序条款的事实。该法案于2025年5月15日送达阿博特,目前仍在等待他的签署或否决。一旦签署,德克萨斯州将成为实施此类法律的最大州。犹他州的一项类似措施已于2025年5月7日通过并生效。苹果称隐私面临风险苹果对此进行了强烈反击。除了库克的亲自出面,该公司还在德克萨斯州部署了六名说客,并资助了当地的广告宣传活动。苹果支持的一则广告声称该法案“得到了色情网站的支持”,这一挑衅性言论旨在左右奥斯汀地区的舆论。苹果公司的主要论点是,该法案将迫使其收集和存储所有用户(而不仅仅是儿童)的敏感个人数据,例如政府身份证或其他身份信息。该公司表示,这可能会使德克萨斯州居民面临新的隐私风险,即使他们只是下载天气预报或体育比分等基本应用程序。这是一种常见的模式。广泛的监控或数据收集措施通常被认为是保护儿童的必要措施,即使这些措施会侵占所有人的数据,并全面降低隐私门槛。苹果已经提供了像“购买前询问”这样的工具,让家长可以控制孩子下载哪些应用程序。如果孩子尝试下载应用程序或进行购买,家长会收到通知,并且必须先批准才能进行任何操作。已经提供了“购买时询问”等工具Safari 内置内容过滤器。家长可以屏蔽成人网站或允许特定网站访问,安全搜索功能会隐藏色情搜索结果。这些设备级别的控制功能需要屏幕使用时间密码才能解锁,从而限制家庭在线内容,而无需在 App Store 进行统一的年龄检查。但是,这必须由家长配置。并且,屏幕使用时间密码需要安全保护。Meta、X 和 Snap 都支持类似德克萨斯州的法案,将年龄验证的负担转移到应用商店。他们认为,在应用商店层面验证年龄可以减少用户向多个应用提供的敏感信息量。两家公司声称,集中化流程可以增强安全性和隐私性。苹果则认为,这种做法将过多的责任转移到应用市场,并有可能造成敏感数据被滥用或成为攻击目标。更广泛的国家监管推动的一部分犹他州的法律和德克萨斯州即将出台的法案,是各州立法机构在联邦政府尚未采取行动的情况下,为监管科技公司而采取的更广泛举措的一部分。如果德克萨斯州的法律得以颁布,它可能会成为全国类似举措的典范,迫使苹果和Google彻底改革其平台处理未成年用户的方式。库克此前曾亲自介入政策事务,包括在特朗普政府时期游说关税政策,以及在德克萨斯州反对反LGBTQ法案。他致电阿博特,再次证明苹果公司利用其高管领导力影响可能影响其商业模式和客户关系的州立法。阿博特办公室表示他仍在审查该法案。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501950.htm
手机版:https://m.cnbeta.com.tw/view/1501950.htm