cnBeta.COM中文业界资讯站
26.4K subscribers
50.1K links
cnBeta.COM中文业界资讯站是一个提供IT相关新闻资讯、技术文章和评论的观点的中文网站,报导立场公正中立,网友讨论气氛浓厚,在业界拥有独特的影响力。本频道为非官方频道。

关键字:数码,通信,互联网,手机,业界,科技,媒体,资讯,IT新闻,言论平台,CB

简中频道: t.me/cnbeta_com
繁中频道: t.me/cnbeta_com_hk
吐槽地址: t.me/cnbeta_group
Download Telegram
Google AI 模式登陆美国 将增加对深入研究、比价购物等场景的支持


该功能基于Google现有的人工智能搜索体验“AI Overviews”,该功能会在搜索结果页面顶部显示人工智能生成的摘要。“AI Overviews”于去年推出,但由于Google的人工智能提供的答案和建议存在问题,例如建议在披萨上涂胶水等,其结果好坏参半。然而,Google声称,AI Overviews 在采用率方面取得了成功,即使准确性方面并非如此,因为每月已有超过 15 亿用户使用过该 AI 功能。现在,该功能将退出实验室。该公司表示,该功能将扩展到 200 多个国家和地区,并提供 40 多种语言版本。与此同时,AI 模式允许用户提出复杂的问题并进行后续跟进。该功能最初在Google搜索实验室进行测试,随着 Perplexity 和 OpenAI 等其他 AI 公司也纷纷将自己的网络搜索功能扩展到Google领域,该功能也应运而生。由于担心搜索市场份额可能被竞争对手蚕食,AI 模式代表了Google对未来搜索格局的定位。随着人工智能模式的广泛推广,Google正在大力宣传其一些新功能,包括深度搜索。人工智能模式会将问题分解成不同的子主题来回答你的查询,而深度搜索则能够进行大规模搜索。它可以发出数十甚至数百个查询来提供答案,其中还会包含链接,方便你自行深入研究。Google表示,结果是在几分钟内生成一份完整引用的报告,可能会节省您数小时的研究时间。该公司建议使用深度搜索功能进行比较购物,无论是购买大件家用电器还是儿童夏令营。AI 模式即将推出的另一项AI 购物功能是虚拟服装“试穿”选项,该功能使用用户上传的照片生成用户穿着该商品的图像。Google指出,该功能将能够识别 3D 形状、面料类型和弹性,并将于今日在搜索实验室中推出。Google表示,未来几个月将为美国用户推出一款购物工具,当商品达到特定价格后,该工具将代您购买商品。(不过,您仍然需要点击“代买”才能启动该代理。)AI Overviews 和 AI Mode 现在都将使用 Gemini 2.5 的定制版本,Google表示 AI Mode 的功能将随着时间的推移逐步推广到 AI Overviews。AI 模式还将支持在体育和金融查询中使用复杂数据,该功能即将通过 Labs 推出。用户可以提出一些复杂的问题,例如“比较费城人队和白袜队过去五个赛季的主场胜率”。AI 会搜索多个来源的数据,将这些数据汇总成一个答案,甚至可以即时创建可视化效果,帮助你更好地理解数据。另一项功能利用了Google的代理 Project Mariner,它可以与网络互动,代表您采取行动。AI 模式最初可用于查询餐厅、活动和其他本地服务,它将节省您搜索多个网站价格和库存情况的时间,从而找到最佳选择——例如,价格实惠的音乐会门票。Search Live 将于今年夏末推出,它能让你根据手机摄像头的实时画面提问。这超越了 Google Lens 的视觉搜索功能,因为你可以通过视频和音频与 AI 进行互动对话,类似于Google的多模态 AI 系统Project Astra。搜索结果还将根据您过去的搜索记录进行个性化设置,如果您选择使用今年夏天推出的一项功能连接您的 Google Apps,搜索结果也将进行个性化设置。例如,如果您连接了 Gmail,Google 可以从预订确认邮件中了解您的旅行日期,然后根据这些信息推荐您所访问城市中即将举办的活动。(由于担心隐私问题会引发一些争议,Google 指出,您可以随时连接或断开您的应用。)该公司指出,Gmail 是第一款支持个性化内容的应用程序。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501160.htm
手机版:https://m.cnbeta.com.tw/view/1501160.htm
Google 推出其网页浏览人工智能代理项目 Mariner


Google新推出的AI Ultra 套餐(每月 249.99 美元)的美国用户将可以访问 Project Mariner,该公司表示,更多国家/地区的支持即将推出。Google还表示,将把 Project Mariner 的功能引入 Gemini API 和 Vertex AI,让开发者能够构建由该代理驱动的应用程序。Mariner 项目于 2024 年底首次亮相,代表了Google迄今为止最大胆的尝试,旨在通过人工智能代理改变用户与互联网的互动方式。在项目发布时,Google搜索负责人表示,他们将 Mariner 项目视为用户体验根本性转变的一部分,届时人们将把更多任务委托给人工智能代理,而不是自己访问网站并完成这些任务。例如,Project Mariner 用户无需访问第三方网站即可在线购买棒球比赛门票或购买杂货——他们只需与 Google 的 AI 代理聊天,它就会访问网站并为他们采取行动。Mariner 项目与其他网页浏览 AI 代理竞争,例如OpenAI 的 Operator、亚马逊的 Nova Act和Anthropic 的 Computer Use。这些工具都处于实验阶段,TechCrunch 的经验证明,这些原型速度慢且容易出错。Google表示,他们已经听取了早期测试人员的反馈,以改进 Project Mariner 的功能。一位Google发言人告诉 TechCrunch,公司已将 Project Mariner 更新为在云端虚拟机上运行,类似于 OpenAI 和亚马逊的代理。这意味着用户可以在 Project Mariner 在后台完成任务的同时处理其他项目——Google表示,新的 Project Mariner 最多可以同时处理 10 个任务。此次更新使 Project Mariner 比其在用户浏览器上运行的前代产品更加实用。Project Mariner 的早期设计意味着用户在 AI 代理工作时无法使用桌面上的其他标签页或应用程序。这在某种程度上违背了 AI 代理的初衷——它可以为你工作,但你在它工作时却无法做任何其他事情。Google表示,未来几个月,用户将能够以 AI 模式访问 Project Mariner,这是该公司基于 AI 的Google搜索体验。该功能上线后,将仅限于搜索实验室(Google的搜索功能可选测试平台)使用。Google表示,它正在与 Ticketmaster、StubHub、Resy 和 Vagaro 合作,为部分代理流程提供支持。今天,Google还发布了另一项名为“代理模式”的代理体验的早期演示。该公司表示,该功能将网页浏览与搜索功能和集成以及其他Google应用相结合。Google表示,Ultra 订阅用户很快将在桌面端体验“代理模式”。在今年的 I/O 开发者大会上,Google似乎终于准备推出它多年来一直在谈论的代理体验。Project Mariner、Agent Mode 和 AI Mode 似乎都准备改变用户的网页浏览方式,以及供应商与客户在线互动的方式。网页浏览代理对互联网经济有着重大影响,但Google似乎已经准备好将这些代理全部推向世界。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501162.htm
手机版:https://m.cnbeta.com.tw/view/1501162.htm
iOS 版 Gemini App 新增 Live View 功能 提供实时视觉帮助


在演示中,Gemini 识别了用户正在查看的物体,纠正了用户对物体的错误假设,并通过回答问题提供背景信息。Gemini 的实时视图可以实时识别物体,为 DIY 或家居装修项目提供帮助,帮助整理空间,协助购物等等。您还可以与 Gemini 共享您的iPhone或iPad屏幕,以获取您在线看到的内容的反馈。Gemini 的 Live 功能可能对盲人或视力低下的用户有所帮助,因为它可以提供周围环境的实时语音反馈。Live 功能基于 Project Astra 构建,Google在去年的 I/O 开发者大会上曾预览过该项目,并且此前已在 Pixel 设备上推出。今年夏天,Google还计划为 Gemini 添加个人背景信息,以实现 Gmail 的智能回复等功能。Gemini 将能够利用Google各应用的相关信息,提供更加个性化的体验。例如,Gmail 中的 AI 回复功能可以发出类似于您本人的声音,而不是千篇一律的普通声音。它能够扫描过往邮件,匹配语气、风格和措辞,还能查找笔记、Google Drive 中的文档等,为邮件添加背景信息。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501164.htm
手机版:https://m.cnbeta.com.tw/view/1501164.htm
Google新推出的 SynthID Detector 可以帮助发现和判断 AI 缺陷


用户可以上传文件,SynthID Detector 将判断整个样本(或其中一部分)是否由 AI 创建。SynthID Detector 的首次亮相正值 AI 生成的媒体充斥网络之际。据估计,仅深度伪造视频的数量就从 2019 年到 2024 年飙升了 550% 。 据《泰晤士报》报道,去年秋季美国 Facebook 上浏览量最高的 20 个帖子中,有 4 个“显然是由 AI 制作的”。图片来源: DeepMind当然,SynthID Detector 也有其局限性。它只能检测使用 Google SynthID 规范的工具(主要是 Google 产品)创建的媒体。微软、  Meta和 OpenAI都有自己的内容水印技术。SynthID 并非一项完美的技术。Google承认,它可以被绕过,尤其是在处理文本的场景下。Google辩称其 SynthID 标准已经得到大规模应用。据这家科技巨头称,自 2023 年推出 SynthID 以来,已有超过 100 亿份媒体被加了水印。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501166.htm
手机版:https://m.cnbeta.com.tw/view/1501166.htm
Google宣布推出Deep Think 基于Gemini 2.5 Pro模型的“增强型”推理模式


Google人工智能研发部门 DeepMind 负责人 Demis Hassabis 在新闻发布会上表示:“Deep Think 将模型性能推向了极限。它运用了我们在思维和推理方面最新的前沿研究成果,包括并行技术。”Google对 Deep Think 的内部工作原理含糊其辞,但该技术可能类似于 OpenAI 的o1-pro和即将推出的 o3-pro 模型,它们可能使用引擎来搜索和合成给定问题的最佳解决方案。Google表示,Deep Think 助力 Gemini 2.5 Pro 在 LiveCodeBench(一项颇具挑战性的编程评估)中脱颖而出。此外,Gemini 2.5 Pro Deep Think 还在 MMMU(一项针对感知和推理等技能的测试)中击败了 OpenAI 的 o3。自本周起,“可信测试人员”可以通过 Gemini API 使用 Deep Think。Google表示,在广泛推广 Deep Think 之前,还需要更多时间进行安全评估。除了 Deep Think 之外,Google还对其预算导向的 Gemini 2.5 Flash 模型进行了更新,使其在涉及编码、多模态、推理和长上下文的任务上表现更佳。新的 2.5 Flash 模型也比其取代的版本更高效,目前已在Google的 AI Studio 和 Vertex AI 平台以及 Gemini 应用程序中提供预览。Google表示,改进后的 Gemini 2.5 Flash 将于 6 月份某个时候向开发人员全面开放。最后,Google推出了一款名为 Gemini Diffusion 的模型,该公司声称该模型“速度非常快”——输出速度比同类模型快 4-5 倍,性能堪比其两倍大小的模型。Gemini Diffusion 现已面向“值得信赖的测试人员”开放。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501168.htm
手机版:https://m.cnbeta.com.tw/view/1501168.htm
Google发布最新AI图像生成器Imagen 4


“Imagen 4 在质量上迈出了一大步,”Google实验室负责人 Josh Woodward 在新闻发布会上表示。“我们还投入了大量精力,并针对其生成文本和地形的方式进行了改进,因此它非常适合制作幻灯片、邀请函,或者任何其他需要融合图像和文字的内容。”Imagen 4 的一个样本。图片来源:Google从ChatGPT 的热门工具到Midjourney 的 V7 ,市面上 AI 图像生成器琳琅满目。它们都相对复杂、可定制,并且能够创作高质量的 AI 艺术作品。另一个 Imagen 4 样本。图片来源:Google而 Imagen 4 的卖点在于速度很快——比 Imagen 3 还要快,而且它很快就会变得更快。在不久的将来,Google计划发布 Imagen 4 的一个变体,其速度将比 Imagen 3 快 10 倍。从今天早上开始,Imagen 4 可以在 Gemini 应用程序、Google 的 Whisk 和 Vertex AI 平台以及 Google Workspace 中的 Google Slides、Vids、Docs 等应用中使用。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501170.htm
手机版:https://m.cnbeta.com.tw/view/1501170.htm
Google推出AI Ultra套餐 每月支付249.99美元获得最佳AI体验


AI Ultra 每月售价 249.99 美元,包含Google Veo 3 视频生成器、该公司全新的 Flow 视频编辑应用,以及名为Gemini 2.5 Pro Deep Think 模式的强大 AI 功能(该模式尚未发布)。Google实验室和 Gemini 副总裁 Josh Woodward 在新闻发布会上表示:“Ultra 适合那些想要站在Google人工智能最前沿的人。”AI Ultra 目前仅限美国市场,它加入了日益壮大的超高端 AI 订阅市场。去年年底,OpenAI 推出了ChatGPT Pro,这是一个每月 200 美元的套餐,提高了 ChatGPT 的速率限制并包含某些专属功能。几个月后,Anthropic 也推出了Claude Max,其每月费用也高达 200 美元。Google希望通过提供大量额外内容来增加吸引力。除了 Flow、Veo 3 和 Gemini 2.5 Pro Deep Think 之外,AI Ultra 还支持Google NotebookLM 平台和该公司的图像合成应用Whisk 的更高容量。AI Ultra 的订阅用户还可以使用 Chrome 中的Google Gemini 聊天机器人、由该公司Project Mariner技术支持的某些“代理”工具、YouTube Premium,以及 Google Drive、Google Photos 和 Gmail 的 30TB 存储空间。这些代理工具之一是代理模式,它将很快登陆桌面。Google表示,代理模式将能够浏览网页、进行研究,并与Google应用程序集成以处理特定任务。值此 AI Ultra 正式发布之际,Google将以 Google AI Pro 取代原有的 Google One AI Premium 计划。AI Pro 将包含 Flow、NotebookLM 以及 Gemini 应用(原名Gemini Advanced)等产品,所有产品均具有特殊功能和更高的用量限制。AI Pro 订阅用户还可以获得 Flow 和 Chrome 中 Gemini 的抢先体验,以及 Google Meet 中英语和西班牙语的实时语音翻译(即将推出更多语言)。Google Meet 中的语音翻译功能也适用于 AI Ultra 用户,它可以将语音翻译成听众的首选语言,同时保留语音、语调和表情。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501172.htm
手机版:https://m.cnbeta.com.tw/view/1501172.htm
Google展示基于Android XR的眼镜 并宣布与Warby Parker合作


Google去年与高通和三星合作推出了Android XR平台。虽然当时Google没有透露具体的设备,但最新的公告表明,该公司希望与不同的合作伙伴共同打造多款眼镜和头显。周二,该公司还表示将把与三星的合作扩展到XR眼镜。该公司补充说,两家公司正在开发一个软件和硬件参考平台,供开发人员构建解决方案。三星、高通和Google于 2023 年宣布了一项混合现实项目。三星随后于 2024 年底发布了一款名为 Project Moohan 的头显。Google表示,该产品将于今年晚些时候首次亮相。在 I/O 大会上,Google还展示了基于 Android XR 平台、并由其 Gemini AI 增强功能的概念眼镜。这款眼镜配备了摄像头、麦克风和扬声器,与雷朋 Meta 眼镜类似。此外,它还可选配一个显示屏,用于查看通知,该显示屏固定在眼镜镜片上。Google演示了几种不同的用例,例如消息传递、逐向导航、安排约会、实时语言翻译和拍照。这家搜索巨头表示,他们正在组建测试小组,挑选测试人员收集反馈。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501174.htm
手机版:https://m.cnbeta.com.tw/view/1501174.htm
最新的 Google Gemma 3n AI 模型可以在手机上运行


近年来,高效到可以离线运行且无需云端计算的模型在人工智能领域日益受到青睐。它们不仅比大型模型更便宜,而且无需将数据传输到远程数据中心,从而保护了隐私。除了 Gemma 3n,Google还通过其健康 AI 开发者基金会计划发布了 MedGemma。据该公司称,MedGemma 是其在分析健康相关文本和图像方面功能最强大的开放模型。此外,即将推出的还有 SignGemma,这是一个将手语翻译成口语文本的开放模型。Google表示,SignGemma 将使开发者能够为聋哑和听力障碍用户创建新的应用程序和集成。值得注意的是,Gemma 因其定制的非标准许可条款而受到批评, 一些开发者表示,这 使得商业化使用这些模型变得危险。然而,这并没有阻止开发者下载 Gemma 模型,下载量高达数千万次。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501176.htm
手机版:https://m.cnbeta.com.tw/view/1501176.htm
Google推出Veo 3视频生成AI模型 可以生成视频并附带配乐


Veo 3 从周二开始在Google的 Gemini 聊天机器人应用程序中推出,供Google每月 249.99 美元的 AI Ultra 计划订阅者使用,可以通过文本或图像进行提示。Google人工智能研发部门 DeepMind 的首席执行官 Demis Hassabis 在新闻发布会上表示:“我们首次摆脱了视频生成的无声时代。你可以给 Veo 3 一个描述人物和环境的提示,并根据你希望的声音效果提出对话建议。”视频生成器工具的广泛普及,导致供应商数量激增,该领域已趋于饱和。包括 Runway、  Lightricks、Genmo、  Pika、  Higgsfield、Kling 和 Luma在内的初创公司,以及 OpenAI和阿里巴巴等科技巨头,都在快速发布各种模型。在很多情况下,不同模型之间几乎没有什么区别。如果Google能够兑现其承诺,音频输出将成为 Veo 3 的一大差异化优势。人工智能声音生成工具并不新鲜,用于创建视频 音效 的模型也并非新鲜事物。但据Google称,Veo 3 的独特之处在于它能够理解视频中的原始像素,并自动将生成的声音与视频片段同步。以下是该模型的一个示例剪辑:Veo 3 的诞生很可能得益于DeepMind 早期在“视频转音频”人工智能领域的研究。去年 6 月,DeepMind 透露,他们正在开发一种人工智能技术,通过结合声音、对话记录和视频片段来训练模型,从而为视频生成配乐。DeepMind 不愿透露 Veo 3 训练内容的具体来源,但 YouTube 的可能性很大。YouTube 是Google旗下的子公司,DeepMind 此前曾透露,像 Veo 这样的Google模型“可能”会使用一些 YouTube 内容进行训练。为了降低深度伪造的风险,DeepMind 表示正在使用其专有水印技术 SynthID 将隐形标记嵌入到 Veo 3 生成的帧中。 尽管像Google这样的公司将 Veo 3 宣传为强大的创意工具,但许多艺术家对它们仍抱有警惕,这可以理解——它们可能会颠覆整个行业。代表好莱坞动画师和漫画家的工会——美国动画协会 (Animation Guild) 委托进行的一项 2024 年 研究 估计,到 2026 年,美国将有超过 10 万个电影、电视和动画工作岗位被人工智能取代。Google今天还推出了 Veo 2 的新功能,其中包括一项功能,允许用户为模型提供人物、场景、物体和风格的图像,以提高一致性。最新的 Veo 2 可以理解摄像机的旋转、推拉和缩放等运动,并允许用户在视频中添加或删除对象,或扩展视频片段的帧率,例如将视频从纵向转换为横向。Google表示,所有这些新的 Veo 2 功能将在未来几周内登陆其 Vertex AI API 平台。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501178.htm
手机版:https://m.cnbeta.com.tw/view/1501178.htm
Google制作了专门针对UI设计的AI开发工具


Stitch 根据选定的主题和自然语言描述生成可视化界面,目前支持英语。开发者可以提供他们希望在最终设计中看到的细节,例如调色板或用户体验。此外,还可以上传视觉参考资料来指导 Stitch 的生成,包括线框图、草图和其他 UI 设计的截图。据Google称,Stitch 允许用户生成界面的“多种变体”,从而更轻松地尝试不同的风格和布局。UI 资源与功能齐全的前端代码一起生成,这些代码可以直接添加到应用程序中或导出到 Figma,以优化设计元素、与现有系统集成以及与设计师协作。鉴于 Figma 已经是一个成熟的产品设计平台,并且能够更好地促进特定视觉元素的更改,导出选项的出现并不令人意外。然而,Stitch 的自动编程功能侵犯了Figma本月早些时候发布的Make UI构建应用的权限。Google或许希望 Stitch 能够成为解决方案,防止那些使用Gemini Code Assist工具的设计师彻底放弃使用。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501180.htm
手机版:https://m.cnbeta.com.tw/view/1501180.htm
Google Gemini AI 即将登陆 Chrome


在 Chrome 浏览器中,你会在右上角看到一个闪闪发光的小图标。点击它,Gemini 聊天机器人窗口就会打开——它是一个浮动的 UI,你可以移动它并调整其大小。在那里,你可以询问关于网站的问题。在演示中,Chrome 团队的产品管理总监 Charmaine D'Silva 打开了 REI 的一款睡袋页面,然后点击了 Gemini 的提示,列出了这款睡袋的主要功能。Gemini 会阅读整个页面,并简要介绍一下这款睡袋。D'Silva 随后询问这款睡袋是否适合在缅因州露营,Chrome 中的 Gemini 会从 REI 页面和网络上提取信息进行回复。之后,D'Silva 访问了另一家零售商网站的购物页面,购买了另一款睡袋,并要求 Gemini 比较这两款睡袋。Gemini 照做了,并附上了一个比较表格。该工具最初只能在两个标签页中使用。但“今年晚些时候”,Chrome 中的 Gemini 将能够跨多个标签页运行。D'Silva 还演示了一项未来即将推出的功能:使用 Gemini 浏览网站。在演示中,D'Silva 在 Chrome 浏览器中打开 Gemini Live,帮助浏览一个食谱网站。D'Silva 要求 Gemini 滚动到配料部分,AI 便会快速跳转到该页面。当 D'Silva 请求 Gemini 帮助将所需的糖量从杯转换为克时,Gemini 也做出了响应。在Google选定的演示中,Chrome 中的 Gemini 似乎偶尔会派上用场,尤其是在比较表格或即时成分换算方面Chrome 版 Gemini 将于周三上线。它最初将在 Windows 和 macOS 平台上线,面向 18 岁及以上使用英语的用户开放抢先体验。Google副总裁兼 Chrome 总经理 Parisa Tabriz 在发布会上表示,Google AI Pro 和 Ultra 订阅用户,以及 Chrome Beta 版、Canary 版和 Dev 版用户均可使用 Gemini。至于将 Gemini 引入移动版 Chrome,“这是我们会考虑的一个领域,”Tabriz 表示,但目前,该公司“非常专注于桌面端”。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501182.htm
手机版:https://m.cnbeta.com.tw/view/1501182.htm
Google Beam 有望实现未来 AI 驱动的 3D 视频聊天


Google Beam 采用六摄像头阵列,从不同角度捕捉拍摄对象。AI 视频模型实时拼接这些视角,创建 3D 人物。Google表示,该系统拥有近乎完美的头部追踪能力,精度可达毫米级,视频帧率为每秒 60 帧。  这一想法让人联想到《星球大战》和《星际迷航》等电影中出现的各种全息通信系统。与《新希望》中微小、低质量的莱娅公主全息图不同,Beam 的设计与真人大小相仿,栩栩如生。Google曾将这项技术描述为“魔法之窗”。Google 的 Starline 技术平台正在成长并获得了一个新名称:Google Beam。该平台采用光场显示器,无需佩戴任何特殊设备。Google 还表示,语音翻译是Google为 Google Meet 提供的一项新增功能,未来也可能应用于 Beam。Google 于 2021 年将 Starline 作为一项研究项目推出,并一直在测试和改进原型。今天的公告意味着这项技术即将迎来黄金时段。视频通话长期以来一直饱受挑战。例如,难以解读表情和手势。传统的视频聊天缺乏眼神交流。在新冠疫情高峰期,Zoom 疲劳问题成为热门话题。Beam 希望通过更沉浸、更逼真的体验来解决这些问题。Google表示,惠普将在6月份的InfoComm视听技术展会上分享更多关于该平台的信息。Google还在与Zoom和其他视听公司合作。Beam很可能首先在那些希望革新视频会议处理方式的大型组织中站稳脚跟。首批 Beam 设备将于 2025 年晚些时候面向早期采用者推出。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501184.htm
手机版:https://m.cnbeta.com.tw/view/1501184.htm
Google为 iOS 推出 Gemini 2.5 Flash 和 Live Camera


该应用程序的更新将于周二开始向用户推出。第一个主要变化是 Gemini 2.5 Flash,这是一个 AI 模型,与 Google 目录中的其他模型相比,它速度更快,占用的资源更少。对于新发布的 iOS 版本,2.5 Flash 的性能得到了显著提升。根据使用情况,Gemini 2.5 Flash 现在使用的查询词元比之前的 Gemini 应用版本减少了约 25%。这意味着与早期版本相比,它将使用更少的查询资源,或者提供更好的响应或更低的延迟。除了常规性能外,Gemini Live 还配备了 Gemini Live 摄像头,这是一个用于 Gemini 查询的可视化界面。该摄像头和屏幕共享功能基于 Project Astra,采用全屏界面,用户可以根据视图中的内容进行查询。例如,用户可以将iPhone的摄像头对准某个物体并询问它是什么。Google 还计划通过与其他 Google 应用集成,为 Gemini Live 增添更多功能。Google 日历活动链接和 Google 地图导航是未来几周内可能推出的两项功能。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501186.htm
手机版:https://m.cnbeta.com.tw/view/1501186.htm
Google AI Overviews每月用户数达15亿 已扩展至200个国家/地区


AI Overviews 是Google搜索的一部分,旨在解释复杂的用户查询。该功能让用户能够轻松快速地在网络上查找信息,并解答常规Google搜索无法解答的更详细的问题。人工智能生成的摘要出现在许多 Google 搜索结果的顶部,在从多个来源提取数据后提供快速简洁的答案。AI 概览于去年的 Google I/O 大会上推出,并在几个月内进行了多次更新。然而,AI 概览因向用户提供有争议的答案而陷入困境。例如,该 AI 工具建议使用胶水将奶酪粘在披萨上。Google在开发者大会上宣布,AI Overviews 现已覆盖 200 多个国家/地区。该 AI 工具支持 40 多种语言,新增了对中文、阿拉伯语、马来语、乌尔都语等语言的支持。美国和印度是 AI Overviews 的最大市场,它“推动了Google在 AI Overviews 查询类型的使用量增长了 10% 以上”。Google表示,一旦用户开始使用该功能,他们大多会成为重复用户,并表示美国的 AI Overviews 现在使用 Gemini 2.5 的定制版本来解决更棘手的问题。Google过去也曾推出过 AI 模式,它建立在 AI 概览之上,在对话体验中提供高级推理和更深入的探索。该功能最初作为搜索实验室的一部分进行测试,但Google宣布已在美国全面上线。未来几周内,AI 搜索模式将出现在桌面版和 Google 应用的搜索栏中。该模式也由 Gemini 2.5 的定制版本提供支持,类似于 AI 概览。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501188.htm
手机版:https://m.cnbeta.com.tw/view/1501188.htm
Google的NotebookLM已加入视频概览功能


自推出以来,NotebookLM 一直致力于帮助用户理解和处理复杂的文档。凭借这项新功能,NotebookLM 将采用更直观的方式,帮助用户理解不同的主题和想法。NotebookLM 已经可以采用音频方式帮助用户通过音频概览理解材料,该功能使用户能够根据他们与 NotebookLM 共享的文档(例如课程阅读材料或法律摘要)生成具有 AI 虚拟主机的播客。现在,Google 为音频概览带来了更大的灵活性,允许用户选择理想的音频概览长度。例如,可以选择默认长度的音频概览,也可以选择更长或更短的音频概览。今天宣布的新功能是在Google正式发布适用于Android 和 iOS 系统的 NotebookLM 应用的第二天 。此前,NotebookLM 仅支持桌面端访问。Google现已推出移动端服务。这些应用支持后台播放、音频概览的离线播放以及暗黑模式。应用还允许用户创建新笔记本并查看已创建的笔记本。此外,当您在设备上浏览网站、PDF 或 YouTube 视频时,您可以点击分享图标并选择 NotebookLM 将其添加为新来源。用户还可以查看已在每个笔记本中上传的来源。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501190.htm
手机版:https://m.cnbeta.com.tw/view/1501190.htm
GeForce RTX 5080 SUPER将板载24 GB GDDR7和10752个CUDA核心


在 X 平台的最新帖子中,爆料人表示这款新卡将继续使用 203 GB 的 GPU,与现有 RTX 5080 的 10752 个 CUDA 核心的容量相同。SUPER 的唯一改进在于显存容量和速度。与基础型号 16 GB 的 30 Gbps GDDR7 显存不同,SUPER 版本配备 24 GB 的 32 Gbps GDDR7 显存,理论带宽达 1 TB/s。显存的提升可能会在高分辨率游戏和需要大量帧缓冲区的专业工作负载中带来显著的优势。初步带宽估算表明,与标准版 RTX 5080 的 960 GB/s 相比,其吞吐量提升了 6%。同时,更高的内存密度需要更高密度的 3 GB 模块,类似于 RTX PRO 6000 中已经使用的模块。功耗要求也会相应增加。据传,SUPER 型号的功耗将超过 400 W,比普通 RTX 5080 的 360 W 高出约 40 W。现在,只有 NVIDIA 的旗舰 RTX 5090(拥有 21760 个核心和 32 GB GDDR7 显存,512 位总线)在计算和内存资源方面超过 5080 SUPER,这还不包括上一代顶级 RTX 4090。确切的发布日期尚未确定,虽然早先的传言指向 2025 年第四季度发布,但根据新的时间表,NVIDIA 可能会在 2026 年初在 CES 等大型贸易展会上首次亮相这款新卡。定价同样充满不确定性。建议零售价可能在 1000 美元到 1500 美元之间,其定位将避免与 NVIDIA 入门级专业 Blackwell GPU 直接竞争。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501192.htm
手机版:https://m.cnbeta.com.tw/view/1501192.htm
Google在Pixel 9 Pro上展示Project Astra:可代表用户行动的AI助手


Project Astra 本质上是 Gemini Live 相机和屏幕共享功能背后的技术,但在今天的Google I/O 开发者大会上,这家科技巨头分享了其为提高这款 AI 助手的效率而采取的下一步重大举措。Google使用 Pixel 9 Pro 进行了一次现场演示,展示了其功能。演示中,一位用户在修理自行车时使用该工具,并要求其查找相关手册。Astra 不仅能够快速找到手册,还能通过自主与屏幕交互,帮助用户突出显示相关部分。这表明 Astra 能够无缝理解上下文,即使在控制设备方面,它的表现也令人印象深刻。它甚至可以更进一步,拨打电话,甚至代表用户进行对话。Project Astra 的功能远不止屏幕控制和代您执行任务。它甚至可以通过提供实时空间感知来帮助视障人士识别障碍物、检测房间内的物体,并真正地为您解读房间。Google将这些人工智能的进步称为“行动智能”,因为该工具可以主动代表您执行任务,包括控制应用程序、参与对话、帮助您购物以及进行更自然的对话。借助独立的 Astra 应用,Google将能够测试这些功能,最终将其扩展到 Gemini Live,并最终作为通用人工智能助手,更广泛地普及。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501194.htm
手机版:https://m.cnbeta.com.tw/view/1501194.htm
NASA毅力号火星车在日出前拍摄到火卫二在天际闪耀的景象


美国宇航局的“毅力号”火星探测车于 2025 年 3 月 1 日当地时间凌晨 4:27 拍摄到了火星较小的卫星火卫二在天空中闪耀的景象。图片来源:NASA/JPL-Caltech为了拍摄这张照片,毅力号使用其左侧导航相机拍摄了16张长曝光照片,每张时长3.28秒。这些照片随后在火星车上被合成为一张照片,然后被发回地球。最终的照片曝光时间总计52秒。由于光线不足,图像中弥漫着薄雾和数码噪点。天空中散落的许多白色斑点很可能是相机造成的伪影,但也有一些可能是宇宙射线。图像中最亮的两个点是真正的恒星——轩辕十四和轩辕十二,它们都属于狮子座。上图为标注星体和火卫二的注释版。图片来源:NASA/JPL-Caltech位于图片中央偏右的“伍德斯托克陨石坑”距离火星探测车约半英里(750米)。当时,“毅力号”正前往一个名为“金缕梅山”的地方。火卫二是火星两颗卫星中较小且距离较远的一颗,另一颗是火卫一。火卫二由美国天文学家阿萨夫·霍尔于1877年发现,其直径仅约12公里(7.5英里),是太阳系中最小的卫星之一。火卫二的形状像一块块状不规则的岩石,看起来更像一颗小行星,而非传统的卫星。科学家认为,它最初可能是一颗被火星引力捕获的小行星。它的轨道距离火星表面约 23500 公里(14,600 英里),绕火星一周大约需要 30 小时。这幅插图描绘了 NASA 的“毅力号”火星探测器在火星表面运行的场景。图片来源:NASA美国宇航局的“毅力号”火星车是“火星2020”任务的一部分,它是一款突破性的机器人探测器,旨在推进火星生命探索,并为未来的人类任务奠定基础。“毅力号”的主要目标是天体生物学研究,具体来说,就是在这颗红色星球上寻找古代微生物生命的迹象。为此,该火星车正在研究火星的地质和历史气候,帮助科学家了解这颗行星的历史和潜在的宜居性。毅力号是首个收集并储存火星岩石和土壤(风化层)样本的任务,样本将被密封保存。这些样本最终将由美国宇航局(NASA)的火星样本返回计划回收并送回地球。该计划由NASA与欧洲航天局(ESA)合作开展,旨在实现前所未有的实验室分析。此次任务是美国宇航局火星探索计划及其更广泛的月球到火星战略的核心部分,其中包括阿尔忒弥斯登月任务,作为未来人类探索火星的垫脚石。该火星车由美国宇航局喷气推进实验室(JPL)建造并运营,该实验室由位于加利福尼亚州帕萨迪纳的加州理工学院管理。编译自/ScitechDaily ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501196.htm
手机版:https://m.cnbeta.com.tw/view/1501196.htm
马斯克确认特斯拉计划6月推出自动驾驶出租车


特斯拉首席执行官埃隆・马斯克自 2016 年以来,马斯克一直向特斯拉投资者、客户和粉丝承诺,该公司距离推出无需人类干预(或无需人类坐在方向盘后)即可安全运送乘客的自动驾驶汽车 “大约还有一年时间”。然而,特斯拉目前仍未推出无需人类监督的安全车辆。“我们谨慎地从少量车辆开始,确认一切顺利后再扩大规模,” 马斯克表示。特斯拉表示,首批自动驾驶出租车将基于 Model Y 车型,配备即将推出的 FSD(完全自动驾驶)版本 “FSD Unsupervised”(无监督完全自动驾驶)。谷歌母公司 Alphabet 旗下的 Waymo 目前已在美国多个市场运营商业化无人驾驶叫车服务。在最近的财报电话会议上,Alphabet 透露 Waymo 每周已完成 25 万次付费出行。马斯克称,奥斯汀的机器人出租车初期将设置 “地理围栏”(geofence),即限制车辆的行驶区域,但车内不会配备安全驾驶员。马斯克承诺。他说,特斯拉员工将对车队进行远程监控。“我们会非常仔细地观察车辆的运行情况,随着信心的增强,这种监控需求会减少,” 马斯克说。马斯克此前曾声称,特斯拉机器人出租车的 “通用化” 路线比 Waymo 更具野心。特斯拉主要依赖基于摄像头的系统和计算机视觉技术,而非在车辆中使用包括激光雷达(lidar)和雷达在内的复杂传感器。马斯克表示,这些传感器成本高昂,可能阻碍机器人出租车的大规模生产和全球车队的扩展。“真正最适合道路系统的是人工智能、数字神经网络和摄像头,” 马斯克周二表示。法伯就马斯克参与唐纳德・特朗普政府事务引发的政治争议(包括德国政坛的反对声音)向其施压。特斯拉在 2025 年第一季度的电动汽车销量下滑,汽车业务收入下降了 20%。马斯克将销量下滑归因于公司需要对工厂进行改造,以生产最受欢迎车型 Model Y 的更新版本。“工厂改造期间我们无法生产汽车,但目前需求已大幅反弹,” 马斯克称(未提供具体数据)。“当你购买一件产品时,你有多少在意 CEO 的政治观点,甚至是否知道他们的观点?”在继续领导特斯拉并管理 SpaceX 和 xAI 的同时,马斯克在花费近 3 亿美元助推特朗普重返白宫后,成为特朗普总统的关键顾问。马斯克创立了 “政府效率部”(DOGE),通过大幅削减机构和精简联邦员工的 “裁员运动” 给华盛顿带来了全面变革,特朗普总统对此表示大力支持。根据亿万富翁指数,马斯克在特斯拉和 SpaceX 的持股使其成为全球首富,目前净资产估计约为 3760 亿美元。周二早些时候,马斯克表示,他承诺在未来五年内继续领导特斯拉。“是的,这一点毫无疑问,” 马斯克说。 ...

PC版:https://www.cnbeta.com.tw/articles/soft/1501198.htm
手机版:https://m.cnbeta.com.tw/view/1501198.htm