一个小站的自留地
97 subscribers
115 photos
1 video
1 file
263 links
起于小站,终于生活。
现实之外,一个普通人的思考。

博客地址:ygxz.in
讨论组:https://t.me/+a5Clq4jLuJc4YWQ9
Download Telegram
一个小站的自留地
快手「可灵」:可能是「中国版Sora」 在快手13周年庆典上,快手毫无预兆地发布了AI视频大模型「可灵」。 「可灵」支持生成最长2分钟、30fps的1080P视频,从头脑风暴到可发布作品的一键转化功能,让全球用户大为震撼。其生成效果不仅超越了Sora,还引发了硅谷创投圈的热议。Stability AI前CEO Emad Mostaque称赞中国AI技术有其独特优势,YC CEO也在X平台转发了可灵生成的视频示例。 「可灵」成为国内首个文生视频产品级应用,不论是在生成视频的连续性、真实度和清晰度方面,…
字节跳动发布豆包视频生成大模型 PixelDance 和 Seaweed,AI 视频创作迎来新突破

2024 年 9 月 24 日,字节跳动在火山引擎的「AI 创新巡展」活动上正式发布了两款 AI 视频生成大模型——豆包视频生成-PixelDance 和豆包视频生成-Seaweed。

豆包视频生成大模型的最大亮点在于其对复杂指令的精准理解以及自然连贯的多主体互动能力。与传统的视频生成模型相比,这两款模型能够在不同镜头下保持人物样貌、服装细节以及头饰的一致性,接近实拍效果。尤其是在多主体、多动作交互场景中,表现尤为出色。

PixelDance 擅长复杂动作与高动态场景
•复杂动作与高动态表现:能够呈现丰富的人物动作、面部表情以及相机视角控制,适合视觉冲击力强烈的场景,如动画制作、影视特效和创意广告等。
•潜在扩散架构:采用潜在扩散架构进行训练,结合图像指令(针对视频片段的首尾帧)和文本指令,使其能够更好地理解和学习视频中的动态信息。

Seaweed 注重细腻细节与逼真度
•逼真度与细腻细节:在生成具备丰富细节层次的视频方面表现出色,特别适合需要高质量视觉呈现的场景。
•多种风格与分辨率支持:支持横屏、竖屏及多分辨率输出,并根据用户输入的高清图像进行适配和保真,默认输出为 720p 分辨率、24fps,可延长至 20-30 秒。
一个小站的自留地
代码泄露 OpenAI 或将于 9 月 24 日推出 ChatGPT AI 高级语音模式 TestingCatalog 报道,根据最近的代码泄露,ChatGPT 的高级语音模式将在 9 月 24 日面向更广泛的用户推出,并且可能是直接正式发布。 适用于 macOS 的 ChatGPT 应用程序也有了一些新的变化,语音模式 UI 中,代表 ChatGPT 语音模式的黑色图标已经被替换为随语音播放而动的天空动画。 目前,ChatGPT 高级语音模式仅向一小部份 ChatGPT Plus 用户开放。 (爱范儿)
OpenAI 推出高级语音模式,ChatGPT 语音交互能力大幅提升

据 OpenAI 官方宣布,ChatGPT 应用的「高级语音模式」(Advanced Voice Mode, AVM)正在逐步向更多付费用户开放。

OpenAI 表示,AVM 将在一周内逐步向所有 Plus 和 Team 用户推送。同时,还增加了以下功能:

- 「自定义指令」功能
- 记忆功能
- 五种新语音
- 改进的口音支持
- 支持超过 50 种语言

同时,自 AVM 的有限 alpha 测试发布以来,OpenAI 进行了多项改进:
- 对口音的理解能力更强
- 对话更加顺畅和迅速
- 扩展了部分定制功能到 AVM

ChatGPT 现在共有九种语音供用户选择:Arbor、Maple、Sol、Spruce、Vale、Breeze、Juniper、Cove 和 Ember。
「自定义指令」功能允许用户个性化 ChatGPT 的响应方式;「记忆功能」则使 ChatGPT 能够记住之前的对话以供后续参考。
一个小站的自留地
谷歌发布三款 Gemini 实验 AI 模型,1.5 Pro 冲榜第二 2024 年 8 月 28 日,谷歌 AI Studio 产品总监 Logan Kilpatrick 在 X 平台宣布推出三款实验性 Gemini 模型: - Gemini 1.5 Flash-8B:这是 Gemini 1.5 Flash 的精简版本,拥有 80 亿参数,专为多模态任务设计,包括大容量任务和长文本摘要。 - Gemini 1.5 Pro Exp-0827:该模型主要增强编程和复杂提示词功能,现已通过 Google AI…
谷歌更新 Gemini 1.5 系列模型,性能大幅提升,价格降低 50%

2024 年 9 月 25 日,谷歌发布了两款升级后的生产就绪版本的 Gemini 1.5 模型:Gemini-1.5-Pro-002Gemini-1.5-Flash-002。这些新模型在原有 Gemini 1.5 模型基础上进行了显著改进,并将 API 价格下调了 50%。

新款 Gemini 1.5 Pro-002 和 Flash-002 模型在多个方面表现出色:
- MMLU-Pro 基准测试提高 7%
- 数学能力大幅提升,MATH 和 HiddenMath 测试成绩提高 20%
- 视觉和代码任务性能提升 2-7%

谷歌宣布输入词元 (Token) 价格降低 64%;输出词元价格降低 52%。在128K词元以内的任务中,增量缓存词元价格降低64%,自2024年10月1日起生效。

此外,谷歌还提高了速率限制。付费级别中,1.5 Flash 达到2000 RPM,1.5 Pro 达到1000 RPM。
一个小站的自留地
据信是 Llama 3-405B 的模型以及基准测试成绩已经被泄露。 网友整理的模型下载地址: https://x.com/kimmonismus/status/1815314833236984274 从泄露的基准测试成绩来看,Llama 3-405B 模型在大多数方面优于 GPT-4o,这一结果或侧面表面 GPT-4o 模型蒸馏后的模型参数小于这一量级。 据新智元报道,除了最大的405B,Meta这次还升级了5月初发布的8B和70B模型,并将上下文长度全部提升到了128K。 至此,模型版本也正式从Llama…
Meta 发布 Llama 3.2

北京时间2024 年 9 月 26 日凌晨,Meta 发布 Llama 3.2。


本次发布,包含 4 种尺寸的模型,包括 1B、3B、11B 和 90B,以及一些硬件:一款新的雷朋 AI 眼镜 和 Meta Quest 3S:

1B/3B:旨在提供边缘算力,也就是可以在如移动设备上运行,目前已支持Arm、高通(Qualcomm)和联发科(MediaTek)

11B/90B:具备多模态能力,并可直接替代 Llama 3.1 8B 和 70B。

Llama Stack: 开发套件,帮助快速构建、部署 AI 应用。雷朋眼镜:支持车位助记、实时翻译、多模态问答等功能。

Meta Quest 3S:最新的 VR 玩具,299.99 美金

(赛博禅心)
一个小站的自留地
本频从多个信源观察到,近期对于OpenAI (通过 Azure)和 Claude(通过 AWS 或 GCP Vertex AI)渠道的滥用正日益泛滥。 由于微软正式发布 Azure AI Studio 后开放了 OpenAI 模型的流式输出(或称「打字机模式」),现在 API 转发商使用 Azure 转发的 API 与官方已无二异。 而 AWS 平台由于账号可采用预付费模式,加上对 Claude-3.5 Sonnet 模型的宽松开放政策,使得 API 转发商可以以非常低的边际成本盈利。 目前,使用 Azure…
本频从多个信源观察到,OpenAI 的风控政策正在近期进一步升级。

对于部分长期使用网关登录的账号(如部分合租面板、逆向号池),OpenAI 强制更改了密码,要求开启两步验证。

对于部分长期使用非家宽节点登录的账户,OpenAI 会在不通知用户的情况下更改模型为较低智能的 gpt-4o-mini,表现为无法调用任何工具,如使用记忆、联网、生图等。用户上传文件或图片后,OpenAI 会自动将该对话交由 gpt-4o 处理。并正常消耗配额。全程完全为黑箱操作,用户侧无提示。付费用户也可能受到影响。

对于部分有风险的 IP,OpenAI 禁用了免登录使用 ChatGPT 对话。
上交所股票竞价交易出现异常,指数更新缓慢

据反馈,9 月 27 日上午十点左右,上交所交易系统开始出现宕机,疑似交易过多,指数更新缓慢。

中午 11 时,上交所发布公告称,今日开盘后本所股票竞价交易出现成交确认缓慢的异常。

公告发出约 15 分钟后,上交所交易陆续恢复正常。

市场人士分析指出,这可能是订单拥挤引发 “塞单”,在历史上,其它交易所也发生类似的交易异常。具体表现是订单回报出现延迟,交易者长时间不清楚已报委托的状态。交易者不断撤单并重新申报,导致券商到交易所的流量迅速激增并积压。

南方+
美团平台疑似发生用户信用卡信息泄露事件

据多个来源的讨论,美团平台疑似发生用户信用卡信息泄露事件,涉及非银联卡组织的信用卡用户。此次事件中,受影响的用户为在美团绑定 VISA、Mastercard、AMEX 以及银联国际等国际卡的用户,泄露信息包括卡号、有效期及 CVV 等敏感信息。

多位美团用户反馈其绑定的外卡(包括银联国际)出现被盗刷现象。据用户报告,包括汇丰银行(HSBC)香港 Mastercard 在内的多张信用卡被盗刷,盗刷金额从小额认证到数千港币不等。值得注意的是,这些被盗刷的信用卡均只在美团和其他少数几个平台进行过绑定,因此疑似与此次美团数据泄露事件有直接关联。

目前已知的认证网关包括 STEIN INC(Weston, US)、Airtech Inc、GenZ Inc 等。已绑定这些外卡的用户遭遇了不同程度的盗刷。

根据多方反馈,目前国内使用快捷支付的用户暂未发现被盗刷的情况。使用手机支付、银行快速绑卡或银联通道(包括境外银联)的用户暂时不受此次事件影响。

截至发稿,美团方面没有发表任何声明;本频暂时无法对此消息进行独立验证。

——————

疑似美团内部人士透露,「(美团)不以任何方式记录和存储用户外卡CVV等敏感信息,不具备网络传言所称泄露用户CVV等敏感信息的条件」。
OpenAI DevDay 2024 发布多项功能更新

OpenAI 于 2024 年 10 月 1 日在旧金山举行了第二届 DevDay 开发者大会。与去年相比,今年的大会规模虽然相对低调,但仍推出了多项重要创新,包括实时 API、视觉微调、模型蒸馏和提示缓存

实时 API:实现语音到语音体验

据 Simon Willison 的现场报道,OpenAI 发布了实时 API 的公测版,允许付费开发者在应用中构建低延迟的多模态体验。该 API 支持自然的语音到语音对话,类似于 ChatGPT 的高级语音模式,并提供六种预设语音。

实时 API 简化了创建语音助手和其他会话 AI 工具的过程,消除了将多个模型组合用于转录、推理和文本到语音转换的需要。例如,语言学习应用 Speak 已经使用实时 API 来驱动其角色扮演功能,鼓励用户练习用新语言进行对话。

实时 API 的定价为每百万输入 tokens 5 美元和每百万输出 tokens 20 美元,音频输入为每百万 tokens 100 美元,音频输出为每百万 tokens 200 美元。

视觉微调:定制 GPT-4o 的图像理解能力

OpenAI 现在允许开发者通过图像和文本微调 GPT-4o,提升其视觉理解能力。这一功能为改进视觉搜索、自动驾驶汽车中的物体检测以及医学图像分析等应用提供了新的可能性。

据 Maginative 报道,东南亚的一家食品配送和共享出行公司 Grab 利用这一技术,将车道计数的准确性提高了 20%,限速标志的定位准确性提升了 13%。

提示缓存:降低成本和延迟

OpenAI 引入了提示缓存功能,旨在降低开发者成本和延迟。根据 VentureBeat 的报道,该功能会自动对模型最近处理过的输入 tokens 应用 50% 的折扣,对于频繁重复使用上下文的应用来说,这可能会带来成本的大幅降低。

提示缓存将自动应用于最新版本的 GPT-4o、GPT-4o mini、o1-preview 和 o1-mini,以及这些模型的微调版本。

模型蒸馏:简化 AI 模型开发

OpenAI 推出了新的模型蒸馏工具,使得开发者可以利用大型模型(如 GPT-4o 和 o1-preview)的输出来提升小型模型(如 GPT-4o mini)的性能。据 TechCrunch 报道,这一集成工作流程包括存储完成和评估功能,允许开发者在 OpenAI 平台内捕获输入输出对、微调模型并评估性能。

这种方法使得小型公司能够利用与高级模型相似的能力,而无需承担相同的计算成本。模型蒸馏将有助于缩小 AI 行业中尖端、资源密集型系统与更易访问但能力较弱的系统之间的差距。

(综合媒体报道,图:maginative
一个小站的自留地
据@数字生命卡兹克,Runway Gen-3 Alpha近日面向部分超级合作者开放。 @数字生命卡兹克 认为,Gen-3 Alpha在模型质量上确实超越了Luma和可灵等竞品,特别是在审美方面。虽然与真实世界相比仍有差距,但已经是当前AI视频生成领域的佼佼者。 在写实风格测试中,人物特写和风景表现最为稳定,但涉及人物与物体交互时仍存在一些问题。动画风格整体表现较弱,显示出数据集的不足。科幻风格则是Gen-3 Alpha的强项,表现出色。玄幻风格虽不及科幻,但在西方题材上仍有不错发挥。抽象风格的表现令人…
Pika 1.5 发布,AI 视频生成特效突破物理法则

Pika Labs(也称为 Pika)近日宣布推出其最新的 AI 视频生成模型 Pika 1.5。据 VentureBeat 报道,这一版本以突破物理法则的 AI 特效而闻名。新版本的 Pikaffects 可以将图像和预录视频中的对象转变为极其可塑的版本。

Pika 最初于 2023 年 11 月通过 1.0 版本的文本生成视频 AI 平台进入市场,并在短时间内筹集了 3500 万美元的 A 轮融资。尽管在过去的一年里,许多竞争对手发布了更新的模型,如 Runway 的 Gen-3 Alpha Turbo 和 Luma AI 的 Dream Machine 1.5,但 Pika 一直保持沉默,直到最近推出了全新的 Pika 1.5。

新版本的 Pika 1.5 引入了令人惊叹的特效「Pikaffects」,包括爆炸、融化、压碎、膨胀等效果。这些特效可以通过一个新按钮实现,甚至可以将静态图像中的对象变成栩栩如生的动态视频。

据 VentureBeat 报道,Pika 1.5 还改进了图像生成视频(i2v)和文本生成视频(t2v)的工作流程,使用户能够创建高质量的五秒视频片段,并包含跑步、滑板甚至飞行等逼真的动作。平台还增加了新的运动控制功能,使用户能够轻松捕捉专业级别的动态镜头,如「子弹时间」、眩晕效果等。

除了新特效,付费用户仍然可以选择使用旧版本 Pika 1.0 及其提供的 Lip Sync 和 AI 音效功能。值得注意的是,尽管订阅价格保持不变,但每生成一个五秒的视频片段将需要 15 个积分。

(综合媒体报道)
Forwarded from AI Copilot
#Update #ChatGPT

OpenAI 刚刚发布了 ChatGPT Canvas 功能:

- 专为代码和写作场景设计
- Canvas 在独立窗口打开
- 为写作场景提供的快捷方式:建议、修改长度、修改写作水平等
- 为代码场景提供的快捷方式:代码审查、添加日志、修复 bug、代码语言转换等

从今天开始,向 Plus 和 Team 用户灰度推出,选择 GPT-4o with canvas 模型即可体验。
一个小站的自留地
Apple 2024 秋季发布会:iPhone 16 系列、Apple Watch Series 10、AirPods 4 重磅亮相 2024 年 9 月 10 日凌晨,Apple 如期举行了备受期待的秋季发布会,主题为「It's Glowtime」。本次发布会上,Apple 推出了 iPhone 16 系列、Apple Watch Series 10、AirPods 4 等多款新品。虽然硬件更新并未带来太多惊喜,但围绕 AI 的发展方向和应用引发了广泛讨论。 iPhone 16 系列:全新相机控制键与…
iPhone SE 4将搭载苹果自研5G 基带

据华尔街见闻从供应链独家获悉,iPhone SE 4将搭载苹果自研5G Modem。

另据10月4日公开消息,苹果公司预计将于2025年春季推出第四代iPhone SE,这款机型将首次采用OLED屏幕,售价可能为459美元-499美元,约合人民币3221元-3502 元。

(华尔街见闻)
一个小站的自留地
据华为终端消息,9月10日14:30,华为将举行见非凡品牌盛典及鸿蒙智行新品发布会。
微信鸿蒙原生版开启内测邀请

腾讯宣布微信鸿蒙原生版正式开始邀请内测。此次内测对象为已升级至原生鸿蒙操作系统HarmonyOS NEXT的用户,用户在收到邀请后可抢先体验新版本。

据了解,腾讯这款「尝鲜版」的微信,已包含基础社交通讯,音视频通话、朋友圈、微信支付的二维码收/付款等功能。

(鹅厂黑板报)
一个小站的自留地
FLUX 模型:AI 图像生成新标杆 Black Forest Labs 公司(原Stable Diffusion团队成员创立)近日发布了革命性的 FLUX 系列图像生成模型。FLUX 采用创新的混合架构,结合 Transformer 和扩散技术,拥有 120 亿参数,在图像质量、提示词响应和输出多样性方面均达到了新高度。 模型版本: - FLUX.1 [pro]:顶级商业版本,提供最高质量的图像生成能力。 - FLUX.1 [dev]:开放权重的非商业版本,适合研究和开发使用。 -…
BlackForestLabs 推出 FLUX1.1 [pro] 模型及 BFL API

据 BlackForestLabs 官方宣布,其最新一代人工智能模型 FLUX1.1 [pro] 正式发布,同时推出了 beta 版 BFL API。

FLUX1.1 [pro] 模型在性能方面有显著提升。与前代相比,其生成速度提高了 6 倍,同时在图像质量、提示遵循性和输出多样性等方面均有改进。在保持原有输出质量的基础上,新模型的生成速度提高了 2 倍。根据测试,FLUX1.1 [pro] 的运行速度是当前 FLUX1.0 [pro] 的 3 倍。这种卓越的速度和效率大大降低了延迟,实现了图像质量与推理速度的最佳平衡,有助于提高工作流程效率。

代号为「blueberry」的 FLUX1.1 [pro] 已在知名文本到图像模型评测平台 Artificial Analysis 上进行了基准测试。结果显示,该模型超越了所有其他模型,获得了排行榜最高的 Elo 分数。

BlackForestLabs 表示,FLUX1.1 [pro] 即将支持超高分辨率生成功能,允许用户创建高达 2K 分辨率的图像,且不会影响提示准确性。该功能将通过 API 提供。此外,新模型还将在 together.ai、Replicate、fal.ai 和 Freepik 等热门平台上线。

随 FLUX1.1 [pro] 一同发布的还有 beta 版 BFL API。这一 API 为开发者和企业提供了 FLUX 的高级功能,使其能够无缝集成先进的图像生成技术。BFL API 的主要优势包括:

- 高级自定义:通过灵活选项调整输出,包括模型选择、图像分辨率和内容审核。
- 可扩展性:从小型项目到企业级应用都能轻松扩展。

FLUX.1 模型定价如下:
FLUX.1 [dev]:每张图片 2.5 美分
FLUX.1 [pro]:每张图片 5 美分
FLUX1.1 [pro]:每张图片 4 美分

该模型也已在 POE 平台上线。

BlackForestLab
互联网档案馆遭受严重网络攻击和数据泄露

近日,互联网档案馆(Internet Archive)遭遇了一系列严重的网络攻击,包括分布式拒绝服务(DDoS)攻击和数据泄露事件。据《Forbes》 报道 ,一个自称亲巴勒斯坦的黑客组织 SN_BLACKMETA 宣称对此次攻击负责,导致 3100 万用户的信息被泄露。

根据《Forbes》报道,黑客通过利用 JavaScript 库漏洞攻陷了互联网档案馆的网站,并展示弹出消息警告用户数据泄露。Troy Hunt,Have I Been Pwned 的创始人,确认这些数据包括电子邮件地址、用户名以及经过 bcrypt 算法加密的密码。

据安全公司 Radware 指出,尽管 SN_BLACKMETA 自称为亲巴勒斯坦组织,但该组织的真实动机可能与全球政治不满有关,而非单纯的地缘政治因素。

据 Bleeping Computer 报道,此次数据泄露涉及互联网档案馆的认证数据库,其中包含详细用户信息。1Password 的产品副总裁 Jason Meller 表示 :「数据库被外泄表明后端基础设施可被访问,且攻击者对网站内容有一定控制。」

尽管 bcrypt 算法相对安全,但专家建议用户更改密码以防万一,尤其是在其他网站使用相同密码的用户。这一建议突显了定期更新密码和避免在多个平台使用相同密码的重要性。

互联网档案馆创始人 Brewster Kahle 在 X 平台(原 Twitter)上 表示 ,目前已暂时抵御住 DDoS 攻击,并正在清理系统和加强安全措施。然而,SN_BLACKMETA 在 X 上继续 宣称 计划发起更多攻击,理由是互联网档案馆「属于美国」,而美国政府被指责支持以色列。

这一说法被认为是误导性的,因为互联网档案馆是一个非营利组织,并提供大量关于巴勒斯坦的资源。

(综合媒体报道)
Forwarded from 风声吹过我先知
广东省教育厅短信平台被不法分子入侵

10月12日消息,今日有多名网友在社交平台反映,自己收到了来自广东省教育厅的非法链接短信。短信内容为「【广东省教育厅】深掖必备成電影戳 .com 拒收请回复R」。

广东省教育厅对此发布声明:“近日,发现有不法分子入侵我厅短信平台,以“广东省教育厅”名义向师生和家长发送包含非法链接的短信。我厅已第一时间向公安机关报案,并配合开展调查。请广大师生和家长提高警惕,切勿点击短信中的非法链接,避免个人信息泄露或遭受财产损失。”
一个小站的自留地
DeepSeek-V2.5 领跑国内大模型:刷新多项国产记录 DeepSeek-AI 团队于 9 月初发布并开源了全新模型 DeepSeek-V2.5,近日在 LMSYS 组织的全球大模型竞技场(ChatBotArena)中表现出色,刷新了国产模型的多项历史纪录。 在最新公布的 ChatBotArena 排名中,DeepSeek-V2.5 位列国内大模型第一,成功超越 Yi-Large-Preview、Qwen-Plus-0828 和 GLM-4-0520 等国内最强闭源模型,并在 8 个单项能力上均领跑国内模型。这一成绩标志着…
零一万物公司正式发布新旗舰模型 Yi-Lightning

零一万物公司正式发布了其新旗舰模型 Yi-Lightning(闪电),这款模型在大模型竞技场(Chatbot Arena)上表现优异,总榜单并列第 6,数学分榜并列第 3,代码等其他分榜也名列前茅。其总成绩几乎与马斯克最新的 xAI 大模型 Grok-2-08-13 持平,超过了 GPT-4-0613 等顶级模型。此外,智谱 AI 的 GLM-4-Plus 也进入了总榜,排名第 9。

在大模型竞技场的各类分榜中,Yi-Lightning 表现突出:

- 中文能力:与 o1-mini 一同名列前位
- 数学能力:与 Gemini-1.5-Pro-002 并列第 3
- 代码能力:排名并列第 4
- Hard Prompts 和 Longer Query 分榜:均排名第 4

Yi-Lightning 采用 MoE 混合专家模型架构,优化了混合注意力机制(Hybrid Attention)和跨层注意力(Cross-Layer Attention, CLA),有效降低推理成本并提升性能。通过动态 Top-P 路由机制,Yi-Lightning 可根据任务难度选择最合适的专家网络组合,从而在不同场景中表现出色。

零一万物创始人李开复博士在发布会上表示,公司绝不放弃预训练,并通过多阶段训练方法提升模型能力。Yi-Lightning 的训练与底层架构高度适配,使得推理时更加经济实惠。Yi-Lightning 的定价为每百万词元 0.99 元人民币,与 OpenAI 的 GPT-3.5-turbo 相比价格更具竞争力。李开复博士强调,即便如此定价也不亏损。

同时,零一万物还推出了 AI2.0 数字人方案,提升了互动效果。李开复博士表示,国产大模型与硅谷最顶尖模型的差距缩短至五个月,而「模基共建」是零一万物的独特路径。

(量子位,图:Chatbot Arena)
一个小站的自留地
本频从多个信源观察到,OpenAI 的风控政策正在近期进一步升级。 对于部分长期使用网关登录的账号(如部分合租面板、逆向号池),OpenAI 强制更改了密码,要求开启两步验证。 对于部分长期使用非家宽节点登录的账户,OpenAI 会在不通知用户的情况下更改模型为较低智能的 gpt-4o-mini,表现为无法调用任何工具,如使用记忆、联网、生图等。用户上传文件或图片后,OpenAI 会自动将该对话交由 gpt-4o 处理。并正常消耗配额。全程完全为黑箱操作,用户侧无提示。付费用户也可能受到影响。 对于部分有风险的…
OpenAI 近期开始提高风控等级。网页版用户有较大规模封号现象。

坊间传闻,OpenAI 在测试名为 gpt-4.5o 的模型,并贴出网络请求截图。本频无法确认该截图的真实性。

本频信源指,OpenAI 近期很可能有一次面向大规模用户的模型更新,但不确定属于 API 还是 ChatGPT 服务。也无法判断是否为下一代模型,还是现有模型的修补增强。

赛博禅心此前预告,ChatGPT 正在测试实时读取网页的新功能。

目前 OpenAI 除 o1 外的最强模型chatgpt-4o-latest,仍未进入 gpt-4o 系列模型列表作为新版本发布。
一个小站的自留地
上海电信宽带大面积断网 2024 年 8 月 26 日 17:30 左右,上海电信部分宽带业务发生异常。对此,上海电信表示正在全力抢修排障,并对用户所带来的不便深表歉意。 据 IT 之家报道,当天有大量网友在社交平台反馈上海电信宽带网络出现问题。18:00 左右,不少用户反映宽带信号消失,甚至无法拨打电信 10000 号进行报修。一些网友称,他们最初怀疑是自家网络出现问题,甚至联系了维修师傅,后来才得知是全市范围内的网络故障。 相关话题登上微博热搜第二。在「中国电信上海客服」微博下,不少用户已留言反馈。…
中国移动系统故障导致用户无法登录,预计需 3-4 小时修复

据第一财经报道,2024 年 10 月 21 日下午 4 点左右,中国移动系统突发故障,导致用户无法正常登录官网和微信。中国移动 10086 客服确认系统确实出现故障,目前技术人员正在紧急抢修。

客服表示,此次故障预计需要 3 至 4 小时进行修复,可能在晚上 7 点后恢复正常。如果未能如期解决,可能会影响到次日,但公司将尽力避免此情况发生。建议用户在晚上七八点再尝试登录。
一个小站的自留地
@apples_jimmy 爆料称,Anthropic 预计将在当地时间 10 月 22 日发布新产品。 据 APPSO, 近日在 X 平台陆续有不少消息称,Anthropic 即将发布超大杯模型 Claude 3.5 Opus。
Anthropic宣布推出升级版 Claude 3.5 Sonnet 和全新的 Claude 3.5 Haiku 模型

Anthropic 宣布推出升级版 Claude 3.5 Sonnet 和全新的 Claude 3.5 Haiku 模型,同时引入了实验性的「计算机使用」功能。据 Anthropic 官方介绍,Claude 3.5 Sonnet 在多个领域均有显著提升,尤其是在代码编写方面表现突出。而 Claude 3.5 Haiku 则在多项智能基准测试中超越了此前的旗舰模型 Claude 3 Opus,但成本和速度更接近上一代 Haiku。

据 VentureBeat 报道,Anthropic 新推出的「计算机使用」功能目前处于公开测试阶段。开发者可以通过 API 指导 Claude 像人类一样操作计算机,包括查看屏幕、移动光标、点击按钮和输入文本。尽管这项功能仍在实验阶段,可能偶有错误,但开发者的反馈将有助于其快速迭代改进。

在行业基准测试中,Claude 3.5 Sonnet 表现优异。在 SWE-bench Verified 测试中,其编码能力从 33.4% 提升至 49.0%,超越了所有公开可用模型。在 TAU-bench 中,其在零售和航空领域的表现也有显著提高。据 GitLab 测试,Claude 3.5 Sonnet 在 DevSecOps 任务中提升了推理能力,且未增加延迟,使其成为多步骤软件开发过程中的理想选择。

Claude 3.5 Haiku 则以高性能和经济性见长,特别适合面向用户的产品及专业子代理任务。其低延迟和改进的指令跟随能力使其能够生成个性化体验,如购买历史和库存记录等。

升级版Claude 3.5 Sonnet现已向所有用户开放。从今天起,开发者可以在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用测试版进行构建。新的Claude 3.5 Haiku将在本月晚些时候发布。

Anthropic