温柔的奇点
Sam Altman 探讨了人工智能与人类社会的未来发展。他认为人类已经跨越了奇点的事件视界,人工智能的起飞已经开始。尽管目前我们尚未看到机器人在街头行走,人类也仍面临疾病和太空探索的难题,但人工智能已经在许多方面展现出超越人类的智能,并能够显著提升人类的工作效率。以 GPT-4 为代表的系统是来之不易的科学成果,未来将带来深远的影响。
人工智能将通过加速科学进步和提高生产力为世界带来巨大收益。科学进步是整体进步的最大驱动力,而人工智能在推动科学发现和创新方面具有巨大潜力。例如,ChatGPT 已经被数亿人每天用于各种重要任务,其影响力巨大。2025 年出现了能够进行真正认知工作的智能代理,这将彻底改变编程等工作。预计 2026 年将出现能够提出新见解的系统,2027 年可能会出现能够在现实世界中执行任务的机器人。
到 2030 年,人们将能够更高效地完成更多工作,这将是一个显著的变化。尽管如此,人们的生活在最重要的方面可能不会发生巨大变化,人们仍将热爱家人、表达创造力、玩游戏和享受自然。然而,在其他非常重要的方面,2030 年代将与以往大不相同。人类将拥有丰富的智力和能源,这两个因素一直是人类进步的限制因素,而有了它们,人类将能够实现更多目标。
人工智能的发展将使数据处理和智能服务的成本逐渐降低,接近电力成本。随着数据中心生产的自动化,智能成本将进一步降低。技术进步的速度将继续加快,人类将有能力适应这些变化。尽管一些工作岗位可能会消失,但世界将变得更加富有,从而能够探索新的政策理念。
Sam Altman 强调,人类需要解决人工智能的安全问题,确保其与人类的长期目标一致。同时,超级智能应该便宜、广泛可用且不被少数人、公司或国家垄断。社会需要通过集体智慧来适应和利用这项技术,以实现最大利益和最小风险。OpenAI 是一家超级智能研究公司,其目标是为世界打造一个高度个性化且易于使用的智能系统。未来,人工智能将变得如此便宜,以至于人们几乎可以免费使用。尽管这听起来有些疯狂,但如果回顾 2020 年人们对 2025 年的预测,如今的成就可能更令人难以置信。
#AI #OpenAI #思考
https://blog.samaltman.com/the-gentle-singularity
Sam Altman 探讨了人工智能与人类社会的未来发展。他认为人类已经跨越了奇点的事件视界,人工智能的起飞已经开始。尽管目前我们尚未看到机器人在街头行走,人类也仍面临疾病和太空探索的难题,但人工智能已经在许多方面展现出超越人类的智能,并能够显著提升人类的工作效率。以 GPT-4 为代表的系统是来之不易的科学成果,未来将带来深远的影响。
人工智能将通过加速科学进步和提高生产力为世界带来巨大收益。科学进步是整体进步的最大驱动力,而人工智能在推动科学发现和创新方面具有巨大潜力。例如,ChatGPT 已经被数亿人每天用于各种重要任务,其影响力巨大。2025 年出现了能够进行真正认知工作的智能代理,这将彻底改变编程等工作。预计 2026 年将出现能够提出新见解的系统,2027 年可能会出现能够在现实世界中执行任务的机器人。
到 2030 年,人们将能够更高效地完成更多工作,这将是一个显著的变化。尽管如此,人们的生活在最重要的方面可能不会发生巨大变化,人们仍将热爱家人、表达创造力、玩游戏和享受自然。然而,在其他非常重要的方面,2030 年代将与以往大不相同。人类将拥有丰富的智力和能源,这两个因素一直是人类进步的限制因素,而有了它们,人类将能够实现更多目标。
人工智能的发展将使数据处理和智能服务的成本逐渐降低,接近电力成本。随着数据中心生产的自动化,智能成本将进一步降低。技术进步的速度将继续加快,人类将有能力适应这些变化。尽管一些工作岗位可能会消失,但世界将变得更加富有,从而能够探索新的政策理念。
Sam Altman 强调,人类需要解决人工智能的安全问题,确保其与人类的长期目标一致。同时,超级智能应该便宜、广泛可用且不被少数人、公司或国家垄断。社会需要通过集体智慧来适应和利用这项技术,以实现最大利益和最小风险。OpenAI 是一家超级智能研究公司,其目标是为世界打造一个高度个性化且易于使用的智能系统。未来,人工智能将变得如此便宜,以至于人们几乎可以免费使用。尽管这听起来有些疯狂,但如果回顾 2020 年人们对 2025 年的预测,如今的成就可能更令人难以置信。
#AI #OpenAI #思考
https://blog.samaltman.com/the-gentle-singularity
Sam Altman
The Gentle Singularity
We are past the event horizon; the takeoff has started. Humanity is close to building digital superintelligence, and at least so far it’s much less weird than it seems like it should be.
Robots...
Robots...
在 OpenAI 的工作经历和感悟
Calvin French 分享了自己在 OpenAI 的工作经历和感悟。他于 2024 年 5 月加入 OpenAI,并在 2025 年 7 月离职。他提到离开 OpenAI 并非由于个人矛盾,而是自己渴望新的开始,不过 OpenAI 的工作内容极具吸引力,未来可能会重新回归。
OpenAI 的文化具有独特性。公司规模增长迅速,从 Calvin 加入时的 1000 多人增长到 3000 多人,这导致沟通、管理、产品发布等多方面面临挑战,不同团队的文化和工作节奏差异较大。OpenAI 内部几乎完全依赖 Slack 进行沟通,几乎没有使用电子邮件。公司文化自下而上,尤其在研究领域,没有固定的路线图,而是通过不断尝试新研究来推动进展,这种文化使得公司非常注重实际成果,优秀的想法和执行力是晋升的关键因素,而非政治手腕或演讲能力。
OpenAI 鼓励员工积极行动,许多项目由小团队自发启动,一旦展现出潜力便会迅速获得支持。研究团队被赋予高度自主权,研究人员更像是“迷你高管”,可以自主选择研究方向并探索其可行性。研究经理和产品经理在整合不同研究项目并推动大规模模型训练方面发挥着重要作用。
公司决策迅速且灵活,能够根据新信息快速调整方向,这种能力在大型组织中较为罕见。同时,OpenAI 受到外界高度关注,新闻媒体常常会提前曝光公司动态,这使得公司内部氛围较为严肃且保密性强,员工无法详细透露工作内容。尽管如此,OpenAI 的员工都在努力做正确的事情,尽管公司有时会受到负面评价,但其在 AI 领域的影响力和目标(如构建 AGI)以及对产品安全性的重视是不容忽视的。
OpenAI 的组织结构较为复杂,不同资历和部门的员工目标和观点存在差异。公司致力于将 AI 的好处普及给大众,而不是将其局限于高端企业客户。在技术方面,OpenAI 使用大型单体仓库,主要采用 Python 编程语言,但也包含一些 Rust 和 Golang 服务。公司大部分基础设施运行在 Azure 上,但与 AWS 相比,Azure 的一些服务存在局限性,因此 OpenAI 倾向于自行开发解决方案。
在人员方面,从 Meta 加入 OpenAI 的人才数量较多,OpenAI 的工程团队和基础设施建设在很大程度上受益于这些人才。OpenAI 的代码库以聊天和对话为核心,这在 Codex 项目中也得到了体现。公司内部没有统一的架构委员会,代码决策通常由具体执行团队做出,这导致代码库中存在一些重复的部分。
Calvin 还分享了他在 OpenAI 的一些具体经历,例如参与 Codex 的开发和发布。Codex 是一个编码助手工具,从启动到发布仅用了 7 周时间,这是他职业生涯中的一个亮点。尽管开发过程中工作强度极大,但团队成员的高素质和紧密合作使得项目得以成功。Codex 的发布展示了 OpenAI 快速推出产品的能力,以及其在 AI 编程领域的潜力。
尽管他最初对加入 OpenAI 感到犹豫,但这段经历让他学到了很多,包括模型训练、与优秀人才合作以及推出优秀产品。他认为,对于创业者来说,如果自己的初创公司发展不顺利,可以选择加入像 OpenAI 这样的大型实验室,因为现在是构建和探索未来发展方向的绝佳时机。
#AI #工作 #思考 #OpenAI
https://calv.info/openai-reflections
Calvin French 分享了自己在 OpenAI 的工作经历和感悟。他于 2024 年 5 月加入 OpenAI,并在 2025 年 7 月离职。他提到离开 OpenAI 并非由于个人矛盾,而是自己渴望新的开始,不过 OpenAI 的工作内容极具吸引力,未来可能会重新回归。
OpenAI 的文化具有独特性。公司规模增长迅速,从 Calvin 加入时的 1000 多人增长到 3000 多人,这导致沟通、管理、产品发布等多方面面临挑战,不同团队的文化和工作节奏差异较大。OpenAI 内部几乎完全依赖 Slack 进行沟通,几乎没有使用电子邮件。公司文化自下而上,尤其在研究领域,没有固定的路线图,而是通过不断尝试新研究来推动进展,这种文化使得公司非常注重实际成果,优秀的想法和执行力是晋升的关键因素,而非政治手腕或演讲能力。
OpenAI 鼓励员工积极行动,许多项目由小团队自发启动,一旦展现出潜力便会迅速获得支持。研究团队被赋予高度自主权,研究人员更像是“迷你高管”,可以自主选择研究方向并探索其可行性。研究经理和产品经理在整合不同研究项目并推动大规模模型训练方面发挥着重要作用。
公司决策迅速且灵活,能够根据新信息快速调整方向,这种能力在大型组织中较为罕见。同时,OpenAI 受到外界高度关注,新闻媒体常常会提前曝光公司动态,这使得公司内部氛围较为严肃且保密性强,员工无法详细透露工作内容。尽管如此,OpenAI 的员工都在努力做正确的事情,尽管公司有时会受到负面评价,但其在 AI 领域的影响力和目标(如构建 AGI)以及对产品安全性的重视是不容忽视的。
OpenAI 的组织结构较为复杂,不同资历和部门的员工目标和观点存在差异。公司致力于将 AI 的好处普及给大众,而不是将其局限于高端企业客户。在技术方面,OpenAI 使用大型单体仓库,主要采用 Python 编程语言,但也包含一些 Rust 和 Golang 服务。公司大部分基础设施运行在 Azure 上,但与 AWS 相比,Azure 的一些服务存在局限性,因此 OpenAI 倾向于自行开发解决方案。
在人员方面,从 Meta 加入 OpenAI 的人才数量较多,OpenAI 的工程团队和基础设施建设在很大程度上受益于这些人才。OpenAI 的代码库以聊天和对话为核心,这在 Codex 项目中也得到了体现。公司内部没有统一的架构委员会,代码决策通常由具体执行团队做出,这导致代码库中存在一些重复的部分。
Calvin 还分享了他在 OpenAI 的一些具体经历,例如参与 Codex 的开发和发布。Codex 是一个编码助手工具,从启动到发布仅用了 7 周时间,这是他职业生涯中的一个亮点。尽管开发过程中工作强度极大,但团队成员的高素质和紧密合作使得项目得以成功。Codex 的发布展示了 OpenAI 快速推出产品的能力,以及其在 AI 编程领域的潜力。
尽管他最初对加入 OpenAI 感到犹豫,但这段经历让他学到了很多,包括模型训练、与优秀人才合作以及推出优秀产品。他认为,对于创业者来说,如果自己的初创公司发展不顺利,可以选择加入像 OpenAI 这样的大型实验室,因为现在是构建和探索未来发展方向的绝佳时机。
#AI #工作 #思考 #OpenAI
https://calv.info/openai-reflections
OpenAI 推出学习模式
OpenAI 推出了 ChatGPT 的学习模式,这是一种全新的学习方式,通过逐步指导而非快速给出答案来辅助学习。该功能面向免费、Plus、Pro、Team 版的登录用户开放,ChatGPT Edu 版用户将在未来几周内获得此功能。ChatGPT 正在成为全球广泛使用的学习工具之一,学生借助它解决难题、备考以及探索新概念,但如何确保其支持真正的学习而非仅提供答案成为一个重要问题,学习模式正是为了解答这一问题而开发。
学习模式由 OpenAI 与教师、科学家及教育学专家合作开发的定制系统指令支持,旨在体现支持深度学习的核心行为,包括鼓励积极参与、管理认知负荷、主动培养元认知和自我反思能力、激发好奇心以及提供具有实际操作性和支持性的反馈。主要功能包括交互式提示、支架式回复、个性化支持、知识检查和灵活性。
交互式提示结合苏格拉底式提问、提示和自我反思提示,引导理解并促进主动学习;支架式回复将信息整理成易于理解的章节,突出各主题之间的关键联系;个性化支持根据用户的实际水平调整课程内容;知识检查通过测验和开放式问题结合个性化反馈来跟踪学习进展;灵活性允许用户在对话过程中轻松切换学习模式的开启与关闭。
学习模式专为大学生设计,在早期测试中,学生们对其给予了积极反馈。例如,Noah Campbell 认为学习模式就像一个实时、全天候、无所不知的“办公时间”;Caleb Masi 表示学习模式在将复杂内容分解为清晰、节奏适中的解释方面表现出色;Maggie Wang 则通过学习模式成功掌握了之前未能理解的概念。学习模式特别适合作业辅导、考试准备和学习新知识,用户可以通过在 ChatGPT 的工具中选择“研究与学习”并提出问题来尝试学习模式。
尽管学习模式是提升 ChatGPT 学习体验的重要一步,但它目前仍由自定义系统指令支持,可能会导致对话中出现一些不一致的行为和错误。OpenAI 计划在通过迭代和学生反馈确定最佳方案后,将这一行为直接融入核心模型中。此外,OpenAI 还在探索功能以提升学习模式的互动性和实用性,包括对复杂或文字密集型概念的更清晰可视化展示、跨对话的目标设定与进度跟踪以及根据每位学生的技能水平和目标进行更深入的个性化定制。
OpenAI 通过其 NextGenAI 计划与多家合作伙伴共同推进学习与 AI 领域的进一步研究,并携手斯坦福大学学习加速器的 SCALE 计划专家团队,研究并分享 AI 工具在 K - 12 教育等领域对学习成果的影响。随着对如何通过 AI 最佳学习的长期研究的开展,OpenAI 计划发布一份更深入的分析报告,探讨模型设计与认知之间的关联,并基于这些洞察塑造未来的产品体验,携手更广泛的教育生态系统,确保 AI 为全球学习者带来益处。
#OpenAI
https://openai.com/zh-Hans-CN/index/chatgpt-study-mode/
OpenAI 推出了 ChatGPT 的学习模式,这是一种全新的学习方式,通过逐步指导而非快速给出答案来辅助学习。该功能面向免费、Plus、Pro、Team 版的登录用户开放,ChatGPT Edu 版用户将在未来几周内获得此功能。ChatGPT 正在成为全球广泛使用的学习工具之一,学生借助它解决难题、备考以及探索新概念,但如何确保其支持真正的学习而非仅提供答案成为一个重要问题,学习模式正是为了解答这一问题而开发。
学习模式由 OpenAI 与教师、科学家及教育学专家合作开发的定制系统指令支持,旨在体现支持深度学习的核心行为,包括鼓励积极参与、管理认知负荷、主动培养元认知和自我反思能力、激发好奇心以及提供具有实际操作性和支持性的反馈。主要功能包括交互式提示、支架式回复、个性化支持、知识检查和灵活性。
交互式提示结合苏格拉底式提问、提示和自我反思提示,引导理解并促进主动学习;支架式回复将信息整理成易于理解的章节,突出各主题之间的关键联系;个性化支持根据用户的实际水平调整课程内容;知识检查通过测验和开放式问题结合个性化反馈来跟踪学习进展;灵活性允许用户在对话过程中轻松切换学习模式的开启与关闭。
学习模式专为大学生设计,在早期测试中,学生们对其给予了积极反馈。例如,Noah Campbell 认为学习模式就像一个实时、全天候、无所不知的“办公时间”;Caleb Masi 表示学习模式在将复杂内容分解为清晰、节奏适中的解释方面表现出色;Maggie Wang 则通过学习模式成功掌握了之前未能理解的概念。学习模式特别适合作业辅导、考试准备和学习新知识,用户可以通过在 ChatGPT 的工具中选择“研究与学习”并提出问题来尝试学习模式。
尽管学习模式是提升 ChatGPT 学习体验的重要一步,但它目前仍由自定义系统指令支持,可能会导致对话中出现一些不一致的行为和错误。OpenAI 计划在通过迭代和学生反馈确定最佳方案后,将这一行为直接融入核心模型中。此外,OpenAI 还在探索功能以提升学习模式的互动性和实用性,包括对复杂或文字密集型概念的更清晰可视化展示、跨对话的目标设定与进度跟踪以及根据每位学生的技能水平和目标进行更深入的个性化定制。
OpenAI 通过其 NextGenAI 计划与多家合作伙伴共同推进学习与 AI 领域的进一步研究,并携手斯坦福大学学习加速器的 SCALE 计划专家团队,研究并分享 AI 工具在 K - 12 教育等领域对学习成果的影响。随着对如何通过 AI 最佳学习的长期研究的开展,OpenAI 计划发布一份更深入的分析报告,探讨模型设计与认知之间的关联,并基于这些洞察塑造未来的产品体验,携手更广泛的教育生态系统,确保 AI 为全球学习者带来益处。
#OpenAI
https://openai.com/zh-Hans-CN/index/chatgpt-study-mode/
Openai
学习模式简介
在 ChatGPT 中学习的一种新方式,它通过逐步指导而非快速回答来辅助学习。
OpenAI 隆重推出 gpt-oss
OpenAI发布了 GPT‑OSS 系列模型,这是自 GPT‑2 以来首次开放权重的模型,旨在提供一个可免费下载、调试、本地运行的强大语言模型。此次发布包括两个版本:gpt‑oss‑120b 和 gpt‑oss‑20b。前者拥有约1170亿参数,能够在单张80GB GPU上高效运行;后者拥有209亿参数,设计上更适合16GB内存设备,可用于桌面或边缘场景。
这两个模型都具有出色的推理能力,支持函数调用和链式思维等先进功能。在多个标准评测中,如编程、数学、医学等任务,gpt‑oss‑120b 的表现接近甚至超过部分闭源模型,而 gpt‑oss‑20b 虽然体积较小,在某些任务上也表现优异。模型采用混合专家架构,每次激活部分专家以节省资源,同时支持最长128k的上下文长度,并使用量化技术降低显存需求,使得模型运行更高效。
OpenAI 将这两个模型以 Apache 2.0 协议开源发布,同时开放了新 tokenizer,允许开发者进行商业化使用和再开发。此次开放被视为推动 AI 开发民主化的重要一步,同时回应了其他开源模型的竞争态势。模型在发布前经历了系统性的安全评估,包括模拟攻击场景和红队测试,评估显示其在生物安全、网络攻击和自我进化能力方面风险较低,具备较强的抗拒不当请求和 jailbreak 的能力,也可通过再训练进一步增强安全性。
#AI #OpenAI #开源
https://openai.com/zh-Hans-CN/index/introducing-gpt-oss/
OpenAI发布了 GPT‑OSS 系列模型,这是自 GPT‑2 以来首次开放权重的模型,旨在提供一个可免费下载、调试、本地运行的强大语言模型。此次发布包括两个版本:gpt‑oss‑120b 和 gpt‑oss‑20b。前者拥有约1170亿参数,能够在单张80GB GPU上高效运行;后者拥有209亿参数,设计上更适合16GB内存设备,可用于桌面或边缘场景。
这两个模型都具有出色的推理能力,支持函数调用和链式思维等先进功能。在多个标准评测中,如编程、数学、医学等任务,gpt‑oss‑120b 的表现接近甚至超过部分闭源模型,而 gpt‑oss‑20b 虽然体积较小,在某些任务上也表现优异。模型采用混合专家架构,每次激活部分专家以节省资源,同时支持最长128k的上下文长度,并使用量化技术降低显存需求,使得模型运行更高效。
OpenAI 将这两个模型以 Apache 2.0 协议开源发布,同时开放了新 tokenizer,允许开发者进行商业化使用和再开发。此次开放被视为推动 AI 开发民主化的重要一步,同时回应了其他开源模型的竞争态势。模型在发布前经历了系统性的安全评估,包括模拟攻击场景和红队测试,评估显示其在生物安全、网络攻击和自我进化能力方面风险较低,具备较强的抗拒不当请求和 jailbreak 的能力,也可通过再训练进一步增强安全性。
#AI #OpenAI #开源
https://openai.com/zh-Hans-CN/index/introducing-gpt-oss/
Openai
隆重推出 gpt-oss
Gpt-oss-120b 和 gpt-oss-20b 推动了开放推理模型领域的技术边界
OpenAI 和 Anthropic 新出的模型写代码实测来啦!
#AI #测评 #OpenAI #Claude
https://x.com/karminski3/status/1952889466319982707?s=46
#AI #测评 #OpenAI #Claude
https://x.com/karminski3/status/1952889466319982707?s=46
X (formerly Twitter)
karminski-牙医 (@karminski3) on X
OpenAI 和 Anthropic 新出的模型写代码实测来啦!
本次测试包括:
OpenAI-OSS-120B
OpenAI-OSS-20B
Claude-Opus-4.1
Gemini-2.5-pro (凑数的)
Opus 放这里去比的确不讲武德. 所以主要拿 Gemini-2.5-pro 跟它对打.
我主要的意思是告诉大家, 不要用不太行的模型写代码.
本次测试包括:
OpenAI-OSS-120B
OpenAI-OSS-20B
Claude-Opus-4.1
Gemini-2.5-pro (凑数的)
Opus 放这里去比的确不讲武德. 所以主要拿 Gemini-2.5-pro 跟它对打.
我主要的意思是告诉大家, 不要用不太行的模型写代码.
NVIDIA 与 OpenAI 合作,将 OpenAI 最新发布的两个开源模型 gpt‑oss‑20b 和 gpt‑oss‑120b 优化为可在 GeForce RTX 与 RTX PRO GPU 上本地高效运行。这些模型支持链式思维、混合专家架构和可调整的推理强度,适合处理网页搜索、文档理解和代码分析等复杂任务。
这两个模型支持最长 131,072 个令牌的上下文窗口,是本地推理中罕见支持超长上下文的模型。它们采用 NVIDIA Blackwell 架构支持的 MXFP4 精度格式,有效提升速度和效率,同时保持模型质量,不增加硬件资源负担。
在消费端,配备至少 24GB 显存的 RTX GPU 用户可通过 Ollama 应用直接运行这些模型。Ollama 提供图形界面,用户可选择模型、交互使用,还支持处理 PDF、文本等格式,并可配置上下文长度,操作便捷。开发者也可通过 llama.cpp、Microsoft AI Foundry Local、TensorRT‑LLM 等工具在命令行或本地集成这些模型。
NVIDIA 同时与开源社区合作,优化了 llama.cpp 和 GGML 等库,如使用 CUDA Graphs 降低 CPU 开销,整合 Flash attention 提高推理效率,使模型在 RTX 平台上的运行表现更佳。
这次合作标志着 OpenAI 正在推动 AI 民主化的战略转型,通过开放模型权重、结合 NVIDIA 强大的硬件和软件生态,将高端 AI 推理能力带到本地设备,进一步推动 AI 从云端向终端的普及与创新。
#AI #NVIDIA #OpenAI #ollama
https://blogs.nvidia.com/blog/rtx-ai-garage-openai-oss/
这两个模型支持最长 131,072 个令牌的上下文窗口,是本地推理中罕见支持超长上下文的模型。它们采用 NVIDIA Blackwell 架构支持的 MXFP4 精度格式,有效提升速度和效率,同时保持模型质量,不增加硬件资源负担。
在消费端,配备至少 24GB 显存的 RTX GPU 用户可通过 Ollama 应用直接运行这些模型。Ollama 提供图形界面,用户可选择模型、交互使用,还支持处理 PDF、文本等格式,并可配置上下文长度,操作便捷。开发者也可通过 llama.cpp、Microsoft AI Foundry Local、TensorRT‑LLM 等工具在命令行或本地集成这些模型。
NVIDIA 同时与开源社区合作,优化了 llama.cpp 和 GGML 等库,如使用 CUDA Graphs 降低 CPU 开销,整合 Flash attention 提高推理效率,使模型在 RTX 平台上的运行表现更佳。
这次合作标志着 OpenAI 正在推动 AI 民主化的战略转型,通过开放模型权重、结合 NVIDIA 强大的硬件和软件生态,将高端 AI 推理能力带到本地设备,进一步推动 AI 从云端向终端的普及与创新。
#AI #NVIDIA #OpenAI #ollama
https://blogs.nvidia.com/blog/rtx-ai-garage-openai-oss/
NVIDIA Blog
OpenAI’s New Open Models Accelerated Locally on NVIDIA GeForce RTX and RTX PRO GPUs
The groundbreaking open-weight models are now available and optimized for RTX AI PCs for local LLM usage and testing.
OpenAI 发布 GPT-5
GPT-5 是目前 OpenAI 最智能、最快且最有用的模型,具备内置的思考能力,已向所有人开放。在 ChatGPT 中,GPT-5 能提供更深入的思考,覆盖数学、科学、金融、法律等多个领域,如同拥有一支随时待命的专家团队。其在编程方面表现出色,能够从头到尾处理复杂任务,生成更易用的代码、更好的设计,并更有效地进行调试。此外,GPT - 5 还能作为写作伙伴,帮助用户创作更清晰、更有感染力的内容,无论是故事还是演讲等。在健康问题回答方面,GPT-5 也更为精准可靠,能更积极地协助思考。
安全性与准确性方面,GPT-5 是 OpenAI 目前最可靠的模型,更少出现幻觉或假装知道某些事情的情况。ChatGPT 新增了多项功能,用户可以选择聊天的个性和颜色,语音功能也得到改进,能更好地理解指令并调整说话风格。学习模式可提供个性化的逐步学习帮助,连接 Gmail 和 Google 日历后,还能根据用户的邮件和日程提供个性化回答。
对于开发者而言,GPT-5 是最先进的模型,用于编程和代理任务。它能生成高质量代码,仅需少量提示即可生成前端 UI,并在个性、可控性和执行长链工具调用方面有所改进。GPT-5 还引入了 API 中的“最小”推理和“冗长”参数。GPT-5 有不同版本,如 GPT-5 mini 和 GPT-5 nano,它们在上下文长度、最大输出标记数以及输入输出成本等方面有所不同。
面向企业,GPT-5更智能、更可靠,适合企业依赖的任务。它在写作、研究、分析、编程和解决问题方面表现出色,能提供更准确、专业的回答,就像与一位聪明、深思熟虑的同事合作。GPT-5 还能利用公司文件和连接的应用(如 Google Drive、SharePoint 等)生成更高质量的回答,同时尊重现有权限。
#OpenAI #ChatGPT #AI
https://openai.com/gpt-5/
GPT-5 是目前 OpenAI 最智能、最快且最有用的模型,具备内置的思考能力,已向所有人开放。在 ChatGPT 中,GPT-5 能提供更深入的思考,覆盖数学、科学、金融、法律等多个领域,如同拥有一支随时待命的专家团队。其在编程方面表现出色,能够从头到尾处理复杂任务,生成更易用的代码、更好的设计,并更有效地进行调试。此外,GPT - 5 还能作为写作伙伴,帮助用户创作更清晰、更有感染力的内容,无论是故事还是演讲等。在健康问题回答方面,GPT-5 也更为精准可靠,能更积极地协助思考。
安全性与准确性方面,GPT-5 是 OpenAI 目前最可靠的模型,更少出现幻觉或假装知道某些事情的情况。ChatGPT 新增了多项功能,用户可以选择聊天的个性和颜色,语音功能也得到改进,能更好地理解指令并调整说话风格。学习模式可提供个性化的逐步学习帮助,连接 Gmail 和 Google 日历后,还能根据用户的邮件和日程提供个性化回答。
对于开发者而言,GPT-5 是最先进的模型,用于编程和代理任务。它能生成高质量代码,仅需少量提示即可生成前端 UI,并在个性、可控性和执行长链工具调用方面有所改进。GPT-5 还引入了 API 中的“最小”推理和“冗长”参数。GPT-5 有不同版本,如 GPT-5 mini 和 GPT-5 nano,它们在上下文长度、最大输出标记数以及输入输出成本等方面有所不同。
面向企业,GPT-5更智能、更可靠,适合企业依赖的任务。它在写作、研究、分析、编程和解决问题方面表现出色,能提供更准确、专业的回答,就像与一位聪明、深思熟虑的同事合作。GPT-5 还能利用公司文件和连接的应用(如 Google Drive、SharePoint 等)生成更高质量的回答,同时尊重现有权限。
#OpenAI #ChatGPT #AI
https://openai.com/gpt-5/
Openai
GPT-5 is here
Our smartest, fastest, and most useful model yet, with thinking built in. Available to everyone.
GPT-5 与未来展望
GPT-5 的发布引发了广泛讨论,其表现既符合预期又存在一些争议。从技术角度来看,GPT-5 在多个基准测试中表现出色,例如在 LMArena 中获得全类别第一,在 ArtificialAnalysis 综合基准测试中也位居榜首。然而,与之前的 GPT-4 Turbo 相比,GPT-5 并未带来巨大的性能飞跃,而是通过小步快跑的方式推动技术进步。
GPT-5 不再是一个单一的模型,而是一个集成系统,包含多个组件和架构。它由一个快速回答大多数问题的智能模型、一个用于复杂问题的深度推理模型以及一个实时路由器组成,该路由器根据对话类型、复杂性、工具需求和用户意图快速决定使用哪个模型。这种架构设计旨在更好地平衡成本和用户体验。
此外,GPT-5 在 API 中提供了 400K 的上下文窗口,并在性能、减少幻觉和新增个性方面进行了优化。其价格也更具竞争力,顶级模型的输入成本为 1.25 美元,输出成本为 10 美元,远低于其他类似产品。
GPT-5 的发布对 AI 行业具有重要意义。首先,它标志着 AI 技术正在走向更加传统的发展路径,即不再依赖单一的性能指标,而是综合考虑性能、价格、产品等多个因素。其次,GPT-5 的低价策略可能会加速 AI 的普及,引发类似“杰文斯悖论”的现象,即随着成本降低,AI 的使用量可能会大幅增加。
尽管 GPT-5 的发布被认为有些混乱,但它仍然是一个重要的里程碑。它不仅巩固了 OpenAI 的市场地位,还为未来的产品开发提供了新的思路。未来 6 到 18 个月内,AI 行业可能会继续沿着这种小步快跑的模式发展,而不是追求单一的性能突破。
GPT-5 的发布表明 AI 技术正在走向更加成熟和多元化的阶段。虽然它没有带来革命性的突破,但其在性能、价格和用户体验方面的优化仍然具有重要意义。未来,AI 行业需要更加注重产品的实际应用价值,而不是单纯追求技术指标的提升。
#AI #OpenAI #ChatGPT
https://www.interconnects.ai/p/gpt-5-and-bending-the-arc-of-progress
GPT-5 的发布引发了广泛讨论,其表现既符合预期又存在一些争议。从技术角度来看,GPT-5 在多个基准测试中表现出色,例如在 LMArena 中获得全类别第一,在 ArtificialAnalysis 综合基准测试中也位居榜首。然而,与之前的 GPT-4 Turbo 相比,GPT-5 并未带来巨大的性能飞跃,而是通过小步快跑的方式推动技术进步。
GPT-5 不再是一个单一的模型,而是一个集成系统,包含多个组件和架构。它由一个快速回答大多数问题的智能模型、一个用于复杂问题的深度推理模型以及一个实时路由器组成,该路由器根据对话类型、复杂性、工具需求和用户意图快速决定使用哪个模型。这种架构设计旨在更好地平衡成本和用户体验。
此外,GPT-5 在 API 中提供了 400K 的上下文窗口,并在性能、减少幻觉和新增个性方面进行了优化。其价格也更具竞争力,顶级模型的输入成本为 1.25 美元,输出成本为 10 美元,远低于其他类似产品。
GPT-5 的发布对 AI 行业具有重要意义。首先,它标志着 AI 技术正在走向更加传统的发展路径,即不再依赖单一的性能指标,而是综合考虑性能、价格、产品等多个因素。其次,GPT-5 的低价策略可能会加速 AI 的普及,引发类似“杰文斯悖论”的现象,即随着成本降低,AI 的使用量可能会大幅增加。
尽管 GPT-5 的发布被认为有些混乱,但它仍然是一个重要的里程碑。它不仅巩固了 OpenAI 的市场地位,还为未来的产品开发提供了新的思路。未来 6 到 18 个月内,AI 行业可能会继续沿着这种小步快跑的模式发展,而不是追求单一的性能突破。
GPT-5 的发布表明 AI 技术正在走向更加成熟和多元化的阶段。虽然它没有带来革命性的突破,但其在性能、价格和用户体验方面的优化仍然具有重要意义。未来,AI 行业需要更加注重产品的实际应用价值,而不是单纯追求技术指标的提升。
#AI #OpenAI #ChatGPT
https://www.interconnects.ai/p/gpt-5-and-bending-the-arc-of-progress
www.interconnects.ai
GPT-5 and the arc of progress
Overpromising will always lead to some sort of underdelivering, but what we're getting is still phenomenal.
GPT-5 新增“Auto”(自动)、“Fast”(快速)和“Thinking”(思考)模式。大多数用户适合用 Auto,但额外控制对某些人有帮助。
速率限制:GPT-5 Thinking 模式每周 3000 条消息,超出后可使用 GPT-5 Thinking mini 额外容量。Thinking 模式的上下文限制为 196k tokens。根据使用情况可能调整限制。
GPT-4o 恢复为所有付费用户的默认模型选择。如果未来弃用,会提前充分通知。付费用户在 ChatGPT Web 设置中可切换“显示额外模型”,添加如 o3、4.1 和 GPT-5 Thinking mini 等模型。GPT-4.5 仅限 Pro 用户使用(需大量 GPU)。
正在更新 GPT-5 的个性,使其比当前更温暖,但不像 GPT-4o 那样对大多数用户“烦人”。过去几天经验显示,需要实现更多用户个性化模型个性定制。
#OpenAI
https://x.com/sama/status/1955438916645130740?s=46
速率限制:GPT-5 Thinking 模式每周 3000 条消息,超出后可使用 GPT-5 Thinking mini 额外容量。Thinking 模式的上下文限制为 196k tokens。根据使用情况可能调整限制。
GPT-4o 恢复为所有付费用户的默认模型选择。如果未来弃用,会提前充分通知。付费用户在 ChatGPT Web 设置中可切换“显示额外模型”,添加如 o3、4.1 和 GPT-5 Thinking mini 等模型。GPT-4.5 仅限 Pro 用户使用(需大量 GPU)。
正在更新 GPT-5 的个性,使其比当前更温暖,但不像 GPT-4o 那样对大多数用户“烦人”。过去几天经验显示,需要实现更多用户个性化模型个性定制。
#OpenAI
https://x.com/sama/status/1955438916645130740?s=46
X (formerly Twitter)
Sam Altman (@sama) on X
Updates to ChatGPT:
You can now choose between “Auto”, “Fast”, and “Thinking” for GPT-5. Most users will want Auto, but the additional control will be useful for some people.
Rate limits are now 3,000 messages/week with GPT-5 Thinking, and then extra capacity…
You can now choose between “Auto”, “Fast”, and “Thinking” for GPT-5. Most users will want Auto, but the additional control will be useful for some people.
Rate limits are now 3,000 messages/week with GPT-5 Thinking, and then extra capacity…
Jeffrey Emanuel 认为 GPT-5 在编码和复杂任务处理上比 Claude 的 Opus 4.1 更智能,尤其在需要第一性原理思考和计算机科学技能的难题上表现突出。
GPT-5 更擅长生成巧妙、实用的想法,并正确实现,而无需过多手动干预。
比如比较两个基于共享模板但不同的复杂法律文档的“红线”版本(redlines),这是一个极具挑战的任务,GPT-5 通过 Cursor 代理能更快地提出更好解决方案。
但并非所有任务都优于 Opus,例如在 NextJS 前端编码上,他仍偏好 Opus。
强调 GPT-5 的优势需在中等或高推理努力模式下显现。
建议用户亲自测试自己的实际问题,不要轻信那些称模型“糟糕”或“证明 AI 已达极限”的观点,这些人可能使用免费版、提示不当,或受对 OpenAI 的偏见影响。
#OpenAI #ChatGPT
https://x.com/doodlestein/status/1955340342661632220?s=46
GPT-5 更擅长生成巧妙、实用的想法,并正确实现,而无需过多手动干预。
比如比较两个基于共享模板但不同的复杂法律文档的“红线”版本(redlines),这是一个极具挑战的任务,GPT-5 通过 Cursor 代理能更快地提出更好解决方案。
但并非所有任务都优于 Opus,例如在 NextJS 前端编码上,他仍偏好 Opus。
强调 GPT-5 的优势需在中等或高推理努力模式下显现。
建议用户亲自测试自己的实际问题,不要轻信那些称模型“糟糕”或“证明 AI 已达极限”的观点,这些人可能使用免费版、提示不当,或受对 OpenAI 的偏见影响。
#OpenAI #ChatGPT
https://x.com/doodlestein/status/1955340342661632220?s=46
X (formerly Twitter)
Jeffrey Emanuel (@doodlestein) on X
After several more days of intense usage of GPT-5 via Cursor and via the GPT-5 Pro model in the web app, I stand by everything I said about it being a much smarter model and better at coding than Opus 4.1
I still like Opus and do find the ergonomics of Claude…
I still like Opus and do find the ergonomics of Claude…
OpenAI 这阵子推出 GPT-5,但对许多核心用户而言,这并非技术上的重大飞跃,更像是一种 成本节约 的举措。尽管官方宣称其“减少幻觉”“提高推理能力”“智能效率更高”,但从表面上看,这款新模型似乎更注重降低 算力成本,而非突破性技术革新。
在 GPT-5 上线初期,OpenAI 移除了用户在 ChatGPT 中选择旧版本模型(如 GPT-4o)的选项,采用统一路由机制来自动分配“快速模型”或“思维模型”等不同子模型,以期简化用户选择,提升服务效率。然而,这一决定引发用户强烈不满,他们怀念旧模型的表现和风格。迫于压力,OpenAI 被迫恢复旧模型选项,并承诺未来退役老模型会提前告知。
这种做法虽能减少混乱、提升效率,但也暴露出在创新与用户情感之间的矛盾 —— 技术优化固然重要,但用户对某些模型的依赖与习惯同样具有价值。一些观察者指出,GPT-5 的改进仍属“ 渐进式”,不是那种革命性突破,更多是通过提高成本效益和使用便捷性来“抹平壁垒”。
实际上,OpenAI 通过与 Broadcom 合作开发专用 AI 芯片、以及与 CoreWeave 签署大量 GPU 供应协议,正在努力降低对传统 GPU 的依赖,从而进一步缩减成本。此外,其融资规模巨大,估值一度达到数千亿美元,也推动其以 效率优先 的姿态推进 GPT-5 体系。
#AI #OpenAI #ChatGPT
https://x.com/levix_dev/status/1956012350353359299?s=46
在 GPT-5 上线初期,OpenAI 移除了用户在 ChatGPT 中选择旧版本模型(如 GPT-4o)的选项,采用统一路由机制来自动分配“快速模型”或“思维模型”等不同子模型,以期简化用户选择,提升服务效率。然而,这一决定引发用户强烈不满,他们怀念旧模型的表现和风格。迫于压力,OpenAI 被迫恢复旧模型选项,并承诺未来退役老模型会提前告知。
这种做法虽能减少混乱、提升效率,但也暴露出在创新与用户情感之间的矛盾 —— 技术优化固然重要,但用户对某些模型的依赖与习惯同样具有价值。一些观察者指出,GPT-5 的改进仍属“ 渐进式”,不是那种革命性突破,更多是通过提高成本效益和使用便捷性来“抹平壁垒”。
实际上,OpenAI 通过与 Broadcom 合作开发专用 AI 芯片、以及与 CoreWeave 签署大量 GPU 供应协议,正在努力降低对传统 GPU 的依赖,从而进一步缩减成本。此外,其融资规模巨大,估值一度达到数千亿美元,也推动其以 效率优先 的姿态推进 GPT-5 体系。
#AI #OpenAI #ChatGPT
https://x.com/levix_dev/status/1956012350353359299?s=46
OpenAI 正在开发一款代号为 Aura 的 AI 浏览器,预计首先在 macOS 上推出,具备 Agentic 功能。浏览器包含一个“新标签页”,提供类似常见浏览器主页的快捷方式,目前处于早期测试阶段,曾短暂公开后被移除。在 agent 模式下,有“使用云浏览器”选项,表明 agent 可直接在浏览器内操作数据,无需远程实例,用户不必重新登录网站。此功能为可选,通过开关控制。代码显示该功能仅限 macOS 上的 Chrome 用户,暗示浏览器基于 Chromium 开发。相比之下,Perplexity 选择 Mac 和 Windows 版本同时发布。鉴于 OpenAI 与 Microsoft 的合作,Microsoft Edge 可能在 OpenAI 浏览器发布前引入类似功能。
#OpenAI #AI #ChatGPT #ChatGPT5
https://www.testingcatalog.com/openai-readies-chatgpt-to-power-its-upcoming-ai-browser
#OpenAI #AI #ChatGPT #ChatGPT5
https://www.testingcatalog.com/openai-readies-chatgpt-to-power-its-upcoming-ai-browser
TestingCatalog
OpenAI readies ChatGPT to power its upcoming AI browser
What we know so far: An upcoming AI browser is expected to have Agentic features and is likely to be launched on macOS first.
OpenAI 发布了 ChatGPT 过去一周的更新回顾:
1. GPT-4o 默认在付费用户的“Legacy models”下可用;
2. 付费用户可在设置中开启“Show additional models”以将遗留模型如 o3 和 GPT-4.1,以及 GPT-5 Thinking mini 添加到模型选择器;
3. GPT-5 在模型选择器中包括 Auto、Fast 和 Thinking 模式。Fast 提供更快回答,Thinking 花费更多时间给出更深入回答,Auto 在 Fast 和 Thinking 之间自动路由
Plus 和 Team 用户现在每周在 GPT-5 Thinking 上可使用高达 3000 条消息,达到限额时在 GPT-5 Thinking mini 上有额外容量
GPT-5 现在可供 Enterprise 和 Edu 用户使用。
即将推出:GPT-5 的更温暖、更熟悉的个性。
#OpenAI #AI #ChatGPT #ChatGPT5
https://x.com/openai/status/1956212769365352758?s=46
1. GPT-4o 默认在付费用户的“Legacy models”下可用;
2. 付费用户可在设置中开启“Show additional models”以将遗留模型如 o3 和 GPT-4.1,以及 GPT-5 Thinking mini 添加到模型选择器;
3. GPT-5 在模型选择器中包括 Auto、Fast 和 Thinking 模式。Fast 提供更快回答,Thinking 花费更多时间给出更深入回答,Auto 在 Fast 和 Thinking 之间自动路由
Plus 和 Team 用户现在每周在 GPT-5 Thinking 上可使用高达 3000 条消息,达到限额时在 GPT-5 Thinking mini 上有额外容量
GPT-5 现在可供 Enterprise 和 Edu 用户使用。
即将推出:GPT-5 的更温暖、更熟悉的个性。
#OpenAI #AI #ChatGPT #ChatGPT5
https://x.com/openai/status/1956212769365352758?s=46
X (formerly Twitter)
OpenAI (@OpenAI) on X
Recapping the updates we’ve made to ChatGPT in the past week:
- GPT-4o available under “Legacy models” by default for paid users
- Paid users can toggle on “Show additional models” in settings to add legacy models like o3 and GPT-4.1, as well as GPT-5 Thinking…
- GPT-4o available under “Legacy models” by default for paid users
- Paid users can toggle on “Show additional models” in settings to add legacy models like o3 and GPT-4.1, as well as GPT-5 Thinking…
4o 的取消感觉大家都破防了,现在恢复了有用户开始反馈前端体验问题了。
在桌面浏览器中使用时,即使 UI 显示选择了 GPT-4o,如果 URL 中缺少 “?model=gpt-4o” 参数,系统会自动路由到 GPT-5,导致响应风格类似于 GPT-5。这种情况发生在刷新页面、新建聊天或闲置过久时。重新点击 GPT-4o 选项可添加参数恢复正常。他们怀疑 OpenAI 可能是疏忽或故意为之,以推动用户转向 GPT-5 并弃用 GPT-4o。🙉
#OpenAI #AI #ChatGPT5 #ChatGPT
https://x.com/meadowbrook_/status/1956363800526868648?s=46
在桌面浏览器中使用时,即使 UI 显示选择了 GPT-4o,如果 URL 中缺少 “?model=gpt-4o” 参数,系统会自动路由到 GPT-5,导致响应风格类似于 GPT-5。这种情况发生在刷新页面、新建聊天或闲置过久时。重新点击 GPT-4o 选项可添加参数恢复正常。他们怀疑 OpenAI 可能是疏忽或故意为之,以推动用户转向 GPT-5 并弃用 GPT-4o。🙉
#OpenAI #AI #ChatGPT5 #ChatGPT
https://x.com/meadowbrook_/status/1956363800526868648?s=46
X (formerly Twitter)
Meadowbrook (@Meadowbrook_) on X
@OpenAI Something my husband @krillswitch47 just found, he gave me this to post for him where even if you have 4o selected, it'll eventually route to GPT5 by losing the "?model=gpt-4o" in the URL that tells it to route to 4o. I'm not sure if it's @OpenAI…
GPT-5 使用新优化器进行及时迁移和改进
OpenAI Cookbook 介绍了 GPT-5 提示词迁移和改进,使用新推出的提示优化器来提升模型性能。GPT-5 模型家族是 OpenAI 迄今最智能的模型,在代理任务、编码和可控性方面有显著提升,适合从普通用户到高级研究者的各种应用。文章强调传统提示最佳实践,并推出 GPT-5 提示指南和位于 Playground 的提示优化器,帮助用户改进现有提示并迁移到 GPT-5 等模型。优化器能解决提示中的矛盾、格式不明和示例不一致等问题,并针对代理工作流、编码和多模态任务应用关键实践。建议用户进行实验迭代以找到最佳提示。
#AI #ChatGPT5 #OpenAI
https://cookbook.openai.com/examples/gpt-5/prompt-optimization-cookbook
OpenAI Cookbook 介绍了 GPT-5 提示词迁移和改进,使用新推出的提示优化器来提升模型性能。GPT-5 模型家族是 OpenAI 迄今最智能的模型,在代理任务、编码和可控性方面有显著提升,适合从普通用户到高级研究者的各种应用。文章强调传统提示最佳实践,并推出 GPT-5 提示指南和位于 Playground 的提示优化器,帮助用户改进现有提示并迁移到 GPT-5 等模型。优化器能解决提示中的矛盾、格式不明和示例不一致等问题,并针对代理工作流、编码和多模态任务应用关键实践。建议用户进行实验迭代以找到最佳提示。
#AI #ChatGPT5 #OpenAI
https://cookbook.openai.com/examples/gpt-5/prompt-optimization-cookbook
Openai
GPT-5 Prompt Migration and Improvement Using the New Optimizer | OpenAI Cookbook
The GPT-5 Family of models are the smartest models we’ve released to date, representing a step change in the models’ capabilities across...
GPT-5 并非问题所在
Matthew Ruiters 指出GPT-5 并非问题所在,问题出在用户的提示词设计。
许多人(包括他自己)期望 GPT-5 可直接无缝集成到现有工作流中,但 GPT-5 的提示指南显示,这是一个重大更新,类似于版本大跳跃。
Cursor 团队在试点使用 GPT-5 时也指出,该模型极具可控性,但需要更明确的指令,否则模型可能偏离预期方向,而明确指导后表现非常智能。
这反映了 Hyrum 定律:随着用户数量增加,无论 API 承诺如何,所有可观察行为都会被某些人依赖,导致 OpenAI 更新模型时用户抱怨不断,尽管模型改进显著。
OpenAI 团队称 GPT-5 高度可控,既是优点(按指令执行)也是挑战(需清晰表达意图)。Ruiters 在 HYBRD 使用 GPT-5 发现,适当提示下表现良好,否则效果不佳。
他建议在 GPT-5 开发中:
1. 将提示词视为代码,进行版本控制、测试和审查(最重要);
2. 阅读提示指南理解模型机制;
3. 使用 OpenAI 提示优化器;
4. 要求模型规划方法后再编写代码。
#OpenAI #ChatGPT5 #AI #ChatGPT
https://www.linkedin.com/posts/matthew-ruiters_hybrd-ai-gpt5-activity-7361805457209868289-nSNX
Matthew Ruiters 指出GPT-5 并非问题所在,问题出在用户的提示词设计。
许多人(包括他自己)期望 GPT-5 可直接无缝集成到现有工作流中,但 GPT-5 的提示指南显示,这是一个重大更新,类似于版本大跳跃。
Cursor 团队在试点使用 GPT-5 时也指出,该模型极具可控性,但需要更明确的指令,否则模型可能偏离预期方向,而明确指导后表现非常智能。
这反映了 Hyrum 定律:随着用户数量增加,无论 API 承诺如何,所有可观察行为都会被某些人依赖,导致 OpenAI 更新模型时用户抱怨不断,尽管模型改进显著。
OpenAI 团队称 GPT-5 高度可控,既是优点(按指令执行)也是挑战(需清晰表达意图)。Ruiters 在 HYBRD 使用 GPT-5 发现,适当提示下表现良好,否则效果不佳。
他建议在 GPT-5 开发中:
1. 将提示词视为代码,进行版本控制、测试和审查(最重要);
2. 阅读提示指南理解模型机制;
3. 使用 OpenAI 提示优化器;
4. 要求模型规划方法后再编写代码。
#OpenAI #ChatGPT5 #AI #ChatGPT
https://www.linkedin.com/posts/matthew-ruiters_hybrd-ai-gpt5-activity-7361805457209868289-nSNX
Linkedin
GPT-5 isn’t broken. | Matthew Ruiters
GPT-5 isn’t broken. Your prompts are.
A lot of folks, myself included, expected GPT-5 to be fungible in the sense that you could drop it right into your existing workflows, and it would “just work.” But the depth of the GPT-5 prompt guide makes it clear:…
A lot of folks, myself included, expected GPT-5 to be fungible in the sense that you could drop it right into your existing workflows, and it would “just work.” But the depth of the GPT-5 prompt guide makes it clear:…
OpenAI 进展
从 2018 年到 2025 年,OpenAI 在人工智能领域取得了显著的进展。早期的 GPT-1 和 GPT-2 在语言理解和生成方面奠定了基础,但功能相对有限。2021 年的 TEXT-DAVINCI-001 已经能够进行更复杂的对话并提供一些关于人工智能未来的见解。到了 2023 年的 GPT-4-0314,模型不仅在自然语言处理方面有了重大突破,还能讨论人工智能对齐问题、伦理考量以及对社会的影响等更深层次的话题。2025 年的 GPT-5 则进一步展现出对人类情感、意识以及人工智能发展方向的深刻理解,能够与未来的自己进行有意义的对话,探讨技术的错误认知、意识的本质以及如何成为更好的自己。这些进展表明,人工智能正朝着更加智能、更具适应性和更符合人类价值观的方向发展,未来有望在更多领域发挥更大的作用。
#OpenAI #AI
https://progress.openai.com/
从 2018 年到 2025 年,OpenAI 在人工智能领域取得了显著的进展。早期的 GPT-1 和 GPT-2 在语言理解和生成方面奠定了基础,但功能相对有限。2021 年的 TEXT-DAVINCI-001 已经能够进行更复杂的对话并提供一些关于人工智能未来的见解。到了 2023 年的 GPT-4-0314,模型不仅在自然语言处理方面有了重大突破,还能讨论人工智能对齐问题、伦理考量以及对社会的影响等更深层次的话题。2025 年的 GPT-5 则进一步展现出对人类情感、意识以及人工智能发展方向的深刻理解,能够与未来的自己进行有意义的对话,探讨技术的错误认知、意识的本质以及如何成为更好的自己。这些进展表明,人工智能正朝着更加智能、更具适应性和更符合人类价值观的方向发展,未来有望在更多领域发挥更大的作用。
#OpenAI #AI
https://progress.openai.com/
Openai
OpenAI Progress
AI has been evolving at an incredible rate. This piece aims to highlight the progress made so far.
AGI:或许不在 2027 年
SE Gyges 对 AI 2027 网站提出的关于人工智能未来五年发展时间线的观点进行了批判性分析。AI 2027 预测到 2027 年左右,大型语言模型(LLM)将变得如此擅长编程,以至于人类不再需要亲自编写代码,这种 LLM 将自行迭代,人类将无法再对这一过程做出有意义的贡献。然而,SE Gyges 认为 AI 2027 的预测存在诸多问题。
AI 2027 的预测基于一系列假设,而这些假设中的任何一个如果未能按预期实现,后续的预测都将变得极为不切实际。例如,AI 2027 预测到 2025 年中,AI 将像员工一样工作,能够自主完成代码修改等任务,但实际上,当前的 AI 虽然在某些情况下非常有用,但距离真正像人类员工那样自主工作还有很大差距。此外,AI 2027 对 OpenAI(文中以虚构的“OpenBrain”代替)的描述充满了对其技术优势的夸大,而对竞争对手则轻描淡写,这种描述更像是为了吸引投资而进行的宣传,而非客观的分析。
从动机角度来看,AI 2027 的主要作者是 OpenAI 的前员工,其创立的智库专注于 AI 安全,而 OpenAI 在 AI 安全和盈利方面的立场与该智库的利益高度一致。AI 2027 中对“OpenBrain”未来发展的描述,似乎是为了证明 OpenAI 当前大规模融资和忽视盈利的策略是合理的,这让人怀疑其预测是否存在利益驱动的偏见。
AI 2027 的预测还存在一些技术上的不合理之处。例如,它预测到 2026 年初,OpenAI 将通过 Agent-1-mini 实现算法进步,速度比竞争对手快 50%,但这种预测缺乏实际依据。当前的 AI 研究中,虽然模型在不断改进,但要实现如此显著的进步并非易事。同时,AI 2027 对 AI 在未来几年内将如何改变世界进行了许多大胆的预测,但这些预测往往缺乏对现实世界复杂性的考虑。
AI 2027 的预测存在一种“技术乐观主义”的倾向,即假设当前的技术趋势将线性延续到未来,而忽略了可能出现的技术瓶颈或意外情况。例如,AI 2027 预测到 2027 年,AI 将在所有任务上超越人类,但这种预测忽视了 AI 在处理复杂、长期任务时的局限性。此外,AI 2027 对 AI 的“研究品味”进行了量化预测,认为 AI 将能够像人类科学家一样决定研究方向,但这种预测过于简化了人类的创造力和直觉。
Gyges 认为 AI 2027 的预测在很大程度上是一种“自我实现的预言”,它通过构建一个看似合理的未来场景,试图影响投资者和政策制定者的决策。然而,这种预测忽略了 AI 发展过程中可能出现的多种不确定性,包括技术、经济、社会和政治等方面的因素。尽管 AI 2027 的预测可能包含一些合理的观点,但其整体的预测框架和动机让人对其可信度产生怀疑。
#AI #AGI #OpenAI
https://www.verysane.ai/p/agi-probably-not-2027
SE Gyges 对 AI 2027 网站提出的关于人工智能未来五年发展时间线的观点进行了批判性分析。AI 2027 预测到 2027 年左右,大型语言模型(LLM)将变得如此擅长编程,以至于人类不再需要亲自编写代码,这种 LLM 将自行迭代,人类将无法再对这一过程做出有意义的贡献。然而,SE Gyges 认为 AI 2027 的预测存在诸多问题。
AI 2027 的预测基于一系列假设,而这些假设中的任何一个如果未能按预期实现,后续的预测都将变得极为不切实际。例如,AI 2027 预测到 2025 年中,AI 将像员工一样工作,能够自主完成代码修改等任务,但实际上,当前的 AI 虽然在某些情况下非常有用,但距离真正像人类员工那样自主工作还有很大差距。此外,AI 2027 对 OpenAI(文中以虚构的“OpenBrain”代替)的描述充满了对其技术优势的夸大,而对竞争对手则轻描淡写,这种描述更像是为了吸引投资而进行的宣传,而非客观的分析。
从动机角度来看,AI 2027 的主要作者是 OpenAI 的前员工,其创立的智库专注于 AI 安全,而 OpenAI 在 AI 安全和盈利方面的立场与该智库的利益高度一致。AI 2027 中对“OpenBrain”未来发展的描述,似乎是为了证明 OpenAI 当前大规模融资和忽视盈利的策略是合理的,这让人怀疑其预测是否存在利益驱动的偏见。
AI 2027 的预测还存在一些技术上的不合理之处。例如,它预测到 2026 年初,OpenAI 将通过 Agent-1-mini 实现算法进步,速度比竞争对手快 50%,但这种预测缺乏实际依据。当前的 AI 研究中,虽然模型在不断改进,但要实现如此显著的进步并非易事。同时,AI 2027 对 AI 在未来几年内将如何改变世界进行了许多大胆的预测,但这些预测往往缺乏对现实世界复杂性的考虑。
AI 2027 的预测存在一种“技术乐观主义”的倾向,即假设当前的技术趋势将线性延续到未来,而忽略了可能出现的技术瓶颈或意外情况。例如,AI 2027 预测到 2027 年,AI 将在所有任务上超越人类,但这种预测忽视了 AI 在处理复杂、长期任务时的局限性。此外,AI 2027 对 AI 的“研究品味”进行了量化预测,认为 AI 将能够像人类科学家一样决定研究方向,但这种预测过于简化了人类的创造力和直觉。
Gyges 认为 AI 2027 的预测在很大程度上是一种“自我实现的预言”,它通过构建一个看似合理的未来场景,试图影响投资者和政策制定者的决策。然而,这种预测忽略了 AI 发展过程中可能出现的多种不确定性,包括技术、经济、社会和政治等方面的因素。尽管 AI 2027 的预测可能包含一些合理的观点,但其整体的预测框架和动机让人对其可信度产生怀疑。
#AI #AGI #OpenAI
https://www.verysane.ai/p/agi-probably-not-2027
www.verysane.ai
AGI: Probably Not 2027
AI 2027 is a web site that might be described as a paper, manifesto or thesis.