linux.do
14.1K subscribers
47.3K photos
51 videos
53 files
64.3K links
linux.do最新话题和热议话题
Download Telegram
:Fire:【大模型系列12】关于GPT-5,你想知道的一切【更新:ARC-AGI-2评分不敌Grok4】
LINUX DO - 热门话题 (RSS)

GPT5 基本信息
250808凌晨发布

发布会视频:https://www.youtube.com/watch?v=0Uu_VJeVVfo

官网新闻稿:https://openai.com/index/introducing-gpt-5/

官网System card:https://cdn.openai.com/pdf/8124a3ce-ab78-4f06-96eb-49ea29ffb52f/gpt5-system-card-aug7.pdf

官网会员价格:https://openai.com/zh-Hans-CN/chatgpt/pricing/

官网API价格1:https://openai.com/zh-Hans-CN/api/pricing/

官网API价格2:https://platform.openai.com/docs/pricing

官网编程案例:GitHub - openai/gpt-5-coding-examples: GPT-5 coding examples

GPT-5与以前模型不一样,GPT-就是个统一入口(路由),来自动判断问题应该转发到哪个模型,下图来自官方新闻稿翻译

个人想法:这虽然对小白用户方便,减少选择焦虑。但对专业用户,你搞不清你现在到底在用哪个模型,GPT-5的表现也可能因为转发模型不同,而不稳定



评分
官方自评







幻觉率明显下降
正在处理:微信图片_2025-08-08_020355_121.png...



长上下文性能保持率显著提升



Humanity’s Last Exam



LMArena
综合



中文



编程



来源:https://lmarena.ai/leaderboard/

Artificial Analysis评分



ARC-AGI-2评分 250808 04:41更新



来源:ARC Prize - Leaderboard

Aider编程评分 截止到250808 01:50暂未上线
来源:Aider LLM Leaderboards | aider

LiveBench评分...

View original post
:Fire:【大模型系列12】关于GPT-5,你想知道的一切【更新:ARC-AGI-2评分不敌Grok4】
LINUX DO - 热门话题 (RSS)

GPT5 基本信息
250808凌晨发布

发布会视频:https://www.youtube.com/watch?v=0Uu_VJeVVfo

官网新闻稿:https://openai.com/index/introducing-gpt-5/

官网System card:https://cdn.openai.com/pdf/8124a3ce-ab78-4f06-96eb-49ea29ffb52f/gpt5-system-card-aug7.pdf

官网会员价格:https://openai.com/zh-Hans-CN/chatgpt/pricing/

官网API价格1:https://openai.com/zh-Hans-CN/api/pricing/

官网API价格2:https://platform.openai.com/docs/pricing

官网编程案例:GitHub - openai/gpt-5-coding-examples: GPT-5 coding examples

GPT-5与以前模型不一样,GPT-就是个统一入口(路由),来自动判断问题应该转发到哪个模型,下图来自官方新闻稿翻译

个人想法:这虽然对小白用户方便,减少选择焦虑。但对专业用户,你搞不清你现在到底在用哪个模型,GPT-5的表现也可能因为转发模型不同,而不稳定



评分
官方自评







幻觉率明显下降
正在处理:微信图片_2025-08-08_020355_121.png...



长上下文性能保持率显著提升



Humanity’s Last Exam



LMArena
综合



中文



编程



来源:https://lmarena.ai/leaderboard/

Artificial Analysis评分



ARC-AGI-2评分 250808 04:41更新



来源:ARC Prize - Leaderboard

Aider编程评分 截止到250808 01:50暂未上线
来源:Aider LLM Leaderboards | aider

LiveBench评分...

View original post