Meta发布Llama 4系列,推动原生多模态AI技术发展
【2025年4月】Meta正式发布Llama 4系列大模型,标志着其在原生多模态人工智能(AI)方向取得重要进展。Llama 4具备更强的图文理解与推理能力,是Meta在开源AI模型领域的又一次关键升级。
【2025年4月】Meta正式发布Llama 4系列大模型,标志着其在原生多模态人工智能(AI)方向取得重要进展。Llama 4具备更强的图文理解与推理能力,是Meta在开源AI模型领域的又一次关键升级。
原生多模态设计,提升图文融合能力
Llama 4在模型架构上原生支持多模态输入,将文本与视觉信息从训练阶段就深度融合。这使得模型在图文理解、视觉问答、跨模态推理等任务中表现更为精准、高效。
性能优化与部署便利并重
在保持模型能力提升的同时,Meta也对数据质量、模型结构和推理效率做了系统性优化。Llama 4不仅拥有更强的泛化能力,也更适合实际部署和应用。
延续开源策略,鼓励开放协作
Meta将继续坚持开源路线,向研究机构、开发者和企业提供Llama 4模型。这一策略旨在推动AI领域的合作创新,加速多模态技术在科研和产业中的应用落地。
Llama 4的发布为多模态AI模型的发展注入了新动力,也进一步明确了Meta在开源大模型生态中的方向。
👍1
ChatGPT及Grok近期均推出教育免费计划。北美及加区学生可免费使用ChatGPT Plus及SuperGrok。
OpenAI: 注册后 https://chatgpt.com/students ,认证SheerID即可领取。
Grok: 使用教育邮箱注册后即可直接在订阅界面0元订阅。
#白嫖 #OpenAI #Grok
OpenAI: 注册后 https://chatgpt.com/students ,认证SheerID即可领取。
Grok: 使用教育邮箱注册后即可直接在订阅界面0元订阅。
#白嫖 #OpenAI #Grok
OpenAI推出新一代GPT-4.1系列模型
今日,OpenAI宣布通过API推出三款全新模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这三款模型在各方面均优于GPT-4o和GPT-4o mini,特别是在代码生成和指令遵循能力上取得重大突破。这些模型还支持高达100万tokens的上下文窗口,并能更有效地利用长上下文,同时将知识截止日期更新至2024年6月。
OpenAI还宣布将开始弃用API中的GPT-4.5预览版,因为GPT-4.1在许多关键能力上提供了相同或更好的性能,同时成本和延迟更低。GPT-4.5预览将于2025年7月14日关闭,以便开发者有时间过渡。
所有三款新模型现已向所有开发者开放。
OpenAI表示,GPT-4.1是人工智能实际应用的重大进步,专注于从编码到指令遵循和长上下文理解等实际开发者需求,为构建智能系统和复杂的代理应用程序开启了新的可能性。
发布视频: https://www.youtube.com/live/kA-P9ood-cE
今日,OpenAI宣布通过API推出三款全新模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这三款模型在各方面均优于GPT-4o和GPT-4o mini,特别是在代码生成和指令遵循能力上取得重大突破。这些模型还支持高达100万tokens的上下文窗口,并能更有效地利用长上下文,同时将知识截止日期更新至2024年6月。
卓越性能亮点
编程能力
- GPT-4.1在SWE-bench基准测试中得分54.6%,比GPT-4o提高21.4%,比GPT-4.5提高26.6%,使其成为编程领域的领先模型
- 在人工评估中,80%的情况下评估者更偏好GPT-4.1生成的网站而非GPT-4o
- 在内部评估中,代码中的多余编辑从GPT-4o的9%降低到GPT-4.1的2%
指令遵循
- 在Scale的MultiChallenge基准测试中,GPT-4.1得分38.3%,比GPT-4o提高10.5%
- 在IFEval测试中,GPT-4.1得分87.4%,而GPT-4o为81.0%
- 特别擅长格式遵循、负面指令、有序指令、内容要求、排序和避免过度自信
长上下文理解
- 所有三款模型均支持100万tokens的上下文窗口
- 在Video-MME基准测试中(针对30-60分钟长视频的理解),GPT-4.1创下新纪录,得分72.0%,比GPT-4o提高6.7%
- 在全新的OpenAI-MRCR和Graphwalks评估中展现出卓越的多轮和多跳推理能力
视觉理解
- GPT-4.1 mini在图像理解基准测试中表现尤为出色,在多项测试中超越了GPT-4o
- 在MMMU、MathVista和CharXiv-Reasoning等跨模态基准测试中均有显著提升
真实场景应用案例
编程应用
- Windsurf:在内部编码基准测试中,GPT-4.1比GPT-4o高出60%,工具调用效率提高30%,不必要的编辑减少约50%
- Qodo:在200个实际GitHub拉取请求的代码审查测试中,55%的情况下GPT-4.1提供了更优质的建议
指令遵循应用
- Blue J:在最具挑战性的实际税务场景内部基准测试中,GPT-4.1的准确率比GPT-4o高53%
- Hex:在最具挑战性的SQL评估集上,GPT-4.1的表现提升近2倍,尤其是在从大型、复杂模式中选择正确表格的能力上
长上下文应用
- Thomson Reuters:在使用CoCounsel(法律工作AI助手)时,多文档审查准确率提高17%
- Carlyle:在提取多份复杂文档中的精细财务数据时,长文档检索性能提升50%,首次成功克服核心限制
定价和可用性
OpenAI通过提高推理系统效率,提供了更具竞争力的价格:
- GPT-4.1:输入$2.00/百万tokens,输出$8.00/百万tokens(比GPT-4o便宜26%)
- GPT-4.1 mini:输入$0.40/百万tokens,输出$1.60/百万tokens
- GPT-4.1 nano:输入$0.10/百万tokens,输出$0.40/百万tokens(OpenAI最便宜最快速的模型)
提示缓存折扣从之前的50%提高到75%,长上下文请求不收取额外费用。
值得注意的是,GPT-4.1将仅通过API提供。在ChatGPT中,许多指令遵循、编码和智能方面的改进已逐步整合到最新版本的GPT-4o中,并将在未来版本中继续整合更多功能。
OpenAI还宣布将开始弃用API中的GPT-4.5预览版,因为GPT-4.1在许多关键能力上提供了相同或更好的性能,同时成本和延迟更低。GPT-4.5预览将于2025年7月14日关闭,以便开发者有时间过渡。
所有三款新模型现已向所有开发者开放。
OpenAI表示,GPT-4.1是人工智能实际应用的重大进步,专注于从编码到指令遵循和长上下文理解等实际开发者需求,为构建智能系统和复杂的代理应用程序开启了新的可能性。
发布视频: https://www.youtube.com/live/kA-P9ood-cE
OpenAI发布全新推理模型o3和o4-mini,实现工具完全接入能力
2025年4月16日,OpenAI宣布推出o系列最新模型o3和o4-mini,这是该公司迄今最智能的模型。新模型实现了在ChatGPT中全面使用各种工具的能力,包括网络搜索、Python分析、视觉推理和图像生成。
从即日起,ChatGPT Plus、Pro和Team用户可使用这些新模型,Enterprise和Edu用户将在一周内获得访问权限。免费用户可通过选择"Think"试用o4-mini。这些模型也通过API向开发者开放。
这次更新融合了o系列的专业推理能力与GPT系列的自然对话能力,未来将支持更无缝的对话体验和高级问题解决能力。
2025年4月16日,OpenAI宣布推出o系列最新模型o3和o4-mini,这是该公司迄今最智能的模型。新模型实现了在ChatGPT中全面使用各种工具的能力,包括网络搜索、Python分析、视觉推理和图像生成。
o3是公司最强大的推理模型,在编程、数学、科学和视觉感知等领域表现优异。外部评估显示,o3在复杂任务中比o1减少了20%的重大错误。o4-mini则是一款针对速度和成本优化的模型,在AIME 2025测试中得分达到99.5%,并在数据科学等领域超越了前代产品。
这些模型能通过强化学习使用工具,不仅知道如何使用,还能判断何时使用。它们首次能将图像直接集成到思考过程中,可以解释白板照片、教科书图表或手绘草图。
随着能力提升,OpenAI也升级了安全措施,重建安全训练数据,增加拒绝提示,并开发系统级缓解措施标记危险提示。
OpenAI还推出了Codex CLI实验,这是一个轻量级编码代理,直接在用户计算机上运行,最大化模型的推理能力。
从即日起,ChatGPT Plus、Pro和Team用户可使用这些新模型,Enterprise和Edu用户将在一周内获得访问权限。免费用户可通过选择"Think"试用o4-mini。这些模型也通过API向开发者开放。
这次更新融合了o系列的专业推理能力与GPT系列的自然对话能力,未来将支持更无缝的对话体验和高级问题解决能力。
👍2❤1
新一代机场VPN系统 PPanel 发布 1.0 正式版并宣布全面开源
由全球多元化团队联合开发、以 Go 语言和全新架构打造的新一代机场管理面板 PPanel,近日正式发布了 1.0 稳定版本。与此同时,PPanel 同步开放了前后端源代码,欢迎全球开发者和用户进行自由审计与参与协作。
PPanel 致力于提供更加高效、灵活、面向未来的机场管理体验。其采用现代化技术栈,具备高性能、高可维护性、持续迭代等特点,由来自世界各地的开发者团队持续维护与优化,确保系统稳定、安全、符合行业前沿标准。
用户可通过以下渠道了解更多信息及参与社区讨论:
• 官方群组:https://t.me/PPanelChat
• 官方频道:https://t.me/PPanel
PPanel 的发布和开源标志着新一代机场管理系统迈出了重要一步,为行业注入了新的活力。
由全球多元化团队联合开发、以 Go 语言和全新架构打造的新一代机场管理面板 PPanel,近日正式发布了 1.0 稳定版本。与此同时,PPanel 同步开放了前后端源代码,欢迎全球开发者和用户进行自由审计与参与协作。
PPanel 致力于提供更加高效、灵活、面向未来的机场管理体验。其采用现代化技术栈,具备高性能、高可维护性、持续迭代等特点,由来自世界各地的开发者团队持续维护与优化,确保系统稳定、安全、符合行业前沿标准。
用户可通过以下渠道了解更多信息及参与社区讨论:
• 官方群组:https://t.me/PPanelChat
• 官方频道:https://t.me/PPanel
PPanel 的发布和开源标志着新一代机场管理系统迈出了重要一步,为行业注入了新的活力。
Telegram
PPanel Chat Group
本群不支持群发广告,请注意您的广告宣传方式,避免引起他人不适
Powered By @SurgeLab
English is the default language at work
Good vibes only
English:@PPanelEN
Chinese:@PPanelZH
Russian:@PPanelRU
Persian:@PPanelFA
Email:support@ppanel.dev
Web:https://ppanel.dev
Powered By @SurgeLab
English is the default language at work
Good vibes only
English:@PPanelEN
Chinese:@PPanelZH
Russian:@PPanelRU
Persian:@PPanelFA
Email:support@ppanel.dev
Web:https://ppanel.dev
👍4🔥1🙏1
内测期间 免费使用,特奉上内测券码:
neice邀请好友注册并购买套餐,
一起打造更强大的光云!
Please open Telegram to view this post
VIEW IN TELEGRAM
Qwen发布新一代大模型Qwen3:思深,行速
2025年4月29日,Qwen团队正式发布新一代大型语言模型系列——Qwen3。此次发布包括旗舰MoE模型Qwen3-235B-A22B(总参数超2350亿)和轻量版Qwen3-30B-A3B,以及六个Dense模型,全部开源并采用Apache 2.0许可。
Qwen3在代码、数学、通用推理等多个基准测试中表现优异,与DeepSeek、Grok、Gemini等顶尖模型竞争力十足。特别是小型模型Qwen3-4B,其性能已媲美前代Qwen2.5-72B模型。
核心亮点包括:
• 思考模式切换:支持深度推理或快速响应,用户可根据任务灵活控制推理预算。
• 多语言支持:覆盖119种语言与方言,进一步拓宽全球应用范围。
• 强化Agent能力:显著提升环境交互与工具调用效率,适配多种应用场景。
• 预训练升级:采用约36万亿token数据(比前代翻倍),涵盖更多学科、代码及长文本数据。
• 灵活部署:支持Hugging Face、ModelScope、Kaggle等平台,同时适配SGLang、vLLM、Ollama等开发框架。
Qwen团队表示,Qwen3标志着向通用人工智能(AGI)迈进的重要一步,未来将在数据规模、模型规模、推理深度、多模态集成等方面持续创新,致力于从训练大模型到训练智能Agent的转型。
Qwen3现已上线,用户可通过网页版或移动App体验全新能力。
该模型现已在 Hugging Face、ModelScope、DashScope 和 GitHub 开放,用户可访问 Qwen Chat 体验 Qwen3,并加入 Discord 参与讨论。
官方Blog: https://qwenlm.github.io/zh/blog/qwen3/
2025年4月29日,Qwen团队正式发布新一代大型语言模型系列——Qwen3。此次发布包括旗舰MoE模型Qwen3-235B-A22B(总参数超2350亿)和轻量版Qwen3-30B-A3B,以及六个Dense模型,全部开源并采用Apache 2.0许可。
Qwen3在代码、数学、通用推理等多个基准测试中表现优异,与DeepSeek、Grok、Gemini等顶尖模型竞争力十足。特别是小型模型Qwen3-4B,其性能已媲美前代Qwen2.5-72B模型。
核心亮点包括:
• 思考模式切换:支持深度推理或快速响应,用户可根据任务灵活控制推理预算。
• 多语言支持:覆盖119种语言与方言,进一步拓宽全球应用范围。
• 强化Agent能力:显著提升环境交互与工具调用效率,适配多种应用场景。
• 预训练升级:采用约36万亿token数据(比前代翻倍),涵盖更多学科、代码及长文本数据。
• 灵活部署:支持Hugging Face、ModelScope、Kaggle等平台,同时适配SGLang、vLLM、Ollama等开发框架。
Qwen团队表示,Qwen3标志着向通用人工智能(AGI)迈进的重要一步,未来将在数据规模、模型规模、推理深度、多模态集成等方面持续创新,致力于从训练大模型到训练智能Agent的转型。
Qwen3现已上线,用户可通过网页版或移动App体验全新能力。
该模型现已在 Hugging Face、ModelScope、DashScope 和 GitHub 开放,用户可访问 Qwen Chat 体验 Qwen3,并加入 Discord 参与讨论。
官方Blog: https://qwenlm.github.io/zh/blog/qwen3/
❤2👍1
双向机器人,全新登场。
运营神器 @EasyPM_bot 现已上线。
私聊更快,协作更酷。轻松应对每一次沟通挑战。不为双向限制困扰!
✅ 你的Bot,由你掌控。
自有 Bot设计,随时可收回控制权
🗂️ 话题分组 · 多人协作
支持转发到群,自动按用户分类话题,高峰消息,也游刃有余
☁️ SaaS 一键托管
无需运维,即刻启用。
💬 基础版永久免费
保证零广告,纯净体验。
⚙️ 商业版即将支持
客服中心接入 & 外部平台(如 Crisp,联动PPanel)
💰 收费?仅限商业版
免费版,始终清爽无打扰。
有Bug?想提建议?欢迎来群里唠嗑:
https://t.me/SurgeLabChat
(记得带上复现步骤,我们才能更快修好!)
运营神器 @EasyPM_bot 现已上线。
私聊更快,协作更酷。轻松应对每一次沟通挑战。不为双向限制困扰!
✅ 你的Bot,由你掌控。
自有 Bot设计,随时可收回控制权
🗂️ 话题分组 · 多人协作
支持转发到群,自动按用户分类话题,高峰消息,也游刃有余
☁️ SaaS 一键托管
无需运维,即刻启用。
💬 基础版永久免费
保证零广告,纯净体验。
⚙️ 商业版即将支持
客服中心接入 & 外部平台(如 Crisp,联动PPanel)
💰 收费?仅限商业版
免费版,始终清爽无打扰。
有Bug?想提建议?欢迎来群里唠嗑:
https://t.me/SurgeLabChat
(记得带上复现步骤,我们才能更快修好!)
❤1
Forwarded from 笔记本:Lin's 文字世界 : 个人见闻/B站视频/网络见闻
【无机言_nokay】阿里千问3:开发者热捧与市场冷淡的背后
阿里千问3的发布在开发者圈掀起波澜,主要得益于其贴合实际需求的特性。这套包含8个模型的组合,从235B旗舰混合专家模型到0.6B轻量移动端模型,覆盖了多种场景,尤其32B模型只需一张专业级显卡即可部署,八卡机器就能微调,极大降低了成本和门槛。更重要的是,全线模型支持商用开源协议,打破了过去大模型商用限制的壁垒。此外,模型能自主切换深度思考模式,既保证任务质量又提升效率,对智能体开发来说是个理想选择。
尽管开发者青睐有加,千问3却面临明显短板,市场反应也颇为冷淡。虽然支持119种语言和MCP协议,但缺乏类似“Agent to Agent”通信框架的突破性创新,错失了定义行业标准的机会。相较于OpenAI的数据沉淀策略、DeepSeek的理想主义路线,以及谷歌Gemini2.5 Pro的强大规划能力,千问3在通用人工智能(AGI)方向上的进展未能触及市场期待,股价毫无波动也反映了这一现实。
#千问3 #阿里AI #开发者模型 #开源AI #智能体 source
阿里千问3的发布在开发者圈掀起波澜,主要得益于其贴合实际需求的特性。这套包含8个模型的组合,从235B旗舰混合专家模型到0.6B轻量移动端模型,覆盖了多种场景,尤其32B模型只需一张专业级显卡即可部署,八卡机器就能微调,极大降低了成本和门槛。更重要的是,全线模型支持商用开源协议,打破了过去大模型商用限制的壁垒。此外,模型能自主切换深度思考模式,既保证任务质量又提升效率,对智能体开发来说是个理想选择。
尽管开发者青睐有加,千问3却面临明显短板,市场反应也颇为冷淡。虽然支持119种语言和MCP协议,但缺乏类似“Agent to Agent”通信框架的突破性创新,错失了定义行业标准的机会。相较于OpenAI的数据沉淀策略、DeepSeek的理想主义路线,以及谷歌Gemini2.5 Pro的强大规划能力,千问3在通用人工智能(AGI)方向上的进展未能触及市场期待,股价毫无波动也反映了这一现实。
#千问3 #阿里AI #开发者模型 #开源AI #智能体 source
😁1
Gemini 2.5 Pro 0506已低调更新。进一步提升编码能力。跑分可查看官方介绍网站。
https://deepmind.google/technologies/gemini/pro/
#Google #Gemini
https://deepmind.google/technologies/gemini/pro/
#Google #Gemini
Google DeepMind
Gemini 3 Pro
Our most intelligent model yet. Learn, build, and plan like never before Gemini 3 Pro’s incredible reasoning powers.
❤1😁1
AI一线|ShareCentre
ChatGPT及Grok近期均推出教育免费计划。北美及加区学生可免费使用ChatGPT Plus及SuperGrok。 OpenAI: 注册后 https://chatgpt.com/students ,认证SheerID即可领取。 Grok: 使用教育邮箱注册后即可直接在订阅界面0元订阅。 #白嫖 #OpenAI #Grok
Cursor
Students
Empowering the next generation of developers. Get Cursor Pro at a discounted rate with our student program.
▎线路
• 所有节点均采用跨境专线
• 无设备数限制,无晚高峰限速,无在线IP限制
• 流媒体及各种服务解锁Netflix ChatGPT 等
• 基本不进行任何审计,保证用户能访问所有网站
• 全天速率保证,无晚高峰限速
• 800G及以上,提供唯云专线
▎服务
• 注册免费试用三天
• 套餐按周期购买,低至18.8RMB/月,提供0.2倍专线节点
• 提供官方四端APP,并且支持市场所有主流代理软件
▎优惠
• 优惠码:95Zhe
官方频道 https://t.me/aifun_report
图中仅展示部分HK节点测速
• 所有节点均采用跨境专线
• 无设备数限制,无晚高峰限速,无在线IP限制
• 流媒体及各种服务解锁Netflix ChatGPT 等
• 基本不进行任何审计,保证用户能访问所有网站
• 全天速率保证,无晚高峰限速
• 800G及以上,提供唯云专线
▎服务
• 注册免费试用三天
• 套餐按周期购买,低至18.8RMB/月,提供0.2倍专线节点
• 提供官方四端APP,并且支持市场所有主流代理软件
▎优惠
• 优惠码:95Zhe
官方频道 https://t.me/aifun_report
注册连接 afun.la图中仅展示部分HK节点测速
❤1😁1