AI一线｜ShareCentre

Meta发布Llama 4系列，推动原生多模态AI技术发展

【2025年4月】Meta正式发布Llama 4系列大模型，标志着其在原生多模态人工智能（AI）方向取得重要进展。Llama 4具备更强的图文理解与推理能力，是Meta在开源AI模型领域的又一次关键升级。

原生多模态设计，提升图文融合能力

Llama 4在模型架构上原生支持多模态输入，将文本与视觉信息从训练阶段就深度融合。这使得模型在图文理解、视觉问答、跨模态推理等任务中表现更为精准、高效。

性能优化与部署便利并重

在保持模型能力提升的同时，Meta也对数据质量、模型结构和推理效率做了系统性优化。Llama 4不仅拥有更强的泛化能力，也更适合实际部署和应用。

延续开源策略，鼓励开放协作

Meta将继续坚持开源路线，向研究机构、开发者和企业提供Llama 4模型。这一策略旨在推动AI领域的合作创新，加速多模态技术在科研和产业中的应用落地。

Llama 4的发布为多模态AI模型的发展注入了新动力，也进一步明确了Meta在开源大模型生态中的方向。

👍1

5.01K views14:25

AI一线｜ShareCentre

ChatGPT及Grok近期均推出教育免费计划。北美及加区学生可免费使用ChatGPT Plus及SuperGrok。

OpenAI: 注册后 https://chatgpt.com/students ，认证SheerID即可领取。
Grok: 使用教育邮箱注册后即可直接在订阅界面0元订阅。

#白嫖 #OpenAI #Grok

4.54K views11:59

AI一线｜ShareCentre

Forwarded from 𝚂𝚙𝚎𝚎𝚍𝙲𝚎𝚗𝚝𝚛𝚎 (小的胖可莉)

Github已主动屏蔽中国大陆IP访问。 #快讯

3.48K views06:42

AI一线｜ShareCentre

OpenAI推出新一代GPT-4.1系列模型

今日，OpenAI宣布通过API推出三款全新模型：GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这三款模型在各方面均优于GPT-4o和GPT-4o mini，特别是在代码生成和指令遵循能力上取得重大突破。这些模型还支持高达100万tokens的上下文窗口，并能更有效地利用长上下文，同时将知识截止日期更新至2024年6月。

卓越性能亮点

编程能力
- GPT-4.1在SWE-bench基准测试中得分54.6%，比GPT-4o提高21.4%，比GPT-4.5提高26.6%，使其成为编程领域的领先模型
- 在人工评估中，80%的情况下评估者更偏好GPT-4.1生成的网站而非GPT-4o
- 在内部评估中，代码中的多余编辑从GPT-4o的9%降低到GPT-4.1的2%

指令遵循
- 在Scale的MultiChallenge基准测试中，GPT-4.1得分38.3%，比GPT-4o提高10.5%
- 在IFEval测试中，GPT-4.1得分87.4%，而GPT-4o为81.0%
- 特别擅长格式遵循、负面指令、有序指令、内容要求、排序和避免过度自信

长上下文理解
- 所有三款模型均支持100万tokens的上下文窗口
- 在Video-MME基准测试中（针对30-60分钟长视频的理解），GPT-4.1创下新纪录，得分72.0%，比GPT-4o提高6.7%
- 在全新的OpenAI-MRCR和Graphwalks评估中展现出卓越的多轮和多跳推理能力

视觉理解
- GPT-4.1 mini在图像理解基准测试中表现尤为出色，在多项测试中超越了GPT-4o
- 在MMMU、MathVista和CharXiv-Reasoning等跨模态基准测试中均有显著提升

真实场景应用案例

编程应用
- Windsurf：在内部编码基准测试中，GPT-4.1比GPT-4o高出60%，工具调用效率提高30%，不必要的编辑减少约50%
- Qodo：在200个实际GitHub拉取请求的代码审查测试中，55%的情况下GPT-4.1提供了更优质的建议

指令遵循应用
- Blue J：在最具挑战性的实际税务场景内部基准测试中，GPT-4.1的准确率比GPT-4o高53%
- Hex：在最具挑战性的SQL评估集上，GPT-4.1的表现提升近2倍，尤其是在从大型、复杂模式中选择正确表格的能力上

长上下文应用
- Thomson Reuters：在使用CoCounsel（法律工作AI助手）时，多文档审查准确率提高17%
- Carlyle：在提取多份复杂文档中的精细财务数据时，长文档检索性能提升50%，首次成功克服核心限制

定价和可用性

OpenAI通过提高推理系统效率，提供了更具竞争力的价格：
- GPT-4.1：输入$2.00/百万tokens，输出$8.00/百万tokens（比GPT-4o便宜26%）
- GPT-4.1 mini：输入$0.40/百万tokens，输出$1.60/百万tokens
- GPT-4.1 nano：输入$0.10/百万tokens，输出$0.40/百万tokens（OpenAI最便宜最快速的模型）

提示缓存折扣从之前的50%提高到75%，长上下文请求不收取额外费用。

值得注意的是，GPT-4.1将仅通过API提供。在ChatGPT中，许多指令遵循、编码和智能方面的改进已逐步整合到最新版本的GPT-4o中，并将在未来版本中继续整合更多功能。

OpenAI还宣布将开始弃用API中的GPT-4.5预览版，因为GPT-4.1在许多关键能力上提供了相同或更好的性能，同时成本和延迟更低。GPT-4.5预览将于2025年7月14日关闭，以便开发者有时间过渡。

所有三款新模型现已向所有开发者开放。

OpenAI表示，GPT-4.1是人工智能实际应用的重大进步，专注于从编码到指令遵循和长上下文理解等实际开发者需求，为构建智能系统和复杂的代理应用程序开启了新的可能性。

发布视频: https://www.youtube.com/live/kA-P9ood-cE

8.89K viewsedited 17:31

AI一线｜ShareCentre

OpenAI发布全新推理模型o3和o4-mini，实现工具完全接入能力

2025年4月16日，OpenAI宣布推出o系列最新模型o3和o4-mini，这是该公司迄今最智能的模型。新模型实现了在ChatGPT中全面使用各种工具的能力，包括网络搜索、Python分析、视觉推理和图像生成。

o3是公司最强大的推理模型，在编程、数学、科学和视觉感知等领域表现优异。外部评估显示，o3在复杂任务中比o1减少了20%的重大错误。o4-mini则是一款针对速度和成本优化的模型，在AIME 2025测试中得分达到99.5%，并在数据科学等领域超越了前代产品。

这些模型能通过强化学习使用工具，不仅知道如何使用，还能判断何时使用。它们首次能将图像直接集成到思考过程中，可以解释白板照片、教科书图表或手绘草图。

随着能力提升，OpenAI也升级了安全措施，重建安全训练数据，增加拒绝提示，并开发系统级缓解措施标记危险提示。

OpenAI还推出了Codex CLI实验，这是一个轻量级编码代理，直接在用户计算机上运行，最大化模型的推理能力。

从即日起，ChatGPT Plus、Pro和Team用户可使用这些新模型，Enterprise和Edu用户将在一周内获得访问权限。免费用户可通过选择"Think"试用o4-mini。这些模型也通过API向开发者开放。

这次更新融合了o系列的专业推理能力与GPT系列的自然对话能力，未来将支持更无缝的对话体验和高级问题解决能力。

👍2❤1

4.57K views17:34

AI一线｜ShareCentre

新一代机场VPN系统 PPanel 发布 1.0 正式版并宣布全面开源

由全球多元化团队联合开发、以 Go 语言和全新架构打造的新一代机场管理面板 PPanel，近日正式发布了 1.0 稳定版本。与此同时，PPanel 同步开放了前后端源代码，欢迎全球开发者和用户进行自由审计与参与协作。

PPanel 致力于提供更加高效、灵活、面向未来的机场管理体验。其采用现代化技术栈，具备高性能、高可维护性、持续迭代等特点，由来自世界各地的开发者团队持续维护与优化，确保系统稳定、安全、符合行业前沿标准。

用户可通过以下渠道了解更多信息及参与社区讨论：
• 官方群组：https://t.me/PPanelChat

• 官方频道：https://t.me/PPanel

PPanel 的发布和开源标志着新一代机场管理系统迈出了重要一步，为行业注入了新的活力。

PPanel Chat Group

本群不支持群发广告，请注意您的广告宣传方式，避免引起他人不适
Powered By @SurgeLab
English is the default language at work
Good vibes only
English:@PPanelEN
Chinese:@PPanelZH
Russian:@PPanelRU
Persian:@PPanelFA
Email:support@ppanel.dev
Web:https://ppanel.dev

👍4🔥1🙏1

3.45K views11:31

AI一线｜ShareCentre

🌟

光云内测邀请函

🌟

📍 官网： https://guang-cloud.com
💬 官方群组：@guang_cloud

🚀

光云正式开启内测啦！
内测期间 免费使用，特奉上内测券码：

🎟️

neice

👉 可 全额抵扣敏捷小组月度套餐！

🗓️ 限时邀请机制开启！（即日起至 5月5日 24:00）
邀请好友注册并购买套餐，

💰

返利100%（限消费金额，不可提现）！

🛠️ 欢迎大家积极使用并反馈建议～
一起打造更强大的光云！🌈

Please open Telegram to view this post

VIEW IN TELEGRAM

3.3K views07:29

AI一线｜ShareCentre

关注Qwen的朋友们可以先不要睡，Qwen 3已经呼之欲出🥰

2.74K viewsedited 15:59

AI一线｜ShareCentre

关注Qwen的朋友们可以先不要睡，Qwen 3已经呼之欲出🥰

魔搭已上线
https://modelscope.cn/collections/Qwen3-9743180bdc6b48

modelscope.cn

Qwen3

通义千问3系列

2.62K viewsedited 16:23

AI一线｜ShareCentre

Qwen发布新一代大模型Qwen3：思深，行速

2025年4月29日，Qwen团队正式发布新一代大型语言模型系列——Qwen3。此次发布包括旗舰MoE模型Qwen3-235B-A22B（总参数超2350亿）和轻量版Qwen3-30B-A3B，以及六个Dense模型，全部开源并采用Apache 2.0许可。

Qwen3在代码、数学、通用推理等多个基准测试中表现优异，与DeepSeek、Grok、Gemini等顶尖模型竞争力十足。特别是小型模型Qwen3-4B，其性能已媲美前代Qwen2.5-72B模型。

核心亮点包括：
• 思考模式切换：支持深度推理或快速响应，用户可根据任务灵活控制推理预算。
• 多语言支持：覆盖119种语言与方言，进一步拓宽全球应用范围。
• 强化Agent能力：显著提升环境交互与工具调用效率，适配多种应用场景。
• 预训练升级：采用约36万亿token数据（比前代翻倍），涵盖更多学科、代码及长文本数据。
• 灵活部署：支持Hugging Face、ModelScope、Kaggle等平台，同时适配SGLang、vLLM、Ollama等开发框架。

Qwen团队表示，Qwen3标志着向通用人工智能（AGI）迈进的重要一步，未来将在数据规模、模型规模、推理深度、多模态集成等方面持续创新，致力于从训练大模型到训练智能Agent的转型。

Qwen3现已上线，用户可通过网页版或移动App体验全新能力。

该模型现已在 Hugging Face、ModelScope、DashScope 和 GitHub 开放，用户可访问 Qwen Chat 体验 Qwen3，并加入 Discord 参与讨论。

官方Blog: https://qwenlm.github.io/zh/blog/qwen3/

❤2👍1

6.94K views01:20

AI一线｜ShareCentre

双向机器人，全新登场。
运营神器 @EasyPM_bot 现已上线。

私聊更快，协作更酷。轻松应对每一次沟通挑战。不为双向限制困扰！

✅ 你的Bot，由你掌控。
自有 Bot设计，随时可收回控制权

🗂️ 话题分组 · 多人协作
支持转发到群，自动按用户分类话题，高峰消息，也游刃有余

☁️ SaaS 一键托管
无需运维，即刻启用。

💬 基础版永久免费
保证零广告，纯净体验。

⚙️ 商业版即将支持
客服中心接入 & 外部平台（如 Crisp，联动PPanel）

💰 收费？仅限商业版
免费版，始终清爽无打扰。

有Bug？想提建议？欢迎来群里唠嗑：
https://t.me/SurgeLabChat
（记得带上复现步骤，我们才能更快修好！）

❤1

3.52K viewsedited 16:30

AI一线｜ShareCentre

网传grok3.5正在灰度了，有人测试到了吗🙃

2.63K views03:45

AI一线｜ShareCentre

Forwarded from 笔记本：Lin's 文字世界 : 个人见闻/B站视频/网络见闻

【无机言_nokay】阿里千问3：开发者热捧与市场冷淡的背后

阿里千问3的发布在开发者圈掀起波澜，主要得益于其贴合实际需求的特性。这套包含8个模型的组合，从235B旗舰混合专家模型到0.6B轻量移动端模型，覆盖了多种场景，尤其32B模型只需一张专业级显卡即可部署，八卡机器就能微调，极大降低了成本和门槛。更重要的是，全线模型支持商用开源协议，打破了过去大模型商用限制的壁垒。此外，模型能自主切换深度思考模式，既保证任务质量又提升效率，对智能体开发来说是个理想选择。

尽管开发者青睐有加，千问3却面临明显短板，市场反应也颇为冷淡。虽然支持119种语言和MCP协议，但缺乏类似“Agent to Agent”通信框架的突破性创新，错失了定义行业标准的机会。相较于OpenAI的数据沉淀策略、DeepSeek的理想主义路线，以及谷歌Gemini2.5 Pro的强大规划能力，千问3在通用人工智能（AGI）方向上的进展未能触及市场期待，股价毫无波动也反映了这一现实。

#千问3 #阿里AI #开发者模型 #开源AI #智能体 source

😁1

2.55K views13:40

AI一线｜ShareCentre

Gemini 2.5 Pro 0506已低调更新。进一步提升编码能力。跑分可查看官方介绍网站。

https://deepmind.google/technologies/gemini/pro/
#Google #Gemini

Google DeepMind

Gemini 3 Pro

Our most intelligent model yet. Learn, build, and plan like never before Gemini 3 Pro’s incredible reasoning powers.

❤1😁1

2.67K viewsedited 16:14

AI一线｜ShareCentre

ChatGPT及Grok近期均推出教育免费计划。北美及加区学生可免费使用ChatGPT Plus及SuperGrok。 OpenAI: 注册后 https://chatgpt.com/students ，认证SheerID即可领取。 Grok: 使用教育邮箱注册后即可直接在订阅界面0元订阅。 #白嫖 #OpenAI #Grok

Cursor对非中国大陆学生提供一年免费试用。

领取地址: cursor.com/students

Cursor

Students

Empowering the next generation of developers. Get Cursor Pro at a discounted rate with our student program.

2.65K viewsedited 06:36

AI一线｜ShareCentre

▎线路
• 所有节点均采用跨境专线
• 无设备数限制,无晚高峰限速，无在线IP限制
• 流媒体及各种服务解锁Netflix ChatGPT 等
• 基本不进行任何审计，保证用户能访问所有网站
• 全天速率保证，无晚高峰限速
• 800G及以上，提供唯云专线

▎服务
• 注册免费试用三天
• 套餐按周期购买，低至18.8RMB/月，提供0.2倍专线节点
• 提供官方四端APP，并且支持市场所有主流代理软件

▎优惠
• 优惠码：95Zhe

官方频道 https://t.me/aifun_report

注册连接 afun.la

图中仅展示部分HK节点测速

❤1😁1

3.34K views07:14

About

Blog

Apps

Platform