变色龙 (@bianselong) 在 通义千问Qwen3系列AI模型正式发布 继续采用开源模式引领AI开源社区发展 中发帖
2025 年 4 月 29 日,阿里巴巴人工智能团队通义千问推出最新的开源大型语言模型系列:Qwen3。根据通义千问团队的介绍,该模型在架构、训练数据、推理效率、多模态能力等多方面实现显著提升,为学术研究、产业应用和开源社区注入新活力。
通义千问团队提供的权重包括旗舰版 Qwen3-235B-A22B,该模型在编程、数学和通用能力等基准测试中,与 DeepSeek-R1、GPT-o1、GPT-o3-mini、Grok-3 和 Gemini-2.5-Pro 相比取得极具竞争力的优势。
而 Qwen3 的小型 MoE 架构模型 Qwen3-30B-A3B 激活参数量是 QwQ-32B 的 10 倍,得益于混合专家模式,即便是 Qwen3-4B 这类微型模型,其性能也可以与 Qwen2.5-72B-Instruct 相媲美。 通义千问Qwen3系列AI模型正式发布 继续采用开源模式引领AI开...
ZinGer_KyoN 在 关于Qwen3我有一个猜想, 不一定对 中发帖
235B-A22B可能是临发布才赶鸭子上架的, 或者说是被逼得至少要有一个分数上接近SOTA的模型面子上才过的去, 32B/14B这些小模型才是他们花精力认真调的, 在这种小参数下有明显提升
ysaww 在 关于如何屏蔽手机中的各种营销号、垃圾内容 中发帖
父母在用智能手机的时候,各种的垃圾广告、营销视频、推送接踵而来,父母使用这种智能手机没有分辨能力,使用过程中很容易上当受骗,不知道有没有一些工具能够减少这一类信息
banlan 在 claw-SG这两天波动频繁 中发帖
[QQ截图20250429115634]
之前在SG区域部署的阅后即焚,放到uptimerobot监控的,昨晚一直给我发邮件,up and down 🤣
昨晚在另一个号部署了owu试试,看着部署成功了,但是不能访问,过了几个小时再看,部署的应用那里是空的 🤣,重新部署了还是不能访问,就算了
York Ji 在 真白菜价!硅基流动 DeepSeek 系列模型价格直降50% 中发帖
即日起至 5 月 10 日 23:59:59,为期两周的“迎五一 · 大放‘价’”狂欢活动正式开启:硅基流动 SiliconCloud 平台的实时推理 DeepSeek-R1 & V3 (Pro)直降 50%;批量推理 DeepSeek-R1 & V3 直降 50%,V3 低至输入 0.5 元/百万 Tokens,输出 2 元/百万 Tokens,R1 低至输入 1 元/百万 Tokens,输出 4 元/百万 Tokens。请纵情享用,敦促 DeepSeek 在假期为人类努力工作。
[6113b7c12b96649dcaef8917546bb93c]
这下真的白菜价了, 不会是在给 V4 & R2 模型做铺垫吧
tomm 在 【2026考研】西医综合全程班 中发帖
总计: 📁 170 个文件夹, 📄 1630 个文件
📂 05.【2026考研】西医综合
└── 📂 渠道一
└── 📂 2026考研西综全程班
├── 📂 2026年启航西综全程班
│ ├── 📂 01.2026年择校择专业指导
│ │ ├── 📂 01.择校方法指导
│ │ │ └── 🎬 01.择专择校.mp4
│ │ ├── 📂 02.考研常识精讲
│ │ │ ├── 🎬 01.科普-国家线是啥.mp4
│ │ │ ├── 🎬 02.科普-公共课专业课都考啥.mp4
│ │ │ ├── 🎬 03.科普-联合培养研究生是啥?.mp4
│ │ │ ├── ...
踩美帝 (@caimeidi) 在 五一回老家同事想蹭车顺路捎一段路,大家有遇到这种情况吗?该怎么办? 中发帖
背景描述
五一和女朋友回老家,自驾一辆车,有个同部门但是关系一般的同事主动提出要搭顺风车,该同事和我是一个省但不同市,平时没说过几句话,基本上都是工作往来,职级比我高一些
我的纠结
要是拒绝同事的要求的话,怕日后工作上会被穿小鞋
我和女朋友再加上这个同事三个人在车上,要度过差不多6个多小时,很尴尬
女朋友也不太同意载同事,不认识+社恐
解决方法
大家有遇到类似的问题吗?要怎么委婉拒绝呢?
@loveless21 在 Google支付卡更新失败,陷入死循环了 中发帖
之前一直在Play商店绑定了招行的双币信用卡,最近快到期了(7月),所以申请了续卡。
新卡到了之后,不管是在旧卡上修改有效日期及安全码(提示交易被拒,付款方式无效),还是添加新卡(提示卡号无效或此卡未被接受),有佬友遇到过相同问题吗?
问过招行及Google客服,双方都说没查到任何问题。招行说建议移除旧卡后,再重新添加;但是因为有订阅服务,移除后就得退掉订阅(Google One 2T),优惠就没了。。。
wang Yan 在 小道消息:黄仁勋计划剥离中国业务(不保证准确性) 中发帖
受美国出口管制政策等影响,NVIDIA在中国市场的业务面临诸多不确定性,有报道称其计划剥离在中国的GPU业务。
媒体:英伟达CEO计划本月前往中国大陆 - 2023年6月1日, 俄罗斯卫星通讯社NVIDIA在中国市场有着举足轻重的地位。过去多年,NVIDIA不仅在AI领域,在汽车和消费级图形等应用领域也占据主导。中国是其重要市场之一,曾占其收入的五分之一左右。
然而,美国政策的不断变化让NVIDIA在中国的业务举步维艰。每次NVIDIA为遵守法规调整业务后,计划总会在一段时间后被推翻,如面向中国的AI GPU产品就深受其害。 为应对这一局面,NVIDIA似乎计划采取业务剥离的方式。
据《电子时报》报道,NVIDIA打算在中国作为独立公司运营,通过与中国国内公司建立合资企业来实现业务分拆。分拆后,NVIDIA将作为独立实体运作,首先可能从CUDA生态系统入手,以防止中国国内AI科技巨头...
@Amel 在 出一个 GCP300,剩余 300 刀 中发帖
非虚拟卡料卡,实体自己的港卡开通,账号是三四年的老号过了二验,转移结算帐号出 100 剩余300刀88天
50原邮的都是新号万人料卡或者虚拟卡,别说我没通网了…
chevecp 在 求医学知识库 中发帖
[image]
求医学相关的知识库,感觉这种东西放到一个知识库用来指导自己的一些身体的判断很好用,现在用的是之前佬发的默沙东诊疗手册,想问问站里的佬还有没有其他的相关的知识库
@CNJK49 在 Qwen3参数量是不是太小了? 中发帖
Qwen 3开源版本只有200B参数,激活20B;
这个参数量规模,无论是对比deepseek,还是chatgpt、gemini、claude、grok,都是不值得看的;
这么小的参数量,会不会严重影响模型能力,毕竟即使你的训练策略再改进,根本上你的模型规模不够,模型拟合的能力肯定是达不到的,训练策略只是锦上添花。
小模型在处理复杂任务、复杂理解、更多的上下文关联方面,感觉都是不行的。