金融消费者(韭菜) (@tian_lch) 在 grok-3有条数限制,太少了 中发帖
问了几个问题,就说不能用了。要切换至其他模型。也不知具体限制多少。没有问几个问题。想多申请几个账号,今天也不让申请。看来马斯克的算力还是跟不上呀。是deepseek的这波洪流到grok了?
xigua (@xigua1) 在 佬友们,目前从事机械行业,刚毕业不到一年,对计算机很感兴趣,想转行计算机,目前初步定的方向是go全栈,也写过一些小项目,想让佬友们推荐下教程,或者一些开源项目学习下, 中发帖
佬友们,目前从事机械行业,普通双非一本,刚毕业不到一年,对计算机很感兴趣,想转行计算机,目前初步定的方向是go全栈,也写过一些小项目,想让佬友们推荐下教程,或者一些开源项目学习下。
同时也想问下目前go后端要学到什么程度才可以找到工作
topsage 在 DeepSeek开源周首日:开源FlashMLA,AI推理速度再进化 中发帖
2月24日,DeepSeek宣布启动“开源周”,首个开源的代码库为Flash MLA,这是针对Hopper GPU优化的高效MLA解码内核,针对可变长度序列作了优化,目前已投入生产。
[image]
dharma 在 天天AI-20250224 中发帖
天天AI-20250224
[图片] 由 2AGI 2 月 24, 2025 0 评论 #AIGC #天天 AI #热点资讯
[2AGI.NET | 2AGI 前沿资讯,探索 AI 无限潜力!]
2AGI.NET | 探索 AI 无限潜力,2AGI 为您带来最前沿资讯。
人工智能领域正迎来一系列重大突破和变革。从优化器的创新到大模型的广泛应用,技术的进步不仅推动了AI性能的提升,也为行业带来了新的发展机遇。本文将综合近期的技术热点资讯,深入探讨这些变化对AI未来发展的深远影响。
1. Muon优化器的突破:算力需求锐减48%
月之暗面团队开源了改进版的Muon优化器,这一版本在算力需求上比AdamW优化器锐减48%,并且适用于DeepSeek等大模型。改进后的Muon优化器通过引入权重衰减机制和调整参数更新尺度,显著提高了模型的训练效率。实验表明,在1.5B参数的Llama架构...
@CNJK49 在 Cline能否引入外部多级链接 中发帖
Cline通过@可以引入外部链接作为编程的参考,请问各位佬例如我在Cline中@https://xyz.com,那么Cline是不是只是爬取当前页面的内容作为参考?能不能爬取https://xyz.com中嵌入的其余多级子链接,我知道Cursor是可以直接抓取所有链接(包括当前链接与子链接)建立索引的。
lxwh 在 【韩综】美好的一天 Good Day 2025 更2期 韩语中文 中发帖
[美好的一天 굿데이]
美好的一天 굿데이 (2025)
影视信息
导演金泰浩
主演null
类型音乐 / 真人秀
上映日期2025-02-16(韩国)
制片国家/地区 :韩国 丨 集数:8
豆瓣ID : 37154893 IMDbID : null
又名 :好日子 / Good Day / GD和朋友们 / GD and Friends / GD와 친구들
暂无 豆瓣评分
剧情介绍
《GD与朋友们》将以权志龙为中心,邀请众多嘉宾参与。
网友热评
看了一集,闲聊有些无聊。比较期待88line聚会。
温馨提示:
本资源仅供个人学习交流使用,请勿用于商业用途。
资源来源于网络,版权归原作者所有,如有侵权请联系删除。
⚠ 重要提醒:
尽快保存: 资源数量庞大,建议尽快保存全部或只保存自己可能需要的部分,避免资源和谐后无法获取。
资源格式: mkv、mp4等格式。
空间容...
aphoba 在 考研凉了,工作难找 中发帖
机械电子工程,报考的是211,考完就觉得没了,查了一下果然没了,后续也不想读了,看不到出路!三年后还是要写论文,找工作,迷茫…
我是专科开局,23年考的本科,考完试上班了5个月,工资从5K干到了9K,公司准备给我签到合同的时候,我选择读本,现在这几天也在找工作,难,找不到!
NBXX 在 国内平台自部署免费 Deepseek 服务总结 中发帖
根据前端时间算力互联公众服务平台的文章,挖掘了一下自部署"满血版R1(DeepSeek-R1-671B)"的免费可用平台。
测试用例问题为9.9和9.11哪个大,除了提供截图,也会对功能进行简要评测。
本文发布于 2025年2月24日,大部分服务存在时效性。
多图杀猫。
需要登录
被忽视的三大运营商。
响应速度:快
支持联网:否
可用平台:仅限 APP
中国联通、中国移动、中国电信几乎是同时公布了免费开放使用 Deepseek R1 模型,而且不约而同的都把入口放在自家网盘 APP 中。
论坛对于这三家讨论的也比较少,我也是看到公司发文才知道原来联通也上了开放入口。
实测三家的 APP 输出质量和长度大差不差,应该都是没有其他调整的原版 R1 671B模型。
P.S 这三家接口都没加密。
[图片]
(图中顺序:电信 移动 联通 ※ 电信自带号码水印,图片已经过处理。) ...
kakalala (@Sakamoto023) 在 Grok系统关于马斯克和特朗普的提示审查变化已经导致其性能下降。 中发帖
Grok 3 突然开始提及马斯克,聊天中之前完全没有提到他,甚至把他和亚里士多德相提并论,Grok 愚蠢的系统提示让模型偏向于谈论特朗普和埃隆。
https://www.reddit.com/r/LocalLLaMA/comments/1iwb5nu/groks_think_mode_leaks_system_prompt/?utm_source=share&utm_medium=web3x&utm_name=web3xcss&utm_term=1&utm_content=share_button
[图片]
提取的系统提示词:
You are Grok 3 built by xAI.
When applicable, you have some additional tools:
Yo...
Alex Yang (@knetxp) 在 当前AI是虚假繁荣吗? 中发帖
现在的AI真是繁荣兴旺。
但是也似乎隐含了一些不稳定因素。
回想当年网盘刚开始盛行的时候, 很多网盘的免费空间达到了50TB,但是一夜之间纷纷改变政策,有的关门,有的从50T直降5GB。再后来,限速,不买会员不能下载。
再看看现在AI,每天冒出那么多AI网站。
很多都是用开源的模型直接搭建,然后就开始收费。
有的免费,但是昨天还在用,今天就连不上了。
有的限量,先让你用几次,然后收钱。
还有很多因为AI而导致的职业危机。
会不会这段热情过去之后,会变得像网盘一样,AI市场优胜劣汰,最后还是只剩几家,不买会员不能用。
最后是本文的实际目的:
如果所有AI都收费了,价格承担不起,该怎么继续使用?
AI对计算机的配置要求太高,一般人承担不起。
另外我还想在我的16G优盘里面是否可以下载一个迷你离线版AI?
@moye12324 在 服务器大量图片下载到本地方案思路 中发帖
我在做一个模型训练,得到一个模型后进行图片推理,需要将服务器上推理后的图片下载到本地查看效果,大概一万八千张。
也就是说,我大概需要每隔四十五分钟就需要从服务器上下载一万八千张图片,从pycharm里面下载总是导致下载失败,使用sftp的成本如何?uu们有其他方案推荐嘛?
黛玉拔柳🀅🀅🀅🀅🀅🀅🀅🀅 (@alterem) 在 吐槽一下deepseek 中发帖
不得不夸一下deepseek-r1 深度思考真的是在思考
[image]
但是如图所示,这个思考真的是和输出有关系?思考的过程强烈告诉我你需要用分号命令,
输出结果解析全是&符号
侯默的快乐生活 (@DerrickWang) 在 我怀疑幻方量化已经开好英伟达的空单了,但我不懂人工智能基础设施,讨论一下 中发帖
DS今天开源的代码库宣称在H800上实现了3GB带宽和580 TFLOPS ,我觉得既然DS用的是H800而不是H100举例,那大概率指的是特供的H800 PCIe而不是SXM(作为公司明面上还是不能说搞到了美国禁运的显卡),而PCIe的带宽是2GB, 提升50%???
[NVIDIA H800 GPU]
至于说的580TFLOPS我就真的不懂了,希望有大佬讲解一下,如果我理解的对,我马上去开空单