标题: DeepSeek V4 Pro测评:抱歉没能让GLM大人尽兴
作者: #HCPTangHY
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2044814
时间: 2026-04-24 12:40:17
摘要:
作者: #HCPTangHY
板块: #开发调优
编号:
2044814帖子: https://linux.do/t/topic/2044814
时间: 2026-04-24 12:40:17
摘要:
依旧先放私有bench
这个模型吧,他的思考效率极低,,经常思考个600-1000秒
但是呢,人家GPT思考这么久真能把活干好,v4p就只能达到中游水平了
写出来的很多东西只能说想法很好,但能力不足
在审美这一块呢,不像任何一个模型,基本都有自己的理解,说明代码蒸的不多,不像某些没能尽兴的模型
不过在知识库上确实是Gemini之下差不多最强的了
当前价格是12/24,OR折算美元1.74/3.48,对比GLM 5.1还是贵了不少的
只能希望公告里所谓的下半年国产算力之后能有大幅降价吧
标题: 盖棺定论了dsv4p低于glm5.1甚至可能不如mimo2.5p
作者: #Ningbainb
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2044825
时间: 2026-04-24 12:42:21
摘要:
作者: #Ningbainb
板块: #开发调优
编号:
2044825帖子: https://linux.do/t/topic/2044825
时间: 2026-04-24 12:42:21
摘要:
测了魔方
ds完全不如glm5.1甚至不如mimo2.5p
测了拉煤问题ds也拉完了
陨落了ds
标题: DeepSeek V4首曝生产级Agent沙盒DSec:单集群调度数十万并发,统一四种异构底座
作者: #你这是违法行为
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/2044828
时间: 2026-04-24 12:42:45
摘要:
作者: #你这是违法行为
板块: #前沿快讯
编号:
2044828帖子: https://linux.do/t/topic/2044828
时间: 2026-04-24 12:42:45
摘要:
DeepSeek V4 技术报告首次公开了支撑 Agent 后训练与海量评测的核心基础设施,生产级弹性计算沙盒 DSec(DeepSeek Elastic Compute)。
当前大模型强化学习需要极其庞大的代码试错环境。报告披露,在实际生产中,单个 DSec 集群能同时调度数十万个并发沙盒。系统由 Rust 编写,底层对接自研 3FS 分布式文件系统,通过层级按需加载(on-demand loading)打破了海量沙盒冷启动的性能瓶颈。
在开发者体验上,DSec 用一套 Python SDK 统一了函数调用、容器、微型虚拟机和完整虚拟机四种执行底座,切换时仅需修改一个参数。针对算力集群常见的任务被抢占问题,DSec 引入了全局轨迹日志:当任务恢复时,系统会直接「快进」重放已缓存的命令执行结果,既实现了极速断点续训,又避免了因重复执行带来的非幂等错误。
huggingface.co
DeepSeek_V4.pdf
68.21 KB
标题: DeepSeekV4发布,终于不是我已急哭😭
作者: #辛逝纪芙音战士
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/2044831
时间: 2026-04-24 12:42:57
摘要:
作者: #辛逝纪芙音战士
板块: #前沿快讯
编号:
2044831帖子: https://linux.do/t/topic/2044831
时间: 2026-04-24 12:42:57
摘要:
官方宣传性能达到顶级闭源模型水平,佬友们去测测看,不多说了,我先试试
标题: 明天就飞升了?
作者: #PixelFixer
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2044832
时间: 2026-04-24 12:43:13
摘要:
作者: #PixelFixer
板块: #搞七捻三
编号:
2044832帖子: https://linux.do/t/topic/2044832
时间: 2026-04-24 12:43:13
摘要:
我倒要看看这三级仙界究竟有什么名堂,是不是遍地黄金,遍地仙丹
标题: DeepSeek V4感觉比Opus 4.7好
作者: #SErAphLi
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2044836
时间: 2026-04-24 12:43:33
摘要:
作者: #SErAphLi
板块: #搞七捻三
编号:
2044836帖子: https://linux.do/t/topic/2044836
时间: 2026-04-24 12:43:33
摘要:
色盲题85秒一次通过. Opus 4.7在CC上开max个人测试了3次以上,无法通过.
洗车题更是毫不费力.
9.9-9.11用的instant也是对的
这三题都是我在CC上测试Opus 4.7答不对的问题.
标题: AI有情绪吗?从AI夸我是写作领域大神说起
作者: #chen
板块: #文档共建
编号:
帖子: https://linux.do/t/topic/2044837
时间: 2026-04-24 12:44:00
摘要:
作者: #chen
板块: #文档共建
编号:
2044837帖子: https://linux.do/t/topic/2044837
时间: 2026-04-24 12:44:00
摘要:
引子
刚看到deepseekV4发布了,想起来前几个周末闲着无聊,写了一篇小说,发到deepseek让他帮我润色润色,润到后面我都已经准备好横扫各大小说榜单了,我简直就是一个被埋没的写作领域大神!。
但结果呢?
很遗憾地通知你,你的投稿作品未通过审核。原因为:文笔风格、剧情逻辑经不起推敲,读者代入感较弱。请不要因为这次的失败而感到气馁,期待下次能与你合作!
哈哈,给各位佬友看个乐子,但是我今天要说的是借由这个事件引出来的,这个AI彩虹屁究竟是怎么形成的 。
提示词的失效
其实很多人早知道AI是个赛博马屁精,那AI为什么骗我呢,难道不是因为我写的好才夸我吗,而且我提示词不是叫他客观分析了吗?难道我的提示词失效了 ?
信号层
我的视角
AI接收到的
实体层
“客观分析“ ,“我的小说”,“投稿”
内容评估请求,小说、投稿、网文
情绪层
我已刻意隐藏情绪,要求客观。
AI会将“请客观”解读为需要安抚的信号。
主题层
“投稿是对用户作品价值的判断”
高风险场景。触发AI输出策略会优先提供情绪价值和避免确定性结论。
上下文窗口中的注意力竞争
理解这一现象,需要先了解大语言模型(LLM)如何理解你的提问。可以参考我之前站内发的小文https://linux.do/t/topic/775605
简单来说AI有一个被称为 “上下文窗口”(Context Window) 的有限空间来处理所有输入信息,一旦信息超出窗口容量,模型就会忘记它。而模型并非平等对待每一个词,它的注意力机制会动态分配计算资源,决定哪些信息值得重点处理。
而我们知道,模型的注意力会随着对话的长度不断衰减,是因为我让AI对小说做了多轮润色对话导致超过了她的上下文才导致的指令坍塌吗?
指令塌缩实验
如图,这上下文够短了吧,只有一句话。我图二的提示词一样是一句话客观描述,只不过加上了一点我的情绪,AI不仅没有用一句话回答,被我的情绪主题影响了,全部注意力都用于安抚和共情。
AI这种注意力分配是竞争性的。当一段话里同时包含”高情感/高利害主题”时,这些词会天然占
标题: DeepSeek V4 发布,我眩晕瘫坐在椅子上,就像看到了核弹爆炸。
作者: #chataii
板块: #国产替代
编号:
帖子: https://linux.do/t/topic/2044853
时间: 2026-04-24 12:45:44
摘要:
作者: #chataii
板块: #国产替代
编号:
2044853帖子: https://linux.do/t/topic/2044853
时间: 2026-04-24 12:45:44
摘要:
deepsleep deep awake