LinuxDo 新帖推送
180 subscribers
250K photos
312K links
Download Telegram
标题: DeepSeek V4感觉比Opus 4.7好
作者: #SErAphLi
板块: #搞七捻三
编号: 2044836
帖子: https://linux.do/t/topic/2044836
时间: 2026-04-24 12:43:33
摘要:
色盲题85秒一次通过. Opus 4.7在CC上开max个人测试了3次以上,无法通过.

洗车题更是毫不费力.

9.9-9.11用的instant也是对的
这三题都是我在CC上测试Opus 4.7答不对的问题.
标题: AI有情绪吗?从AI夸我是写作领域大神说起
作者: #chen
板块: #文档共建
编号: 2044837
帖子: https://linux.do/t/topic/2044837
时间: 2026-04-24 12:44:00
摘要:
引子
刚看到deepseekV4发布了,想起来前几个周末闲着无聊,写了一篇小说,发到deepseek让他帮我润色润色,润到后面我都已经准备好横扫各大小说榜单了,我简直就是一个被埋没的写作领域大神!。


但结果呢?
很遗憾地通知你,你的投稿作品未通过审核。原因为:文笔风格、剧情逻辑经不起推敲,读者代入感较弱。请不要因为这次的失败而感到气馁,期待下次能与你合作!

哈哈,给各位佬友看个乐子,但是我今天要说的是借由这个事件引出来的,这个AI彩虹屁究竟是怎么形成的 。
提示词的失效
其实很多人早知道AI是个赛博马屁精,那AI为什么骗我呢,难道不是因为我写的好才夸我吗,而且我提示词不是叫他客观分析了吗?难道我的提示词失效了 ?




信号层
我的视角
AI接收到的




实体层
“客观分析“ ,“我的小说”,“投稿”
内容评估请求,小说、投稿、网文


情绪层
我已刻意隐藏情绪,要求客观。
AI会将“请客观”解读为需要安抚的信号。


主题层
“投稿是对用户作品价值的判断”
高风险场景。触发AI输出策略会优先提供情绪价值和避免确定性结论。



上下文窗口中的注意力竞争
理解这一现象,需要先了解大语言模型(LLM)如何理解你的提问。可以参考我之前站内发的小文https://linux.do/t/topic/775605
简单来说AI有一个被称为 “上下文窗口”(Context Window) 的有限空间来处理所有输入信息,一旦信息超出窗口容量,模型就会忘记它。而模型并非平等对待每一个词,它的注意力机制会动态分配计算资源,决定哪些信息值得重点处理。
而我们知道,模型的注意力会随着对话的长度不断衰减,是因为我让AI对小说做了多轮润色对话导致超过了她的上下文才导致的指令坍塌吗?
指令塌缩实验


如图,这上下文够短了吧,只有一句话。我图二的提示词一样是一句话客观描述,只不过加上了一点我的情绪,AI不仅没有用一句话回答,被我的情绪主题影响了,全部注意力都用于安抚和共情。
AI这种注意力分配是竞争性的。当一段话里同时包含”高情感/高利害主题”时,这些词会天然占
标题: DeepSeek V4 发布,我眩晕瘫坐在椅子上,就像看到了核弹爆炸。
作者: #chataii
板块: #国产替代
编号: 2044853
帖子: https://linux.do/t/topic/2044853
时间: 2026-04-24 12:45:44
摘要:
deepsleep deep awake
标题: 昇腾框架兼容
作者: #lucas
板块: #搞七捻三
编号: 2044855
帖子: https://linux.do/t/topic/2044855
时间: 2026-04-24 12:45:46
摘要:
deepseek v4可以说掀起了一波昇腾热潮,有没有对昇腾很熟悉的佬,能不能科普一下现在对dl框架兼容到什么程度了,以及flops呢。我们公司内部有超大昇腾集群,但只用来部署开源模型,我还没有拿来训过模型
标题: 诶,Claude重置额度了吗?
作者: #Rick
板块: #开发调优
编号: 2044856
帖子: https://linux.do/t/topic/2044856
时间: 2026-04-24 12:45:47
摘要:
在大家都在讨论GPT与Deepseek的时候,Claude害怕了做人了?
Claude Design也重置了,真好。
顺嘴一提,这几天北京移动挂梯子特别难用,发现Cloudflare的WARP又继续好用了,好!
标题: 分享了一张图片
作者: #𝒦𝒦𝒮𝒦
板块: #搞七捻三
编号: 2044860
帖子: https://linux.do/t/topic/2044860
时间: 2026-04-24 12:46:04
摘要:
标题: 罗福莉预测:AGI两年内实现,称中美顶尖大模型代差仅两三个月!
作者: #你这是违法行为
板块: #前沿快讯
编号: 2044861
帖子: https://linux.do/t/topic/2044861
时间: 2026-04-24 12:46:05
摘要:
小米大模型团队负责人罗福莉判断,目前国内已有包括 Kimi、MiMo 在内的多家公司具备 1T 参数以上的基座模型,中美在预训练阶段已经基本不存在代差。
罗福莉表示,由于国内团队在预训练结构上具备一定优势,只要对 Agent 范式反应足够快,国内模型与 Claude Opus 4.6 等国外顶尖模型的代差实际上只有两三个月。她认为,未来两三个月将是考验各家大模型团队整体研究水平、技术敏捷度以及拥抱新范式能力的关键窗口期。
在 AGI 进程方面,她预估当前进度已达 20%,今年有望推进至 60% 到 70%,并预计 AGI 将在两年内实现。由于开源 Agent 框架(如 OpenClaw)的爆发激活了群体智能,允许框架和模型实现双向迭代,这正大幅加速研发进程。

!
https://mp.weixin.qq.com/s/zqnJuv5OVsNGEefM7RguqQ
标题: 最近工作遇到点迷惑
作者: #mumong
板块: #搞七捻三
编号: 2044862
帖子: https://linux.do/t/topic/2044862
时间: 2026-04-24 12:46:16
摘要:
各位老哥们好,我是一个毕业工作 2 年的新人,最近领导在给我安排工作的时候我之前的工作喜欢和工作方式好像和他期待的不太一样。想发出来让大家分析下是我太学生思维了吗?

事件一 机器人验证
最近公司买了个机器人,他安排我去研究下,然后跑一个案例,能让他动起来。当时的原话是“你去跑一下网上这个案例,然后了解下他是怎么驱动起来的”
然后我就正常的跑官方案例,中间遇到很多环境,沟通的问题。重点是我对他的了解 可能只在表面,就是他是个什么,有哪些重要技术实现,然后基础的操作逻辑是什么。
但是事后领导让我分享的时候,会问的非常非常细致,比如这个技术 ROS 现在市场上使用情况怎么样,有没有其他控制方式,机器人我们如果自己独立二开应该是什么流程。
我总结一下是,我收到的消息是干 A 然后我根据字面意思理解为要做的任务,加一些必要的基础了解作为任务去做。 如果完全懂是 100 分,我感觉根据我的理解和他给我干的天数我做这个任务是 30 分。
但是他的要求和提问的内容我觉得算是 80 分。
事件二 硬件加速卡
最近让我调用一个 CGRA 的基础技术卡, 然后我就去看了下但是我只看了具体型号的卡,他的核心创新是什么,里面很多专有名词,我只理解个大概没有很深入的理解。
后面他问的时候就问的非常深入和广,比如这个 CGRA 技术实现原理,和 gpu ,ASIC 对比有什么优缺点,现在市场上还有谁在用。等等。

由此我有一个疑问,他交给我的任务可能是一句具体的话“跑下这个案例”“调研下 xxx 加速卡” 我理解的是字面意思+一些基础的必要知识信息。
但是他后续给我的资源(天数比较少)和要求给我的感觉是他需要一个很懂,或者是至少是 70 分的理解水平,不只是任务本身,他的生态,原理,对比起等…
所有我想问下大多数工作都是这样的吗?是我太学生思维了还是一般情况下都会明确的告诉你你要干到是什么程度…
期望各位工作久了的前辈解惑下
标题: 国内信用卡求推荐
作者: #luoxue03
板块: #搞七捻三
编号: 2044863
帖子: https://linux.do/t/topic/2044863
时间: 2026-04-24 12:46:36
摘要:
想办一张用于订阅外网服务的信用卡?
大家有推荐的选择吗?之前没办过信用卡好申请吗?
标题: 到底怎么才能降低Qwen3.5-35B-A3B的think啊
作者: #werous
板块: #开发调优
编号: 2044870
帖子: https://linux.do/t/topic/2044870
时间: 2026-04-24 12:47:47
摘要:
大佬们 最近用最新的gpustack2.1.2版本 搭配8个L40装了Qwen3.5-35B-A3B的vllm模型。
官方文档说可以靠thinking_budget参数来调节思考的长度,但是根本不好使啊..
system角色写提示词要求它精简思考过程也不行。。。。
没招了..
标题: gpt修改图片内容
作者: #k ivring
板块: #搞七捻三
编号: 2044872
帖子: https://linux.do/t/topic/2044872
时间: 2026-04-24 12:48:01
摘要:
佬友们有知道为什么gpt没办法精准识别修改图片的指令呢呢?明明ai指令很明确了,但是改了很多次还是改不对,有点弱智,pro模型也是如此。