LinuxDo 新帖推送
184 subscribers
253K photos
316K links
Download Telegram
标题: 关于从零了解一个开源项目的设计与实现,除了deepwiki外,还有什么好的方法吗?
作者: #hzqst
板块: #搞七捻三
编号: 2089694
帖子: https://linux.do/t/topic/2089694
时间: 2026-04-30 20:55:54
摘要:
最好是那种init了之后发现有遗漏的点可以随时自己补的,并且最好可以生成流程图方便人类查看的
标题: DeepSeek 要开视觉了吗
作者: #niu12503
板块: #开发调优
编号: 2089763
帖子: https://linux.do/t/topic/2089763
时间: 2026-04-30 21:07:19
摘要:
DeepSeek「Thinking with Visual Primitives」深度技术解构
关键区分:你说的「退出视觉」应是笔误/自动纠错,DeepSeek 是在「大举进军视觉」,且这次的手法与OpenAI、Google-Anthropic等主流范式截然不同,堪称一次范式级重构。

一、项目速览
发布日期
• 维度: 发布日期
• 详情: 2026年4月30日(与今天是同一天!)
项目代号
• 维度: 项目代号
• 详情: Janus
基础架构
• 维度: 基础架构
• 详情: DeepSeek-V4-Flash
代码许可证
• 维度: 代码许可证
• 详情: MIT
模型权重
• 维度: 模型权重
• 详情: 尚未发布(将集成到基金会模型中后发布)
论文
• 维度: 论文
• 详情: 已发布技术报告 PDF
对标模型
• 维度: 对标模型
• 详情: GPT‑5.4、Claude-Sonnet‑4.6、Gemini‑3‑Flash

二、核心突破:从「感知鸿沟」到「指代鸿沟」
现有的多模态 LLM(MLLMs)虽然通过高分辨率裁剪或用图像思考等手段缩小了「感知鸿沟」,但在复杂结构推理上集体翻车。
DeepSeek 发现的新问题:Reference Gap(指代鸿沟)
自然语言在描述稠密空间布局时存在致命的模糊性:
「左边第三个杯子后面的那个杯子的把手」
—这句自然语言描述的歧义在密集场景中是指数级的。
人类怎么做?→ 用手指着数:“这个、这个、这个……”
DeepSeek 团队指出,现有模型在思考过程中,这种模糊性会导致:

逻辑坍缩 — 推理链中某一步「指错了对象」,后续全错
空间幻觉 — 模型自信地描述一个不存在的空间关系


三、范式转移:「边推理边指」
不是「看得更清楚」,而是「在推理时指出具体位置」
核心创新:将空间标记(点和边界框)作为「最小思维单元」,直接穿插到推理轨迹中。
就像人类思考时的下意识动作:

用手指着屏幕数数
在纸上画圈标注重点区域
走迷宫时用指尖追踪路径

技术实现路径
传统 MLLM 推理链
标题: warp里面用自己订阅的claude 会被claude封号吗
作者: #可口可乐
板块: #开发调优
编号: 2089764
帖子: https://linux.do/t/topic/2089764
时间: 2026-04-30 21:07:21
摘要:
之前用warp习惯了,但是不知道claude会不会封号啊?
标题: 给我一个不用DS的理由
作者: #ObsidianOOO
板块: #开发调优
编号: 2089771
帖子: https://linux.do/t/topic/2089771
时间: 2026-04-30 21:08:52
摘要:
最近奥特曼大善人收菜了,team 20x炒到1500,claude code又顶不住了,刚好ds上新还有优惠,试用了一下,爽的一批,属于是指哪打哪,而且智商也在线,做些逆向之类的工作都没有道德,思考与推理都强的离谱。个人体验下来和opus4.6/4.7差不多(主观体验,勿喷,也并非无脑吹)。甚至价格都低的离谱(下面塞个账单总结),大善人ds直接2.5打骨折,最开始持续到5月5号,今天看了一下持续到31号,所以还有什么理由不用ds呢
标题: codex功能扩展询问
作者: #xinyann
板块: #开发调优
编号: 2089779
帖子: https://linux.do/t/topic/2089779
时间: 2026-04-30 21:10:09
摘要:
codex window版 gui,除了remote connection远端链接这种,需要在config里面激活,还有什么功能,或者有用的模块可以在config里面激活使用
标题: Xiaomi MiMo到账0元是什么玩法?属实没看懂!
作者: #道友
板块: #搞七捻三
编号: 2089797
帖子: https://linux.do/t/topic/2089797
时间: 2026-04-30 21:13:59
摘要:
收到了小米的百万亿 Token 创造者激励计划会的邮件,发现到账0元是什么玩法?属实没看懂!
标题: gpt新注册账号codex登录都要验证手机号了吗
作者: #lengendxword
板块: #搞七捻三
编号: 2089798
帖子: https://linux.do/t/topic/2089798
时间: 2026-04-30 21:15:10
摘要:
前两天用gmail注册还能直接登录codex,今天注册新的号,发现登录codex都需要验证手机号了。
标题: Gopay Plus存活统计
作者: #benzoo
板块: #开发调优
编号: 2089802
帖子: https://linux.do/t/topic/2089802
时间: 2026-04-30 21:16:01
摘要:
昨日跟着佬搓出来2个号,目前健壮,看看各位佬的



健壮!!
狗die了:(
凑热闹看看

Click to view the poll.
标题: 谷歌给出了你的价格(广告类的)
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #前沿快讯
编号: 2089825
帖子: https://linux.do/t/topic/2089825
时间: 2026-04-30 21:21:08
摘要:
Proton – 28 Apr 26





What Google thinks you're worth | Proton

Proton analyzed 54,000 profiles using real ad auction data to determine your worth to Google. How valuable is your data?
标题: 初吻给出去咯嘻嘻😁
作者: #猫猫团子
板块: #搞七捻三
编号: 2089839
帖子: https://linux.do/t/topic/2089839
时间: 2026-04-30 21:22:45
摘要:
今天和女朋友一起玩了PS5,然后又去吃了米线,看了猫猫狗狗
牵了小手手,然后她好像是想让我主动亲她,我有点害羞,当时没同意,然后后面觉得不应该这样想亲亲她又不让(纯粹是闹着玩)
然后我们下了地铁,她回酒店,我回家,走之前她突然亲了一口我的嘴唇
大约3分钟之后我才回过味来
初吻是菠萝味的
标题: uu们是怎么用ai参与科研的
作者: #RaBit_Tao
板块: #搞七捻三
编号: 2089848
帖子: https://linux.do/t/topic/2089848
时间: 2026-04-30 21:26:08
摘要:
最近自己尝试了下只提需求纯让ai按照自己的思路去调优,然后就让他自己改。结果是opus烧了几百块依然模型性能要么没什么变化(他直接采用了最保守的方案)要么就是变得很差。比如在已经有idea了的时候希望让ai能参与自己的模型指标提升应该怎么用呀?