LinuxDo 新帖推送
180 subscribers
250K photos
312K links
Download Telegram
标题: 【大模型系列33】关于Deepseek 4,你想知道的一切
作者: #dwqxq1
板块: #文档共建
编号: 2044549
帖子: https://linux.do/t/topic/2044549
时间: 2026-04-24 11:52:57
摘要:
基本资料
官方模型卡:DeepSeek_V4.pdf · deepseek-ai/DeepSeek-V4-Pro at main
deepseek-4-pro
输入¥12,输出¥24,缓存1/12
上下文1m,最大输出384k
参数1600B,激活49B,参考3.2是685B
预训练数据33T,预训练数据33T,截止日期25年5月
训练平台:华为升腾
deepseek-4-flash
输入¥1,输入¥2,缓存1/5
上下文1m,最大输出384k
参数184T,激活49B
训练同上
官方自评

AMArena暂未上线
ArtificialAnalysis暂未上线
LiveBench暂未上线
Chat渠道
官网已上线
OpenRouter暂未上线
LMArena暂未上线
本地部署
模型下载:DeepSeek-V4 - a deepseek-ai Collection
标题: 自己公司部署deepseek-v4-pro,需要什么样的配置,总价几何
作者: #YOYO
板块: #搞七捻三
编号: 2044550
帖子: https://linux.do/t/topic/2044550
时间: 2026-04-24 11:53:01
摘要:
告诉grok说1000人重度使用,资金富可敌国。grok 给的回复是

熟悉的大佬,给说下靠谱吗
标题: [NFSW] 无聊测试了下 Image2 不知道算不算焚决
作者: #Night Charm
板块: #搞七捻三
编号: 2044551
帖子: https://linux.do/t/topic/2044551
时间: 2026-04-24 11:53:04
摘要:
提示词:
四格漫画|Pixiv日系风|女忍者大战森林怪物| 受伤|损坏衣物| 热血冒险
标题: 关于deepseek的感想
作者: #大星.派
板块: #搞七捻三
编号: 2044552
帖子: https://linux.do/t/topic/2044552
时间: 2026-04-24 11:53:08
摘要:
感觉deepseek现在处境比价危险,要是性能差的话那就完蛋了,基本上所有目光都聚焦在他的上面,但是还是希望国产越来越好
标题: Deepseek v4 pro疑似幻觉问题
作者: #fogonroad
板块: #搞七捻三
编号: 2044554
帖子: https://linux.do/t/topic/2044554
时间: 2026-04-24 11:53:12
摘要:
如图,本来想简单看看v4 pro的小说能力如何,但是查看思维链发现怎么出现了疑似幻觉问题
标题: DeepSeek V4 出来了,感觉国内的各种 Token plan 和 Code plan 要爆了
作者: #chitaibao
板块: #搞七捻三
编号: 2044556
帖子: https://linux.do/t/topic/2044556
时间: 2026-04-24 11:54:05
摘要:
DeepSeek V4 这波性能更新可以啊。

参数量上来了,不过价格也上来了。 Pro 还是有点小贵的。






项目
deepseek-v4-flash*
deepseek-v4-pro




BASE URL(OpenAI 格式)
https://api.deepseek.com
https://api.deepseek.com


BASE URL(Anthropic 格式)
https://api.deepseek.com/anthropic
https://api.deepseek.com/anthropic


模型版本
DeepSeek-V4-Flash
DeepSeek-V4-Pro


思考模式
支持非思考与思考模式(默认)
支持非思考与思考模式(默认)


上下文长度
1M
1M


输出长度
最大 384K
最大 384K


Json Output
支持
支持


Tool Calls
支持
支持


对话前缀续写(Beta)
支持
支持


FIM 补全(Beta)
仅非思考模式支持
仅非思考模式支持


输入价格:缓存命中
0.2 元 / 百万 tokens
1 元 / 百万 tokens


输入价格:缓存未命中
1 元 / 百万 tokens
12 元 / 百万 tokens


输出价格
2 元 / 百万 tokens
24 元 / 百万 tokens



佬友们感觉国内的Token plan 和 Code plan 多久会上 DeepSeek V4 ?
附上目前官方的资料;


模型 & 价格 | DeepSeek API Docs


官方公众号推文


Hugging Face 文档
标题: 我算了一下如果直接使用deepseekv4的api, 4月的花费
作者: #pan iron
板块: #搞七捻三
编号: 2044558
帖子: https://linux.do/t/topic/2044558
时间: 2026-04-24 11:54:11
摘要:
“input”: 210100299
“output”: 4082460
“cacheRead”: 986467554
“cacheWrite”: 2078702
如果全部使用deepeek-v4 pro的话, 花费大概:
210 * 12 + 4 * 24 + 986 + 2 * 24 = 3650 RMB
现在是订阅的一个月Plus(20$), 直接api还是太烧不起了, 期待后面价格降下来, 那就爽用了
标题: 开发只能使用小米的模型,佬请问下面的模型建议使用哪个呢?
作者: #糖糖软萌喵
板块: #开发调优
编号: 2044559
帖子: https://linux.do/t/topic/2044559
时间: 2026-04-24 11:54:14
摘要:
佬们,请问,上门三个小米的模型,开始建议使用哪个呢?

没办法,只能用小米的模型,我哭
标题: 有大佬知道deepseekv4支持英伟达卡吗?
作者: #karx
板块: #国产替代
编号: 2044561
帖子: https://linux.do/t/topic/2044561
时间: 2026-04-24 11:54:28
摘要:
还是说只支持昇腾,要是只支持昇腾,感觉短期算力问题很大啊
标题: 算力,运维,电力
作者: #hlool
板块: #开发调优
编号: 2044569
帖子: https://linux.do/t/topic/2044569
时间: 2026-04-24 11:55:33
摘要:
我感觉现在模型迭代越来越快了,我们之前好像都是等快一年才能哇哦一下,现在每个月都有好几个模型正在迭代
国内的算力主要是国产的这些显卡撑着,以及以前买的一些集群
我感觉做运维行业,维护显卡集群以后应该工作比较吃香
电力行业,清洁能源也蓬勃发展,太阳能水电风电大有作为啊
感觉ds的更新,最近股票可能会带动全部ai行业
标题: deepseek与昇腾的绑定大大加深,是一个非常好的起点
作者: #yiming
板块: #前沿快讯
编号: 2044571
帖子: https://linux.do/t/topic/2044571
时间: 2026-04-24 11:56:13
摘要:
deepseek价格这一块没得说,还有小字惊喜紧接着上文说到等到下半年昇腾950超节点算力集群上市后pro模型的价格还能大幅下降。
我一直对梁文峰的采访中的一句话非常敬佩,大致意思是:我们并非主动或者偏执地追求降低成本和价格,成本和价格下降其实是前沿技术探索和工程优化带来的副产品,也就是“自然而然的降下来了”。成本低不是幌子和噱头,反而是技术探索的执着和开源普惠的最好证明。
同时,刚才也刷到了昇腾CANN在晚上七点会对模型适配进行讲解分享。
这一段时间,公众都在怀疑或者说也可能是事实“国产芯片拖慢了新模型发布”,包括现在deepseek还需要等待到下半年才能用上新芯片来提升体验。但是,我的信心一直没变,现在也更强了,不管是芯片厂商还是deepseek他们都一直坚持着做难而正确的事,他们都在打造属于我们自己的开发生态,创造自己力所能及的开源普惠。目前还存在着许多困难,但我相信这一段路这一里程碑将会是未来的坚实基础!!国产加油啊!!!
标题: deepseek v4 依旧不支持多模态吗
作者: #小鸟壁纸
板块: #搞七捻三
编号: 2044574
帖子: https://linux.do/t/topic/2044574
时间: 2026-04-24 11:56:26
摘要:
一直期待deepseek出个带视觉的,还是期望过高了
标题: gpt5.5缓存命中很高啊
作者: #璇枢
板块: #搞七捻三
编号: 2044583
帖子: https://linux.do/t/topic/2044583
时间: 2026-04-24 11:58:10
摘要:
看看CPA统计中,3.8M中3.3M是缓存token

看起来还不错,相比5.4
标题: Deepseek v4 pro是否是GLM平替
作者: #SophiaCloud94
板块: #国产替代
编号: 2044585
帖子: https://linux.do/t/topic/2044585
时间: 2026-04-24 11:58:40
摘要:
看到网上的图,分数似乎跟GLM相同
价格还是可以的
有没有兄弟实际使用过,感受如何呢
或是体验有没有办法跟claude gpt扳一扳手脚
标题: Deepseek-V4-Pro & Flash 24点测试
作者: #化学老师贩冰冰
板块: #搞七捻三
编号: 2044586
帖子: https://linux.do/t/topic/2044586
时间: 2026-04-24 11:58:50
摘要:
提示词 (click for more details)
Pro3.7s完成任务
而Flash一直在猜测,思考了100多s,我就懒得继续了,直接终止对话其实是怕本来不多的余额没了


GPT那边的回答见GPT 5.5 / Pro 你这让我怎么相信你?16+2=24 你怎么敢说的?做这个题你还不如阉割版o3(只有网页版!)
GPT那边回答这个问题很不稳定,照这样来看GPT完败?(至少在这个问题上)
标题: 话费套餐怎么越来越贵,你们都用那个运营商啊?
作者: #wjinj0620
板块: #搞七捻三
编号: 2044590
帖子: https://linux.do/t/topic/2044590
时间: 2026-04-24 11:59:01
摘要:
现在的话费真的越来越贵,不办那种大流量卡,本地办一个拉个宽带,这是越来越贵了,流量还少,你们都用啥啊?
更可笑的是昨天打电话给我说看到我最近消费稳定,流量不够用,说20快的活动一月多20g通用流量让我办不办,我气的,我说我都不打算用了要去注销了,贵的很啥一样还让我开通业务。与其20开20G流量我为啥不办一个流量卡呢,真服了!
所以你们都用那一家的呢?
标题: 是不是以后想私有化部署满血开源模型越来越难了?
作者: #牛牛
板块: #开发调优
编号: 2044601
帖子: https://linux.do/t/topic/2044601
时间: 2026-04-24 12:00:55
摘要:
deepseekv4 pro 862B参数,GLM5.1 754B参数,kimi 2.6 1.1T的参数。像千问这种397B的是不是以后就不会有了。
想在公司八卡L20上部署一下算了一下量化后都很难部署上去。部署成本太高了,qwen3.6的满参数迟迟不发布感觉L20真是废了。
标题: 富可敌国的cc如何使用
作者: #kakazeoo
板块: #搞七捻三
编号: 2044602
帖子: https://linux.do/t/topic/2044602
时间: 2026-04-24 12:01:17
摘要:
买了富可敌国的额度,想使用super应该怎么操作?求助各位佬
我的setting.json和教程里面是一样的,但是/model的时候不应该有4.7opus吧,我看富可敌国里面没有这个模型(在super里),我该怎么操作