【大模型系列33】关于Deepseek 4,你想知道的一切
基本资料
官方模型卡:DeepSeek_V4.pdf · deepseek-ai/DeepSeek-V4-Pro at main
deepseek-4-pro
输入¥12,输出¥24,缓存1/12
上下文1m,最大输出384k
参数1600B,激活49B,参考3.2是685B
预训练数据33T,预训练数据33T,截止日期25年5月
训练平台:华为升腾
deepseek-4-flash
输入¥1,输入¥2,缓存1/5
上下文1m,最大输出384k
参数184T,激活49B
训练同上
官方自评
AMArena暂未上线
ArtificialAnalysis暂未上线
LiveBench暂未上线
Chat渠道
官网已上线
OpenRouter暂未上线
LMArena暂未上线
本地部署
模型下载:DeepSeek-V4 - a deepseek-ai Collection
2 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: dwqxq1)
基本资料
官方模型卡:DeepSeek_V4.pdf · deepseek-ai/DeepSeek-V4-Pro at main
deepseek-4-pro
输入¥12,输出¥24,缓存1/12
上下文1m,最大输出384k
参数1600B,激活49B,参考3.2是685B
预训练数据33T,预训练数据33T,截止日期25年5月
训练平台:华为升腾
deepseek-4-flash
输入¥1,输入¥2,缓存1/5
上下文1m,最大输出384k
参数184T,激活49B
训练同上
官方自评
AMArena暂未上线
ArtificialAnalysis暂未上线
LiveBench暂未上线
Chat渠道
官网已上线
OpenRouter暂未上线
LMArena暂未上线
本地部署
模型下载:DeepSeek-V4 - a deepseek-ai Collection
2 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: dwqxq1)
❤1
自己公司部署deepseek-v4-pro,需要什么样的配置,总价几何
告诉grok说1000人重度使用,资金富可敌国。grok 给的回复是
熟悉的大佬,给说下靠谱吗
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: YOYO)
告诉grok说1000人重度使用,资金富可敌国。grok 给的回复是
熟悉的大佬,给说下靠谱吗
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: YOYO)
[NFSW] 无聊测试了下 Image2 不知道算不算焚决
提示词:
四格漫画|Pixiv日系风|女忍者大战森林怪物| 受伤|损坏衣物| 热血冒险
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Night Charm)
提示词:
四格漫画|Pixiv日系风|女忍者大战森林怪物| 受伤|损坏衣物| 热血冒险
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Night Charm)
关于deepseek的感想
感觉deepseek现在处境比价危险,要是性能差的话那就完蛋了,基本上所有目光都聚焦在他的上面,但是还是希望国产越来越好
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 大星.派)
感觉deepseek现在处境比价危险,要是性能差的话那就完蛋了,基本上所有目光都聚焦在他的上面,但是还是希望国产越来越好
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 大星.派)
Deepseek v4 pro疑似幻觉问题
如图,本来想简单看看v4 pro的小说能力如何,但是查看思维链发现怎么出现了疑似幻觉问题
3 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: fogonroad)
如图,本来想简单看看v4 pro的小说能力如何,但是查看思维链发现怎么出现了疑似幻觉问题
3 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: fogonroad)
DeepSeek V4 出来了,感觉国内的各种 Token plan 和 Code plan 要爆了
DeepSeek V4 这波性能更新可以啊。
参数量上来了,不过价格也上来了。 Pro 还是有点小贵的。
佬友们感觉国内的Token plan 和 Code plan 多久会上 DeepSeek V4 ?
附上目前官方的资料;
● 模型 & 价格 | DeepSeek API Docs
● 官方公众号推文
● Hugging Face 文档
5 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: chitaibao)
DeepSeek V4 这波性能更新可以啊。
参数量上来了,不过价格也上来了。 Pro 还是有点小贵的。
佬友们感觉国内的Token plan 和 Code plan 多久会上 DeepSeek V4 ?
附上目前官方的资料;
● 模型 & 价格 | DeepSeek API Docs
● 官方公众号推文
● Hugging Face 文档
5 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: chitaibao)
如果直接使用deepseekv4的api, 4月的花费
“input”: 210100299
“output”: 4082460
“cacheRead”: 986467554
“cacheWrite”: 2078702
如果全部使用deepeek-v4 pro的话, 花费大概:
210 * 12 + 4 * 24 + 986 + 2 * 24 = 3650 RMB
现在是订阅的一个月openai Plus(20$), 直接api还是太烧不起了, 期待后面价格降下来, 那就爽用了
5 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: pan iron)
“input”: 210100299
“output”: 4082460
“cacheRead”: 986467554
“cacheWrite”: 2078702
如果全部使用deepeek-v4 pro的话, 花费大概:
210 * 12 + 4 * 24 + 986 + 2 * 24 = 3650 RMB
现在是订阅的一个月openai Plus(20$), 直接api还是太烧不起了, 期待后面价格降下来, 那就爽用了
5 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: pan iron)
开发只能使用小米的模型,佬请问下面的模型建议使用哪个呢?
佬们,请问,上门三个小米的模型,开始建议使用哪个呢?
阅读完整话题
via LINUX DO - 最新话题 (author: 糖糖软萌喵)
佬们,请问,上门三个小米的模型,开始建议使用哪个呢?
没办法,只能用小米的模型,我哭1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 糖糖软萌喵)
有大佬知道deepseekv4支持英伟达卡吗?
还是说只支持昇腾,要是只支持昇腾,感觉短期算力问题很大啊
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: karx)
还是说只支持昇腾,要是只支持昇腾,感觉短期算力问题很大啊
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: karx)
算力,运维,电力
我感觉现在模型迭代越来越快了,我们之前好像都是等快一年才能哇哦一下,现在每个月都有好几个模型正在迭代
国内的算力主要是国产的这些显卡撑着,以及以前买的一些集群
我感觉做运维行业,维护显卡集群以后应该工作比较吃香
电力行业,清洁能源也蓬勃发展,太阳能水电风电大有作为啊
感觉ds的更新,最近股票可能会带动全部ai行业
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: hlool)
我感觉现在模型迭代越来越快了,我们之前好像都是等快一年才能哇哦一下,现在每个月都有好几个模型正在迭代
国内的算力主要是国产的这些显卡撑着,以及以前买的一些集群
我感觉做运维行业,维护显卡集群以后应该工作比较吃香
电力行业,清洁能源也蓬勃发展,太阳能水电风电大有作为啊
感觉ds的更新,最近股票可能会带动全部ai行业
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: hlool)
deepseek与昇腾的绑定大大加深,是一个非常好的起点
deepseek价格这一块没得说,还有小字惊喜紧接着上文说到等到下半年昇腾950超节点算力集群上市后pro模型的价格还能大幅下降。
我一直对梁文峰的采访中的一句话非常敬佩,大致意思是:我们并非主动或者偏执地追求降低成本和价格,成本和价格下降其实是前沿技术探索和工程优化带来的副产品,也就是“自然而然的降下来了”。成本低不是幌子和噱头,反而是技术探索的执着和开源普惠的最好证明。
同时,刚才也刷到了昇腾CANN在晚上七点会对模型适配进行讲解分享。
这一段时间,公众都在怀疑或者说也可能是事实“国产芯片拖慢了新模型发布”,包括现在deepseek还需要等待到下半年才能用上新芯片来提升体验。但是,我的信心一直没变,现在也更强了,不管是芯片厂商还是deepseek他们都一直坚持着做难而正确的事,他们都在打造属于我们自己的开发生态,创造自己力所能及的开源普惠。目前还存在着许多困难,但我相信这一段路这一里程碑将会是未来的坚实基础!!国产加油啊!!!
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: yiming)
deepseek价格这一块没得说,还有小字惊喜紧接着上文说到等到下半年昇腾950超节点算力集群上市后pro模型的价格还能大幅下降。
我一直对梁文峰的采访中的一句话非常敬佩,大致意思是:我们并非主动或者偏执地追求降低成本和价格,成本和价格下降其实是前沿技术探索和工程优化带来的副产品,也就是“自然而然的降下来了”。成本低不是幌子和噱头,反而是技术探索的执着和开源普惠的最好证明。
同时,刚才也刷到了昇腾CANN在晚上七点会对模型适配进行讲解分享。
这一段时间,公众都在怀疑或者说也可能是事实“国产芯片拖慢了新模型发布”,包括现在deepseek还需要等待到下半年才能用上新芯片来提升体验。但是,我的信心一直没变,现在也更强了,不管是芯片厂商还是deepseek他们都一直坚持着做难而正确的事,他们都在打造属于我们自己的开发生态,创造自己力所能及的开源普惠。目前还存在着许多困难,但我相信这一段路这一里程碑将会是未来的坚实基础!!国产加油啊!!!
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: yiming)
deepseek v4 依旧不支持多模态吗
一直期待deepseek出个带视觉的,还是期望过高了
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 小鸟壁纸)
一直期待deepseek出个带视觉的,还是期望过高了
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 小鸟壁纸)
gpt5.5缓存命中很高啊
看看CPA统计中,3.8M中3.3M是缓存token
看起来还不错,相比5.4
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 璇枢)
看看CPA统计中,3.8M中3.3M是缓存token
看起来还不错,相比5.4
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 璇枢)
Deepseek v4 pro是否是GLM平替
看到网上的图,分数似乎跟GLM相同
价格还是可以的
有没有兄弟实际使用过,感受如何呢
或是体验有没有办法跟claude gpt扳一扳手脚
5 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: SophiaCloud94)
看到网上的图,分数似乎跟GLM相同
价格还是可以的
有没有兄弟实际使用过,感受如何呢
或是体验有没有办法跟claude gpt扳一扳手脚
5 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: SophiaCloud94)
Deepseek-V4-Pro & Flash 24点测试
而Flash一直在猜测,思考了100多s,我就懒得继续了,直接终止对话其实是怕本来不多的余额没了
GPT那边的回答见GPT 5.5 / Pro 你这让我怎么相信你?16+2=24 你怎么敢说的?做这个题你还不如阉割版o3(只有网页版!)
GPT那边回答这个问题很不稳定,照这样来看GPT完败?(至少在这个问题上)
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 化学老师贩冰冰)
提示词 (点击了解更多详细信息)Pro3.7s完成任务
而Flash一直在猜测,思考了100多s,我就懒得继续了,直接终止对话其实是怕本来不多的余额没了
GPT那边的回答见GPT 5.5 / Pro 你这让我怎么相信你?16+2=24 你怎么敢说的?做这个题你还不如阉割版o3(只有网页版!)
GPT那边回答这个问题很不稳定,照这样来看GPT完败?(至少在这个问题上)
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 化学老师贩冰冰)
话费套餐怎么越来越贵,你们都用那个运营商啊?
现在的话费真的越来越贵,不办那种大流量卡,本地办一个拉个宽带,这是越来越贵了,流量还少,你们都用啥啊?
更可笑的是昨天打电话给我说看到我最近消费稳定,流量不够用,说20快的活动一月多20g通用流量让我办不办,我气的,我说我都不打算用了要去注销了,贵的很啥一样还让我开通业务。与其20开20G流量我为啥不办一个流量卡呢,真服了!
所以你们都用那一家的呢?
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: wjinj0620)
现在的话费真的越来越贵,不办那种大流量卡,本地办一个拉个宽带,这是越来越贵了,流量还少,你们都用啥啊?
更可笑的是昨天打电话给我说看到我最近消费稳定,流量不够用,说20快的活动一月多20g通用流量让我办不办,我气的,我说我都不打算用了要去注销了,贵的很啥一样还让我开通业务。与其20开20G流量我为啥不办一个流量卡呢,真服了!
所以你们都用那一家的呢?
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: wjinj0620)