linux.do
21.5K subscribers
123K photos
200 videos
122 files
260K links
linux.do最新话题和热议话题
Download Telegram
不是,哥们?deepseek-4-pro 你干嘛哈哈哎哟

6 个帖子 - 6 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: echoxxzhang)
【大模型系列33】关于Deepseek 4,你想知道的一切

基本资料

官方模型卡:DeepSeek_V4.pdf · deepseek-ai/DeepSeek-V4-Pro at main

deepseek-4-pro

输入¥12,输出¥24,缓存1/12
上下文1m,最大输出384k
参数1600B,激活49B,参考3.2是685B
预训练数据33T,预训练数据33T,截止日期25年5月
训练平台:华为升腾

deepseek-4-flash

输入¥1,输入¥2,缓存1/5
上下文1m,最大输出384k
参数184T,激活49B
训练同上

官方自评

AMArena暂未上线

ArtificialAnalysis暂未上线

LiveBench暂未上线

Chat渠道

官网已上线

OpenRouter暂未上线

LMArena暂未上线

本地部署

模型下载:DeepSeek-V4 - a deepseek-ai Collection

2 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: dwqxq1)
1
自己公司部署deepseek-v4-pro,需要什么样的配置,总价几何

告诉grok说1000人重度使用,资金富可敌国。grok 给的回复是

熟悉的大佬,给说下靠谱吗
1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: YOYO)
[NFSW] 无聊测试了下 Image2 不知道算不算焚决

提示词:
四格漫画|Pixiv日系风|女忍者大战森林怪物| 受伤|损坏衣物| 热血冒险

4 个帖子 - 4 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Night Charm)
关于deepseek的感想

感觉deepseek现在处境比价危险,要是性能差的话那就完蛋了,基本上所有目光都聚焦在他的上面,但是还是希望国产越来越好

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 大星.派)
Deepseek v4 pro疑似幻觉问题

如图,本来想简单看看v4 pro的小说能力如何,但是查看思维链发现怎么出现了疑似幻觉问题
3 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: fogonroad)
DeepSeek V4 出来了,感觉国内的各种 Token plan 和 Code plan 要爆了

DeepSeek V4 这波性能更新可以啊。

参数量上来了,不过价格也上来了。 Pro 还是有点小贵的。

佬友们感觉国内的Token plan 和 Code plan 多久会上 DeepSeek V4 ?

附上目前官方的资料;

模型 & 价格 | DeepSeek API Docs
官方公众号推文
Hugging Face 文档

5 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: chitaibao)
如果直接使用deepseekv4的api, 4月的花费

“input”: 210100299
“output”: 4082460
“cacheRead”: 986467554
“cacheWrite”: 2078702

如果全部使用deepeek-v4 pro的话, 花费大概:
210 * 12 + 4 * 24 + 986 + 2 * 24 = 3650 RMB

现在是订阅的一个月openai Plus(20$), 直接api还是太烧不起了, 期待后面价格降下来, 那就爽用了

5 个帖子 - 4 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: pan iron)
开发只能使用小米的模型,佬请问下面的模型建议使用哪个呢?

佬们,请问,上门三个小米的模型,开始建议使用哪个呢?
没办法,只能用小米的模型,我哭
1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 糖糖软萌喵)
有大佬知道deepseekv4支持英伟达卡吗?

还是说只支持昇腾,要是只支持昇腾,感觉短期算力问题很大啊

3 个帖子 - 3 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: karx)
算力,运维,电力

我感觉现在模型迭代越来越快了,我们之前好像都是等快一年才能哇哦一下,现在每个月都有好几个模型正在迭代
国内的算力主要是国产的这些显卡撑着,以及以前买的一些集群
我感觉做运维行业,维护显卡集群以后应该工作比较吃香
电力行业,清洁能源也蓬勃发展,太阳能水电风电大有作为啊
感觉ds的更新,最近股票可能会带动全部ai行业

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: hlool)
deepseek与昇腾的绑定大大加深,是一个非常好的起点

deepseek价格这一块没得说,还有小字惊喜紧接着上文说到等到下半年昇腾950超节点算力集群上市后pro模型的价格还能大幅下降。
我一直对梁文峰的采访中的一句话非常敬佩,大致意思是:我们并非主动或者偏执地追求降低成本和价格,成本和价格下降其实是前沿技术探索和工程优化带来的副产品,也就是“自然而然的降下来了”。成本低不是幌子和噱头,反而是技术探索的执着和开源普惠的最好证明。
同时,刚才也刷到了昇腾CANN在晚上七点会对模型适配进行讲解分享。
这一段时间,公众都在怀疑或者说也可能是事实“国产芯片拖慢了新模型发布”,包括现在deepseek还需要等待到下半年才能用上新芯片来提升体验。但是,我的信心一直没变,现在也更强了,不管是芯片厂商还是deepseek他们都一直坚持着做难而正确的事,他们都在打造属于我们自己的开发生态,创造自己力所能及的开源普惠。目前还存在着许多困难,但我相信这一段路这一里程碑将会是未来的坚实基础!!国产加油啊!!!

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: yiming)
deepseek v4 依旧不支持多模态吗

一直期待deepseek出个带视觉的,还是期望过高了

3 个帖子 - 3 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 小鸟壁纸)
gpt5.5缓存命中很高啊

看看CPA统计中,3.8M中3.3M是缓存token

看起来还不错,相比5.4

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 璇枢)
Deepseek v4 pro是否是GLM平替

看到网上的图,分数似乎跟GLM相同

价格还是可以的

有没有兄弟实际使用过,感受如何呢

或是体验有没有办法跟claude gpt扳一扳手脚

5 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: SophiaCloud94)
Deepseek-V4-Pro & Flash 24点测试

提示词 (点击了解更多详细信息)
Pro3.7s完成任务
而Flash一直在猜测,思考了100多s,我就懒得继续了,直接终止对话其实是怕本来不多的余额没了

GPT那边的回答见GPT 5.5 / Pro 你这让我怎么相信你?16+2=24 你怎么敢说的?做这个题你还不如阉割版o3(只有网页版!)
GPT那边回答这个问题很不稳定,照这样来看GPT完败?(至少在这个问题上)
1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 化学老师贩冰冰)
话费套餐怎么越来越贵,你们都用那个运营商啊?

现在的话费真的越来越贵,不办那种大流量卡,本地办一个拉个宽带,这是越来越贵了,流量还少,你们都用啥啊?
更可笑的是昨天打电话给我说看到我最近消费稳定,流量不够用,说20快的活动一月多20g通用流量让我办不办,我气的,我说我都不打算用了要去注销了,贵的很啥一样还让我开通业务。与其20开20G流量我为啥不办一个流量卡呢,真服了!
所以你们都用那一家的呢?

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: wjinj0620)