linux.do
21.5K subscribers
123K photos
199 videos
122 files
259K links
linux.do最新话题和热议话题
Download Telegram
deepseek定位的一些分析

大家有称赞有批评,批评主要集中在coding不是很突出上,但作为上一代代表中国最先进水平的国内爆款模型,大部分的user还是集中在QA和世界知识上,而不是coding,也就是说他们想做的可能是一款平民(更通用的)模型,而不是类似于glm的coding model ?

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: lucas)
codex windows app 新版本浏览器使用功能

在新版本设置中发现了浏览器使用,但是似乎无法使用
1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: VIAOTO)
原来L站都是高收入家庭、

Epoch AI

Claude skews high-income; Meta AI skews low-income

Household income of weekly AI users ranges from 80% earning $100K+ for Claude to 37% for Meta AI in the Epoch AI/Ipsos survey.

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷)
cpa反代codex 5.5怎么开启fast模式

我平常是在codexapp里使用的自己的cpa服务器,之前5.4时期就有配过。
当时看到有佬友说config.toml中加入service_tier = "fast"然后在cpa中的payload中加入如下配置就行

不知道现在是否还能这样配置
这是我目前的codex配置

btw:codexapp里只能显示自定义模型而且上下文窗口好像只有258k

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 初雨荷)
DeepSeek V4 Thinking Max+OpenCode小功能代码测试

用DeepSeek V4测试了一下代码能力,让它给我的一个后端项目加个RSS功能,实测下来感觉还不错,能很好的理解项目架构(也有OpenCode的功劳),做出的改动符合当前项目架构,没有出现写屎山或者自己造轮子情况,不过没有自行生成单元测试,gpt的话大部分时间会自动生成单元测试。就是价格上有点小贵,直接用的官方API,后台显示花费4.98元,总Token为1533274 token,输入(命中缓存)1245696 token,输入(未命中缓存)263792 token,输出23786 token

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: AlexFox)
一张531790卡头的0刀卡,还有30多分钟

cdk.linux.do

LINUX DO CDK

Linux Do 社区 CDK 快速分享平台 - 让分享变得更简单

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: zoenoa)
华为芯片拖慢DeepSeek V4上线?同一内核通吃英伟达昇腾还加速近2倍!

DeepSeek V4 发布前,社区广泛流传一种猜测:V4 上线时间晚于预期,是因为模型从英伟达迁移到华为昇腾平台遭遇适配困难。V4 技术报告虽未直接回应这一传闻,但披露的性能数据与之明显矛盾。

报告显示,V4 的细粒度专家分区方案(Fine-Grained EP Scheme)已在 NVIDIA GPU 和华为昇腾 NPU 双平台完成部署验证,常规推理负载加速 1.50 至 1.73 倍,RL rollout 和高速 Agent 服务等延迟敏感场景最高加速 1.96 倍。团队已将 CUDA 版本内核 MegaMoE 作为 DeepGEMM 的一部分开源。换言之,V4 在两套硬件上都跑出了接近理论上限的效率,跨平台适配并未造成性能折损。

huggingface.co

DeepSeek_V4.pdf

68.21 KB

8 个帖子 - 6 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 你这是违法行为)
双机位机考有什么好用的方法吗

马上机考了 要双机位 请问有什么其他的好用的方法吗

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: gyj)
求问关于国内云服务厂商带宽使用的问题

最近帮一个朋友搞服务器,发现国内云厂商的带宽贵的离谱

尤其是要求高一点的,简直抢劫一样

基本上20M规定带宽的,1年都要1.5w左右

问了下大模型,想了几个方案,求有经验的佬们指导一下

1、订购几个小流量的带宽

比如,订购4个5M的,绑定个很弱的服务器,然后再通过云厂商的EIP之类的做轮询转发,

这样,只要不是单客户端对大流量有要求的,是不是基本可以满足?

2、订购多个轻量级服务器

同上面的思路一样,轻量级服务器一般是共享200M带宽的,有云厂商也提供的多轻量级服务器路由的能力。

不过我有一点不是很确定,有没有可能,我订阅的轻量级服务器都是在1个200m的池子里面,虽然定了多台,但是实际上是自己抢自己的?

谢谢各位佬的指教

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: fangxiusun)
deepseekv4编码

大家都是在哪用的dsv4编码呀 trae和cursor都没适配吧?“error”:{“message”:"The reasoning_content in the thinking mode must be passed back to the API. }

3 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Kurt)
DS V4 没有 Web Search 吗?咋整

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 朱高祖)
GPT 5.5 可能没法破限了

GPT 5.4 使用之前 model_instruction 方法,加上 ctf 相关的 skill,从没翻车过,就连一些恶意的 exploit 都帮写了。5.5 出来之后想试试渗透能力,结果会话被中断了,感觉可能是外审,这样的话可能没法破限了。

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 霞葉)