cpa反代codex 5.5怎么开启fast模式
我平常是在codexapp里使用的自己的cpa服务器,之前5.4时期就有配过。
当时看到有佬友说config.toml中加入
不知道现在是否还能这样配置
这是我目前的codex配置
btw:codexapp里只能显示自定义模型而且上下文窗口好像只有258k
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 初雨荷)
我平常是在codexapp里使用的自己的cpa服务器,之前5.4时期就有配过。
当时看到有佬友说config.toml中加入
service_tier = "fast"然后在cpa中的payload中加入如下配置就行不知道现在是否还能这样配置
这是我目前的codex配置
btw:codexapp里只能显示自定义模型而且上下文窗口好像只有258k
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 初雨荷)
DeepSeek V4 Thinking Max+OpenCode小功能代码测试
用DeepSeek V4测试了一下代码能力,让它给我的一个后端项目加个RSS功能,实测下来感觉还不错,能很好的理解项目架构(也有OpenCode的功劳),做出的改动符合当前项目架构,没有出现写屎山或者自己造轮子情况,不过没有自行生成单元测试,gpt的话大部分时间会自动生成单元测试。就是价格上有点小贵,直接用的官方API,后台显示花费4.98元,总Token为1533274 token,输入(命中缓存)1245696 token,输入(未命中缓存)263792 token,输出23786 token
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: AlexFox)
用DeepSeek V4测试了一下代码能力,让它给我的一个后端项目加个RSS功能,实测下来感觉还不错,能很好的理解项目架构(也有OpenCode的功劳),做出的改动符合当前项目架构,没有出现写屎山或者自己造轮子情况,不过没有自行生成单元测试,gpt的话大部分时间会自动生成单元测试。就是价格上有点小贵,直接用的官方API,后台显示花费4.98元,总Token为1533274 token,输入(命中缓存)1245696 token,输入(未命中缓存)263792 token,输出23786 token
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: AlexFox)
一张531790卡头的0刀卡,还有30多分钟
cdk.linux.do
LINUX DO CDK
Linux Do 社区 CDK 快速分享平台 - 让分享变得更简单
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: zoenoa)
cdk.linux.do
LINUX DO CDK
Linux Do 社区 CDK 快速分享平台 - 让分享变得更简单
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: zoenoa)
华为芯片拖慢DeepSeek V4上线?同一内核通吃英伟达昇腾还加速近2倍!
DeepSeek V4 发布前,社区广泛流传一种猜测:V4 上线时间晚于预期,是因为模型从英伟达迁移到华为昇腾平台遭遇适配困难。V4 技术报告虽未直接回应这一传闻,但披露的性能数据与之明显矛盾。
报告显示,V4 的细粒度专家分区方案(Fine-Grained EP Scheme)已在 NVIDIA GPU 和华为昇腾 NPU 双平台完成部署验证,常规推理负载加速 1.50 至 1.73 倍,RL rollout 和高速 Agent 服务等延迟敏感场景最高加速 1.96 倍。团队已将 CUDA 版本内核 MegaMoE 作为 DeepGEMM 的一部分开源。换言之,V4 在两套硬件上都跑出了接近理论上限的效率,跨平台适配并未造成性能折损。
huggingface.co
DeepSeek_V4.pdf
68.21 KB
8 个帖子 - 6 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 你这是违法行为)
DeepSeek V4 发布前,社区广泛流传一种猜测:V4 上线时间晚于预期,是因为模型从英伟达迁移到华为昇腾平台遭遇适配困难。V4 技术报告虽未直接回应这一传闻,但披露的性能数据与之明显矛盾。
报告显示,V4 的细粒度专家分区方案(Fine-Grained EP Scheme)已在 NVIDIA GPU 和华为昇腾 NPU 双平台完成部署验证,常规推理负载加速 1.50 至 1.73 倍,RL rollout 和高速 Agent 服务等延迟敏感场景最高加速 1.96 倍。团队已将 CUDA 版本内核 MegaMoE 作为 DeepGEMM 的一部分开源。换言之,V4 在两套硬件上都跑出了接近理论上限的效率,跨平台适配并未造成性能折损。
huggingface.co
DeepSeek_V4.pdf
68.21 KB
8 个帖子 - 6 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 你这是违法行为)
求问关于国内云服务厂商带宽使用的问题
最近帮一个朋友搞服务器,发现国内云厂商的带宽贵的离谱
尤其是要求高一点的,简直抢劫一样
基本上20M规定带宽的,1年都要1.5w左右
问了下大模型,想了几个方案,求有经验的佬们指导一下
1、订购几个小流量的带宽
比如,订购4个5M的,绑定个很弱的服务器,然后再通过云厂商的EIP之类的做轮询转发,
这样,只要不是单客户端对大流量有要求的,是不是基本可以满足?
2、订购多个轻量级服务器
同上面的思路一样,轻量级服务器一般是共享200M带宽的,有云厂商也提供的多轻量级服务器路由的能力。
不过我有一点不是很确定,有没有可能,我订阅的轻量级服务器都是在1个200m的池子里面,虽然定了多台,但是实际上是自己抢自己的?
谢谢各位佬的指教
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: fangxiusun)
最近帮一个朋友搞服务器,发现国内云厂商的带宽贵的离谱
尤其是要求高一点的,简直抢劫一样
基本上20M规定带宽的,1年都要1.5w左右
问了下大模型,想了几个方案,求有经验的佬们指导一下
1、订购几个小流量的带宽
比如,订购4个5M的,绑定个很弱的服务器,然后再通过云厂商的EIP之类的做轮询转发,
这样,只要不是单客户端对大流量有要求的,是不是基本可以满足?
2、订购多个轻量级服务器
同上面的思路一样,轻量级服务器一般是共享200M带宽的,有云厂商也提供的多轻量级服务器路由的能力。
不过我有一点不是很确定,有没有可能,我订阅的轻量级服务器都是在1个200m的池子里面,虽然定了多台,但是实际上是自己抢自己的?
谢谢各位佬的指教
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: fangxiusun)
deepseekv4编码
大家都是在哪用的dsv4编码呀 trae和cursor都没适配吧?“error”:{“message”:"The reasoning_content in the thinking mode must be passed back to the API. }
3 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Kurt)
大家都是在哪用的dsv4编码呀 trae和cursor都没适配吧?“error”:{“message”:"The reasoning_content in the thinking mode must be passed back to the API. }
3 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Kurt)
GPT 5.5 可能没法破限了
GPT 5.4 使用之前 model_instruction 方法,加上 ctf 相关的 skill,从没翻车过,就连一些恶意的 exploit 都帮写了。5.5 出来之后想试试渗透能力,结果会话被中断了,感觉可能是外审,这样的话可能没法破限了。
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 霞葉)
GPT 5.4 使用之前 model_instruction 方法,加上 ctf 相关的 skill,从没翻车过,就连一些恶意的 exploit 都帮写了。5.5 出来之后想试试渗透能力,结果会话被中断了,感觉可能是外审,这样的话可能没法破限了。
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 霞葉)
AI读《DeepSeek-V4: Towards Highly Efficient Million-Token Context Intelligence》
使用deepseek-v4 pro的总结,配合gpt-image-2的出图
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 徐福)
使用deepseek-v4 pro的总结,配合gpt-image-2的出图
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 徐福)
微软首次向员工提供自愿离职补偿方案
https://cn.wsj.com/articles/microsoft-offers-buyouts-to-7-of-workforce-601754bc
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷)
https://cn.wsj.com/articles/microsoft-offers-buyouts-to-7-of-workforce-601754bc
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷)
❤1
DeepSeek V4角色扮演简单测试
简单测试了一下角色扮演能力(这可是重中之重啊!),用的是v3.2的简单的提示词(提示词就不发了咳咳咳),能感觉出来回复明显“平淡化”了,原来的v3.2的提示词可能需要优化一下,等某个APP上架了v4 pro我再试试那些大神写的角色卡,这次用的也是pro+think max,不知道如果不开max效果会不会打折扣
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: AlexFox)
简单测试了一下角色扮演能力(这可是重中之重啊!),用的是v3.2的简单的提示词(提示词就不发了咳咳咳),能感觉出来回复明显“平淡化”了,原来的v3.2的提示词可能需要优化一下,等某个APP上架了v4 pro我再试试那些大神写的角色卡,这次用的也是pro+think max,不知道如果不开max效果会不会打折扣
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: AlexFox)
将glm5.1的智商换算为juice值,那一定是429
🤣gpt的juice值需要提示词才能问出来,glm5.1就不一样了,你不问他他都跟你报429(高峰期限流不可用报错)
2 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: xhzlk)
🤣gpt的juice值需要提示词才能问出来,glm5.1就不一样了,你不问他他都跟你报429(高峰期限流不可用报错)
2 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: xhzlk)
求现在可用的奥特曼注册机
大佬们,现在还可以用的奥特曼注册机有哪些哦,求一个,古法手搓一直跳手机验证,动态IP、市面上的邮箱都试过了。
PS:顺带求个赞,升级二级。
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 西贡情人)
大佬们,现在还可以用的奥特曼注册机有哪些哦,求一个,古法手搓一直跳手机验证,动态IP、市面上的邮箱都试过了。
PS:顺带求个赞,升级二级。
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 西贡情人)
copilot pro+貌似除了次数限制外也加了token用量限制了
现在既有次数限制又有用量限制,没法像以前那样爽登了..现在应该是同时有次数限制+5小时用量限制+周用量限制了..
image
7 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: ceshi01Adx)
现在既有次数限制又有用量限制,没法像以前那样爽登了..现在应该是同时有次数限制+5小时用量限制+周用量限制了..
image
7 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: ceshi01Adx)