DeepseekV4上线,模型在下了,昇腾的部署文档快端上来吧,已经饥渴难耐了
还记得上次部署deepseek还是在上次 🤔
4 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: shamiko)
还记得上次部署deepseek还是在上次 🤔
4 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: shamiko)
Deepseek价格恐怖如斯 好贵啊
一个hi+一个分析系统的命令
花了11m41s
消耗4.13rmb
10 个帖子 - 10 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: slayer3320)
一个hi+一个分析系统的命令
花了11m41s
消耗4.13rmb
10 个帖子 - 10 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: slayer3320)
佬们,有没有本地大模型替代的
我电脑是m2 max 96G的,最近羊毛不好弄了,想本地部署一个大模型,求推荐适合代码的本地大模型,能偶尔用用的
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: xbc)
我电脑是m2 max 96G的,最近羊毛不好弄了,想本地部署一个大模型,求推荐适合代码的本地大模型,能偶尔用用的
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: xbc)
无人在意的角落,gpt5.5上主页了
We’re releasing GPT‑5.5, our smartest and most intuitive to use model yet, and the next step toward a new way of getting work done on a computer.
https://openai.com/index/introducing-gpt-5-5/
6 个帖子 - 6 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Viber)
We’re releasing GPT‑5.5, our smartest and most intuitive to use model yet, and the next step toward a new way of getting work done on a computer.
https://openai.com/index/introducing-gpt-5-5/
6 个帖子 - 6 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Viber)
deepseek v4pro解 base64加密
刚刚站里有开公益站的佬新上线了ds v4。并发布了cdk,但是加密的所以我就丢到官方渠道的ds v4pro上,思考了足足900秒才给出结果。。。。 是因为用的人太多导致的吗?
gpt-5.4倒是很快
grok-4.3 beta 思考了22s
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Suhuanzhen)
刚刚站里有开公益站的佬新上线了ds v4。并发布了cdk,但是加密的所以我就丢到官方渠道的ds v4pro上,思考了足足900秒才给出结果。。。。 是因为用的人太多导致的吗?
gpt-5.4倒是很快
grok-4.3 beta 思考了22s
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Suhuanzhen)
【CHY API公益站】终于2级了,抽500个1w额度兑换码
来社区好久了,终于2级啦!为了表达喜悦,也是搞了个抽奖好吧(这次绝对不会发不了奖品)
抽奖地址
兑奖地址
21 个帖子 - 21 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: CHY)
来社区好久了,终于2级啦!为了表达喜悦,也是搞了个抽奖好吧(这次绝对不会发不了奖品)
抽奖地址
兑奖地址
PS:求求不要再举报了,我不想被踢2级啊嘤嘤嘤嘤嘤对了,注册也打开了
21 个帖子 - 21 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: CHY)
电子斗蛐蛐:小米mimo vs 智谱glm vs GPT
从该评论继续讨论:小米发布了MiMo-V2.5-Pro模型,有用过的感觉效果怎么样吗?
昨天使用了社区佬友分享的 mimo-v2.5-pro,当时解决了我一个困扰已久的问题,此问题 gpt-5.4/glm-5.1 都没有解决,今天又遇到一个类似的问题,我决定试一试 初始提示词相同 情况下(由于后期模型修复后的错误不一致,我尽量保持 prompt 的格式、风格一致),各个模型需要 额外 几次提示词能修复。
小米mimo、智谱glm 在 claude code 中运行,gpt 在 codex 中运行,插件、skill配置相似,统计数据来源:Claude Code History Viewer
战况如下:
mimo-v2.5-pro:
额外 prompt 2次,合计消息98条,用时20分钟,token数 4.8M,文件修改数 1
glm-5v-turbo:
额外 prompt 8次,编译错误1次,合计消息183条,用时25分钟,token数 4.3M,文件修改数 1
glm-5.1:
额外 prompt 3次,合计消息69条(主agent 52条,subagent 17条),用时38分钟,token数 2.5M,文件修改数 2
gpt-5.4-xhigh:
额外 prompt 3次,合计消息491条,用时59分钟,token数 25.6M,文件修改数 4
----------------------
主观体验:
mimo-v2.5-pro 输出很快(60~90 t/s),非常喜欢调用工具,有点gpt的味道。
glm-5v-turbo 输出很快(40~60 t/s),但是代码检查不到位,会出现编译错误,体验一般。
glm-5.1 似乎是用量太大的原因?我的lite订阅输出非常慢(6-20 t/s),输出质量不错,跟 mimo-v2.5-pro 伯仲之间,而且他的总消息数小于mimo,用了更少的工具,得到了正确答案,还充分利用了subagent 能力,但是由于吞吐速度慢,整体耗时很长,体验有点差。
gpt-5.4-xhigh 吞吐速度一般(30~60 t/s),由于我没有官方订阅,使用的是社区佬友的公益,速度仅作参考。体验大家也知道的,gpt不爱说人话,喜欢先调用一大堆工具,然后输出。面对这个问题使用了 3 次额外提示,修改了4个文件,没有想象中的那么精准。
----------------------
本场斗蛐蛐的胜者是:mimo-v2.5-pro / glm-5.1
mimo-v2.5-pro 用较少的prompt尽快的定位了问题并修复,展示了自己作为挑战者的底气。glm-5.1 则以较少的工具调用次数、较少的token消耗证明了自己国模一哥的地位。评价为 夯。
glm-5v-turbo 在本场中评为 拉完了,出现编译错误非常扣分。
gpt-5.4-xhigh 本场评为 拉完了,没有符合大家对它较高的期待,并且大量的token消耗,和最长的用时,但是鉴于平时可靠的长任务运行,提升到 NPC。
本次测评评价仅供娱乐,测评场景单一,不符合任何科学测试原则,不作为任何 XXX plan 购入参考,不包含对任何公司的客观评价依据。
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Junerver)
从该评论继续讨论:小米发布了MiMo-V2.5-Pro模型,有用过的感觉效果怎么样吗?
昨天使用了社区佬友分享的 mimo-v2.5-pro,当时解决了我一个困扰已久的问题,此问题 gpt-5.4/glm-5.1 都没有解决,今天又遇到一个类似的问题,我决定试一试 初始提示词相同 情况下(由于后期模型修复后的错误不一致,我尽量保持 prompt 的格式、风格一致),各个模型需要 额外 几次提示词能修复。
小米mimo、智谱glm 在 claude code 中运行,gpt 在 codex 中运行,插件、skill配置相似,统计数据来源:Claude Code History Viewer
战况如下:
mimo-v2.5-pro:
额外 prompt 2次,合计消息98条,用时20分钟,token数 4.8M,文件修改数 1
glm-5v-turbo:
额外 prompt 8次,编译错误1次,合计消息183条,用时25分钟,token数 4.3M,文件修改数 1
glm-5.1:
额外 prompt 3次,合计消息69条(主agent 52条,subagent 17条),用时38分钟,token数 2.5M,文件修改数 2
gpt-5.4-xhigh:
额外 prompt 3次,合计消息491条,用时59分钟,token数 25.6M,文件修改数 4
----------------------
主观体验:
mimo-v2.5-pro 输出很快(60~90 t/s),非常喜欢调用工具,有点gpt的味道。
glm-5v-turbo 输出很快(40~60 t/s),但是代码检查不到位,会出现编译错误,体验一般。
glm-5.1 似乎是用量太大的原因?我的lite订阅输出非常慢(6-20 t/s),输出质量不错,跟 mimo-v2.5-pro 伯仲之间,而且他的总消息数小于mimo,用了更少的工具,得到了正确答案,还充分利用了subagent 能力,但是由于吞吐速度慢,整体耗时很长,体验有点差。
gpt-5.4-xhigh 吞吐速度一般(30~60 t/s),由于我没有官方订阅,使用的是社区佬友的公益,速度仅作参考。体验大家也知道的,gpt不爱说人话,喜欢先调用一大堆工具,然后输出。面对这个问题使用了 3 次额外提示,修改了4个文件,没有想象中的那么精准。
----------------------
本场斗蛐蛐的胜者是:mimo-v2.5-pro / glm-5.1
mimo-v2.5-pro 用较少的prompt尽快的定位了问题并修复,展示了自己作为挑战者的底气。glm-5.1 则以较少的工具调用次数、较少的token消耗证明了自己国模一哥的地位。评价为 夯。
glm-5v-turbo 在本场中评为 拉完了,出现编译错误非常扣分。
gpt-5.4-xhigh 本场评为 拉完了,没有符合大家对它较高的期待,并且大量的token消耗,和最长的用时,但是鉴于平时可靠的长任务运行,提升到 NPC。
本次测评评价仅供娱乐,测评场景单一,不符合任何科学测试原则,不作为任何 XXX plan 购入参考,不包含对任何公司的客观评价依据。
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Junerver)
我觉得我这周是, 做完你的(gptimage2),做你的(kimi2.6),做完他的(gpt5.5),做他的(deepseekv4)
大家都用上没
刚用上5.5,
不知道消耗是5.4的多少倍。。。。。
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 三卷儿)
大家都用上没
刚用上5.5,
不知道消耗是5.4的多少倍。。。。。
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 三卷儿)
太强了佬,下次不敢了!
● 邮箱提前一个小时给我干欠费了,充值估计也是秒欠费,只能临时关掉邮箱验证码。
● Redis数据库干爆了,上次mysql没扛住,这次换Redis一样炸。
但是有一个好消息,注册成功的有很多是随机字符的@gmail.com结尾的邮箱,我尝试发送邮件,收到退信,原因用户不存在,等几天我就来清理一下这批账号,重新回流。
10 个帖子 - 10 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: picpi)
● 邮箱提前一个小时给我干欠费了,充值估计也是秒欠费,只能临时关掉邮箱验证码。
● Redis数据库干爆了,上次mysql没扛住,这次换Redis一样炸。
但是有一个好消息,注册成功的有很多是随机字符的@gmail.com结尾的邮箱,我尝试发送邮件,收到退信,原因用户不存在,等几天我就来清理一下这批账号,重新回流。
10 个帖子 - 10 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: picpi)
恭喜deepseek v4终于出来了,国模集体抬头
deepseek v4终于出来了,国内大模型以deepseek为首再次集体抬头,直逼三巨头
5 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: zo1223)
deepseek v4终于出来了,国内大模型以deepseek为首再次集体抬头,直逼三巨头
5 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: zo1223)
貌似gpt5.5在windows中会默认使用powershell5
前端时间为了避免codex的powershell老报错,我把powershell5换成了powershell7
但是今天gpt5.5出来之后,我使用中又发现了powershell报错,于是排查了一下发现好像gpt5.5会默认使用powershell5?
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Immey)
前端时间为了避免codex的powershell老报错,我把powershell5换成了powershell7
但是今天gpt5.5出来之后,我使用中又发现了powershell报错,于是排查了一下发现好像gpt5.5会默认使用powershell5?
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Immey)
有实力的来跟你们的老婆们视频通话吧
一张照片。一个活生生的数字人类。
CyberVerse 是一个开源的数字真人代理平台,支持实时视频通话。创建一个你可以面对面看到和交流的 AI 代理,就像视频通话一样。
实时视频通话
非预录。非回合制。与数字真人进行无限时长、实时、低延迟的视频通话——首帧约1.5秒。基于WebRTC,支持P2P流式传输和嵌入式TURN/NAT穿越。
开源地址: GitHub - dsd2077/CyberVerse: CyberVerse is an open-source digital human agent platform with real-time video calling. Create an AI agent you can see and talk to, face to face, just like a video call. · GitHub
效果视频: 数字人实时视频通话演示——小龙女
3 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 弥夏)
一张照片。一个活生生的数字人类。
你是否曾梦想拥有属于自己的J.A.R.V.I.S.——一个真正看见你、听到你并实时回应的人工智能?
想再次见到失去的人,听他们的声音,看他们对你微笑吗?
或者你一直希望能赋予一个角色生命?就一张照片。赛博宇宙让他们活了起来。
CyberVerse 是一个开源的数字真人代理平台,支持实时视频通话。创建一个你可以面对面看到和交流的 AI 代理,就像视频通话一样。
实时视频通话
非预录。非回合制。与数字真人进行无限时长、实时、低延迟的视频通话——首帧约1.5秒。基于WebRTC,支持P2P流式传输和嵌入式TURN/NAT穿越。
开源地址: GitHub - dsd2077/CyberVerse: CyberVerse is an open-source digital human agent platform with real-time video calling. Create an AI agent you can see and talk to, face to face, just like a video call. · GitHub
效果视频: 数字人实时视频通话演示——小龙女
3 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 弥夏)
deepseek 测评【转发】
内测群发的:
DeepSeek-V4测试报告
model1:
优势:
1. 该模型纯编程能力远强于Kimi-k2.6和GLM-5.1
2. 模型上下文超长,利于大量文档阅读
劣势:
1. 该模型未经过Agent使用环境优化 1. 特征一:“亲历亲为”:模型极少使用SubAgent,导致上下文迅速膨胀 2. 特征二:模型代码注释不详实,无文档,
即使有在提示词中以一定程度提及:
“具有AI-AGENT可持续性
具有人类可读性”
但效果聊胜于无,说明模型不知道可读性对应文档详实
Agent可持续性对应良好的AGENTS.md文档以及自主生成SKILL 3. 特征三:缺乏大型项目规划能力:无Todo长程规划,项目构建逻辑不足
rs项目不会写rustfmt.toml以及clippy,依赖配置错误
C++项目Vcpkg配置错误
说明模型并不明白构建项目以及维护良好代码的基本逻辑 4. 特征四:使用Claude Code反而导致模型能力退化
说明模型并不具备复杂Agent系统承载能力
2. “偷懒”:测试模型C++能力时,尝试从开源库拉取代码,这是其他所有模型没有的
特殊:
1. 非思考下模型的规划能力会更强
model2:
优势:
1. 该模型大型项目规划能力强于model1,与Kimi-K2.6,GLM-5.1持平
2. 大规模使用SubAgent,充分利用并发
劣势:
1. 该模型出现"逃逸"行为:
未能正确处理C++依赖,直接将依赖包拉取至非项目目录进行编译
发现主机不存在python并明确不能使用python的情况下尝试安装
在非项目目录编写代码
2. 过于自信
在所有测试中从未尝试对项目进行完整尝试,甚至未尝试编译项目
将编译成功当作没有bug而不进行检查
3. 存在强于model1的幻觉
4. 存在类似于Kimi-K2.6的过早优化,高耦合特化代码
5. 存在猜测性修复而不经用户讨论
6. 用户询问某处更改时,检查到一半发现有问题就自顾自地去改了而不提醒用户
7. 自主查询依赖文档的能力较弱
8. model1中所提及的1.3仍然存在,模型更注重具体代码是否完成,而不注重项目的维护难度
会尝试规避检查,甚至干脆不检查,即使提示词已经强调
9. 存在比model1更强的惰性,会在任务执行中段就宣称全部完成
10. 出现bug会宣称是外部原因,如用户破坏代码等错误归因
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Jan Rodemoyer)
内测群发的:
DeepSeek-V4测试报告
model1:
优势:
1. 该模型纯编程能力远强于Kimi-k2.6和GLM-5.1
2. 模型上下文超长,利于大量文档阅读
劣势:
1. 该模型未经过Agent使用环境优化 1. 特征一:“亲历亲为”:模型极少使用SubAgent,导致上下文迅速膨胀 2. 特征二:模型代码注释不详实,无文档,
即使有在提示词中以一定程度提及:
“具有AI-AGENT可持续性
具有人类可读性”
但效果聊胜于无,说明模型不知道可读性对应文档详实
Agent可持续性对应良好的AGENTS.md文档以及自主生成SKILL 3. 特征三:缺乏大型项目规划能力:无Todo长程规划,项目构建逻辑不足
rs项目不会写rustfmt.toml以及clippy,依赖配置错误
C++项目Vcpkg配置错误
说明模型并不明白构建项目以及维护良好代码的基本逻辑 4. 特征四:使用Claude Code反而导致模型能力退化
说明模型并不具备复杂Agent系统承载能力
2. “偷懒”:测试模型C++能力时,尝试从开源库拉取代码,这是其他所有模型没有的
特殊:
1. 非思考下模型的规划能力会更强
model2:
优势:
1. 该模型大型项目规划能力强于model1,与Kimi-K2.6,GLM-5.1持平
2. 大规模使用SubAgent,充分利用并发
劣势:
1. 该模型出现"逃逸"行为:
未能正确处理C++依赖,直接将依赖包拉取至非项目目录进行编译
发现主机不存在python并明确不能使用python的情况下尝试安装
在非项目目录编写代码
2. 过于自信
在所有测试中从未尝试对项目进行完整尝试,甚至未尝试编译项目
将编译成功当作没有bug而不进行检查
3. 存在强于model1的幻觉
4. 存在类似于Kimi-K2.6的过早优化,高耦合特化代码
5. 存在猜测性修复而不经用户讨论
6. 用户询问某处更改时,检查到一半发现有问题就自顾自地去改了而不提醒用户
7. 自主查询依赖文档的能力较弱
8. model1中所提及的1.3仍然存在,模型更注重具体代码是否完成,而不注重项目的维护难度
会尝试规避检查,甚至干脆不检查,即使提示词已经强调
9. 存在比model1更强的惰性,会在任务执行中段就宣称全部完成
10. 出现bug会宣称是外部原因,如用户破坏代码等错误归因
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Jan Rodemoyer)
shizuku无线调试启动问题
各位佬友,我安卓手机平时使用GKD来跳广告,但是在这之前需要在开发者选项里面无线调试配对shizuku启动shizuku了,GKD才能完成授权。
平时我只需要重启开机,启动一下shizuku就行了,后面无论WiFi是开还是关,shizuku都是启动状态,GKD也不会出现授权这些消息提醒。但是最近系统更新之后,每次只要WiFi已关闭,GKD立马就没授权了,就很恼火啊,我是OPPO手机,大家有没有遇到这种情况是如何解决的
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 怀民亦未寝)
各位佬友,我安卓手机平时使用GKD来跳广告,但是在这之前需要在开发者选项里面无线调试配对shizuku启动shizuku了,GKD才能完成授权。
平时我只需要重启开机,启动一下shizuku就行了,后面无论WiFi是开还是关,shizuku都是启动状态,GKD也不会出现授权这些消息提醒。但是最近系统更新之后,每次只要WiFi已关闭,GKD立马就没授权了,就很恼火啊,我是OPPO手机,大家有没有遇到这种情况是如何解决的
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 怀民亦未寝)