Nao佬的Deepseek V4 评测出来了 国模第一!
flash版本也很能打llm2014.github.io
LLM Benchmark Dashboard
----------------------
二更, 补充一下, Nao佬编程榜上也是国模第一, 这个中午就评测出来了, 所以没提.
编程榜上比的是完成同样任务的扣分数, 总扣分越小越好
不过网上大家的测试效果看起来, Deepseek V4 和 Claude Code 配合的还不是很好, 调工具不够积极
34 个帖子 - 30 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: UltraEvolution)
flash版本也很能打llm2014.github.io
LLM Benchmark Dashboard
----------------------
二更, 补充一下, Nao佬编程榜上也是国模第一, 这个中午就评测出来了, 所以没提.
编程榜上比的是完成同样任务的扣分数, 总扣分越小越好
不过网上大家的测试效果看起来, Deepseek V4 和 Claude Code 配合的还不是很好, 调工具不够积极
34 个帖子 - 30 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: UltraEvolution)
deepseek-v4-pro + Harness 实战效果
【长期贴】开个帖子,分享一下我自己是如何做harness【已更新完成,等待交作业,后续再有新想法再补充】 开发调优
harness 框架:还是上面那篇帖子的产物
编程模型:deepseek-v4-pro
先说总结:效果拔群
如何拔群:1.之前我有发过贴说harness弥补了glm-5和sonnet 4.6的差距,那时的说法是 sonnet 4.6 是9成熟的饭,glm-5 + harness 是全熟的饭,等于是一个完全可用的系统。这里的最低要求当然也是完全可用,那优势在哪里呢,(这里就不对比代码质量了,从明显的内容出发,说实话,几千行我也懒得对比)。
可以看原帖,功能相对来说比较简陋的,而且相信大家也看得出来,页面设计比较不协调,最多最多只能算是个成品,今天这个页面体现就比前面的要好,至少至少能是个得出手的东西。
另外一点,从构建 时间上来说,之前GLM-5 + harness 构建一个 MVP版本,大概需要5-6个小时,而本次是2小时27分15秒。
我个人认为,从编码层面来说,是符合deepseek官方发布的数值的。
PS:再来看个deepseek-v4-pro讲的冷笑话
28 个帖子 - 23 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: coldingcode)
【长期贴】开个帖子,分享一下我自己是如何做harness【已更新完成,等待交作业,后续再有新想法再补充】 开发调优
据网上传,目前Anthropic的所有产品均为harness模式,不过最近他们推了一个harness产品,原本把我吓了一跳,但实质一看,并不是干货,多少有点恶心人了,好东西都藏起来。我昨晚也成功验证了自己的第二个harness,工程量比是一开始做demo的100倍,平均跑完要30-50M token,10个小时左右(glm-5),并且效果还挺好。不过还是有很多优化点的,这也正是本贴的由来,在接下来…
harness 框架:还是上面那篇帖子的产物
编程模型:deepseek-v4-pro
先说总结:效果拔群
如何拔群:1.之前我有发过贴说harness弥补了glm-5和sonnet 4.6的差距,那时的说法是 sonnet 4.6 是9成熟的饭,glm-5 + harness 是全熟的饭,等于是一个完全可用的系统。这里的最低要求当然也是完全可用,那优势在哪里呢,(这里就不对比代码质量了,从明显的内容出发,说实话,几千行我也懒得对比)。
可以看原帖,功能相对来说比较简陋的,而且相信大家也看得出来,页面设计比较不协调,最多最多只能算是个成品,今天这个页面体现就比前面的要好,至少至少能是个得出手的东西。
另外一点,从构建 时间上来说,之前GLM-5 + harness 构建一个 MVP版本,大概需要5-6个小时,而本次是2小时27分15秒。
我个人认为,从编码层面来说,是符合deepseek官方发布的数值的。
PS:再来看个deepseek-v4-pro讲的冷笑话
28 个帖子 - 23 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: coldingcode)
美好的周末,从偶遇亦菲开始
大早上在民宿遇到亦菲,很热情,还请我吃苹果,关键笑得太甜了,美好的一天开始了佬们
感恩 (点击了解更多详细信息)
一起吃瓜子 (点击了解更多详细信息)
43 个帖子 - 41 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: funy)
大早上在民宿遇到亦菲,很热情,还请我吃苹果,关键笑得太甜了,美好的一天开始了佬们
感恩 (点击了解更多详细信息)
剧透还有别的佬友也遇到了,还在一起吃了瓜子 :bili_048:
一起吃瓜子 (点击了解更多详细信息)
43 个帖子 - 41 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: funy)
artificial analysis 测试 v4 flash max幻觉率排名倒数第一
等一会看看Pro的成绩,不过我感觉应该不会很惊艳
26 个帖子 - 20 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: starkvber)
等一会看看Pro的成绩,不过我感觉应该不会很惊艳
26 个帖子 - 20 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: starkvber)
DeepSeekv4神了
deepseek在长上下文和工具调用上不管是pro和flash差距都非常小,都能准确记住长上下文内容,对于pro有这个表现是正常的,但是flash表现居然也不错!要知道flash的参数量才284B!
而经济上deepseek不管是pro还是flash都非常便宜(对比国外),但是能力却差不多,神!夯暴
34 个帖子 - 25 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Neo)
deepseek在长上下文和工具调用上不管是pro和flash差距都非常小,都能准确记住长上下文内容,对于pro有这个表现是正常的,但是flash表现居然也不错!要知道flash的参数量才284B!
而经济上deepseek不管是pro还是flash都非常便宜(对比国外),但是能力却差不多,神!夯暴
34 个帖子 - 25 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Neo)
gpt image 2 生图提示词汇总
站里的gpt image 2 生图评比大赛 真是神仙打架,效果一个比一个好
为了方便学习佬友们的提示词,简单搓了一个汇总页面
LINUX DO · GPT Image 2 画廊
点击这里可以查看原帖并复制提示词
加载时间很长(大概十多秒)不过也能用,如果大家觉得值得我再当个事儿办
貌似变快了也稳定啦 🫠,虽然我也不知道为啥,但问题不大
16 个帖子 - 12 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 马上)
站里的gpt image 2 生图评比大赛 真是神仙打架,效果一个比一个好
为了方便学习佬友们的提示词,简单搓了一个汇总页面
LINUX DO · GPT Image 2 画廊
点击这里可以查看原帖并复制提示词
加载时间很长(大概十多秒)不过也能用,如果大家觉得值得我再当个事儿办
貌似变快了也稳定啦 🫠,虽然我也不知道为啥,但问题不大
16 个帖子 - 12 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 马上)
“眩晕瘫坐,原子弹爆炸”的来源
“眩晕瘫坐,那一刻就像看到原子弹爆炸”这句话实在太搞笑了 🤣,好奇查了查来源如下
阅读完整话题
via LINUX DO - 热门话题 (author: harme ohe)
“眩晕瘫坐,那一刻就像看到原子弹爆炸”这句话实在太搞笑了 🤣,好奇查了查来源如下
英文原句:I really sat back in my chair and I was just like, “Oh man! Here it is!”
直译:我真的靠在椅背上,心里想:“天啊,就是这个了!”
新智元:奥特曼被吓到眩晕瘫坐在椅子上
英文原句:It feels like the Manhattan Project.
直译:这感觉就像曼哈顿计划。
新智元:那一刻就像看到原子弹爆炸15 个帖子 - 14 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: harme ohe)
【GPT_Image_Playground】纯前端的 GPT-Image-2 API 调用 WebUI,参数齐全,功能完备,一上手就被吓到眩晕瘫坐,那一刻就像看到原子弹爆炸!
via LINUX DO - 热门话题 (author: Cook_Sleep)
via LINUX DO - 热门话题 (author: Cook_Sleep)
Telegraph
【GPT_Image_Playground】纯前端的 GPT-Image-2 API 调用 WebUI,参数齐全,功能完…
我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 GPT Image Playground 一站式解决 GPT-Image-2 的 Image API 参数可视化调整、API 调用、输入与输出存储、输出复用等需求,支持多请求同时进行。 听不懂? …
就在刚刚又戳了一个工具
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
● 我的帖子已经打上 开源推广 标签: 是
● 我的开源项目完整开源,无未开源部分: 是
● 我的开源项目已链接认可 LINUX DO 社区: 是
● 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
● 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
----------------------
一个WIN版gpt账号管理工具,马上试试吧github.com
GitHub - acheng-byte/copool-win: Copool Windows dashboard
Copool Windows dashboard
一个 Windows 桌面版账号管理和本地代理工具,可以集中管理多个 ChatGPT / Codex 账号,查看额度状态,自动识别邮箱命名账号,并启动一个 OpenAI 兼容的本地 API 代理,方便在 Cursor、VS Code、OpenAI SDK 等工具里统一使用。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 阿成)
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
● 我的帖子已经打上 开源推广 标签: 是
● 我的开源项目完整开源,无未开源部分: 是
● 我的开源项目已链接认可 LINUX DO 社区: 是
● 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
● 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
----------------------
一个WIN版gpt账号管理工具,马上试试吧github.com
GitHub - acheng-byte/copool-win: Copool Windows dashboard
Copool Windows dashboard
一个 Windows 桌面版账号管理和本地代理工具,可以集中管理多个 ChatGPT / Codex 账号,查看额度状态,自动识别邮箱命名账号,并启动一个 OpenAI 兼容的本地 API 代理,方便在 Cursor、VS Code、OpenAI SDK 等工具里统一使用。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 阿成)
抽一台小鸡,感谢始皇给的一次解封的机会,马上三级了,回馈社区
抽奖主题:[非必要不抽奖]感谢始皇给的一次解封的机会,马上三级了,回馈社区
也希望大家引以为戒,务必遵守社区各项规定
🏆️ 奖品详情:
[奖品名称]:[美国RN圣荷塞小鸡一个月使用权,直接发送服务器账号密码]
[奖品详细]:带宽500 Mbps、流量500 GB /月
:three_o_clock: 活动时间:
开始时间:[此贴发布时]
截止时间:[2026年4月25日晚20点]
📝 参与方式:
在本贴下回复“关于你对非必要不参与抽奖的认识”即可参与抽奖活动。
🔍️ 抽奖规则:
每位用户仅允许参与一次。
将使用 LINUX DO 抽奖工具在所有回复中随机抽取中奖者。
⚠️ 注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后在本帖公布,并通过论坛站内信由发起人通知领奖方式。
所有规则及抽奖结果由 @dnnh2018 及论坛管理团队最终解释。
🛡️ 发起人承诺:
作为本次抽奖的发起人 @dnnh2018 ,我承诺本话题的抽奖活动严格遵守 LINUX DO 社区抽奖规则。因违反上述规定引发的公平性争议或其他问题,均由我独立承担相应的道德与法律责任。
----------------------
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系 @dnnh2018 或论坛管理团队。
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 山河)
抽奖主题:[非必要不抽奖]感谢始皇给的一次解封的机会,马上三级了,回馈社区
也希望大家引以为戒,务必遵守社区各项规定
🏆️ 奖品详情:
[奖品名称]:[美国RN圣荷塞小鸡一个月使用权,直接发送服务器账号密码]
[奖品详细]:带宽500 Mbps、流量500 GB /月
:three_o_clock: 活动时间:
开始时间:[此贴发布时]
截止时间:[2026年4月25日晚20点]
📝 参与方式:
在本贴下回复“关于你对非必要不参与抽奖的认识”即可参与抽奖活动。
🔍️ 抽奖规则:
每位用户仅允许参与一次。
将使用 LINUX DO 抽奖工具在所有回复中随机抽取中奖者。
⚠️ 注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后在本帖公布,并通过论坛站内信由发起人通知领奖方式。
所有规则及抽奖结果由 @dnnh2018 及论坛管理团队最终解释。
🛡️ 发起人承诺:
作为本次抽奖的发起人 @dnnh2018 ,我承诺本话题的抽奖活动严格遵守 LINUX DO 社区抽奖规则。因违反上述规定引发的公平性争议或其他问题,均由我独立承担相应的道德与法律责任。
----------------------
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系 @dnnh2018 或论坛管理团队。
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 山河)
鱼的 X tl上怎么这么多简中cursor送token内容……
…
不过鱼鱼搜出来简中偏多,感觉很奇怪🤔
5 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 🐟)
…
不过鱼鱼搜出来简中偏多,感觉很奇怪🤔
5 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 🐟)
opencode go订阅能用了ds,买了一个发现上当了,根本不让接入Claude code,工具调用有问题
我寻思你们opencode用的不就是a/的协议么,怎么会出现工具调用的问题呢,匪夷所思了 🤣
消费还是要谨慎啊,贪小便宜又损失34rmb 🤣
4 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: ktze)
我寻思你们opencode用的不就是a/的协议么,怎么会出现工具调用的问题呢,匪夷所思了 🤣
消费还是要谨慎啊,贪小便宜又损失34rmb 🤣
4 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: ktze)