linux.do
21.8K subscribers
133K photos
202 videos
133 files
274K links
linux.do最新话题和热议话题
Download Telegram
Nao佬的Deepseek V4 评测出来了 国模第一!

flash版本也很能打llm2014.github.io

LLM Benchmark Dashboard

----------------------

二更, 补充一下, Nao佬编程榜上也是国模第一, 这个中午就评测出来了, 所以没提.
编程榜上比的是完成同样任务的扣分数, 总扣分越小越好
不过网上大家的测试效果看起来, Deepseek V4 和 Claude Code 配合的还不是很好, 调工具不够积极

34 个帖子 - 30 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: UltraEvolution)
deepseek-v4-pro + Harness 实战效果

【长期贴】开个帖子,分享一下我自己是如何做harness【已更新完成,等待交作业,后续再有新想法再补充】 开发调优
据网上传,目前Anthropic的所有产品均为harness模式,不过最近他们推了一个harness产品,原本把我吓了一跳,但实质一看,并不是干货,多少有点恶心人了,好东西都藏起来。我昨晚也成功验证了自己的第二个harness,工程量比是一开始做demo的100倍,平均跑完要30-50M token,10个小时左右(glm-5),并且效果还挺好。不过还是有很多优化点的,这也正是本贴的由来,在接下来…

harness 框架:还是上面那篇帖子的产物
编程模型:deepseek-v4-pro

先说总结:效果拔群
如何拔群:1.之前我有发过贴说harness弥补了glm-5和sonnet 4.6的差距,那时的说法是 sonnet 4.6 是9成熟的饭,glm-5 + harness 是全熟的饭,等于是一个完全可用的系统。这里的最低要求当然也是完全可用,那优势在哪里呢,(这里就不对比代码质量了,从明显的内容出发,说实话,几千行我也懒得对比)。
可以看原帖,功能相对来说比较简陋的,而且相信大家也看得出来,页面设计比较不协调,最多最多只能算是个成品,今天这个页面体现就比前面的要好,至少至少能是个得出手的东西。

另外一点,从构建 时间上来说,之前GLM-5 + harness 构建一个 MVP版本,大概需要5-6个小时,而本次是2小时27分15秒。

我个人认为,从编码层面来说,是符合deepseek官方发布的数值的。

PS:再来看个deepseek-v4-pro讲的冷笑话

28 个帖子 - 23 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: coldingcode)
美好的周末,从偶遇亦菲开始

大早上在民宿遇到亦菲,很热情,还请我吃苹果,关键笑得太甜了,美好的一天开始了佬们
感恩 (点击了解更多详细信息)
剧透
还有别的佬友也遇到了,还在一起吃了瓜子 :bili_048:
一起吃瓜子 (点击了解更多详细信息)
43 个帖子 - 41 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: funy)
artificial analysis 测试 v4 flash max幻觉率排名倒数第一

等一会看看Pro的成绩,不过我感觉应该不会很惊艳

26 个帖子 - 20 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: starkvber)
梁文锋真要成圣?

梁哥,他真的,我哭死 ✋️ 😭 🤚

36 个帖子 - 28 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: ishtar)
DeepSeekv4神了

deepseek在长上下文和工具调用上不管是pro和flash差距都非常小,都能准确记住长上下文内容,对于pro有这个表现是正常的,但是flash表现居然也不错!要知道flash的参数量才284B!

而经济上deepseek不管是pro还是flash都非常便宜(对比国外),但是能力却差不多,神!夯暴

34 个帖子 - 25 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: Neo)
gpt image 2 生图提示词汇总

站里的gpt image 2 生图评比大赛 真是神仙打架,效果一个比一个好

为了方便学习佬友们的提示词,简单搓了一个汇总页面
LINUX DO · GPT Image 2 画廊

点击这里可以查看原帖并复制提示词

加载时间很长(大概十多秒)不过也能用,如果大家觉得值得我再当个事儿办

貌似变快了也稳定啦 🫠,虽然我也不知道为啥,但问题不大

16 个帖子 - 12 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: 马上)
逼迫老婆换了个情头

确实像个傻子一样。。

15 个帖子 - 15 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: b1ghawk119)
“眩晕瘫坐,原子弹爆炸”的来源

“眩晕瘫坐,那一刻就像看到原子弹爆炸”这句话实在太搞笑了 🤣,好奇查了查来源如下
英文原句:I really sat back in my chair and I was just like, “Oh man! Here it is!”
直译:我真的靠在椅背上,心里想:“天啊,就是这个了!”
新智元:奥特曼被吓到眩晕瘫坐在椅子上
英文原句:It feels like the Manhattan Project.
直译:这感觉就像曼哈顿计划。
新智元:那一刻就像看到原子弹爆炸
15 个帖子 - 14 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: harme ohe)
就在刚刚又戳了一个工具

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

● 我的帖子已经打上 开源推广 标签:
● 我的开源项目完整开源,无未开源部分:
● 我的开源项目已链接认可 LINUX DO 社区:
● 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
● 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出

----------------------

一个WIN版gpt账号管理工具,马上试试吧github.com

GitHub - acheng-byte/copool-win: Copool Windows dashboard

Copool Windows dashboard

一个 Windows 桌面版账号管理和本地代理工具,可以集中管理多个 ChatGPT / Codex 账号,查看额度状态,自动识别邮箱命名账号,并启动一个 OpenAI 兼容的本地 API 代理,方便在 Cursor、VS Code、OpenAI SDK 等工具里统一使用。

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 阿成)
抽一台小鸡,感谢始皇给的一次解封的机会,马上三级了,回馈社区

抽奖主题:[非必要不抽奖]感谢始皇给的一次解封的机会,马上三级了,回馈社区

也希望大家引以为戒,务必遵守社区各项规定

🏆️ 奖品详情:

[奖品名称]:[美国RN圣荷塞小鸡一个月使用权,直接发送服务器账号密码]
[奖品详细]:带宽500 Mbps、流量500 GB /月

:three_o_clock: 活动时间:

开始时间:[此贴发布时]
截止时间:[2026年4月25日晚20点]

📝 参与方式:

在本贴下回复“关于你对非必要不参与抽奖的认识”即可参与抽奖活动。

🔍️ 抽奖规则:

每位用户仅允许参与一次。
将使用 LINUX DO 抽奖工具在所有回复中随机抽取中奖者。

⚠️ 注意事项:

本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后在本帖公布,并通过论坛站内信由发起人通知领奖方式。
所有规则及抽奖结果由 @dnnh2018 及论坛管理团队最终解释。

🛡️ 发起人承诺:

作为本次抽奖的发起人 @dnnh2018 ,我承诺本话题的抽奖活动严格遵守 LINUX DO 社区抽奖规则。因违反上述规定引发的公平性争议或其他问题,均由我独立承担相应的道德与法律责任。

----------------------

期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系 @dnnh2018 或论坛管理团队

4 个帖子 - 4 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 山河)
鱼的 X tl上怎么这么多简中cursor送token内容……



不过鱼鱼搜出来简中偏多,感觉很奇怪🤔

5 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 🐟)
opencode go订阅能用了ds,买了一个发现上当了,根本不让接入Claude code,工具调用有问题

我寻思你们opencode用的不就是a/的协议么,怎么会出现工具调用的问题呢,匪夷所思了 🤣
消费还是要谨慎啊,贪小便宜又损失34rmb 🤣

4 个帖子 - 3 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: ktze)