linux.do
21.8K subscribers
133K photos
202 videos
133 files
275K links
linux.do最新话题和热议话题
Download Telegram
deepseek-v4-pro + Harness 实战效果

【长期贴】开个帖子,分享一下我自己是如何做harness【已更新完成,等待交作业,后续再有新想法再补充】 开发调优
据网上传,目前Anthropic的所有产品均为harness模式,不过最近他们推了一个harness产品,原本把我吓了一跳,但实质一看,并不是干货,多少有点恶心人了,好东西都藏起来。我昨晚也成功验证了自己的第二个harness,工程量比是一开始做demo的100倍,平均跑完要30-50M token,10个小时左右(glm-5),并且效果还挺好。不过还是有很多优化点的,这也正是本贴的由来,在接下来…

harness 框架:还是上面那篇帖子的产物
编程模型:deepseek-v4-pro

先说总结:效果拔群
如何拔群:1.之前我有发过贴说harness弥补了glm-5和sonnet 4.6的差距,那时的说法是 sonnet 4.6 是9成熟的饭,glm-5 + harness 是全熟的饭,等于是一个完全可用的系统。这里的最低要求当然也是完全可用,那优势在哪里呢,(这里就不对比代码质量了,从明显的内容出发,说实话,几千行我也懒得对比)。
可以看原帖,功能相对来说比较简陋的,而且相信大家也看得出来,页面设计比较不协调,最多最多只能算是个成品,今天这个页面体现就比前面的要好,至少至少能是个得出手的东西。

另外一点,从构建 时间上来说,之前GLM-5 + harness 构建一个 MVP版本,大概需要5-6个小时,而本次是2小时27分15秒。

我个人认为,从编码层面来说,是符合deepseek官方发布的数值的。

PS:再来看个deepseek-v4-pro讲的冷笑话

28 个帖子 - 23 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: coldingcode)
美好的周末,从偶遇亦菲开始

大早上在民宿遇到亦菲,很热情,还请我吃苹果,关键笑得太甜了,美好的一天开始了佬们
感恩 (点击了解更多详细信息)
剧透
还有别的佬友也遇到了,还在一起吃了瓜子 :bili_048:
一起吃瓜子 (点击了解更多详细信息)
43 个帖子 - 41 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: funy)
artificial analysis 测试 v4 flash max幻觉率排名倒数第一

等一会看看Pro的成绩,不过我感觉应该不会很惊艳

26 个帖子 - 20 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: starkvber)
梁文锋真要成圣?

梁哥,他真的,我哭死 ✋️ 😭 🤚

36 个帖子 - 28 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: ishtar)
DeepSeekv4神了

deepseek在长上下文和工具调用上不管是pro和flash差距都非常小,都能准确记住长上下文内容,对于pro有这个表现是正常的,但是flash表现居然也不错!要知道flash的参数量才284B!

而经济上deepseek不管是pro还是flash都非常便宜(对比国外),但是能力却差不多,神!夯暴

34 个帖子 - 25 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: Neo)
gpt image 2 生图提示词汇总

站里的gpt image 2 生图评比大赛 真是神仙打架,效果一个比一个好

为了方便学习佬友们的提示词,简单搓了一个汇总页面
LINUX DO · GPT Image 2 画廊

点击这里可以查看原帖并复制提示词

加载时间很长(大概十多秒)不过也能用,如果大家觉得值得我再当个事儿办

貌似变快了也稳定啦 🫠,虽然我也不知道为啥,但问题不大

16 个帖子 - 12 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: 马上)
逼迫老婆换了个情头

确实像个傻子一样。。

15 个帖子 - 15 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: b1ghawk119)
“眩晕瘫坐,原子弹爆炸”的来源

“眩晕瘫坐,那一刻就像看到原子弹爆炸”这句话实在太搞笑了 🤣,好奇查了查来源如下
英文原句:I really sat back in my chair and I was just like, “Oh man! Here it is!”
直译:我真的靠在椅背上,心里想:“天啊,就是这个了!”
新智元:奥特曼被吓到眩晕瘫坐在椅子上
英文原句:It feels like the Manhattan Project.
直译:这感觉就像曼哈顿计划。
新智元:那一刻就像看到原子弹爆炸
15 个帖子 - 14 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: harme ohe)
就在刚刚又戳了一个工具

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

● 我的帖子已经打上 开源推广 标签:
● 我的开源项目完整开源,无未开源部分:
● 我的开源项目已链接认可 LINUX DO 社区:
● 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
● 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出

----------------------

一个WIN版gpt账号管理工具,马上试试吧github.com

GitHub - acheng-byte/copool-win: Copool Windows dashboard

Copool Windows dashboard

一个 Windows 桌面版账号管理和本地代理工具,可以集中管理多个 ChatGPT / Codex 账号,查看额度状态,自动识别邮箱命名账号,并启动一个 OpenAI 兼容的本地 API 代理,方便在 Cursor、VS Code、OpenAI SDK 等工具里统一使用。

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 阿成)
抽一台小鸡,感谢始皇给的一次解封的机会,马上三级了,回馈社区

抽奖主题:[非必要不抽奖]感谢始皇给的一次解封的机会,马上三级了,回馈社区

也希望大家引以为戒,务必遵守社区各项规定

🏆️ 奖品详情:

[奖品名称]:[美国RN圣荷塞小鸡一个月使用权,直接发送服务器账号密码]
[奖品详细]:带宽500 Mbps、流量500 GB /月

:three_o_clock: 活动时间:

开始时间:[此贴发布时]
截止时间:[2026年4月25日晚20点]

📝 参与方式:

在本贴下回复“关于你对非必要不参与抽奖的认识”即可参与抽奖活动。

🔍️ 抽奖规则:

每位用户仅允许参与一次。
将使用 LINUX DO 抽奖工具在所有回复中随机抽取中奖者。

⚠️ 注意事项:

本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后在本帖公布,并通过论坛站内信由发起人通知领奖方式。
所有规则及抽奖结果由 @dnnh2018 及论坛管理团队最终解释。

🛡️ 发起人承诺:

作为本次抽奖的发起人 @dnnh2018 ,我承诺本话题的抽奖活动严格遵守 LINUX DO 社区抽奖规则。因违反上述规定引发的公平性争议或其他问题,均由我独立承担相应的道德与法律责任。

----------------------

期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系 @dnnh2018 或论坛管理团队

4 个帖子 - 4 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 山河)
鱼的 X tl上怎么这么多简中cursor送token内容……



不过鱼鱼搜出来简中偏多,感觉很奇怪🤔

5 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 🐟)
opencode go订阅能用了ds,买了一个发现上当了,根本不让接入Claude code,工具调用有问题

我寻思你们opencode用的不就是a/的协议么,怎么会出现工具调用的问题呢,匪夷所思了 🤣
消费还是要谨慎啊,贪小便宜又损失34rmb 🤣

4 个帖子 - 3 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: ktze)
vibe了个小脚本 超星自动答题器 欢迎各位佬友指教

故事背景很简单,蒟蒻下周就要考劳动理论了,但是前两天才得知是闭卷考试,本来还想着老老实实把书本速通一遍然后留些痕迹的,但是有很多题目根本找不到答案,快一个钟才做完一章的题,效率太低,听朋友说ocs那个题库有5块2000题的,算下来1分钱4题,我个人感觉不太划算,于是想到vibe一个自动答题器,这也算是我的第一次vibe coding吧。

这两天用Gemini vibe了一个超星学习通作业自动答题的小脚本,调用DeepSeek的api,现在支持自动答单选、多选、判断、填空、简答等题型,答了几套题正确率在85%~95%不等,重复运行可能会提高正确率(可能答理工类题目正确率还会更高一点?)。

成本方面,我测了400多道题,用了2分钱,平均1分钱200题吧,当然这个跟题目长度有莫大关系,但这个性价比也明显高于题库。

提示词方面,我让他给的答案尽量精简,“单选题只输出选项”之类的,也有助于节省token(应该?)。

哦对还有就是今天早上想上传到油叉的,但是recaptcha一直load不出来,提交不了,就上传到脚本猫去了:超星学习通自动答题
如果觉得好用可以分享给有需要的朋友

后续应该还会补充程序题的答题。
纪念本人第一次vibe coding,如有不当之处或者有待改进的地方,请佬友们多多指教,谢谢

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: dmhnb6)