标题: deepseek-v4-pro + Harness 实战效果
作者: #coldingcode
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2048516
时间: 2026-04-24 20:07:25
摘要:
作者: #coldingcode
板块: #开发调优
编号:
2048516帖子: https://linux.do/t/topic/2048516
时间: 2026-04-24 20:07:25
摘要:
【长期贴】开个帖子,分享一下我自己是如何做harness【已更新完成,等待交作业,后续再有新想法再补充】
开发调优
据网上传,目前Anthropic的所有产品均为harness模式,不过最近他们推了一个harness产品,原本把我吓了一跳,但实质一看,并不是干货,多少有点恶心人了,好东西都藏起来。我昨晚也成功验证了自己的第二个harness,工程量比是一开始做demo的100倍,平均跑完要30-50M token,10个小时左右(glm-5),并且效果还挺好。不过还是有很多优化点的,这也正是本贴的由来,在接下来…
harness 框架:还是上面那篇帖子的产物
编程模型:deepseek-v4-pro
先说总结:效果拔群
如何拔群:1.之前我有发过贴说harness弥补了glm-5和sonnet 4.6的差距,那时的说法是 sonnet 4.6 是9成熟的饭,glm-5 + harness 是全熟的饭,等于是一个完全可用的系统。这里的最低要求当然也是完全可用,那优势在哪里呢,(这里就不对比代码质量了,从明显的内容出发,说实话,几千行我也懒得对比)。
可以看原帖,功能相对来说比较简陋的,而且相信大家也看得出来,页面设计比较不协调,最多最多只能算是个成品,今天这个页面体现就比前面的要好,至少至少能是个得出手的东西。
另外一点,从构建 时间上来说,之前GLM-5 + harness 构建一个 MVP版本,大概需要5-6个小时,而本次是2小时27分15秒。
我个人认为,从编码层面来说,是符合deepseek官方发布的数值的。
PS:再来看个deepseek-v4-pro讲的冷笑话
标题: 【GPT之被标记网安风险】朋友改个数据库技术栈都能碰上?救命
作者: #丛柚
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2048522
时间: 2026-04-24 20:07:49
摘要:
作者: #丛柚
板块: #开发调优
编号:
2048522帖子: https://linux.do/t/topic/2048522
时间: 2026-04-24 20:07:49
摘要:
如图,虽然我朋友安慰自己说可能可以分解成小任务来绕过(?),但咱都确实不明所以。原来数据是 json 文件存储的,朋友让 gpt-5.5 用 prisma + sqlite 改造时马上碰上了。
我今天逆向时候也遇到过几次,我倒觉得可以接受,但我朋友这个请求集思广益,出个小小的绕过方案下下
标题: 翻到了3年前给自己埋的宝藏
作者: #Simmy4867
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2048553
时间: 2026-04-24 20:10:46
摘要:
作者: #Simmy4867
板块: #搞七捻三
编号:
2048553帖子: https://linux.do/t/topic/2048553
时间: 2026-04-24 20:10:46
摘要:
刚刚翻火狐的密码管理,翻到了当时用潘多拉的号,现在甚至还能登上codex使用
数量有10个左右
标题: 感觉用openclaw容易上瘾了!
作者: #xiaoxiaoai
板块: #资源荟萃
编号:
帖子: https://linux.do/t/topic/2048567
时间: 2026-04-24 20:12:40
摘要:
作者: #xiaoxiaoai
板块: #资源荟萃
编号:
2048567帖子: https://linux.do/t/topic/2048567
时间: 2026-04-24 20:12:40
摘要:
感觉用openclaw容易上瘾了! 强迫症的最爱了!
直接让他修改东西,直到超级完美!
在不知不觉 时间没有了!
标题: 目前订阅推荐
作者: #Rsmile.W
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2048591
时间: 2026-04-24 20:14:20
摘要:
作者: #Rsmile.W
板块: #开发调优
编号:
2048591帖子: https://linux.do/t/topic/2048591
时间: 2026-04-24 20:14:20
摘要:
目前考虑的选择是Claude Max5还是Gpt Pro5,目前都是基础档套餐,升级的话选择claude还是GPT呀,佬友们。
如果走google,如果后面降级的话,是先取消原来的订阅然后等到期之后重新订嘛?
5.5看佬友的反馈很好,opus4.7我感觉用下来体感没有4.6强
标题: 一个弱智题目,DeepSeek v4是唯一一个完全错误的
作者: #HitC
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2048611
时间: 2026-04-24 20:17:24
摘要:
作者: #HitC
板块: #搞七捻三
编号:
2048611帖子: https://linux.do/t/topic/2048611
时间: 2026-04-24 20:17:24
摘要:
只用一刀,如何把4个蛋糕分给4个小朋友
只有 DeepSeek 输出了完全错误的答案
Gemini 和 GPT 都意识到了,根本不需要切
Grok 和 Kimi 虽然没意识到不需要切,但是说的也没有毛病
类比之前的洗车问题,会发现,顶尖的ai模型在处理低端弱智问题时往往会犯错
我认为,在这种问题不能彻底解决之前,AI 是不能安全的取代人类的
标题: 怎么使用上DeepSeek-v4pro呀?
作者: #星渊清梦
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2048619
时间: 2026-04-24 20:18:20
摘要:
作者: #星渊清梦
板块: #搞七捻三
编号:
2048619帖子: https://linux.do/t/topic/2048619
时间: 2026-04-24 20:18:20
摘要:
在进行一些特殊领域的文学创作时,gpt5.5与Gemini3pro哪家好?
搞七捻三
现在的我的需求类似于写论文,写小说类似的(举例),需要扩展思路类型的需求,但是内容中是有比较强的逻辑的,会有夹带伪代码类似的逻辑文学,现在我各自使用了深度研究,产出的报告又扔给gpt深度研究融合了一份,接下来需要进行扩充构思,这一步还是比较关键的,所以问问佬们觉得选择哪个比较好
大概就是产品开发方面的报告构思,产品领域比较冷门,需要额外知识库补充知识那种
很久很久没关注国模了,听说ds在写作上面很强,想用用,但是到哪去用呢。。。?
需要深度思考的模式,可以是网页端,能上传文件即可
标题: supergrok换绑会容易掉吗,刚知道能换就换了,然后群友说容易掉,有没有佬知道的有点害怕
作者: #yaoshen
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2048620
时间: 2026-04-24 20:18:24
摘要:
作者: #yaoshen
板块: #搞七捻三
编号:
2048620帖子: https://linux.do/t/topic/2048620
时间: 2026-04-24 20:18:24
摘要:
从hotmail换成gmail了
标题: 其实我在DeepSeek-V4正式发布之前就猜测相关股票会上涨 买了一点点
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2048634
时间: 2026-04-24 20:19:35
摘要:
作者: #𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷
板块: #搞七捻三
编号:
2048634帖子: https://linux.do/t/topic/2048634
时间: 2026-04-24 20:19:35
摘要:
买的具体是哪个就不说了
不构成任何投资建议
投资需谨慎
也没赚多少
今晚和妹妹吃火锅去了 嘿嘿
标题: cc switch配置claudecode的模型的时候出问题
作者: #kang
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2048635
时间: 2026-04-24 20:19:36
摘要:
作者: #kang
板块: #开发调优
编号:
2048635帖子: https://linux.do/t/topic/2048635
时间: 2026-04-24 20:19:36
摘要:
ccswitch显示正常
模型的api什么也都没有问题应该,但是接到Claude里面就会这样,佬有知道怎么解决的吗
标题: 【第 27 弹】微信读书 | 自选书籍 66元!
作者: #思無邪
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/2048648
时间: 2026-04-24 20:20:30
摘要:
作者: #思無邪
板块: #福利羊毛
编号:
2048648帖子: https://linux.do/t/topic/2048648
时间: 2026-04-24 20:20:30
摘要:
好久不见,抽个奖混脸熟
[!danger] 参与须知
非实体书籍。不可折现。按需参与。
微信读书 中 自选 书籍,价值 66币 内。
中奖者一位。
即刻 Sat, Apr 25, 2026 8:00 PM CST
在本帖下回复即可。
官方抽奖工具
规则参见往期,不多哔哔。
点赞不能提高中奖率,但可以让大鹅开心一整天 ————鲁鹅
标题: 又一次被 gpt image 2 震撼到,能完全理解我的意思
作者: #北冰洋胸有大志的娃娃
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2048653
时间: 2026-04-24 20:20:53
摘要:
作者: #北冰洋胸有大志的娃娃
板块: #搞七捻三
编号:
2048653帖子: https://linux.do/t/topic/2048653
时间: 2026-04-24 20:20:53
摘要:
“生成一个正在坐硬拉的男士背面照片,他穿着大狗图案的短裤,旁边的人在给这个小狗图案的嘴喂火腿肠”
标题: 佬友们deepseek几乎都试过了吧,来个投票🔎
作者: #星星棠
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2048661
时间: 2026-04-24 20:21:55
摘要:
作者: #星星棠
板块: #搞七捻三
编号:
2048661帖子: https://linux.do/t/topic/2048661
时间: 2026-04-24 20:21:55
摘要:
一天下来感觉多多少少佬友们都试过了吧,来简单做个测评投票,看看大家的观感如何!
你认为deepseek v4 flash
你认为deepseek v4 flash
非常棒!很喜欢
很好用
也还好
一般般而已
看看大家票数
Click to view the poll.
你觉得deepseek v4 pro
你觉得deepseek v4 pro
非常棒!很喜欢
很好用
也还好
一般般而已
看看大家票数
Click to view the poll.
欢迎评论进行些讨论