0刀卡,还剩40分钟,抽奖抽了,验证时需要接码
可能会被拒绝,不确保好用。因为需要接码,抽一个人。十分钟后开奖。
5 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: xiaolaohu)
可能会被拒绝,不确保好用。因为需要接码,抽一个人。十分钟后开奖。
5 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: xiaolaohu)
「抽奖」9.9刀Rabisu年付小鸡(已支持支付宝支付)
抽奖主题: Rabisu 9.9刀开启支付宝支付,抽一台年付的小鸡
🏆️ 奖品详情:
[奖品]:Rabisu9.9刀年付小鸡
[测评地址]:[Rabisu小鸡年付9.9刀乐(1核1内存,理论不限流量),不含Aff(始皇:主帖里就把内容写全。不然佬友们看着含含糊糊,不知道你是要分享还是推广))
发放方式:手动私聊中奖者IP,ROOT,密码,并提供重置服务
:three_o_clock: 活动时间:
开始时间:Sat, Apr 25, 2026 6:00 PM CST
截止时间:Tue, Apr 28, 2026 8:00 AM CST
兑奖截止时间:Tue, Apr 28, 2026 10:00 AM CST
📝 参与方式:
在本帖下回复任意内容
🔍️ 抽奖规则:
每位用户仅允许参与一次。
使用官方抽奖工具随机抽取中奖者。
⚠️ 注意事项:
参与前请务必查看始皇的帖子抽奖须知
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后2小时内在本帖公布,并通过私信通知领奖方式。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Simshen)
抽奖主题: Rabisu 9.9刀开启支付宝支付,抽一台年付的小鸡
🏆️ 奖品详情:
[奖品]:Rabisu9.9刀年付小鸡
[测评地址]:[Rabisu小鸡年付9.9刀乐(1核1内存,理论不限流量),不含Aff(始皇:主帖里就把内容写全。不然佬友们看着含含糊糊,不知道你是要分享还是推广))
发放方式:手动私聊中奖者IP,ROOT,密码,并提供重置服务
:three_o_clock: 活动时间:
开始时间:Sat, Apr 25, 2026 6:00 PM CST
截止时间:Tue, Apr 28, 2026 8:00 AM CST
兑奖截止时间:Tue, Apr 28, 2026 10:00 AM CST
📝 参与方式:
在本帖下回复任意内容
🔍️ 抽奖规则:
每位用户仅允许参与一次。
使用官方抽奖工具随机抽取中奖者。
⚠️ 注意事项:
参与前请务必查看始皇的帖子抽奖须知
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后2小时内在本帖公布,并通过私信通知领奖方式。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Simshen)
GPT 5.5 逆向需要申请新模型?
This chat was flagged for possible cybersecurity risk If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program.
https://chatgpt.com/cyber
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 文聿)
This chat was flagged for possible cybersecurity risk If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program.
https://chatgpt.com/cyber
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 文聿)
nature : CAS分区表停更,这令人震惊
https://www.nature.com/articles/d41586-026-01277-2
阅读完整话题
via LINUX DO - 最新话题 (author: 🐟)
https://www.nature.com/articles/d41586-026-01277-2
2 个帖子 - 2 位参与者
中国科学院(CAS)北京国家科学图书馆已停止发布其具有影响力的期刊排名,令许多研究人员感到意外。该排名在中国研究评估中占据核心地位已超过20年,其终止让大学和学者对未来走向充满不确定。
CAS期刊排名,也称为CAS期刊分区表,最初是为了帮助研究人员评估期刊质量而开发的。但随着时间推移,它开始影响招聘决策、资金分配和晋升。
阅读完整话题
via LINUX DO - 最新话题 (author: 🐟)
deepseek官网出现了橘子问题终极解决方案!但有点…
如题
看上去deepseek是不是棒棒哒,但把橘子换成苹果试试
hjh,解决了,但没完全解决
属于是独爱橘子了(bushi)
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 我是小鸭头)
如题
看上去deepseek是不是棒棒哒,但把橘子换成苹果试试
hjh,解决了,但没完全解决
属于是独爱橘子了(bushi)
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 我是小鸭头)
本科毕设论文免费查重查AIGC率以及降重降AIGC分享
查重和查AIGC率(免费):
https://www.paperyy.com/ paperYY免费查重
https://uuxie.com/ UU科研助手
https://paperpure.net/ paperpure 每日免费额度(剩余 5 次)
降重:可以查重用paperpass,然后拿标红和标黄的部分去找ai降重
降重(给ai的提示词)(朋友发的 用了一下还可以):
要求:1.保持原文的核心意思不变!但可以通过调整语序、缩写、扩写、替换同义词等方式进行改写2.改写后的内容应更加具有逻辑性和条理性,符合论文的写作规范。3.尽量避免与原文出现连续8个字相同的句子,以提高内容的多样性和可读性。4.请确保改写后的内容仍然保持原文的风格和语气,不要偏离原文的主题和意图。5.长短句结合。6.避免过于机械化的段落结构8.保留原文的核心意思信息和意图
降AIGC:可以用https://paperpure.net/dashboard/text-ai小时卡(20一小时)去降(不是广告或者推销哈 就自己感觉还不错性价比也很高所以分享一下)
亲测:aigc率从60、70%降到百分之十几 但是小时卡第一次很快 后面再降的话可能就要十几分钟或者二十分钟了(这个小时卡购买的时候下面也写的 我没注意看第二次很慢还问了客服 😂)
各位佬有好用免费的途径也拜托分享分享 🫡
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: wobulele)
查重和查AIGC率(免费):
https://www.paperyy.com/ paperYY免费查重
https://uuxie.com/ UU科研助手
https://paperpure.net/ paperpure 每日免费额度(剩余 5 次)
降重:可以查重用paperpass,然后拿标红和标黄的部分去找ai降重
降重(给ai的提示词)(朋友发的 用了一下还可以):
要求:1.保持原文的核心意思不变!但可以通过调整语序、缩写、扩写、替换同义词等方式进行改写2.改写后的内容应更加具有逻辑性和条理性,符合论文的写作规范。3.尽量避免与原文出现连续8个字相同的句子,以提高内容的多样性和可读性。4.请确保改写后的内容仍然保持原文的风格和语气,不要偏离原文的主题和意图。5.长短句结合。6.避免过于机械化的段落结构8.保留原文的核心意思信息和意图
降AIGC:可以用https://paperpure.net/dashboard/text-ai小时卡(20一小时)去降(不是广告或者推销哈 就自己感觉还不错性价比也很高所以分享一下)
亲测:aigc率从60、70%降到百分之十几 但是小时卡第一次很快 后面再降的话可能就要十几分钟或者二十分钟了(这个小时卡购买的时候下面也写的 我没注意看第二次很慢还问了客服 😂)
各位佬有好用免费的途径也拜托分享分享 🫡
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: wobulele)
互联网真的没有记忆
总感觉上网的都是一批一批的人,还是我记忆错乱了?之前就记得微软裁过员了,在上海吧应该是,当时赔偿的还挺多的,但评论区似乎全是第一次听说,并且还是首次裁员的意思,挺震惊
5 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Haggi)
总感觉上网的都是一批一批的人,还是我记忆错乱了?之前就记得微软裁过员了,在上海吧应该是,当时赔偿的还挺多的,但评论区似乎全是第一次听说,并且还是首次裁员的意思,挺震惊
5 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Haggi)
道友佬友们,晚上相聚剑来2大结局呀
今晚提前看大结局,打算试一试之前佬友的分享网站,看看是否有奇效,就不用去夸克一个个试了呜呜呜 😭 还是太穷了呀bro
7 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: chengze lin)
今晚提前看大结局,打算试一试之前佬友的分享网站,看看是否有奇效,就不用去夸克一个个试了呜呜呜 😭 还是太穷了呀bro
7 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: chengze lin)
gpt5.5求推荐点稳定的中转站,收费的,免费的就不考虑了。
现在各种中转站使用的使用下来,现在感觉我都不知道我自己一天要用多少量了,有的中转站一天能消耗几百美金的额度有的也就几十。费率,各种价格是看得眼花缭乱的。免费的公益的现在也不考虑了,收费的只要稳定就行。还是要价格便宜。 😁
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: hacksir)
现在各种中转站使用的使用下来,现在感觉我都不知道我自己一天要用多少量了,有的中转站一天能消耗几百美金的额度有的也就几十。费率,各种价格是看得眼花缭乱的。免费的公益的现在也不考虑了,收费的只要稳定就行。还是要价格便宜。 😁
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: hacksir)
Claude封号观察记录(目前第一天)
TB上弄了一个apple store 付款的Claude pro,为此换了一个纯净度几乎100的家宽梯子,心里十分忐忑,大老板给实验室每个人关于AI的之处报销额度是100,我已超出,不想亏太多,看能活多久,做一个记录。
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: FrostMeetsEvening)
TB上弄了一个apple store 付款的Claude pro,为此换了一个纯净度几乎100的家宽梯子,心里十分忐忑,大老板给实验室每个人关于AI的之处报销额度是100,我已超出,不想亏太多,看能活多久,做一个记录。
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: FrostMeetsEvening)
求教节约claude的token
对原生claude用的还是太少了,不太懂背后机理,让他帮我改一个md文档,一次提问就能烧掉几十刀,如图是问了一个问题其中的几步调用。。。我哭死,求大佬们教教正确的问问题或者使用方式
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: seemslike)
对原生claude用的还是太少了,不太懂背后机理,让他帮我改一个md文档,一次提问就能烧掉几十刀,如图是问了一个问题其中的几步调用。。。我哭死,求大佬们教教正确的问问题或者使用方式
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: seemslike)
我解散、退出了所有家庭群聊
今天上午,解散了抖音家庭群
刚刚退出了微信家庭群
从此没有任何家庭群聊了^_^
是和爹娘的家庭群,你们懂的
34 个帖子 - 28 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 猫猫团子)
今天上午,解散了抖音家庭群
刚刚退出了微信家庭群
从此没有任何家庭群聊了^_^
是和爹娘的家庭群,你们懂的
34 个帖子 - 28 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 猫猫团子)
和异性的聊天记录
之前在网上认识了个女生,现在已经分手了。当我又翻到这段聊天记录,感觉她说的前两句话对我的伤害挺大的。
原因:1.让我在朋友圈官宣我没官宣,我说要一起官宣,这样才公平 2.让我买苹果手机我说等你手机坏了(下一个)我再买,她没得到立马肯定现在去买的意愿。结果被要求分手,我就发朋友圈感官宣了。
67 个帖子 - 55 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: capy)
之前在网上认识了个女生,现在已经分手了。当我又翻到这段聊天记录,感觉她说的前两句话对我的伤害挺大的。
原因:1.让我在朋友圈官宣我没官宣,我说要一起官宣,这样才公平 2.让我买苹果手机我说等你手机坏了(下一个)我再买,她没得到立马肯定现在去买的意愿。结果被要求分手,我就发朋友圈感官宣了。
67 个帖子 - 55 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: capy)
明天到三级 也是来L站的第50天 发点微软邮箱~
明天到三级 也是来L站的第50天 祝L站越来越好 共建你我引以为荣之社区!
抽奖主题:明天到三级 也是来L站的第50天 发点微软邮箱~
🏆️ 奖品详情:
[奖品1]:60个hotmail邮箱(30×2)
[奖品2]:60个outlook邮箱(30×2)
:three_o_clock: 活动时间:
开始时间:Sat, Apr 25, 2026 10:27 AM CST
截止时间:Sun, Apr 26, 2026 12:00 PM CST
📝 参与方式:
在本贴下回复 任意内容 即可参与。
🔍️ 抽奖规则:
每位用户仅允许参与一次。
将使用 LINUX DO 抽奖工具在所有回复中随机抽取中奖者。
⚠️ 注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后在本帖公布,并通过论坛站内信由发起人通知领奖方式。
所有规则及抽奖结果由 @ZMoon 及论坛管理团队最终解释。
🛡️ 发起人承诺:
作为本次抽奖的发起人 @ZMoon,我承诺本话题的抽奖活动严格遵守 LINUX DO 社区抽奖规则。因违反上述规定引发的公平性争议或其他问题,均由我独立承担相应的道德与法律责任。
----------------------
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系 @ZMoon 或论坛管理团队。
58 个帖子 - 58 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: LOVE)
明天到三级 也是来L站的第50天 祝L站越来越好 共建你我引以为荣之社区!
抽奖主题:明天到三级 也是来L站的第50天 发点微软邮箱~
🏆️ 奖品详情:
[奖品1]:60个hotmail邮箱(30×2)
[奖品2]:60个outlook邮箱(30×2)
:three_o_clock: 活动时间:
开始时间:Sat, Apr 25, 2026 10:27 AM CST
截止时间:Sun, Apr 26, 2026 12:00 PM CST
📝 参与方式:
在本贴下回复 任意内容 即可参与。
🔍️ 抽奖规则:
每位用户仅允许参与一次。
将使用 LINUX DO 抽奖工具在所有回复中随机抽取中奖者。
⚠️ 注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后在本帖公布,并通过论坛站内信由发起人通知领奖方式。
所有规则及抽奖结果由 @ZMoon 及论坛管理团队最终解释。
🛡️ 发起人承诺:
作为本次抽奖的发起人 @ZMoon,我承诺本话题的抽奖活动严格遵守 LINUX DO 社区抽奖规则。因违反上述规定引发的公平性争议或其他问题,均由我独立承担相应的道德与法律责任。
----------------------
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系 @ZMoon 或论坛管理团队。
58 个帖子 - 58 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: LOVE)
[千星开源]与其让cc通过grep翻字典,不如给他一个仓库级别的chatgpt,x上20w粉丝大v推荐,大佬李笑来贡献,借鉴deepseek-ngram思想,项目自荐
via LINUX DO - 热门话题 (author: taidamier)
via LINUX DO - 热门话题 (author: taidamier)
Telegraph
[千星开源]与其让cc通过grep翻字典,不如给他一个仓库级别的chatgpt,x上20w粉丝大v推荐,大佬李笑来贡献,…
我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 2025年末bash is all need思想的普及,包括claudecode,codex,cursor,antigravity等ai编程工具都采用了bash命令这种思想,例如,当我们让ai找一…
有人能明白逆向GPT5.4做了两天,opus4.7一轮就给我秒了的挫败感吗
哎,plus号池+2个pro做了2天了,不知道是不是我开了xhigh反而思维散发太广的缘故。5.4做了又做,就是不行,一直在绕圈子,我明明给了明确方向了,他自己跑着跑着就偏题。做完通宵搞的心态爆炸,狂骂了gpt一顿 🤣
claude有个pro,但是问两句就限制cd,就想着算了,反正秒男,不用了,刚刚实在受不了,直接让claude给我做(有gpt做了一些分析总结),全程没停,刚好一轮跑完给我丢了3个dll文件,直接通过功能正常,然后提示Usage limit reached。我裂开了。
我只能说,还是太权威了,我要开Max!
30 个帖子 - 26 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Cuber)
哎,plus号池+2个pro做了2天了,不知道是不是我开了xhigh反而思维散发太广的缘故。5.4做了又做,就是不行,一直在绕圈子,我明明给了明确方向了,他自己跑着跑着就偏题。做完通宵搞的心态爆炸,狂骂了gpt一顿 🤣
claude有个pro,但是问两句就限制cd,就想着算了,反正秒男,不用了,刚刚实在受不了,直接让claude给我做(有gpt做了一些分析总结),全程没停,刚好一轮跑完给我丢了3个dll文件,直接通过功能正常,然后提示Usage limit reached。我裂开了。
我只能说,还是太权威了,我要开Max!
30 个帖子 - 26 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Cuber)
Any大善人归来了
拉闸两天之后再次能用!而且首字很快啊,不像之前4.7首字要十几秒了
148 个帖子 - 95 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 遇到困难睡觉觉)
拉闸两天之后再次能用!而且首字很快啊,不像之前4.7首字要十几秒了
148 个帖子 - 95 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 遇到困难睡觉觉)
房价跌的太狠了,心痛
18年还能卖200多个,现在成交价就不到80了,再跌下去就要亏本了 😭
58 个帖子 - 49 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: yuanshaoxuan)
18年还能卖200多个,现在成交价就不到80了,再跌下去就要亏本了 😭
58 个帖子 - 49 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: yuanshaoxuan)
记一次对 DeepSeek V4 全系列 vs GPT 5.5 全系列真实项目需求的横向评测
项目
这是一个 Unity C# 项目,我进行测试的是一份皮肤系统需求案,我已经做了好预制体,而模型需要编写代码。
本轮与上两轮评测的项目和环境都完全一致:
● 第一轮
● …
● 第十一轮
模型来源
● DeepSeek V4 系列: 官方 API
● GPT 5.5 系列: GPT Plus Codex
速度
令牌数
● DeepSeek V4 Pro(max): 无法准确得知
● DeepSeek V4 Flash(max): 无法准确得知
● GPT 5.5 系列: 无法得知
代码行数
● DeepSeek V4 Pro(max): +1340, -10
● DeepSeek V4 Flash(max): +1167, -7
● GPT 5.5(xhigh): +1599, -15
● GPT 5.5(high): +1234, -6
● GPT 5.5(medium): +1142, -15
● GPT 5.5(low): +728, -135(貌似动用了命令行编辑文件而不是工具)
完成度
DeepSeek V4 Pro(max)
审查结论: 存在常犯错误,未完成部分功能。
详细 (点击了解更多详细信息)
DeepSeek V4 Flash(max)
审查结论: 存在编译错误,存在幻觉,功能实现不完整。
详细 (点击了解更多详细信息)
GPT-5.5(xhigh)
审查结论: 完整实现所有功能。
详细 (点击了解更多详细信息)
GPT-5.5(high)
审查结论: 一点小错误,功能实现完整。
详细 (点击了解更多详细信息)
GPT-5.5(medium)
审查结论: 有一个常见错误和一个功能未实现。
详细 (点击了解更多详细信息)
GPT-5.5(low)
审查结论: 三个功能点未实现。
详细 (点击了解更多详细信息)
最终总结
等待已久,DeepSeek V4 终于在昨天发布,其实昨天早上已经跑出了成绩,但是忙到今天才有时间编辑帖子。
在这期间,我看了很多对它的评测或者排行榜,其中就有 toyama nao 的逻辑和代码评测,对其的评价都超过了 Kimi K2.6 和 GLM 5.1,但很遗憾,在这个需求上,DeepSeek 的表现远不如预期。
● 起初,V4 表现出来的工作流程确实和 V3.2 有明显不同,与排行靠前的模型一样,它会先全盘阅读代码并进行思考,然后再进行编码。
● 但是,V4 Pro 对于两个常错点都没有做对,那么基本意味着它只能屈居于 T2,除了完成度极高(就像 Claude 模型)的话,才可能能够被放在 T1 级别。
● 最终,V4 Pro 的完成度不高,包括协议类型转换在内的多个功能点都没有完成,最终只能被放在 T2 级别。
● 惊讶的是,V4 Flash 完成了入口与系统注册两个功能点,协议类型转换也意识到了需要去做,但是实现是错的,零散的未实现的细节比较多,最终由于幻觉导致使用了不存在的属性,编译失败,最终只能被放在 T3 级别。
● 我对比了一下 V4 Flash 和 Opus 4.7(Max),V4 Flash 甚至做的要更好一点,所以它代替了 Opus 4.7 成为了新的 T3 领衔者,万万没想到 Opus 4.7 在 T3 级别待的时间这么短。
DeepSeek V4、Kimi K2.6 和 Opus 4.7 这几个都是评价褒贬不一,表现众说纷纭,大家实测为真。
接下来是几乎同一时间发布的 GPT-5.5,一般代码审查都是用 GPT 当时最好的模型去做的,所以为了避免自己人帮自己人,都是会用 Claude 模型再做一次审查,这次则是 GPT-5.5(xhigh) 和 Claude Opus 4.7(max)。
● 作为主力使用也有差不多一天了,GPT 5.5 的口癖貌似确实得到了改善,现在的总结简单、直接,用词也更加平常,之前简单的问题被长篇大论描述地一头雾水的情况貌似也没有了。
● GPT 5.5(xhigh) 经过两次审查,依然无懈可击,找不到任何可被验证的错误点,毋庸置疑的 T0 级别。
● GPT 5.5(high) 的表现与 GPT 5.4(high) 差距不大,功能实现完整,只有一些小细节问题,最终被放在 T1 级别。
● GPT 5.5 的 medium 和 low 思考程度下完成度相差不多, medium 未完成协议类型转换但小错误少,low 完成了协议类型转换但小错误多,这可能是偶然做对的,但由于协议类型转换在这个评测里份量比较重,所以 medium 被放在了 low 后面。
● 我使用的 Plus 账号在不使用 Fast 层级的情况下,速度好像有所下降(之前也是标准层级进行评测),XHigh 比 5.4 甚至慢了 10 分钟。
总结,GPT 依然领先,且差距不小,那这篇帖子所谓的 “VS”,也是有一点标题党了,毕竟对手是实力相当,这两个…
但官方应该知道现在的 DeepSeek V4 有些许问题,所以还是预览版,希望能加快迭代脚步。并且价格方面在下半年大幅下降后,这个推理能力、上下文和注意力应该会有非常大的优势!
未来可期吧。
17 个帖子 - 15 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: SmallMain)
项目
这是一个 Unity C# 项目,我进行测试的是一份皮肤系统需求案,我已经做了好预制体,而模型需要编写代码。
本轮与上两轮评测的项目和环境都完全一致:
● 第一轮
● …
● 第十一轮
模型来源
● DeepSeek V4 系列: 官方 API
● GPT 5.5 系列: GPT Plus Codex
速度
令牌数
● DeepSeek V4 Pro(max): 无法准确得知
● DeepSeek V4 Flash(max): 无法准确得知
● GPT 5.5 系列: 无法得知
代码行数
● DeepSeek V4 Pro(max): +1340, -10
● DeepSeek V4 Flash(max): +1167, -7
● GPT 5.5(xhigh): +1599, -15
● GPT 5.5(high): +1234, -6
● GPT 5.5(medium): +1142, -15
● GPT 5.5(low): +728, -135(貌似动用了命令行编辑文件而不是工具)
完成度
DeepSeek V4 Pro(max)
审查结论: 存在常犯错误,未完成部分功能。
详细 (点击了解更多详细信息)
DeepSeek V4 Flash(max)
审查结论: 存在编译错误,存在幻觉,功能实现不完整。
详细 (点击了解更多详细信息)
GPT-5.5(xhigh)
审查结论: 完整实现所有功能。
详细 (点击了解更多详细信息)
GPT-5.5(high)
审查结论: 一点小错误,功能实现完整。
详细 (点击了解更多详细信息)
GPT-5.5(medium)
审查结论: 有一个常见错误和一个功能未实现。
详细 (点击了解更多详细信息)
GPT-5.5(low)
审查结论: 三个功能点未实现。
详细 (点击了解更多详细信息)
最终总结
等待已久,DeepSeek V4 终于在昨天发布,其实昨天早上已经跑出了成绩,但是忙到今天才有时间编辑帖子。
在这期间,我看了很多对它的评测或者排行榜,其中就有 toyama nao 的逻辑和代码评测,对其的评价都超过了 Kimi K2.6 和 GLM 5.1,但很遗憾,在这个需求上,DeepSeek 的表现远不如预期。
● 起初,V4 表现出来的工作流程确实和 V3.2 有明显不同,与排行靠前的模型一样,它会先全盘阅读代码并进行思考,然后再进行编码。
● 但是,V4 Pro 对于两个常错点都没有做对,那么基本意味着它只能屈居于 T2,除了完成度极高(就像 Claude 模型)的话,才可能能够被放在 T1 级别。
● 最终,V4 Pro 的完成度不高,包括协议类型转换在内的多个功能点都没有完成,最终只能被放在 T2 级别。
● 惊讶的是,V4 Flash 完成了入口与系统注册两个功能点,协议类型转换也意识到了需要去做,但是实现是错的,零散的未实现的细节比较多,最终由于幻觉导致使用了不存在的属性,编译失败,最终只能被放在 T3 级别。
● 我对比了一下 V4 Flash 和 Opus 4.7(Max),V4 Flash 甚至做的要更好一点,所以它代替了 Opus 4.7 成为了新的 T3 领衔者,万万没想到 Opus 4.7 在 T3 级别待的时间这么短。
DeepSeek V4、Kimi K2.6 和 Opus 4.7 这几个都是评价褒贬不一,表现众说纷纭,大家实测为真。
接下来是几乎同一时间发布的 GPT-5.5,一般代码审查都是用 GPT 当时最好的模型去做的,所以为了避免自己人帮自己人,都是会用 Claude 模型再做一次审查,这次则是 GPT-5.5(xhigh) 和 Claude Opus 4.7(max)。
● 作为主力使用也有差不多一天了,GPT 5.5 的口癖貌似确实得到了改善,现在的总结简单、直接,用词也更加平常,之前简单的问题被长篇大论描述地一头雾水的情况貌似也没有了。
● GPT 5.5(xhigh) 经过两次审查,依然无懈可击,找不到任何可被验证的错误点,毋庸置疑的 T0 级别。
● GPT 5.5(high) 的表现与 GPT 5.4(high) 差距不大,功能实现完整,只有一些小细节问题,最终被放在 T1 级别。
● GPT 5.5 的 medium 和 low 思考程度下完成度相差不多, medium 未完成协议类型转换但小错误少,low 完成了协议类型转换但小错误多,这可能是偶然做对的,但由于协议类型转换在这个评测里份量比较重,所以 medium 被放在了 low 后面。
● 我使用的 Plus 账号在不使用 Fast 层级的情况下,速度好像有所下降(之前也是标准层级进行评测),XHigh 比 5.4 甚至慢了 10 分钟。
总结,GPT 依然领先,且差距不小,那这篇帖子所谓的 “VS”,也是有一点标题党了,毕竟对手是实力相当,这两个…
但官方应该知道现在的 DeepSeek V4 有些许问题,所以还是预览版,希望能加快迭代脚步。并且价格方面在下半年大幅下降后,这个推理能力、上下文和注意力应该会有非常大的优势!
未来可期吧。
17 个帖子 - 15 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: SmallMain)