GPT 5.5 逆向需要申请新模型?
This chat was flagged for possible cybersecurity risk If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program.
https://chatgpt.com/cyber
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 文聿)
This chat was flagged for possible cybersecurity risk If this seems wrong, try rephrasing your request. To get authorized for security work, join the Trusted Access for Cyber program.
https://chatgpt.com/cyber
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 文聿)
nature : CAS分区表停更,这令人震惊
https://www.nature.com/articles/d41586-026-01277-2
阅读完整话题
via LINUX DO - 最新话题 (author: 🐟)
https://www.nature.com/articles/d41586-026-01277-2
2 个帖子 - 2 位参与者
中国科学院(CAS)北京国家科学图书馆已停止发布其具有影响力的期刊排名,令许多研究人员感到意外。该排名在中国研究评估中占据核心地位已超过20年,其终止让大学和学者对未来走向充满不确定。
CAS期刊排名,也称为CAS期刊分区表,最初是为了帮助研究人员评估期刊质量而开发的。但随着时间推移,它开始影响招聘决策、资金分配和晋升。
阅读完整话题
via LINUX DO - 最新话题 (author: 🐟)
deepseek官网出现了橘子问题终极解决方案!但有点…
如题
看上去deepseek是不是棒棒哒,但把橘子换成苹果试试
hjh,解决了,但没完全解决
属于是独爱橘子了(bushi)
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 我是小鸭头)
如题
看上去deepseek是不是棒棒哒,但把橘子换成苹果试试
hjh,解决了,但没完全解决
属于是独爱橘子了(bushi)
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 我是小鸭头)
本科毕设论文免费查重查AIGC率以及降重降AIGC分享
查重和查AIGC率(免费):
https://www.paperyy.com/ paperYY免费查重
https://uuxie.com/ UU科研助手
https://paperpure.net/ paperpure 每日免费额度(剩余 5 次)
降重:可以查重用paperpass,然后拿标红和标黄的部分去找ai降重
降重(给ai的提示词)(朋友发的 用了一下还可以):
要求:1.保持原文的核心意思不变!但可以通过调整语序、缩写、扩写、替换同义词等方式进行改写2.改写后的内容应更加具有逻辑性和条理性,符合论文的写作规范。3.尽量避免与原文出现连续8个字相同的句子,以提高内容的多样性和可读性。4.请确保改写后的内容仍然保持原文的风格和语气,不要偏离原文的主题和意图。5.长短句结合。6.避免过于机械化的段落结构8.保留原文的核心意思信息和意图
降AIGC:可以用https://paperpure.net/dashboard/text-ai小时卡(20一小时)去降(不是广告或者推销哈 就自己感觉还不错性价比也很高所以分享一下)
亲测:aigc率从60、70%降到百分之十几 但是小时卡第一次很快 后面再降的话可能就要十几分钟或者二十分钟了(这个小时卡购买的时候下面也写的 我没注意看第二次很慢还问了客服 😂)
各位佬有好用免费的途径也拜托分享分享 🫡
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: wobulele)
查重和查AIGC率(免费):
https://www.paperyy.com/ paperYY免费查重
https://uuxie.com/ UU科研助手
https://paperpure.net/ paperpure 每日免费额度(剩余 5 次)
降重:可以查重用paperpass,然后拿标红和标黄的部分去找ai降重
降重(给ai的提示词)(朋友发的 用了一下还可以):
要求:1.保持原文的核心意思不变!但可以通过调整语序、缩写、扩写、替换同义词等方式进行改写2.改写后的内容应更加具有逻辑性和条理性,符合论文的写作规范。3.尽量避免与原文出现连续8个字相同的句子,以提高内容的多样性和可读性。4.请确保改写后的内容仍然保持原文的风格和语气,不要偏离原文的主题和意图。5.长短句结合。6.避免过于机械化的段落结构8.保留原文的核心意思信息和意图
降AIGC:可以用https://paperpure.net/dashboard/text-ai小时卡(20一小时)去降(不是广告或者推销哈 就自己感觉还不错性价比也很高所以分享一下)
亲测:aigc率从60、70%降到百分之十几 但是小时卡第一次很快 后面再降的话可能就要十几分钟或者二十分钟了(这个小时卡购买的时候下面也写的 我没注意看第二次很慢还问了客服 😂)
各位佬有好用免费的途径也拜托分享分享 🫡
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: wobulele)
互联网真的没有记忆
总感觉上网的都是一批一批的人,还是我记忆错乱了?之前就记得微软裁过员了,在上海吧应该是,当时赔偿的还挺多的,但评论区似乎全是第一次听说,并且还是首次裁员的意思,挺震惊
5 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Haggi)
总感觉上网的都是一批一批的人,还是我记忆错乱了?之前就记得微软裁过员了,在上海吧应该是,当时赔偿的还挺多的,但评论区似乎全是第一次听说,并且还是首次裁员的意思,挺震惊
5 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Haggi)
道友佬友们,晚上相聚剑来2大结局呀
今晚提前看大结局,打算试一试之前佬友的分享网站,看看是否有奇效,就不用去夸克一个个试了呜呜呜 😭 还是太穷了呀bro
7 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: chengze lin)
今晚提前看大结局,打算试一试之前佬友的分享网站,看看是否有奇效,就不用去夸克一个个试了呜呜呜 😭 还是太穷了呀bro
7 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: chengze lin)
gpt5.5求推荐点稳定的中转站,收费的,免费的就不考虑了。
现在各种中转站使用的使用下来,现在感觉我都不知道我自己一天要用多少量了,有的中转站一天能消耗几百美金的额度有的也就几十。费率,各种价格是看得眼花缭乱的。免费的公益的现在也不考虑了,收费的只要稳定就行。还是要价格便宜。 😁
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: hacksir)
现在各种中转站使用的使用下来,现在感觉我都不知道我自己一天要用多少量了,有的中转站一天能消耗几百美金的额度有的也就几十。费率,各种价格是看得眼花缭乱的。免费的公益的现在也不考虑了,收费的只要稳定就行。还是要价格便宜。 😁
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: hacksir)
Claude封号观察记录(目前第一天)
TB上弄了一个apple store 付款的Claude pro,为此换了一个纯净度几乎100的家宽梯子,心里十分忐忑,大老板给实验室每个人关于AI的之处报销额度是100,我已超出,不想亏太多,看能活多久,做一个记录。
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: FrostMeetsEvening)
TB上弄了一个apple store 付款的Claude pro,为此换了一个纯净度几乎100的家宽梯子,心里十分忐忑,大老板给实验室每个人关于AI的之处报销额度是100,我已超出,不想亏太多,看能活多久,做一个记录。
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: FrostMeetsEvening)
求教节约claude的token
对原生claude用的还是太少了,不太懂背后机理,让他帮我改一个md文档,一次提问就能烧掉几十刀,如图是问了一个问题其中的几步调用。。。我哭死,求大佬们教教正确的问问题或者使用方式
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: seemslike)
对原生claude用的还是太少了,不太懂背后机理,让他帮我改一个md文档,一次提问就能烧掉几十刀,如图是问了一个问题其中的几步调用。。。我哭死,求大佬们教教正确的问问题或者使用方式
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: seemslike)
我解散、退出了所有家庭群聊
今天上午,解散了抖音家庭群
刚刚退出了微信家庭群
从此没有任何家庭群聊了^_^
是和爹娘的家庭群,你们懂的
34 个帖子 - 28 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 猫猫团子)
今天上午,解散了抖音家庭群
刚刚退出了微信家庭群
从此没有任何家庭群聊了^_^
是和爹娘的家庭群,你们懂的
34 个帖子 - 28 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 猫猫团子)
和异性的聊天记录
之前在网上认识了个女生,现在已经分手了。当我又翻到这段聊天记录,感觉她说的前两句话对我的伤害挺大的。
原因:1.让我在朋友圈官宣我没官宣,我说要一起官宣,这样才公平 2.让我买苹果手机我说等你手机坏了(下一个)我再买,她没得到立马肯定现在去买的意愿。结果被要求分手,我就发朋友圈感官宣了。
67 个帖子 - 55 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: capy)
之前在网上认识了个女生,现在已经分手了。当我又翻到这段聊天记录,感觉她说的前两句话对我的伤害挺大的。
原因:1.让我在朋友圈官宣我没官宣,我说要一起官宣,这样才公平 2.让我买苹果手机我说等你手机坏了(下一个)我再买,她没得到立马肯定现在去买的意愿。结果被要求分手,我就发朋友圈感官宣了。
67 个帖子 - 55 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: capy)
明天到三级 也是来L站的第50天 发点微软邮箱~
明天到三级 也是来L站的第50天 祝L站越来越好 共建你我引以为荣之社区!
抽奖主题:明天到三级 也是来L站的第50天 发点微软邮箱~
🏆️ 奖品详情:
[奖品1]:60个hotmail邮箱(30×2)
[奖品2]:60个outlook邮箱(30×2)
:three_o_clock: 活动时间:
开始时间:Sat, Apr 25, 2026 10:27 AM CST
截止时间:Sun, Apr 26, 2026 12:00 PM CST
📝 参与方式:
在本贴下回复 任意内容 即可参与。
🔍️ 抽奖规则:
每位用户仅允许参与一次。
将使用 LINUX DO 抽奖工具在所有回复中随机抽取中奖者。
⚠️ 注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后在本帖公布,并通过论坛站内信由发起人通知领奖方式。
所有规则及抽奖结果由 @ZMoon 及论坛管理团队最终解释。
🛡️ 发起人承诺:
作为本次抽奖的发起人 @ZMoon,我承诺本话题的抽奖活动严格遵守 LINUX DO 社区抽奖规则。因违反上述规定引发的公平性争议或其他问题,均由我独立承担相应的道德与法律责任。
----------------------
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系 @ZMoon 或论坛管理团队。
58 个帖子 - 58 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: LOVE)
明天到三级 也是来L站的第50天 祝L站越来越好 共建你我引以为荣之社区!
抽奖主题:明天到三级 也是来L站的第50天 发点微软邮箱~
🏆️ 奖品详情:
[奖品1]:60个hotmail邮箱(30×2)
[奖品2]:60个outlook邮箱(30×2)
:three_o_clock: 活动时间:
开始时间:Sat, Apr 25, 2026 10:27 AM CST
截止时间:Sun, Apr 26, 2026 12:00 PM CST
📝 参与方式:
在本贴下回复 任意内容 即可参与。
🔍️ 抽奖规则:
每位用户仅允许参与一次。
将使用 LINUX DO 抽奖工具在所有回复中随机抽取中奖者。
⚠️ 注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后在本帖公布,并通过论坛站内信由发起人通知领奖方式。
所有规则及抽奖结果由 @ZMoon 及论坛管理团队最终解释。
🛡️ 发起人承诺:
作为本次抽奖的发起人 @ZMoon,我承诺本话题的抽奖活动严格遵守 LINUX DO 社区抽奖规则。因违反上述规定引发的公平性争议或其他问题,均由我独立承担相应的道德与法律责任。
----------------------
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系 @ZMoon 或论坛管理团队。
58 个帖子 - 58 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: LOVE)
[千星开源]与其让cc通过grep翻字典,不如给他一个仓库级别的chatgpt,x上20w粉丝大v推荐,大佬李笑来贡献,借鉴deepseek-ngram思想,项目自荐
via LINUX DO - 热门话题 (author: taidamier)
via LINUX DO - 热门话题 (author: taidamier)
Telegraph
[千星开源]与其让cc通过grep翻字典,不如给他一个仓库级别的chatgpt,x上20w粉丝大v推荐,大佬李笑来贡献,…
我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 2025年末bash is all need思想的普及,包括claudecode,codex,cursor,antigravity等ai编程工具都采用了bash命令这种思想,例如,当我们让ai找一…
有人能明白逆向GPT5.4做了两天,opus4.7一轮就给我秒了的挫败感吗
哎,plus号池+2个pro做了2天了,不知道是不是我开了xhigh反而思维散发太广的缘故。5.4做了又做,就是不行,一直在绕圈子,我明明给了明确方向了,他自己跑着跑着就偏题。做完通宵搞的心态爆炸,狂骂了gpt一顿 🤣
claude有个pro,但是问两句就限制cd,就想着算了,反正秒男,不用了,刚刚实在受不了,直接让claude给我做(有gpt做了一些分析总结),全程没停,刚好一轮跑完给我丢了3个dll文件,直接通过功能正常,然后提示Usage limit reached。我裂开了。
我只能说,还是太权威了,我要开Max!
30 个帖子 - 26 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Cuber)
哎,plus号池+2个pro做了2天了,不知道是不是我开了xhigh反而思维散发太广的缘故。5.4做了又做,就是不行,一直在绕圈子,我明明给了明确方向了,他自己跑着跑着就偏题。做完通宵搞的心态爆炸,狂骂了gpt一顿 🤣
claude有个pro,但是问两句就限制cd,就想着算了,反正秒男,不用了,刚刚实在受不了,直接让claude给我做(有gpt做了一些分析总结),全程没停,刚好一轮跑完给我丢了3个dll文件,直接通过功能正常,然后提示Usage limit reached。我裂开了。
我只能说,还是太权威了,我要开Max!
30 个帖子 - 26 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Cuber)
Any大善人归来了
拉闸两天之后再次能用!而且首字很快啊,不像之前4.7首字要十几秒了
148 个帖子 - 95 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 遇到困难睡觉觉)
拉闸两天之后再次能用!而且首字很快啊,不像之前4.7首字要十几秒了
148 个帖子 - 95 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 遇到困难睡觉觉)
房价跌的太狠了,心痛
18年还能卖200多个,现在成交价就不到80了,再跌下去就要亏本了 😭
58 个帖子 - 49 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: yuanshaoxuan)
18年还能卖200多个,现在成交价就不到80了,再跌下去就要亏本了 😭
58 个帖子 - 49 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: yuanshaoxuan)
记一次对 DeepSeek V4 全系列 vs GPT 5.5 全系列真实项目需求的横向评测
项目
这是一个 Unity C# 项目,我进行测试的是一份皮肤系统需求案,我已经做了好预制体,而模型需要编写代码。
本轮与上两轮评测的项目和环境都完全一致:
● 第一轮
● …
● 第十一轮
模型来源
● DeepSeek V4 系列: 官方 API
● GPT 5.5 系列: GPT Plus Codex
速度
令牌数
● DeepSeek V4 Pro(max): 无法准确得知
● DeepSeek V4 Flash(max): 无法准确得知
● GPT 5.5 系列: 无法得知
代码行数
● DeepSeek V4 Pro(max): +1340, -10
● DeepSeek V4 Flash(max): +1167, -7
● GPT 5.5(xhigh): +1599, -15
● GPT 5.5(high): +1234, -6
● GPT 5.5(medium): +1142, -15
● GPT 5.5(low): +728, -135(貌似动用了命令行编辑文件而不是工具)
完成度
DeepSeek V4 Pro(max)
审查结论: 存在常犯错误,未完成部分功能。
详细 (点击了解更多详细信息)
DeepSeek V4 Flash(max)
审查结论: 存在编译错误,存在幻觉,功能实现不完整。
详细 (点击了解更多详细信息)
GPT-5.5(xhigh)
审查结论: 完整实现所有功能。
详细 (点击了解更多详细信息)
GPT-5.5(high)
审查结论: 一点小错误,功能实现完整。
详细 (点击了解更多详细信息)
GPT-5.5(medium)
审查结论: 有一个常见错误和一个功能未实现。
详细 (点击了解更多详细信息)
GPT-5.5(low)
审查结论: 三个功能点未实现。
详细 (点击了解更多详细信息)
最终总结
等待已久,DeepSeek V4 终于在昨天发布,其实昨天早上已经跑出了成绩,但是忙到今天才有时间编辑帖子。
在这期间,我看了很多对它的评测或者排行榜,其中就有 toyama nao 的逻辑和代码评测,对其的评价都超过了 Kimi K2.6 和 GLM 5.1,但很遗憾,在这个需求上,DeepSeek 的表现远不如预期。
● 起初,V4 表现出来的工作流程确实和 V3.2 有明显不同,与排行靠前的模型一样,它会先全盘阅读代码并进行思考,然后再进行编码。
● 但是,V4 Pro 对于两个常错点都没有做对,那么基本意味着它只能屈居于 T2,除了完成度极高(就像 Claude 模型)的话,才可能能够被放在 T1 级别。
● 最终,V4 Pro 的完成度不高,包括协议类型转换在内的多个功能点都没有完成,最终只能被放在 T2 级别。
● 惊讶的是,V4 Flash 完成了入口与系统注册两个功能点,协议类型转换也意识到了需要去做,但是实现是错的,零散的未实现的细节比较多,最终由于幻觉导致使用了不存在的属性,编译失败,最终只能被放在 T3 级别。
● 我对比了一下 V4 Flash 和 Opus 4.7(Max),V4 Flash 甚至做的要更好一点,所以它代替了 Opus 4.7 成为了新的 T3 领衔者,万万没想到 Opus 4.7 在 T3 级别待的时间这么短。
DeepSeek V4、Kimi K2.6 和 Opus 4.7 这几个都是评价褒贬不一,表现众说纷纭,大家实测为真。
接下来是几乎同一时间发布的 GPT-5.5,一般代码审查都是用 GPT 当时最好的模型去做的,所以为了避免自己人帮自己人,都是会用 Claude 模型再做一次审查,这次则是 GPT-5.5(xhigh) 和 Claude Opus 4.7(max)。
● 作为主力使用也有差不多一天了,GPT 5.5 的口癖貌似确实得到了改善,现在的总结简单、直接,用词也更加平常,之前简单的问题被长篇大论描述地一头雾水的情况貌似也没有了。
● GPT 5.5(xhigh) 经过两次审查,依然无懈可击,找不到任何可被验证的错误点,毋庸置疑的 T0 级别。
● GPT 5.5(high) 的表现与 GPT 5.4(high) 差距不大,功能实现完整,只有一些小细节问题,最终被放在 T1 级别。
● GPT 5.5 的 medium 和 low 思考程度下完成度相差不多, medium 未完成协议类型转换但小错误少,low 完成了协议类型转换但小错误多,这可能是偶然做对的,但由于协议类型转换在这个评测里份量比较重,所以 medium 被放在了 low 后面。
● 我使用的 Plus 账号在不使用 Fast 层级的情况下,速度好像有所下降(之前也是标准层级进行评测),XHigh 比 5.4 甚至慢了 10 分钟。
总结,GPT 依然领先,且差距不小,那这篇帖子所谓的 “VS”,也是有一点标题党了,毕竟对手是实力相当,这两个…
但官方应该知道现在的 DeepSeek V4 有些许问题,所以还是预览版,希望能加快迭代脚步。并且价格方面在下半年大幅下降后,这个推理能力、上下文和注意力应该会有非常大的优势!
未来可期吧。
17 个帖子 - 15 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: SmallMain)
项目
这是一个 Unity C# 项目,我进行测试的是一份皮肤系统需求案,我已经做了好预制体,而模型需要编写代码。
本轮与上两轮评测的项目和环境都完全一致:
● 第一轮
● …
● 第十一轮
模型来源
● DeepSeek V4 系列: 官方 API
● GPT 5.5 系列: GPT Plus Codex
速度
令牌数
● DeepSeek V4 Pro(max): 无法准确得知
● DeepSeek V4 Flash(max): 无法准确得知
● GPT 5.5 系列: 无法得知
代码行数
● DeepSeek V4 Pro(max): +1340, -10
● DeepSeek V4 Flash(max): +1167, -7
● GPT 5.5(xhigh): +1599, -15
● GPT 5.5(high): +1234, -6
● GPT 5.5(medium): +1142, -15
● GPT 5.5(low): +728, -135(貌似动用了命令行编辑文件而不是工具)
完成度
DeepSeek V4 Pro(max)
审查结论: 存在常犯错误,未完成部分功能。
详细 (点击了解更多详细信息)
DeepSeek V4 Flash(max)
审查结论: 存在编译错误,存在幻觉,功能实现不完整。
详细 (点击了解更多详细信息)
GPT-5.5(xhigh)
审查结论: 完整实现所有功能。
详细 (点击了解更多详细信息)
GPT-5.5(high)
审查结论: 一点小错误,功能实现完整。
详细 (点击了解更多详细信息)
GPT-5.5(medium)
审查结论: 有一个常见错误和一个功能未实现。
详细 (点击了解更多详细信息)
GPT-5.5(low)
审查结论: 三个功能点未实现。
详细 (点击了解更多详细信息)
最终总结
等待已久,DeepSeek V4 终于在昨天发布,其实昨天早上已经跑出了成绩,但是忙到今天才有时间编辑帖子。
在这期间,我看了很多对它的评测或者排行榜,其中就有 toyama nao 的逻辑和代码评测,对其的评价都超过了 Kimi K2.6 和 GLM 5.1,但很遗憾,在这个需求上,DeepSeek 的表现远不如预期。
● 起初,V4 表现出来的工作流程确实和 V3.2 有明显不同,与排行靠前的模型一样,它会先全盘阅读代码并进行思考,然后再进行编码。
● 但是,V4 Pro 对于两个常错点都没有做对,那么基本意味着它只能屈居于 T2,除了完成度极高(就像 Claude 模型)的话,才可能能够被放在 T1 级别。
● 最终,V4 Pro 的完成度不高,包括协议类型转换在内的多个功能点都没有完成,最终只能被放在 T2 级别。
● 惊讶的是,V4 Flash 完成了入口与系统注册两个功能点,协议类型转换也意识到了需要去做,但是实现是错的,零散的未实现的细节比较多,最终由于幻觉导致使用了不存在的属性,编译失败,最终只能被放在 T3 级别。
● 我对比了一下 V4 Flash 和 Opus 4.7(Max),V4 Flash 甚至做的要更好一点,所以它代替了 Opus 4.7 成为了新的 T3 领衔者,万万没想到 Opus 4.7 在 T3 级别待的时间这么短。
DeepSeek V4、Kimi K2.6 和 Opus 4.7 这几个都是评价褒贬不一,表现众说纷纭,大家实测为真。
接下来是几乎同一时间发布的 GPT-5.5,一般代码审查都是用 GPT 当时最好的模型去做的,所以为了避免自己人帮自己人,都是会用 Claude 模型再做一次审查,这次则是 GPT-5.5(xhigh) 和 Claude Opus 4.7(max)。
● 作为主力使用也有差不多一天了,GPT 5.5 的口癖貌似确实得到了改善,现在的总结简单、直接,用词也更加平常,之前简单的问题被长篇大论描述地一头雾水的情况貌似也没有了。
● GPT 5.5(xhigh) 经过两次审查,依然无懈可击,找不到任何可被验证的错误点,毋庸置疑的 T0 级别。
● GPT 5.5(high) 的表现与 GPT 5.4(high) 差距不大,功能实现完整,只有一些小细节问题,最终被放在 T1 级别。
● GPT 5.5 的 medium 和 low 思考程度下完成度相差不多, medium 未完成协议类型转换但小错误少,low 完成了协议类型转换但小错误多,这可能是偶然做对的,但由于协议类型转换在这个评测里份量比较重,所以 medium 被放在了 low 后面。
● 我使用的 Plus 账号在不使用 Fast 层级的情况下,速度好像有所下降(之前也是标准层级进行评测),XHigh 比 5.4 甚至慢了 10 分钟。
总结,GPT 依然领先,且差距不小,那这篇帖子所谓的 “VS”,也是有一点标题党了,毕竟对手是实力相当,这两个…
但官方应该知道现在的 DeepSeek V4 有些许问题,所以还是预览版,希望能加快迭代脚步。并且价格方面在下半年大幅下降后,这个推理能力、上下文和注意力应该会有非常大的优势!
未来可期吧。
17 个帖子 - 15 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: SmallMain)
GPT-5.5 Juice 总结
Juice 是什么?
Juice 值仅仅指示模型思考深度 。一般来说,在很多推理问题下,推理(reasoning)深度越高,推理消耗的 Token 越多,效果越好,但是:
1. 模型智力中,思考深度仅仅是很小的一部分
2. 不同模型的Juice不可直接比较,其绝对值也没有意义,Juice 只能在同一个模型下比较
3. 有的任务的效果与思考长短无关,甚至可能思考越长效果越差,例如部分写作/翻译任务
4. 这是 OpenAI 的推理系列模型(o*, GPT-5.x)独有的机制,其他模型没有这种机制(尽管可能都有类似的方法控制思考深度)
----------------------
----------------------
简单结论
● Codex 的 high 和 medium 低于 API,但 xhigh 给满了
● ChatGPT Standard = Codex medium = 24
● Codex high (96) < ChatGPT Extended(192) < Codex xhigh(768)
----------------------
1. 来自 【一样】Plus和Pro账号Juice值不一样???GPT 5.5 ↩︎
22 个帖子 - 18 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: neteroster)
Juice 是什么?
Juice 值仅仅指示模型思考深度 。一般来说,在很多推理问题下,推理(reasoning)深度越高,推理消耗的 Token 越多,效果越好,但是:
1. 模型智力中,思考深度仅仅是很小的一部分
2. 不同模型的Juice不可直接比较,其绝对值也没有意义,Juice 只能在同一个模型下比较
3. 有的任务的效果与思考长短无关,甚至可能思考越长效果越差,例如部分写作/翻译任务
4. 这是 OpenAI 的推理系列模型(o*, GPT-5.x)独有的机制,其他模型没有这种机制(尽管可能都有类似的方法控制思考深度)
----------------------
----------------------
简单结论
● Codex 的 high 和 medium 低于 API,但 xhigh 给满了
● ChatGPT Standard = Codex medium = 24
● Codex high (96) < ChatGPT Extended(192) < Codex xhigh(768)
----------------------
1. 来自 【一样】Plus和Pro账号Juice值不一样???GPT 5.5 ↩︎
22 个帖子 - 18 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: neteroster)
聊一聊信息渠道,我觉得我自己很信息茧房!
身份:产品经理 + 独立开发者
年龄:30岁
Google账号:15年,从初中开始翻墙上网(那时候还用免费的赛风)
常用的信息获取渠道
1. telegram + 极搜:我觉得很难用,搜片都搜不到契合的,要翻几页来筛选,总是搜出搜一些无关紧要的聊天记录。还有TG上要么是骗子、要么是二道贩子,想找点儿一手的信息很难
2. Twitter:Twitter上的搜索功能更是💩,和我用过的所有产品搜索功能完全不一样,就感觉像是它不想让你搜索一样,给出的信息总是很少、无关、全是颜色广告
3. Linux.do:我自己最爱的信息获取渠道了,获取一手的教程很方便
4. NodeSeek:第二喜欢的信息渠道,交易和教程
5. V2EX:学生时代爱上,做产品经理了就远离了,现在偶尔看看大家关于技术的一些思考
6. 酷安:找玩机教程,偶尔用用
7. yandex:搜破解资源(软件、影视)
8. 常见信息渠道就不说了(Google、Reddit、国内社媒…)
9. 再补一个:ChatGPT、Claude直接搜不同国家的Linux.do、V2EX类似网站,打开网页翻译,看其他国家的人在聊什么
我自我感觉检索信息的能力还行,但最近多次想找一手信息源、一手渠道买东西,屡屡碰壁,真是给我心态搞崩了,才发现自己的信息检索能力大概是存在问题的。
例1:闲鱼上有 “cursor 500次” 的卖家,上个月只有一家,最近很多都出来卖了,我猜想是有渠道扩散了,并且价格比上月翻倍,我自己每天都在用,因此想找找源头看能否稳定、价格合理的购买自用,但无论如何搜,都找不到。
例2:前几天传的沸沸扬扬的GPT 2大源头渠道,我都是消息流传到V站后,我才知道,并且发现很多人都悄悄的用(二手转卖),这说明:一手信息是不会在站内流通的,站内的人知道也不会出来讲,但他们是如何知道的呢?
我感觉绝大多数信息都是开源的,但就是检索不到。我的问题就是:如果提高自己的信息检索能力,从而找到一手信息源?
希望得到大家的指教[抱拳]
40 个帖子 - 26 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: K2049)
身份:产品经理 + 独立开发者
年龄:30岁
Google账号:15年,从初中开始翻墙上网(那时候还用免费的赛风)
常用的信息获取渠道
1. telegram + 极搜:我觉得很难用,搜片都搜不到契合的,要翻几页来筛选,总是搜出搜一些无关紧要的聊天记录。还有TG上要么是骗子、要么是二道贩子,想找点儿一手的信息很难
2. Twitter:Twitter上的搜索功能更是💩,和我用过的所有产品搜索功能完全不一样,就感觉像是它不想让你搜索一样,给出的信息总是很少、无关、全是颜色广告
3. Linux.do:我自己最爱的信息获取渠道了,获取一手的教程很方便
4. NodeSeek:第二喜欢的信息渠道,交易和教程
5. V2EX:学生时代爱上,做产品经理了就远离了,现在偶尔看看大家关于技术的一些思考
6. 酷安:找玩机教程,偶尔用用
7. yandex:搜破解资源(软件、影视)
8. 常见信息渠道就不说了(Google、Reddit、国内社媒…)
9. 再补一个:ChatGPT、Claude直接搜不同国家的Linux.do、V2EX类似网站,打开网页翻译,看其他国家的人在聊什么
我自我感觉检索信息的能力还行,但最近多次想找一手信息源、一手渠道买东西,屡屡碰壁,真是给我心态搞崩了,才发现自己的信息检索能力大概是存在问题的。
例1:闲鱼上有 “cursor 500次” 的卖家,上个月只有一家,最近很多都出来卖了,我猜想是有渠道扩散了,并且价格比上月翻倍,我自己每天都在用,因此想找找源头看能否稳定、价格合理的购买自用,但无论如何搜,都找不到。
例2:前几天传的沸沸扬扬的GPT 2大源头渠道,我都是消息流传到V站后,我才知道,并且发现很多人都悄悄的用(二手转卖),这说明:一手信息是不会在站内流通的,站内的人知道也不会出来讲,但他们是如何知道的呢?
我感觉绝大多数信息都是开源的,但就是检索不到。我的问题就是:如果提高自己的信息检索能力,从而找到一手信息源?
希望得到大家的指教[抱拳]
40 个帖子 - 26 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: K2049)