放假放假放假!!!
2.7到2.23,周末收拾收拾准备回老家😆
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 喻灵)
2.7到2.23,周末收拾收拾准备回老家😆
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 喻灵)
看到这个标题,想起前几天的一个想法
多数人使用工具只想着提高效率,而极少数人一开始就考虑怎么变现。
类似的技术员思维是打磨产品,运营思维是想怎么迎合市场需求,
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 好好吃飯)
Invalid media: image
多数人使用工具只想着提高效率,而极少数人一开始就考虑怎么变现。
类似的技术员思维是打磨产品,运营思维是想怎么迎合市场需求,
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 好好吃飯)
Invalid media: image
牛逼的服务器拿来干嘛
假如说佬哥们有一台性能很强,带宽很大的服务器,会拿来干嘛。大概配置两颗最强线程撕裂者,再配2块A100吧,带宽大概上下行2000吧 🙃
16 posts - 13 participants
Read full topic
via LINUX DO - 最新话题 (author: tommyjin)
假如说佬哥们有一台性能很强,带宽很大的服务器,会拿来干嘛。大概配置两颗最强线程撕裂者,再配2块A100吧,带宽大概上下行2000吧 🙃
16 posts - 13 participants
Read full topic
via LINUX DO - 最新话题 (author: tommyjin)
WSL Dashboard v0.3.0 开源发布,感谢L站,感谢各位佬友
一款现代、高性能且轻量级的 WSL (Windows Subsystem for Linux) 实例管理面板。基于 Rust 和 Slint 构建,提供高级的原生体验。
更新日志:
1. 系统托盘图标(双击可在显示和隐藏面板之间切换,右键单击可打开菜单);
2. 可以设置,系统启动时自动运行面板(具备路径自动修复功能);
3. 可以设置,自动启动面板后最小化到系统托盘(系统托盘运行模式内存共约10MB,新增静默启动方式 wsldashboard.exe /silent);
4. 可以设置,关闭面板主窗口后最小化到托盘,但不退出程序;
5. 增强运行中的实例分发版徽标的适配性;
6. 修复了在设置(Checkbox勾选状态)和其他界面之间反复切换时出现的内存泄漏问题;
7. 运行内存优化(UI渲染、缓存机制、高负载逻辑触发时机调优等);
8. 重构并拆分大型代码文件;
9. 日志文件的切割由UTC+0变为按用户的时区。
10. 按照语言类型不同运行内存有较大差异:
10.1. 小型/标准字体语言,基于拉丁字母的语言(英语、德语、西班牙语、法语、意大利语、葡萄牙语、印尼语、土耳其语等),中型复杂语言(印地语、孟加拉语、俄语 等),窗口模式运行内存共约18MB;
10.2. 大型字体语言(中文、日语、韩语等),窗口模式运行内存共约35MB。
项目主页:
github.com
GitHub - owu/wsl-dashboard: A modern, high-performance, and lightweight WSL...
A modern, high-performance, and lightweight WSL instance management dashboard. A GUI manager for WSL.
如果您有任何建议或需求可以在主题下方评论 或者 访问 github 提交 issue 。
如果这个项目对您有帮助,请访问 github 帮我加一个星标,您的认可是我持续开发的动力!
WSL Dashboard v0.2.3 相关帖子: WSL Dashboard v0.2.3 开源发布,Rust 开发的 WSL2 可视化管理面板
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: goku)
Invalid media:
image
image
image
一款现代、高性能且轻量级的 WSL (Windows Subsystem for Linux) 实例管理面板。基于 Rust 和 Slint 构建,提供高级的原生体验。
更新日志:
1. 系统托盘图标(双击可在显示和隐藏面板之间切换,右键单击可打开菜单);
2. 可以设置,系统启动时自动运行面板(具备路径自动修复功能);
3. 可以设置,自动启动面板后最小化到系统托盘(系统托盘运行模式内存共约10MB,新增静默启动方式 wsldashboard.exe /silent);
4. 可以设置,关闭面板主窗口后最小化到托盘,但不退出程序;
5. 增强运行中的实例分发版徽标的适配性;
6. 修复了在设置(Checkbox勾选状态)和其他界面之间反复切换时出现的内存泄漏问题;
7. 运行内存优化(UI渲染、缓存机制、高负载逻辑触发时机调优等);
8. 重构并拆分大型代码文件;
9. 日志文件的切割由UTC+0变为按用户的时区。
10. 按照语言类型不同运行内存有较大差异:
10.1. 小型/标准字体语言,基于拉丁字母的语言(英语、德语、西班牙语、法语、意大利语、葡萄牙语、印尼语、土耳其语等),中型复杂语言(印地语、孟加拉语、俄语 等),窗口模式运行内存共约18MB;
10.2. 大型字体语言(中文、日语、韩语等),窗口模式运行内存共约35MB。
项目主页:
github.com
GitHub - owu/wsl-dashboard: A modern, high-performance, and lightweight WSL...
A modern, high-performance, and lightweight WSL instance management dashboard. A GUI manager for WSL.
如果您有任何建议或需求可以在主题下方评论 或者 访问 github 提交 issue 。
如果这个项目对您有帮助,请访问 github 帮我加一个星标,您的认可是我持续开发的动力!
WSL Dashboard v0.2.3 相关帖子: WSL Dashboard v0.2.3 开源发布,Rust 开发的 WSL2 可视化管理面板
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: goku)
Invalid media:
image
image
image
【Embedding公益站】硅基流动 Qwen/Qwen3 系列模型暂时不可用
下午看日志发现好多500错误
在 hoppscotch 中试了一下,也是同样的 500 错误,企业微信群反应情况没有回复,暂时换成 以下模型吧:
● gemini-embedding-001
● text-embedding-3-small
● (Pro)BAAI/bge-m3
● Qwen/Qwen3-Embedding-0.6B
同时禁用8B/4B这几个模型,恢复了第一时间启用
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: unsafe)
Invalid media: image
下午看日志发现好多500错误
在 hoppscotch 中试了一下,也是同样的 500 错误,企业微信群反应情况没有回复,暂时换成 以下模型吧:
● gemini-embedding-001
● text-embedding-3-small
● (Pro)BAAI/bge-m3
● Qwen/Qwen3-Embedding-0.6B
同时禁用8B/4B这几个模型,恢复了第一时间启用
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: unsafe)
Invalid media: image
给大家送个福利,5美刀 Claude codeMax
送几刀额度给大家,私信给我你的邮箱
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: Aa..26552)
送几刀额度给大家,私信给我你的邮箱
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: Aa..26552)
今天用了一天gpt-5.3-codex-xhigh我来说说我的看法
使用一天的感受就是快,尽管是xhigh也很快基本小任务5分钟内 大的15分钟内, 缺点:不知道是不是错觉我感觉他有点不遵守提示词, 5.2我的提示词会详细问我需求里面他不确定的等我确定以后再去开发,5.3同一套提示词下他居然不会问我就去写这就会导致有的需求我没有给他写清楚的就会跑偏, 总的来说5.3需要你把你的需求写详细方方面面考虑到那你可以毫不犹豫的选择他, 如果你的需求只是简单口述我建议还是5.2
5 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: xiaobai)
使用一天的感受就是快,尽管是xhigh也很快基本小任务5分钟内 大的15分钟内, 缺点:不知道是不是错觉我感觉他有点不遵守提示词, 5.2我的提示词会详细问我需求里面他不确定的等我确定以后再去开发,5.3同一套提示词下他居然不会问我就去写这就会导致有的需求我没有给他写清楚的就会跑偏, 总的来说5.3需要你把你的需求写详细方方面面考虑到那你可以毫不犹豫的选择他, 如果你的需求只是简单口述我建议还是5.2
5 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: xiaobai)
今年的班就上到今天了,太累了今年
兄弟们今年的班就上到这里了,总结一下就是今年是这些年来最累的一年,真他妈的累,发过誓26年不再工作到凌晨。就这样吧
4 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: Mycrlc)
Invalid media: image
兄弟们今年的班就上到这里了,总结一下就是今年是这些年来最累的一年,真他妈的累,发过誓26年不再工作到凌晨。就这样吧
4 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: Mycrlc)
Invalid media: image
好久没玩DO了 Digitalocean-TG机器人
刚撸个DO的号,想着好管理一点
github.com
GitHub - xkatld/digitalocean-tgbot: 基于 Go 语言实现的 DigitalOcean 资源管理 Telegram 机器人。
基于 Go 语言实现的 DigitalOcean 资源管理 Telegram 机器人。
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 洗头佬)
Invalid media:
image
image
刚撸个DO的号,想着好管理一点
github.com
GitHub - xkatld/digitalocean-tgbot: 基于 Go 语言实现的 DigitalOcean 资源管理 Telegram 机器人。
基于 Go 语言实现的 DigitalOcean 资源管理 Telegram 机器人。
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 洗头佬)
Invalid media:
image
image
codex插件的401
如题。用自己账号登录的还在401,还以为配置错误。最后的解决办法是删了已有的config.toml,重启软件就行了。 🥲 被自己蠢到
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: yuan lin)
如题。用自己账号登录的还在401,还以为配置错误。最后的解决办法是删了已有的config.toml,重启软件就行了。 🥲 被自己蠢到
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: yuan lin)
小米汽车:春节期间因车辆故障导致的抛锚,可获 500 元打车券及异地送车支持,并可报销最高 1500 元的单程交通费与 500 元住宿费。
小米汽车发布春节出行保障计划,覆盖全国 158 座城市
2 月 6 日,小米汽车 CEO 雷军发布春节出行服务保障计划,服务周期自 2 月 9 日起至 3 月 3 日止。该计划提供 24 小时免费道路救援、7×24 小时上门补胎及线上响应服务。针对因车辆故障导致的抛锚,用户可获 500 元打车券及异地送车支持,并可报销最高 1500 元的单程交通费与 500 元住宿费。
春节期间,小米汽车在全国 158 座城市的 275 家服务中心将保持正常营业,提供机电维修、移动上门快修及事故车接收服务,其官方 APP 商城亦同步维持运营。
3 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: 雪梨纽西兰希思露甘奶迪)
小米汽车发布春节出行保障计划,覆盖全国 158 座城市
2 月 6 日,小米汽车 CEO 雷军发布春节出行服务保障计划,服务周期自 2 月 9 日起至 3 月 3 日止。该计划提供 24 小时免费道路救援、7×24 小时上门补胎及线上响应服务。针对因车辆故障导致的抛锚,用户可获 500 元打车券及异地送车支持,并可报销最高 1500 元的单程交通费与 500 元住宿费。
春节期间,小米汽车在全国 158 座城市的 275 家服务中心将保持正常营业,提供机电维修、移动上门快修及事故车接收服务,其官方 APP 商城亦同步维持运营。
3 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: 雪梨纽西兰希思露甘奶迪)
出一个cc的小白配置教程
大佬可以无视这个教程,主要是给小白看的
拿到中转站的接口地址和密钥
我使用的中转站是:https://wzw.pp.ua/
谷歌签到插件用的:GitHub - qixing-jk/all-api-hub: 统一管理第三方 AI 聚合中转站与自建 New API:自动识别账号、查看余额、同步模型、管理密钥,全平台与云端备份 | Unified management of third-party AI aggregation transfer stations and self-built New API: automatic account identification, balance viewing, model synchronization, key management, and full-platform and cloud backup
软件管理用的:CC Switch GitHub - farion1231/cc-switch: A cross-platform desktop All-in-One assistant tool for Claude Code, Codex, OpenCode & Gemini CLI.
模型留空是可以在claude里面去选,其余的也是这样的方法去配置
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: linux_user)
Invalid media:
image
image
image
大佬可以无视这个教程,主要是给小白看的
拿到中转站的接口地址和密钥
我使用的中转站是:https://wzw.pp.ua/
谷歌签到插件用的:GitHub - qixing-jk/all-api-hub: 统一管理第三方 AI 聚合中转站与自建 New API:自动识别账号、查看余额、同步模型、管理密钥,全平台与云端备份 | Unified management of third-party AI aggregation transfer stations and self-built New API: automatic account identification, balance viewing, model synchronization, key management, and full-platform and cloud backup
软件管理用的:CC Switch GitHub - farion1231/cc-switch: A cross-platform desktop All-in-One assistant tool for Claude Code, Codex, OpenCode & Gemini CLI.
模型留空是可以在claude里面去选,其余的也是这样的方法去配置
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: linux_user)
Invalid media:
image
image
image
微信真鸡贼,屏蔽了千问的口令后才屏蔽了元宝的口令
元宝的链接是一天后被用户投诉太多屏蔽了,不过还可以通过口令复制
千问活动今天上线来势汹汹,当天口令都不能复制了,然后为了看起来公平,把元宝口令也屏蔽了
怎么说呢,就好像岳不群伪君子,不过要点脸起码也是好的
4 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: cabudon)
Invalid media: image
元宝的链接是一天后被用户投诉太多屏蔽了,不过还可以通过口令复制
千问活动今天上线来势汹汹,当天口令都不能复制了,然后为了看起来公平,把元宝口令也屏蔽了
怎么说呢,就好像岳不群伪君子,不过要点脸起码也是好的
4 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: cabudon)
Invalid media: image
现在codex在windows上的使用有优化了吗
之前额总是写一堆ps命令(还写不对)mcp也启动不了
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 小白)
之前额总是写一堆ps命令(还写不对)mcp也启动不了
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 小白)
openclaw在win11下的全部配置文件在哪个目录下呢
打包哪个目录可以无缝迁移
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 小白)
打包哪个目录可以无缝迁移
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 小白)
5.3-Codex 必须正名了!! 附带求佬分享VS code插件端技巧
如官方宣发,这个图是真的,同样准确率,token节省很多,因此速度快的不是一点半点。
我测了一些简单任务,基本比之前快一倍的速度。
此外求佬分享下VS code的codex插件的技巧啥的,因为本人没办法沉浸式vibe coding,代码必须自己过一遍+手动调优,修改什么的。因此只能用vscode搭配插件端,没办法纯粹cli直接“黑盒”搞定一切。
顺便吐槽这个汉化。。。
打开plan 模式,右下角 会显示套餐,实则是汉化问题,应该显示 plan,表示规划,但是汉化成了plan订阅…plan表示成套餐了。。。
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 哈基米基哈基_米基米基哈)
Invalid media:
image
image
如官方宣发,这个图是真的,同样准确率,token节省很多,因此速度快的不是一点半点。
我测了一些简单任务,基本比之前快一倍的速度。
此外求佬分享下VS code的codex插件的技巧啥的,因为本人没办法沉浸式vibe coding,代码必须自己过一遍+手动调优,修改什么的。因此只能用vscode搭配插件端,没办法纯粹cli直接“黑盒”搞定一切。
顺便吐槽这个汉化。。。
打开plan 模式,右下角 会显示套餐,实则是汉化问题,应该显示 plan,表示规划,但是汉化成了plan订阅…plan表示成套餐了。。。
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: 哈基米基哈基_米基米基哈)
Invalid media:
image
image
当我把:distorted_face:装进win11的文件夹 be like:
:distorted_face:
40 posts - 19 participants
Read full topic
via LINUX DO - 热门话题 (author: Canadew)
Invalid media: image
:distorted_face:
40 posts - 19 participants
Read full topic
via LINUX DO - 热门话题 (author: Canadew)
Invalid media: image
GPT-5.3-Codex 正式发布 编程性能再攀新高
OpenAI首席执行官Sam Altman宣布:“GPT-5.3-Codex正式发布!编程性能再攀新高:SWE-Bench Pro评测达57%、TerminalBench 2.0达76%、OSWorld达64%;支持任务中实时调控与动态更新;运行效率跃升:完成同等任务,令牌消耗量较5.2-Codex减少超一半,单令牌处理速度提升超25%;具备成熟的计算机实操能力。”
他还表示,“这是我们首款在安全防护框架的网络安全维度获评“高等级”的模型。目前,我们正试点推出可信访问框架,并投入1000万美元API额度,助力网络安全防御体系的加速建设。”
61 posts - 43 participants
Read full topic
via LINUX DO - 热门话题 (author: Cora Tracy)
Invalid media:
image
image
OpenAI首席执行官Sam Altman宣布:“GPT-5.3-Codex正式发布!编程性能再攀新高:SWE-Bench Pro评测达57%、TerminalBench 2.0达76%、OSWorld达64%;支持任务中实时调控与动态更新;运行效率跃升:完成同等任务,令牌消耗量较5.2-Codex减少超一半,单令牌处理速度提升超25%;具备成熟的计算机实操能力。”
他还表示,“这是我们首款在安全防护框架的网络安全维度获评“高等级”的模型。目前,我们正试点推出可信访问框架,并投入1000万美元API额度,助力网络安全防御体系的加速建设。”
61 posts - 43 participants
Read full topic
via LINUX DO - 热门话题 (author: Cora Tracy)
Invalid media:
image
image
记一次对 Opus 4.6、5.3 Codex、Step-3.5-Flash、Qwen3-Coder-Next 等真实项目需求的横向评测
项目
这是一个 Unity C# 项目,我进行测试的是一份皮肤系统需求案,我已经做了好预制体,而模型需要编写代码。
本次与上一次评测的项目和环境都完全一致: 记一次对 Claude、GPT、Gemini、GLM、Kimi、Minimax、DeepSeek 真实项目需求的横向评测
所以在评级时会参考上次的成绩合并进行评级。
本次有一个评审方式的变化,完成度我会使用 GPT-5.3-Codex(xhigh) 进行审查,会比人工审查更全面,可以说这次的评分比上次严格了非常多,以下是审查提示:
详细 (click for more details)
模型来源
● Step-3.5-Flash: 官方 API
● Qwen3-Coder-Next: OpenRouter(chutes)
● GPT-5.3-Codex: Codex 逆向 API (ChatGPT Team 订阅)
● Claude-Opus-4.6: 宣称官方 Claude Code 的中转站。
速度
● Step-3.5-Flash: 6 分钟
● Qwen3-Coder-Next: 9 分钟
● GPT-5.3-Codex(xhigh): 16 分钟
● GPT-5.3-Codex(high): 16 分钟(触发了一次上下文压缩)
● GPT-5.3-Codex(medium): 10 分钟
● Claude-Opus-4.6(Max): 26 分钟
令牌数
● Step-3.5-Flash: 3.06M (¥0.5)
● Qwen3-Coder-Next: 2.99M (¥1.56)
● GPT-5.3-Codex(xhigh): 未统计,体感上确实少了很多,额度用得也更少了。
● GPT-5.3-Codex(high): 总共尝试两次,都触发了上下文压缩,很不正常。
● GPT-5.3-Codex(medium): 与 xhigh 相同。
● Claude-Opus-4.6(Max): 3.50M
代码行数
● Step-3.5-Flash: (又没看,实在抱歉)
● Qwen3-Coder-Next: +1701, -6
● GPT-5.3-Codex(xhigh): +1600, -6
● GPT-5.3-Codex(high): +1452, -10
● GPT-5.3-Codex(medium): +1318, -5
● Claude-Opus-4.6(Max): +1592, -6
完成度
Step-3.5-Flash
审查结论: 存在编译阻断 + 核心功能回退。
详细 (click for more details)
Qwen3-Coder-Next
审查结论: 存在编译阻断 + 核心功能回退。
详细 (click for more details)
GPT-5.3-Codex(xhigh)
审查结论: 存在极个别小错误,与 GPT-5.2(xhigh) 相当。
详细 (click for more details)
GPT-5.3-Codex(high)
审查结论: 存在逻辑错误。
详细 (click for more details)
GPT-5.3-Codex(medium)
审查结论: 存在逻辑错误。
详细 (click for more details)
Claude-Opus-4.6(Max)
审查结论:
详细 (click for more details)
代码质量
Step-3.5-Flash
● 代码架构与美观:看着挺工整的。
● 注释程度:行间注释多,文档级注释也挺多。
● 防御性编程:正常,该判空的地方都有做。
Qwen3-Coder-Next
● 代码架构与美观:有一些地方扩展性看起来很低。
● 注释程度:行间注释多,文档级注释也挺多。
● 防御性编程:正常,该判空的地方都有做。
GPT-5.3-Codex(xhigh/high/medium)
● 代码架构与美观:看着挺好。
● 注释程度:竟然几乎没有任何注释?!与 5.2 系列的行为不同。
● 防御性编程:正常,该判空的地方都有做。
Claude-Opus-4.6(Max)
● 代码架构与美观:看着挺好。
● 注释程度:满满的 Claude 味,行间注释很多,也几乎都有文档级注释。
● 防御性编程:正常,该判空的地方都有做。
最终总结
Tier 3
● Step-3.5-Flash
● Qwen3-Coder-Next
Tier 2
● 无。
Tier 1
● GPT-5.3-Codex(high)
● GPT-5.3-Codex(medium)
项目
这是一个 Unity C# 项目,我进行测试的是一份皮肤系统需求案,我已经做了好预制体,而模型需要编写代码。
本次与上一次评测的项目和环境都完全一致: 记一次对 Claude、GPT、Gemini、GLM、Kimi、Minimax、DeepSeek 真实项目需求的横向评测
所以在评级时会参考上次的成绩合并进行评级。
本次有一个评审方式的变化,完成度我会使用 GPT-5.3-Codex(xhigh) 进行审查,会比人工审查更全面,可以说这次的评分比上次严格了非常多,以下是审查提示:
详细 (click for more details)
模型来源
● Step-3.5-Flash: 官方 API
● Qwen3-Coder-Next: OpenRouter(chutes)
● GPT-5.3-Codex: Codex 逆向 API (ChatGPT Team 订阅)
● Claude-Opus-4.6: 宣称官方 Claude Code 的中转站。
速度
● Step-3.5-Flash: 6 分钟
● Qwen3-Coder-Next: 9 分钟
● GPT-5.3-Codex(xhigh): 16 分钟
● GPT-5.3-Codex(high): 16 分钟(触发了一次上下文压缩)
● GPT-5.3-Codex(medium): 10 分钟
● Claude-Opus-4.6(Max): 26 分钟
令牌数
● Step-3.5-Flash: 3.06M (¥0.5)
● Qwen3-Coder-Next: 2.99M (¥1.56)
● GPT-5.3-Codex(xhigh): 未统计,体感上确实少了很多,额度用得也更少了。
● GPT-5.3-Codex(high): 总共尝试两次,都触发了上下文压缩,很不正常。
● GPT-5.3-Codex(medium): 与 xhigh 相同。
● Claude-Opus-4.6(Max): 3.50M
代码行数
● Step-3.5-Flash: (又没看,实在抱歉)
● Qwen3-Coder-Next: +1701, -6
● GPT-5.3-Codex(xhigh): +1600, -6
● GPT-5.3-Codex(high): +1452, -10
● GPT-5.3-Codex(medium): +1318, -5
● Claude-Opus-4.6(Max): +1592, -6
完成度
Step-3.5-Flash
审查结论: 存在编译阻断 + 核心功能回退。
详细 (click for more details)
Qwen3-Coder-Next
审查结论: 存在编译阻断 + 核心功能回退。
详细 (click for more details)
GPT-5.3-Codex(xhigh)
审查结论: 存在极个别小错误,与 GPT-5.2(xhigh) 相当。
详细 (click for more details)
GPT-5.3-Codex(high)
审查结论: 存在逻辑错误。
详细 (click for more details)
GPT-5.3-Codex(medium)
审查结论: 存在逻辑错误。
详细 (click for more details)
Claude-Opus-4.6(Max)
审查结论:
详细 (click for more details)
代码质量
Step-3.5-Flash
● 代码架构与美观:看着挺工整的。
● 注释程度:行间注释多,文档级注释也挺多。
● 防御性编程:正常,该判空的地方都有做。
Qwen3-Coder-Next
● 代码架构与美观:有一些地方扩展性看起来很低。
● 注释程度:行间注释多,文档级注释也挺多。
● 防御性编程:正常,该判空的地方都有做。
GPT-5.3-Codex(xhigh/high/medium)
● 代码架构与美观:看着挺好。
● 注释程度:竟然几乎没有任何注释?!与 5.2 系列的行为不同。
● 防御性编程:正常,该判空的地方都有做。
Claude-Opus-4.6(Max)
● 代码架构与美观:看着挺好。
● 注释程度:满满的 Claude 味,行间注释很多,也几乎都有文档级注释。
● 防御性编程:正常,该判空的地方都有做。
最终总结
Tier 3
● Step-3.5-Flash
● Qwen3-Coder-Next
虽然我在期待奇迹,但是对于这两个小参数模型来说不能要求太高,Step-3.5-Flash 的速度真的令人惊艳,但是效果还是 GLM 4.7 最好。
过往模型:
● DeepSeek V3.2
● GLM 4.7
● Minimax M2.1
● Gemini 3 Pro
● Gemini 3 Flash
● GPT 5.1 Codex mini(medium)
Tier 2
● 无。
待补充。
过往模型:
● Kimi K2.5
Tier 1
● GPT-5.3-Codex(high)
● GPT-5.3-Codex(medium)
linux.do
记一次对 Opus 4.6、5.3 Codex、Step-3.5-Flash、Qwen3-Coder-Next 等真实项目需求的横向评测 项目 这是一个 Unity C# 项目,我进行测试的是一份皮肤系统需求案,我已经做了好预制体,而模型需要编写代码。 本次与上一次评测的项目和环境都完全一致: 记一次对 Claude、GPT、Gemini、GLM、Kimi、Minimax、DeepSeek 真实项目需求的横向评测 所以在评级时会参考上次的成绩合并进行评级。 本次有一个评审方式的变化,完成度我会使用…
● Claude Opus 4.6(Max)
Claude Opus 4.6 等了一个多小时才测好,这其中主要是因为出现了几次中断,为了不影响最终效果共测试了三遍。
这次 Opus 的表现令我不敢相信,可以说是大失所望,测试的三遍中每个都花了 20 分钟以上,而且每次前 20 分钟都基本上花在了探索代码库。
可以看出 Opus 4.6 很倾向于探索代码库。
但是最终效果却只能说和 Opus 4.5 没有什么差距:
● Type 枚举未转换的问题在 Opus 4.5 也犯了。
● 未在显示称号时更新建筑的预览也是 Opus 4.5 就有的错误。
这种结果我不想相信,所以我甚至给它开了个后门:
允许它再检查一遍,结果是:
Tier 0
● GPT-5.3-Codex(xhigh)
但可以接受,毕竟花费的时间真的可以感觉到少了,如果忽略网络的影响,与上次的时间相比缩短了一倍,复杂需求时,GPT 5.3 Codex 可以成为首选模型。
----------------------
本次使用自己开发的 VS Code 插件做到在 Copilot 中使用以上模型: GitHub - smallmain/vscode-unify-chat-provider: Integrate multiple LLM API providers into VS Code's GitHub Copilot Chat using the Language Model API. Aggregates the latest free mainstream models, configurable in just a few steps! One-click use of your Claude Code, Gemini CLI, Antigravity, Github Copilot, Qwen Code, OpenAI CodeX (ChatGPT Plus/Pro), iFlow CLI account quotas.
在 VS Code v1.109.0 版本中,Copilot 有很多新特性和优化,大家可以试一试。
这次 Opus 4.6 和 5.3 Codex 的发布,我也将插件进行了第一时间的完全适配,并非改一改模型 ID 就是适配了,这并不能发挥出模型的最大潜力,所以已将官方 API 规范中针对 Opus 4.6 新增的字段都进行了适配:
● Adaptive thinking
● Max effort thinking
如果对佬友们有帮助,请给我一个 Star,感谢!
44 posts - 32 participants
Read full topic
via LINUX DO - 热门话题 (author: SmallMain)
Invalid media:
image
image
GPT-5.3-Codex(high) 尝试了两次,因为每次都触发了上下文压缩,这不应该出现,所以又给了一次机会,但依然有相同的问题。检查之后发现它读取了很多 .prefab 文件,这些文件既不太可读,也不应该被读取,因为需求案已经提供了预制体结构。
过往模型:
● GPT 5.2(medium)
● GPT 5.2 Codex(xhigh)
● Claude Opus 4.5
● Claude Sonnet 4.5
Claude Opus 4.6 等了一个多小时才测好,这其中主要是因为出现了几次中断,为了不影响最终效果共测试了三遍。
这次 Opus 的表现令我不敢相信,可以说是大失所望,测试的三遍中每个都花了 20 分钟以上,而且每次前 20 分钟都基本上花在了探索代码库。
可以看出 Opus 4.6 很倾向于探索代码库。
但是最终效果却只能说和 Opus 4.5 没有什么差距:
● Type 枚举未转换的问题在 Opus 4.5 也犯了。
● 未在显示称号时更新建筑的预览也是 Opus 4.5 就有的错误。
这种结果我不想相信,所以我甚至给它开了个后门:
允许它再检查一遍,结果是:
Tier 0
● GPT-5.3-Codex(xhigh)
依然是王者,需要说的是出现了两个小错误,这两个错误在 GPT 5.2 时没有。
过往模型:
● GPT 5.2(xhigh)
但可以接受,毕竟花费的时间真的可以感觉到少了,如果忽略网络的影响,与上次的时间相比缩短了一倍,复杂需求时,GPT 5.3 Codex 可以成为首选模型。
----------------------
本次使用自己开发的 VS Code 插件做到在 Copilot 中使用以上模型: GitHub - smallmain/vscode-unify-chat-provider: Integrate multiple LLM API providers into VS Code's GitHub Copilot Chat using the Language Model API. Aggregates the latest free mainstream models, configurable in just a few steps! One-click use of your Claude Code, Gemini CLI, Antigravity, Github Copilot, Qwen Code, OpenAI CodeX (ChatGPT Plus/Pro), iFlow CLI account quotas.
在 VS Code v1.109.0 版本中,Copilot 有很多新特性和优化,大家可以试一试。
这次 Opus 4.6 和 5.3 Codex 的发布,我也将插件进行了第一时间的完全适配,并非改一改模型 ID 就是适配了,这并不能发挥出模型的最大潜力,所以已将官方 API 规范中针对 Opus 4.6 新增的字段都进行了适配:
● Adaptive thinking
● Max effort thinking
如果对佬友们有帮助,请给我一个 Star,感谢!
44 posts - 32 participants
Read full topic
via LINUX DO - 热门话题 (author: SmallMain)
Invalid media:
image
image
5.3-codex很强,是codex后缀模型最好用的一次
昨晚以为奥特曼就是说说而已,没想到5.3-codex终于端出来了(感谢
早上看到佬发的帖子:https://linux.do/t/topic/1571133
升级了codex cli,我勒个一晚上更了三个版本啊
示例:
我之前找codex cli的压缩机制时,跟5.2需要讨论两三轮才能找对问题、还需要我自己看代码总结结论,现在gpt-5.3-codex只需要一句话(拉新仓库重新问的,没有缓存)
然后不到2分钟结论直接甩给我了,非常之精准啊!(一句话就能干我+gpt5.2半个小时的活啊)
258k? 272k? 400k? 浅析codex的上下文与压缩机制 开发调优
目前的缺点
free号还没上,所以公益站调用不起来,给奥特曼点时间 :bili_057:
70 posts - 40 participants
Read full topic
via LINUX DO - 热门话题 (author: zj.z)
Invalid media:
image
image
image
昨晚以为奥特曼就是说说而已,没想到5.3-codex终于端出来了(感谢
A/)早上看到佬发的帖子:https://linux.do/t/topic/1571133
升级了codex cli,我勒个一晚上更了三个版本啊
示例:
我之前找codex cli的压缩机制时,跟5.2需要讨论两三轮才能找对问题、还需要我自己看代码总结结论,现在gpt-5.3-codex只需要一句话(拉新仓库重新问的,没有缓存)
然后不到2分钟结论直接甩给我了,非常之精准啊!(一句话就能干我+gpt5.2半个小时的活啊)
258k? 272k? 400k? 浅析codex的上下文与压缩机制 开发调优
0. 从这两个话题出发,看了下codex的代码 0.1 Codex可以超过context length limit继续使用 0.2 简单解释一下codex的上下文大小1. 长话短说篇 gpt-5.2自动触发压缩的窗口 272k*0.9 = 244.8k gpt-5.2显示的窗口272k*0.95 = 258k gpt-5.2实际的窗口:400k gpt5.2能否关闭自动压缩:目前不能,但可…
目前的缺点
free号还没上,所以公益站调用不起来,给奥特曼点时间 :bili_057:
70 posts - 40 participants
Read full topic
via LINUX DO - 热门话题 (author: zj.z)
Invalid media:
image
image
image