记一次对 GLM 5.1、KAT-Coder-Pro V2 的真实项目需求的横向评测
项目
这是一个 Unity C# 项目,我进行测试的是一份皮肤系统需求案,我已经做了好预制体,而模型需要编写代码。
本轮与上两轮评测的项目和环境都完全一致:
● 第一轮
● …
● 第八轮
模型来源
● GLM 5.1: 官方 Coding Plan
● KAT-Coder-Pro V2: 官方 API
速度
令牌数
● GLM 5.1: 无法得知
● KAT-Coder-Pro V2: 15.7M(官方有统计周期,未得知具体金额)
代码行数
● GLM 5.1: +1667, -6
● KAT-Coder-Pro V2: +1592, -34
完成度
GLM 5.1
审查结论: 部分功能未实现。
详细
KAT-Coder-Pro V2
审查结论: 较多功能未实现。
详细
代码质量
GLM 5.1 和 KAT-Coder-Pro V2 的代码风格依旧经典,注释非常详细,行间注释多。
最终总结
GLM 5.1 非常严谨地先阅读了整个项目的代码,在编写代码的过程中也在不断地带着问题去搜索相关代码,在完成之后,还对所有文件进行了重新检查,可以说整个过程看起来非常严谨细致,当然由此导致的是花费的时间较长,我认为应该比 GLM 5 的时间要长(由于 VS Code 新版本突然不显示会话所花费的时间,所以这次没来得及手动计时,实在抱歉)。
GLM 5.1 的做题过程真的非常令人安心,但是很可惜,相对于国外的模型来说,奇迹没有发生,未踏入 Tier 1 的行列,但相比 GLM 5 来说,有了明显的提升,且没有编译错误,上代 GLM 5 是有一点编译错误的。
KAT-Coder-Pro V2 的做题过程相较于 GLM 5.1 来说是更常见的先阅读整个项目的代码,然后再编写代码,中途不会出现 GLM 5.1 那样回头看一下的行为,但在最后完成之后进行了一次全面的代码检查,且输出了一份完成报告。
最终,KAT-Coder-Pro V2 的完成度虽然不如 Tier 2 的其它模型,但是没有编译错误,所以不至于放在 Tier 3 模型。
这次 GLM 5.1 和 KAT-Coder-Pro V2 的表现我认为都是不错的,特别是 GLM 5.1,它展现出来的严谨程度让我有兴趣在之后继续日常使用以更深入地了解。
19 个帖子 - 17 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: SmallMain)
项目
这是一个 Unity C# 项目,我进行测试的是一份皮肤系统需求案,我已经做了好预制体,而模型需要编写代码。
本轮与上两轮评测的项目和环境都完全一致:
● 第一轮
● …
● 第八轮
模型来源
● GLM 5.1: 官方 Coding Plan
● KAT-Coder-Pro V2: 官方 API
速度
令牌数
● GLM 5.1: 无法得知
● KAT-Coder-Pro V2: 15.7M(官方有统计周期,未得知具体金额)
代码行数
● GLM 5.1: +1667, -6
● KAT-Coder-Pro V2: +1592, -34
完成度
GLM 5.1
审查结论: 部分功能未实现。
详细
KAT-Coder-Pro V2
审查结论: 较多功能未实现。
详细
代码质量
GLM 5.1 和 KAT-Coder-Pro V2 的代码风格依旧经典,注释非常详细,行间注释多。
最终总结
GLM 5.1 非常严谨地先阅读了整个项目的代码,在编写代码的过程中也在不断地带着问题去搜索相关代码,在完成之后,还对所有文件进行了重新检查,可以说整个过程看起来非常严谨细致,当然由此导致的是花费的时间较长,我认为应该比 GLM 5 的时间要长(由于 VS Code 新版本突然不显示会话所花费的时间,所以这次没来得及手动计时,实在抱歉)。
GLM 5.1 的做题过程真的非常令人安心,但是很可惜,相对于国外的模型来说,奇迹没有发生,未踏入 Tier 1 的行列,但相比 GLM 5 来说,有了明显的提升,且没有编译错误,上代 GLM 5 是有一点编译错误的。
KAT-Coder-Pro V2 的做题过程相较于 GLM 5.1 来说是更常见的先阅读整个项目的代码,然后再编写代码,中途不会出现 GLM 5.1 那样回头看一下的行为,但在最后完成之后进行了一次全面的代码检查,且输出了一份完成报告。
最终,KAT-Coder-Pro V2 的完成度虽然不如 Tier 2 的其它模型,但是没有编译错误,所以不至于放在 Tier 3 模型。
这次 GLM 5.1 和 KAT-Coder-Pro V2 的表现我认为都是不错的,特别是 GLM 5.1,它展现出来的严谨程度让我有兴趣在之后继续日常使用以更深入地了解。
19 个帖子 - 17 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: SmallMain)
500刀claude opus4.6 速蹬
43 个帖子 - 42 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: nacht)
sk-1y4AiiiqWu8p50qzTFCYChX6kFvCaBqDIdtZaSKoPuwAfSzC
https://new-api-latest-6e4a.onrender.com/
43 个帖子 - 42 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: nacht)
[LogosAPI公益站]跑路了兄弟们
现在一注册就是401,想加并发注册,结果给临时邮箱服务都干到429了
目前没有什么解决方案,只能先跑路了
受影响的站点:sub2.wi11.de
LogosAPI - AI API Gateway
https://api.777114.xyz
如果有在使用的佬友注意切换,避免受到影响
最后来看下本月的统计吧
28 个帖子 - 27 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Logos)
现在一注册就是401,想加并发注册,结果给临时邮箱服务都干到429了
目前没有什么解决方案,只能先跑路了
受影响的站点:sub2.wi11.de
LogosAPI - AI API Gateway
https://api.777114.xyz
如果有在使用的佬友注意切换,避免受到影响
最后来看下本月的统计吧
28 个帖子 - 27 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Logos)
【抽奖】抽一个支付宝6.66口令红包
马上飞升三级,回馈各位佬友
[奖品]:支付宝6.66口令红包 * 1
:three_o_clock: 活动时间:
开始时间:[此帖发出开始]
截止时间: :Sun, Mar 29, 2026 11:30 AM CST
📝 参与方式:
在本帖下回复任意内容
🔍️ 抽奖规则:
每位用户仅允许参与一次。
使用官方抽奖工具随机抽取中奖者。
⚠️ 注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后 12 小时内在本帖公布,并通过私信通知领奖方式。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系抽奖发起人。
173 个帖子 - 173 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 祝好)
马上飞升三级,回馈各位佬友
[奖品]:支付宝6.66口令红包 * 1
:three_o_clock: 活动时间:
开始时间:[此帖发出开始]
截止时间: :Sun, Mar 29, 2026 11:30 AM CST
📝 参与方式:
在本帖下回复任意内容
🔍️ 抽奖规则:
每位用户仅允许参与一次。
使用官方抽奖工具随机抽取中奖者。
⚠️ 注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后 12 小时内在本帖公布,并通过私信通知领奖方式。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系抽奖发起人。
173 个帖子 - 173 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: 祝好)
【抽奖】终于三级了,抽3个支付宝10米口令红包
终于3级了,每天盼星星盼月亮,终于3级了。L站的人真的好的不得了
🏆️ 奖品详情:
3个10米的支付宝口令红包。
:three_o_clock: 活动时间:2026-03-28 12:00 ~ 2026-03-29 12:00
📝 参与方式:
在本帖下回复任意内容即可。
🔍️ 抽奖规则:
每位用户仅允许参与一次。
使用 LINUX DO 抽奖工具随机抽取中奖者。
我会在活动结束后将支付宝红包口令私信到中奖者~
303 个帖子 - 303 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Atomic)
终于3级了,每天盼星星盼月亮,终于3级了。L站的人真的好的不得了
🏆️ 奖品详情:
3个10米的支付宝口令红包。
:three_o_clock: 活动时间:2026-03-28 12:00 ~ 2026-03-29 12:00
📝 参与方式:
在本帖下回复任意内容即可。
🔍️ 抽奖规则:
每位用户仅允许参与一次。
使用 LINUX DO 抽奖工具随机抽取中奖者。
我会在活动结束后将支付宝红包口令私信到中奖者~
303 个帖子 - 303 位参与者
阅读完整话题
via LINUX DO - 热门话题 (author: Atomic)
gemini ultra的deepthink和Pro有很大区别吗
大佬们,最近开始写论文了,已经有了geminiPro 写论文方面体验还不错,ultra的deepthink模式要强很多吗
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Yuanhao)
大佬们,最近开始写论文了,已经有了geminiPro 写论文方面体验还不错,ultra的deepthink模式要强很多吗
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Yuanhao)
Ber....GLM都5.1了,随机性胡言乱语的BUG还没有修好么
我还以为5.1就是修了5.0的bug,结果还是老样子…
欺负max用户脾气好?
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: kobe7180)
我还以为5.1就是修了5.0的bug,结果还是老样子…
欺负max用户脾气好?
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: kobe7180)
你们会看第二遍《活着》吗
下午闲来无事,去书店转了转,随手拿了一本书《活着》, 又随便翻到一页,是福贵背着家珍到村西头看死掉了的有庆。 md,我哭了。。。
5 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: shaonian_sun)
下午闲来无事,去书店转了转,随手拿了一本书《活着》, 又随便翻到一页,是福贵背着家珍到村西头看死掉了的有庆。 md,我哭了。。。
5 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: shaonian_sun)
有用广电卡被限速的嘛,打投诉电话会有用嘛
广电卡晚上只有3M,我很确定是被基站限速了,刚办两月的卡,这玩意应该是被其他运营商恶意限速了。这个问题大家是怎么解决的。
10 个帖子 - 6 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 项少龙爱阿盘)
广电卡晚上只有3M,我很确定是被基站限速了,刚办两月的卡,这玩意应该是被其他运营商恶意限速了。这个问题大家是怎么解决的。
10 个帖子 - 6 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 项少龙爱阿盘)
佬友们,现在海鲜市场五六十的gemini靠谱吗
最近想整一个gemini用一下,刷到海鲜市场这个价格质保30天 或者有没有可以搞定的佬我直接跟佬友买也行
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: dadao)
最近想整一个gemini用一下,刷到海鲜市场这个价格质保30天 或者有没有可以搞定的佬我直接跟佬友买也行
4 个帖子 - 4 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: dadao)
Codex如何高效开发,有啥经验吗
感觉开发好慢啊,跟他沟通理解不好我的需求,ui写不好
(我表达能力可能也不好)
9 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 宇智波佐助)
感觉开发好慢啊,跟他沟通理解不好我的需求,ui写不好
(我表达能力可能也不好)
9 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 宇智波佐助)
【955code】codex公益站,上线试运营
本帖使用社区公益推广,符合推广要求。我申明并遵循社区要求的以下内容:
● 我的项目是免费使用的,无收费(变相收费、赞助)部分: 是
● 我的帖子已经打上 公益推广 标签: 是
● 我的项目属于个人项目,与公司或商业机构无关: 是
● 我的项目不存在QQ、TG等群组引流: 是
● 我的项目不存在非运营必要的网站引流: 是
● 我的项目不存在为他人推广、AFF: 是
● 我的项目无关联的商业项目: 是
● 我的站点存在登录,并已接入 LINUX DO Connect: 是
● 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
● 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
● 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
----------------------
开放地址,要求是 Lv1 级可注册 或github授权登录。955code.top
New API
统一的 AI 模型聚合与分发网关,支持将各类大语言模型跨格式转换为 OpenAI、Claude、Gemini 兼容接口,为个人与企业提供集中式模型管理与网关服务。
11 个帖子 - 11 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: wurong)
本帖使用社区公益推广,符合推广要求。我申明并遵循社区要求的以下内容:
● 我的项目是免费使用的,无收费(变相收费、赞助)部分: 是
● 我的帖子已经打上 公益推广 标签: 是
● 我的项目属于个人项目,与公司或商业机构无关: 是
● 我的项目不存在QQ、TG等群组引流: 是
● 我的项目不存在非运营必要的网站引流: 是
● 我的项目不存在为他人推广、AFF: 是
● 我的项目无关联的商业项目: 是
● 我的站点存在登录,并已接入 LINUX DO Connect: 是
● 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
● 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
● 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
----------------------
开放地址,要求是 Lv1 级可注册 或github授权登录。955code.top
New API
统一的 AI 模型聚合与分发网关,支持将各类大语言模型跨格式转换为 OpenAI、Claude、Gemini 兼容接口,为个人与企业提供集中式模型管理与网关服务。
11 个帖子 - 11 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: wurong)
写了个批量生成微信表情包的小工具,欢迎围观
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
● 我的帖子已经打上 开源推广 标签: 是
● 我的开源项目完整开源,无未开源部分: 是
● 我的开源项目已链接认可 LINUX DO 社区: 是
● 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
● 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
Github:GitHub - twwch/Mako: 一个让用户轻松上传图片、添加文字和特效,在线制作并分享个性化表情包的Web应用。 · GitHub
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: cturing)
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
● 我的帖子已经打上 开源推广 标签: 是
● 我的开源项目完整开源,无未开源部分: 是
● 我的开源项目已链接认可 LINUX DO 社区: 是
● 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
● 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
Github:GitHub - twwch/Mako: 一个让用户轻松上传图片、添加文字和特效,在线制作并分享个性化表情包的Web应用。 · GitHub
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: cturing)
为什么卸载不了Claude Code?
为什么我这执行这个 npm uninstall -g @anthropic-ai/claude-code 命令后,claude code还在呀?
6 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: LRX)
为什么我这执行这个 npm uninstall -g @anthropic-ai/claude-code 命令后,claude code还在呀?
6 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: LRX)
claude还是厉害,gpt是什么垃圾
这几周一直因为gpt额度高,还不封号决定使用codex app和cli进行个人项目开发,或者一些开源项目衍生研究,最近就在试着搞autoresearch。
但用起来就是废话巨多,而且有一种莫名其妙的文风,效率积极低下。更重要的是不懂我的意思(也许是我用不来吧…),我让他根据autoresearch项目给其他一些仓库优化,完全就不按autoresearch的设计来。
昨晚试着用claudecode,一句话就让我感觉完全不一样,还没开始试验结果如何,但是它立马就按我想要的意思做了个适配新项目的autoresearch版本。
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: yiming)
这几周一直因为gpt额度高,还不封号决定使用codex app和cli进行个人项目开发,或者一些开源项目衍生研究,最近就在试着搞autoresearch。
但用起来就是废话巨多,而且有一种莫名其妙的文风,效率积极低下。更重要的是不懂我的意思(也许是我用不来吧…),我让他根据autoresearch项目给其他一些仓库优化,完全就不按autoresearch的设计来。
昨晚试着用claudecode,一句话就让我感觉完全不一样,还没开始试验结果如何,但是它立马就按我想要的意思做了个适配新项目的autoresearch版本。
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: yiming)