linux.do
21K subscribers
116K photos
195 videos
115 files
249K links
linux.do最新话题和热议话题
Download Telegram
这钱也太好赚了吧

闲鱼上看到的

难评

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: AirTouch)
记一次对 GLM 5.1、KAT-Coder-Pro V2 的真实项目需求的横向评测

项目

这是一个 Unity C# 项目,我进行测试的是一份皮肤系统需求案,我已经做了好预制体,而模型需要编写代码。

本轮与上两轮评测的项目和环境都完全一致:

第一轮

第八轮

模型来源

GLM 5.1: 官方 Coding Plan
KAT-Coder-Pro V2: 官方 API

速度

令牌数

GLM 5.1: 无法得知
KAT-Coder-Pro V2: 15.7M(官方有统计周期,未得知具体金额)

代码行数

GLM 5.1: +1667, -6
KAT-Coder-Pro V2: +1592, -34

完成度

GLM 5.1

审查结论: 部分功能未实现。

详细

KAT-Coder-Pro V2

审查结论: 较多功能未实现。

详细

代码质量

GLM 5.1 和 KAT-Coder-Pro V2 的代码风格依旧经典,注释非常详细,行间注释多。

最终总结

GLM 5.1 非常严谨地先阅读了整个项目的代码,在编写代码的过程中也在不断地带着问题去搜索相关代码,在完成之后,还对所有文件进行了重新检查,可以说整个过程看起来非常严谨细致,当然由此导致的是花费的时间较长,我认为应该比 GLM 5 的时间要长(由于 VS Code 新版本突然不显示会话所花费的时间,所以这次没来得及手动计时,实在抱歉)。

GLM 5.1 的做题过程真的非常令人安心,但是很可惜,相对于国外的模型来说,奇迹没有发生,未踏入 Tier 1 的行列,但相比 GLM 5 来说,有了明显的提升,且没有编译错误,上代 GLM 5 是有一点编译错误的。

KAT-Coder-Pro V2 的做题过程相较于 GLM 5.1 来说是更常见的先阅读整个项目的代码,然后再编写代码,中途不会出现 GLM 5.1 那样回头看一下的行为,但在最后完成之后进行了一次全面的代码检查,且输出了一份完成报告。

最终,KAT-Coder-Pro V2 的完成度虽然不如 Tier 2 的其它模型,但是没有编译错误,所以不至于放在 Tier 3 模型。

这次 GLM 5.1 和 KAT-Coder-Pro V2 的表现我认为都是不错的,特别是 GLM 5.1,它展现出来的严谨程度让我有兴趣在之后继续日常使用以更深入地了解。

4 个帖子 - 4 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: SmallMain)
Telegram必备的搜索引擎,极搜JISOU帮你精准找到,想要的群组、频道、视频、音乐

👉 t.me/jisou?start=a_7387292324
乐谱怎么编辑放大

如题,老妈一直在老年大学上音乐课,但是老花眼了,一张A4纸打印的乐谱看不清,问我能不能编辑乐谱把字体放大,我试了按照图片处理AI总有细节错了,按照文档处理AI读不到乐谱,现阶段有没有什么方案能实现放大这个汉字,像word那样放大缩小不影响整体排版?

7 个帖子 - 7 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: hua1)
anyrounter怎么在ccswitch添加呀,一直报错500

1. Anyrounter 检查失败: HTTP 500: {“error”:{“type”:“new_api_error”,“message”:“invalid claude code request (request id: 20260328114711373071232oLHleAlX)”},“type”:“error”}

4 个帖子 - 4 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: multipoint)
有没有好用的模型推荐?

小白一枚,正在学习AI。

5 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: lxning)
GLM5.1 天气卡片测试

提示词
以 iOS 18 的设计风格做一个带有动画效果的天气卡片,要求是使用 HTML、CSS 和基础 JavaScript,使用横板天气页面(拥有 4 个天气卡片 (晴天,大风,暴雨,暴雪))。应足够美观,实现一定的交互效果。

还可以点击卡片展开看详情

代码/预览:
https://codepen.io/wsdx233/pen/QwKQKyX

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Wsdx233)
26年还有人使用RSS订阅吗?

最近接触到了 RSS 订阅这种获取信息的方式,感觉用起来很舒服。目前用的软件是 CapyReader, 也订阅了一些个人博客,感觉好像现在 RSS 订阅不是很流行,佬友们怎么看呢?

上图是 LinuxDo 最新话题的 RSS 订阅
4 个帖子 - 4 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: yidoer)
Accio 输入任意邀请码伪激活启动

注意这只能过邀请码窗口不代表你账户激活能使用了

./hook_accio_activation_ui.bat --root “D:\Accio”

ByPass.zip (4.1 KB)

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 午时)
感觉4o并没有#keep4o所宣称的那么“友爱”

现在 GitHub Copilot 还提供 gpt-4o 的调用,我通过 oauth 把它 2api 出来,和它聊了几句。感觉就是顺着你说话而已,世界知识什么的也很匮乏……

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 阿钖)
发现好像NewAPI公益站出来的GPT模型都无法指定思考?

1. 无法在模型后面通过(xhign)这样指定思考
2. 在Kilo Code这类插件配置思考深度实际无效

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: hebaodan)
内存这么夸张的吗?瞬间被秒

挂海鲜,瞬间被秒,好像卖亏了

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: yrwh)
[赛博史官] 谷歌把 AI Ultra 订阅的 Antigravity 额度改成有周限了

现在 Ultra 订阅的 Antigravity 模型也有周限了。之前的描述是 “No weekly rate limit”,现在改成 “Highest weekly rate limits”.

这不是第一次改了,三月初的时候改成过 “Highest weekly rate limits”,后来又偷偷改回 “No weekly rate limit”。看来谷歌是铁了心要削额度了,不知道 A\ 那边会怎么行动。Google Antigravity

Google Antigravity

Google Antigravity - Build the new way

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Cells)
现在还有什么包月的codex、claude推荐吗?

过年前用的cubence,包月凉了,然后转到packy,也不出包月了

现在剩下的几个可以包月的额度不会重置,90元=100美元,跟直接冲额度没区别了

最好还是能开票的那种,实在没有按量的也行

感激不尽!

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 睡觉的蛋糕)
现在这个时代,怎么提高自己的代码能力呢?

RT,这个问题看上去很无厘头,但博主是真的有点纠结。CC用多了之后感觉自己只会发号施令,而且一旦离开CC,直面IDE,总有点写不下去,甚至gemini 3 pro偶尔胡言乱语都会感觉无法容忍。
这个和博主的背景有关系,博主非科班,跨考过来之后就一直在用GPT辅助编程,现在更是直接换到了可以隐藏大部分编码细节的cc,codex等工具,换句话说其实从来没有一个脚本是亲手敲我完的(这个习惯也埋了不少雷…早期缺乏对大模型的了解,盲目信任GPT给出的脚本,在一年后才发现他给我写的深度学习模型里有一部分是根本没有跑起来的)
不用工具效率低下,用多了产生依赖,变得没耐心,对技术细节也越来越陌生(而且总觉得万一哪天买不起token了怎么办),总是感觉有点焦虑。佬们有什么建议吗?

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 奶奶说过)
小洛克们请分享你们的焚决,我先来

不笑的可以确诊植物人了🤣
1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: lin2101)
Opus咱们不熟了,我要用Claude Capybara

Anthropic 因内容管理系统配置错误导致大量内部草案泄露,随后证实正测试名为“Claude Mythos”的新一代 AI 模型。该公司发言人称,该模型代表了 AI 性能的“阶梯式跨越”,是其迄今为止功能最强大的模型。泄露文档显示,该模型在软件编程、学术推理和网络安全测试中的得分显著高于现有的 Claude 4.6 Opus,并引入了名为“Capybara”的更高性能层级。

_Fortune

Exclusive: Anthropic is testing 'Mythos' its 'most powerful AI model ever...

Anthropic said it was testing the new model, which it called a 'step change' in performance, after accidental data leak reveals its existence

38 个帖子 - 37 位参与者

阅读完整话题

via LINUX DO - 热门话题 (author: )