LinuxDo 新帖推送
185 subscribers
253K photos
315K links
Download Telegram
标题: kimi k2.6 benchmark分析(换成排名)
作者: #blacksein
板块: #国产替代
编号: 2018926
帖子: https://linux.do/t/topic/2018926
时间: 2026-04-21 13:47:23
摘要:
官方的benchmark很全面,但是有点看不清楚,我换成排名的方式感觉更清楚点。
生成表格的代码是AI写的。。想了想还是截图吧
官方原始的benchmark:


kimi.com





Kimi K2.6 Tech Blog: Advancing Open-Source Coding

Kimi K2.6 advances open-source coding, featuring long-horizon coding, coding-driven design, agent swarms, proactive agents, and the Claw Groups research preview.












总结

可以看出kimi k2.6不是总的第一哦,所以说k2.6只有跑分是不对的,因为跑分不是第一。
(opus4.6拉了是因为vision严重拖了后腿 佬可以看下面的图)
其中有两个项目只有k2.6和k2.5。
各位佬可以看下面。
Agentic

这个表现很亮眼 但是注意了 这里其中两个榜只有k2.6和2.5
也可以看到opus几乎没掉出过前三(除了toolathlon是第四
Coding

coding只有SWE-Bench Pro第一了,这个是长任务,此前其他模型还没针对性优化长任务,比如opus 4.7也是重点优化了这个。但是也说明kimi k2.6针对长任务能更好工作(注意glm5.1这项分数是58.4 所以k2.6是开源第一了)
Reasoning & Knowledge

除去IMO-AnswerBench是第三 k2.6和k2.5包揽了最后两名
这项测试和第一梯队还有差距
Vision

没掉出前三 大部分是第3
GPT这里的能力是真强 大部分是第一
Opus分析的总排名拉就是因为Vision不太行 基本垫底了

好了 通过转化为rank的方式可以让佬更直观点看模型能力。
所以 别说“只有跑分”这个站不住脚的结论啦~
标题: GLM Code 海外用户蚌埠住了
作者: #bonabarenfei
板块: #搞七捻三
编号: 2018928
帖子: https://linux.do/t/topic/2018928
时间: 2026-04-21 13:47:45
摘要:
都在讨论海外费用比中国国内贵 129%

大背景,claude费用太高花费不起
看这个帖子




笑死我了,uber


搞七捻三



Uber,怎么这么老实,不搞点白嫖渠道吗
标题: 一边是看人不爽用漏洞赚钱疯狂举报.一遍是黄牛抢货买完.今日战况
作者: #别再熬夜伤身体
板块: #前沿快讯
编号: 2018931
帖子: https://linux.do/t/topic/2018931
时间: 2026-04-21 13:48:04
摘要:
源头被人开盒

这边86的货被扫光

各位老点评吧
标题: GPT一般都是什么封的多,哪些渠道比较稳
作者: #ai小子
板块: #搞七捻三
编号: 2018936
帖子: https://linux.do/t/topic/2018936
时间: 2026-04-21 13:48:24
摘要:
Claude太贵了,换gpt了 需不需要搞个静态IP,多个号能用一个IP吗
标题: openai 大发善心啊 额度全满了
作者: #echokk11
板块: #开发调优
编号: 2018947
帖子: https://linux.do/t/topic/2018947
时间: 2026-04-21 13:50:01
摘要:
今天收到一个邮件

然后继续蹬,突然发现个人 plus 和 team 额度都满了,明明记得是几天后周限重置。L 友们有同样的情况吗
标题: 杀戮尖塔2还是人玩的吗?
作者: #朝朝暮暮不及君
板块: #搞七捻三
编号: 2018954
帖子: https://linux.do/t/topic/2018954
时间: 2026-04-21 13:50:40
摘要:
中文吃完饭睡不着,想着玩几把塔2放松一下.正好碰到哥们在线,就拉他一起.
结果! 结果!!!
我和他俩短短的40分钟开了3把,还都选的观者(开的mod),基本上见不到2层boss.
就这个双人2.5倍的血量的设计,还有人类吗?
标题: GPT渠道真的要就此泯灭了吗?
作者: #Evan
板块: #搞七捻三
编号: 2018958
帖子: https://linux.do/t/topic/2018958
时间: 2026-04-21 13:51:09
摘要:
短短几个小时内,几乎低价的渠道就此下线了。从此低价gpt 真的就此消失了吗?
标题: cpa导入出现要求手机绑定,是不是号算废了
作者: #akiaug
板块: #搞七捻三
编号: 2018970
帖子: https://linux.do/t/topic/2018970
时间: 2026-04-21 13:51:55
摘要:
手上有几个team号,然后还搞了几个pro号。就想自己搭个中转。然后感觉用不完打算多搞点号弄公益。所以去别人卡网又搞了100个free号。但是登录授权的时候发现要手机验证。原来的号都不用。是不是这种就属于废了。原来的几个pro、team号都没这些问题
标题: 在OpenAI论坛举报Plus充值漏洞的人又继续把渠道站给爆了
作者: #zjxx
板块: #搞七捻三
编号: 2018973
帖子: https://linux.do/t/topic/2018973
时间: 2026-04-21 13:52:19
摘要:
标题: 天气一热,痛,太痛了
作者: #Paco
板块: #搞七捻三
编号: 2018979
帖子: https://linux.do/t/topic/2018979
时间: 2026-04-21 13:53:04
摘要:
每年天气一热,湿度一上来,手上虎口位置就开始长小水泡,痒的要命。有没有佬也有这种情况的,有推荐的药吗!痒的受不了了了
标题: 求吴师兄大模型视频课程
作者: #Logan
板块: #资源荟萃
编号: 2018994
帖子: https://linux.do/t/topic/2018994
时间: 2026-04-21 13:55:13
摘要:
有没有佬有吴师兄大模型的资源,求求分享一份
标题: 我的CF登陆好像出问题了,有大佬知道吗
作者: #张林
板块: #开发调优
编号: 2018999
帖子: https://linux.do/t/topic/2018999
时间: 2026-04-21 13:55:41
摘要:
所有CF的服务都用不了。
标题: 求助,有没有那种运行在Windows上(不用docker)的类似cch的软件呢?
作者: #antior
板块: #开发调优
编号: 2019004
帖子: https://linux.do/t/topic/2019004
时间: 2026-04-21 13:56:12
摘要:
RT,有的时候需要带电脑做中转开发,但是docker的话有时候网络问题不太好用,还是希望能用Windows客户端好一些。
标题: 杭州行情如何
作者: #limingrui
板块: #搞七捻三
编号: 2019007
帖子: https://linux.do/t/topic/2019007
时间: 2026-04-21 13:56:20
摘要:
对象在杭州工作,我准备八九月份去杭州工作,有没有佬说下后端开发行情咋样
标题: 【抽奖】抽一个surge mac 4 注册码
作者: #sTepHenY
板块: #福利羊毛
编号: 2019019
帖子: https://linux.do/t/topic/2019019
时间: 2026-04-21 13:57:44
摘要:
升级了surge 6,原来的码用不上了,抽个奖吧。第一次发抽奖贴,如有问题请指出。
活动时间:
开始时间:发帖时间
截止时间:Tue, Apr 21, 2026 9:00 PM CST
兑奖时间:Tue, Apr 21, 2026 9:00 PM CST
参与方式:
在本帖下回复任意内容
: 中奖人数:
1 人
抽奖规则:
每位用户仅允许参与一次。
使用官方抽奖工具随机抽取中奖者。
注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者立马本帖公布。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
非必要不参与抽奖,把奖品留给需要的人
期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系抽奖发起人。
标题: 佬们推荐个tab补全
作者: #zZZ
板块: #搞七捻三
编号: 2019024
帖子: https://linux.do/t/topic/2019024
时间: 2026-04-21 13:58:22
摘要:
copilot tab补全额度用得好快
有没有额度丰厚一点能在jb家ide用的
标题: codex cli 启动缓慢问题
作者: #wwllcc
板块: #开发调优
编号: 2019029
帖子: https://linux.do/t/topic/2019029
时间: 2026-04-21 13:59:41
摘要:
在codex cli 0.116.0版本之后,启动codex非常慢,有时候能过半分钟,就一直卡在截图这个状态,一直到0.122.0有缓解。
中间我让codex根据github上源码进行分析,结论是apps mcp和plugins拖慢了整体启动速度,然后我根据建议在config.toml中加入了两个配置尝试禁用掉这两个功能
apps = false
plugins = false

但是也无法回到0.116.0版本的启动速度了,有佬有相同的问题吗