linux.do

以L站题库+其他题目测试一下谷歌Deep Think的多方面实力，L站题库Deep Think做到了全对
LINUX DO - 热门话题 (RSS)

题库详见：

【长期更新Wiki】语言模型区分题库：主要用来区分语言模型，也能测试逻辑能力文档共建

模型区分题库（逻辑类）

序号
题型
题目_________________________________
________________
________________
答案

1
排列组合
将 6 个数 2,0,1,9,20,19 按任意次序排成一行, 拼成一个 8 位数 (首位不为 0),则产生的不同的 8 位数的个数为
...

如果你有什么其他问题，也可以发给我，我会给出dt的回答

Deep Think目前仅限Ultra用户（250美元/月）使用，一天限制5次

先说测试结果：17道题目，Deep Think做到了全部一次答对
DT回答（按照题目顺序进行排序）

第1题（点击了解更多详细信息）

第2题（点击了解更多详细信息）

第3题（点击了解更多详细信息）

第4题（点击了解更多详细信息）

第5题...

View original post

175 views11:11

linux.do

‌我终于知道为啥京东一定干不过美团了
LINUX DO - 热门话题 (RSS)

【算是个L站小福利吧】接着上回开了个猪脚饭店说，L站天下第一福利羊毛

前情提要：

有朋友说有没有外卖，很幸运的是，我今天把京东外卖整上了，但是我也忽然明白东哥为啥干不过美团了，最简单的一点就是，京东外卖的商家版有bug，有一堆bug，我作为一个前程序员都看懵了，这要是换成其他的小商家绝对崩溃了。我现在也相信东子外卖这个项目是很匆忙的上架的了。
言归正传，终于开了就给大家发点福利吧，首先是上面的抽奖贴，会抽出十份免费的猪脚饭，欢迎大家参与。
其次，给L站的...

书接上回，我费了半天劲，终于把京东外卖给整上了，但是我发现一个严重的问题，就是我根本看不全顾客点的什么饭。。。。我真的无语了。

他的文字会被截断，导致后面的 “加什么东西” 只显示一个 “加” 字，这我tm的哪知道加啥啊，我只能按照最多的那个给了。并且商家APP上也看不清楚。我真的无语了。。。。

并且我的到手价只有14元，我tm的一算，米饭成本2元，鸡腿2元，鸡排4元，菜3元，打包费1.55元一套，我tm的合着就赚了1.45元啊。。。。。我直接裂开了。

58 个帖子 - 29 位参与者

阅读完整话题

LINUX DO

【算是个L站小福利吧】接着上回开了个猪脚饭店说，L站天下第一

前情提要：有朋友说有没有外卖，很幸运的是，我今天把京东外卖整上了，但是我也忽然明白东哥为啥干不过美团了，最简单的一点就是，京东外卖的商家版有bug，有一堆bug，我作为一个前程序员都看懵了，这要是换成其他的小商家绝对崩溃了。我现在也相信东子外卖这个项目是很匆忙的上架的了。言归正传，终于开了就给大家发点福利吧，首先是上面的抽奖贴，会抽出十份免费的猪脚饭，欢迎大家参与。其次，给L站的伙计们发点福利吧，如果你离我不远，你又不嫌弃我这点破东西，你可以在京东上点外卖并且下单的时候备注“L站天下第…

147 views11:11

🔥 Check our NUDES REMOVER BOT 🔥

linux.do

‌免费订阅，流量不多
LINUX DO - 热门话题 (RSS)

直接导入：

hy2：https://sufo.xueshan.shop/api/xueshan/b027ef208771f636979e43857bcd3732&types=hysteria2

vless:https://sufo.xueshan.shop/api/xueshan/b027ef208771f636979e43857bcd3732&types=vless

10 个帖子 - 10 位参与者

阅读完整话题

LINUX DO

免费订阅，流量不多

直接导入：https://sufo.xueshan.shop/api/xueshan/b027ef208771f636979e43857bcd3732 hy2：https://sufo.xueshan.shop/api/xueshan/b027ef208771f636979e43857bcd3732&types=hysteria2 vless:https://sufo.xueshan.shop/api/xueshan/b027ef208771f636979e43857bcd3732&types=vless

143 views11:12

linux.do

淘宝闪购品牌日大放水
LINUX DO - 热门话题 (RSS)

复制下面这个密令可领17—16红包

￥uXZi4g64OV9￥/ HU7405

25 个帖子 - 20 位参与者

阅读完整话题

122 views12:41

linux.do

hohai公益站继续新增国产模型GLM4.5、MiniMax、腾讯混元
LINUX DO - 热门话题 (RSS)

hohai公益站继续新增4个国产模型

欢迎佬友们使用！！！

地址：https://hohai.eu.org

目前支持的公益模型：

claude-sonnet-4-20250514

gemini-2.5-pro

grok-3

grok-3-search

grok-3-reasoning

moonshotai/Kimi-K2-Instruct

deepseek-ai/DeepSeek-R1

deepseek-ai/DeepSeek-V3

Qwen/Qwen3-Coder-480B-A35B-Instruct

Qwen/Qwen3-235B-A22B-Instruct-2507

gemini-2.5-flash

gpt-4.1-mini

meta-llama/Meta-Llama-3.1-405B-Instruct

tencent/Hunyuan-A13B-Instruct

MiniMaxAI/MiniMax-M1-80k

zai-org/GLM-4.5

zai-org/GLM-4.5-Air

21 个帖子 - 17 位参与者

阅读完整话题

129 views12:42

linux.do

Claude Code别再使用SPEC了，把需求拆成"专业废纸"，实现全是屎，还不如随手撸
LINUX DO - 热门话题 (RSS)

公众号 https://mp.weixin.qq.com/s/zn_H8Gp2wMLUFj6CadQR4A

文章修改了一次，有朋友说看不懂

Claude Code别再使用SPEC了，把需求拆成"专业废纸"，实现全是屎，还不如随手撸
核心要点（30秒看完）
问题：Spec 通过一句话生成 requirements → design → tasks，看起来专业完整，实际执行结果是垃圾。

原因：一句话输入 → 自动生成一堆"专业文档" → 但缺少最关键的需求确认环节 → 生成的都是错误假设。

解决方案：requirements-pilot —— 不急着生成文档，先通过对话确认需求（≥90分），再生成可执行规格。

行动：抛弃 Spec，Claude Code 安装 requirements-pilot，从确认需求开始。

一、Spec 的美丽谎言
你肯定见过这样的演示：

— 输入：“为邀请码增加有效期功能”
— Spec 自动生成：

— Requirements 文档（10页）
— Design 文档（15页）
— Tasks 列表（30个）

— 看起来好专业！好完整！

然后呢？执行时全崩了。

二、为什么Spec 生成的是垃圾？
问题1：一句话藏着100个坑
“为邀请码增加有效期功能” —— Kiro Spec 会自作主张脑补：

—...

View original post

120 views12:42

linux.do

GPT-5 难产内幕曝光
LINUX DO - 热门话题 (RSS)

参考资料：

— https://www.theinformation.com/articles/inside-openais-rocky-path-gpt-5?rc=epv9gi
— GPT-5 难产内幕曝光：核心团队遭挖空，推理魔咒难破，靠英伟达续命 - IT之家

20 个帖子 - 17 位参与者

阅读完整话题

137 views12:44

linux.do

149 views12:44

About

Blog

Apps

Platform