linux.do
14.1K subscribers
47.3K photos
51 videos
53 files
64.3K links
linux.do最新话题和热议话题
Download Telegram
以L站题库+其他题目测试一下谷歌Deep Think的多方面实力,L站题库Deep Think做到了全对
LINUX DO - 热门话题 (RSS)

题库详见:

【长期更新Wiki】语言模型区分题库:主要用来区分语言模型,也能测试逻辑能力 文档共建


模型区分题库(逻辑类)

序号
题型
题目_________________________________
________________
________________
答案

1
排列组合
将 6 个数 2,0,1,9,20,19 按任意次序排成一行, 拼成一个 8 位数 (首位不为 0),则产生的不同的 8 位数的个数为
...


如果你有什么其他问题,也可以发给我,我会给出dt的回答

Deep Think目前仅限Ultra用户(250美元/月)使用,一天限制5次

先说测试结果:17道题目,Deep Think做到了全部一次答对
DT回答(按照题目顺序进行排序)

第1题 (点击了解更多详细信息)

第2题 (点击了解更多详细信息)

第3题 (点击了解更多详细信息)

第4题 (点击了解更多详细信息)

第5题...

View original post
我终于知道为啥京东一定干不过美团了
LINUX DO - 热门话题 (RSS)

【算是个L站小福利吧】接着上回开了个猪脚饭店说,L站天下第一 福利羊毛


前情提要:

有朋友说有没有外卖,很幸运的是,我今天把京东外卖整上了,但是我也忽然明白东哥为啥干不过美团了,最简单的一点就是,京东外卖的商家版有bug,有一堆bug,我作为一个前程序员都看懵了,这要是换成其他的小商家绝对崩溃了。我现在也相信东子外卖这个项目是很匆忙的上架的了。
言归正传,终于开了就给大家发点福利吧,首先是上面的抽奖贴,会抽出十份免费的猪脚饭,欢迎大家参与。
其次,给L站的...


书接上回,我费了半天劲,终于把京东外卖给整上了,但是我发现一个严重的问题,就是我根本看不全顾客点的什么饭。。。。我真的无语了。

他的文字会被截断,导致后面的 “加什么东西” 只显示一个 “加” 字,这我tm的哪知道加啥啊,我只能按照最多的那个给了。并且商家APP上也看不清楚。我真的无语了。。。。

并且我的到手价只有14元,我tm的一算,米饭成本2元,鸡腿2元,鸡排4元,菜3元,打包费1.55元一套,我tm的合着就赚了1.45元啊。。。。。我直接裂开了。

58 个帖子 - 29 位参与者

阅读完整话题
淘宝闪购品牌日大放水
LINUX DO - 热门话题 (RSS)

复制下面这个密令可领17—16红包

¥uXZi4g64OV9¥/ HU7405

25 个帖子 - 20 位参与者

阅读完整话题
hohai公益站继续新增国产模型GLM4.5、MiniMax、腾讯混元
LINUX DO - 热门话题 (RSS)

hohai公益站继续新增4个国产模型

欢迎佬友们使用!!!

地址:https://hohai.eu.org



目前支持的公益模型:

claude-sonnet-4-20250514

gemini-2.5-pro

grok-3

grok-3-search

grok-3-reasoning

moonshotai/Kimi-K2-Instruct

deepseek-ai/DeepSeek-R1

deepseek-ai/DeepSeek-V3

Qwen/Qwen3-Coder-480B-A35B-Instruct

Qwen/Qwen3-235B-A22B-Instruct-2507

gemini-2.5-flash

gpt-4.1-mini

meta-llama/Meta-Llama-3.1-405B-Instruct

tencent/Hunyuan-A13B-Instruct

MiniMaxAI/MiniMax-M1-80k

zai-org/GLM-4.5

zai-org/GLM-4.5-Air

21 个帖子 - 17 位参与者

阅读完整话题
Claude Code别再使用SPEC了,把需求拆成"专业废纸",实现全是屎,还不如随手撸
LINUX DO - 热门话题 (RSS)


公众号 https://mp.weixin.qq.com/s/zn_H8Gp2wMLUFj6CadQR4A



文章修改了一次,有朋友说看不懂


Claude Code别再使用SPEC了,把需求拆成"专业废纸",实现全是屎,还不如随手撸
核心要点(30秒看完)
问题:Spec 通过一句话生成 requirements → design → tasks,看起来专业完整,实际执行结果是垃圾。

原因:一句话输入 → 自动生成一堆"专业文档" → 但缺少最关键的需求确认环节 → 生成的都是错误假设。

解决方案:requirements-pilot —— 不急着生成文档,先通过对话确认需求(≥90分),再生成可执行规格。

行动:抛弃 Spec,Claude Code 安装 requirements-pilot,从确认需求开始。

一、Spec 的美丽谎言
你肯定见过这样的演示:

— 输入:“为邀请码增加有效期功能”
— Spec 自动生成:

— Requirements 文档(10页)
— Design 文档(15页)
— Tasks 列表(30个)

— 看起来好专业!好完整!

然后呢?执行时全崩了。

二、为什么Spec 生成的是垃圾?
问题1:一句话藏着100个坑
“为邀请码增加有效期功能” —— Kiro Spec 会自作主张脑补:

—...

View original post