以L站题库+其他题目测试一下谷歌Deep Think的多方面实力,L站题库Deep Think做到了全对
LINUX DO - 热门话题 (RSS)
题库详见:
【长期更新Wiki】语言模型区分题库:主要用来区分语言模型,也能测试逻辑能力 文档共建
如果你有什么其他问题,也可以发给我,我会给出dt的回答
Deep Think目前仅限Ultra用户(250美元/月)使用,一天限制5次
先说测试结果:17道题目,Deep Think做到了全部一次答对
DT回答(按照题目顺序进行排序)
第1题 (点击了解更多详细信息)
第2题 (点击了解更多详细信息)
第3题 (点击了解更多详细信息)
第4题 (点击了解更多详细信息)
第5题...
View original post
LINUX DO - 热门话题 (RSS)
题库详见:
【长期更新Wiki】语言模型区分题库:主要用来区分语言模型,也能测试逻辑能力 文档共建
模型区分题库(逻辑类)
序号
题型
题目_________________________________
________________
________________
答案
1
排列组合
将 6 个数 2,0,1,9,20,19 按任意次序排成一行, 拼成一个 8 位数 (首位不为 0),则产生的不同的 8 位数的个数为
...
如果你有什么其他问题,也可以发给我,我会给出dt的回答
Deep Think目前仅限Ultra用户(250美元/月)使用,一天限制5次
先说测试结果:17道题目,Deep Think做到了全部一次答对
DT回答(按照题目顺序进行排序)
第1题 (点击了解更多详细信息)
第2题 (点击了解更多详细信息)
第3题 (点击了解更多详细信息)
第4题 (点击了解更多详细信息)
第5题...
View original post
我终于知道为啥京东一定干不过美团了
LINUX DO - 热门话题 (RSS)
【算是个L站小福利吧】接着上回开了个猪脚饭店说,L站天下第一 福利羊毛
书接上回,我费了半天劲,终于把京东外卖给整上了,但是我发现一个严重的问题,就是我根本看不全顾客点的什么饭。。。。我真的无语了。
他的文字会被截断,导致后面的 “加什么东西” 只显示一个 “加” 字,这我tm的哪知道加啥啊,我只能按照最多的那个给了。并且商家APP上也看不清楚。我真的无语了。。。。
并且我的到手价只有14元,我tm的一算,米饭成本2元,鸡腿2元,鸡排4元,菜3元,打包费1.55元一套,我tm的合着就赚了1.45元啊。。。。。我直接裂开了。
58 个帖子 - 29 位参与者
阅读完整话题
LINUX DO - 热门话题 (RSS)
【算是个L站小福利吧】接着上回开了个猪脚饭店说,L站天下第一 福利羊毛
前情提要:
有朋友说有没有外卖,很幸运的是,我今天把京东外卖整上了,但是我也忽然明白东哥为啥干不过美团了,最简单的一点就是,京东外卖的商家版有bug,有一堆bug,我作为一个前程序员都看懵了,这要是换成其他的小商家绝对崩溃了。我现在也相信东子外卖这个项目是很匆忙的上架的了。
言归正传,终于开了就给大家发点福利吧,首先是上面的抽奖贴,会抽出十份免费的猪脚饭,欢迎大家参与。
其次,给L站的...
书接上回,我费了半天劲,终于把京东外卖给整上了,但是我发现一个严重的问题,就是我根本看不全顾客点的什么饭。。。。我真的无语了。
他的文字会被截断,导致后面的 “加什么东西” 只显示一个 “加” 字,这我tm的哪知道加啥啊,我只能按照最多的那个给了。并且商家APP上也看不清楚。我真的无语了。。。。
并且我的到手价只有14元,我tm的一算,米饭成本2元,鸡腿2元,鸡排4元,菜3元,打包费1.55元一套,我tm的合着就赚了1.45元啊。。。。。我直接裂开了。
58 个帖子 - 29 位参与者
阅读完整话题
LINUX DO
【算是个L站小福利吧】接着上回开了个猪脚饭店说,L站天下第一
前情提要: 有朋友说有没有外卖,很幸运的是,我今天把京东外卖整上了,但是我也忽然明白东哥为啥干不过美团了,最简单的一点就是,京东外卖的商家版有bug,有一堆bug,我作为一个前程序员都看懵了,这要是换成其他的小商家绝对崩溃了。我现在也相信东子外卖这个项目是很匆忙的上架的了。 言归正传,终于开了就给大家发点福利吧,首先是上面的抽奖贴,会抽出十份免费的猪脚饭,欢迎大家参与。 其次,给L站的伙计们发点福利吧,如果你离我不远,你又不嫌弃我这点破东西,你可以在京东上点外卖并且下单的时候备注“L站天下第…
免费订阅,流量不多
LINUX DO - 热门话题 (RSS)
直接导入:
hy2:https://sufo.xueshan.shop/api/xueshan/b027ef208771f636979e43857bcd3732&types=hysteria2
vless:https://sufo.xueshan.shop/api/xueshan/b027ef208771f636979e43857bcd3732&types=vless
10 个帖子 - 10 位参与者
阅读完整话题
LINUX DO - 热门话题 (RSS)
直接导入:
hy2:https://sufo.xueshan.shop/api/xueshan/b027ef208771f636979e43857bcd3732&types=hysteria2
vless:https://sufo.xueshan.shop/api/xueshan/b027ef208771f636979e43857bcd3732&types=vless
10 个帖子 - 10 位参与者
阅读完整话题
LINUX DO
免费订阅,流量不多
直接导入:https://sufo.xueshan.shop/api/xueshan/b027ef208771f636979e43857bcd3732 hy2:https://sufo.xueshan.shop/api/xueshan/b027ef208771f636979e43857bcd3732&types=hysteria2 vless:https://sufo.xueshan.shop/api/xueshan/b027ef208771f636979e43857bcd3732&types=vless
hohai公益站继续新增国产模型GLM4.5、MiniMax、腾讯混元
LINUX DO - 热门话题 (RSS)
hohai公益站继续新增4个国产模型
欢迎佬友们使用!!!
地址:https://hohai.eu.org
目前支持的公益模型:
claude-sonnet-4-20250514
gemini-2.5-pro
grok-3
grok-3-search
grok-3-reasoning
moonshotai/Kimi-K2-Instruct
deepseek-ai/DeepSeek-R1
deepseek-ai/DeepSeek-V3
Qwen/Qwen3-Coder-480B-A35B-Instruct
Qwen/Qwen3-235B-A22B-Instruct-2507
gemini-2.5-flash
gpt-4.1-mini
meta-llama/Meta-Llama-3.1-405B-Instruct
tencent/Hunyuan-A13B-Instruct
MiniMaxAI/MiniMax-M1-80k
zai-org/GLM-4.5
zai-org/GLM-4.5-Air
21 个帖子 - 17 位参与者
阅读完整话题
LINUX DO - 热门话题 (RSS)
hohai公益站继续新增4个国产模型
欢迎佬友们使用!!!
地址:https://hohai.eu.org
目前支持的公益模型:
claude-sonnet-4-20250514
gemini-2.5-pro
grok-3
grok-3-search
grok-3-reasoning
moonshotai/Kimi-K2-Instruct
deepseek-ai/DeepSeek-R1
deepseek-ai/DeepSeek-V3
Qwen/Qwen3-Coder-480B-A35B-Instruct
Qwen/Qwen3-235B-A22B-Instruct-2507
gemini-2.5-flash
gpt-4.1-mini
meta-llama/Meta-Llama-3.1-405B-Instruct
tencent/Hunyuan-A13B-Instruct
MiniMaxAI/MiniMax-M1-80k
zai-org/GLM-4.5
zai-org/GLM-4.5-Air
21 个帖子 - 17 位参与者
阅读完整话题
Claude Code别再使用SPEC了,把需求拆成"专业废纸",实现全是屎,还不如随手撸
LINUX DO - 热门话题 (RSS)
Claude Code别再使用SPEC了,把需求拆成"专业废纸",实现全是屎,还不如随手撸
核心要点(30秒看完)
问题:Spec 通过一句话生成 requirements → design → tasks,看起来专业完整,实际执行结果是垃圾。
原因:一句话输入 → 自动生成一堆"专业文档" → 但缺少最关键的需求确认环节 → 生成的都是错误假设。
解决方案:requirements-pilot —— 不急着生成文档,先通过对话确认需求(≥90分),再生成可执行规格。
行动:抛弃 Spec,Claude Code 安装 requirements-pilot,从确认需求开始。
一、Spec 的美丽谎言
你肯定见过这样的演示:
— 输入:“为邀请码增加有效期功能”
— Spec 自动生成:
— Requirements 文档(10页)
— Design 文档(15页)
— Tasks 列表(30个)
— 看起来好专业!好完整!
然后呢?执行时全崩了。
二、为什么Spec 生成的是垃圾?
问题1:一句话藏着100个坑
“为邀请码增加有效期功能” —— Kiro Spec 会自作主张脑补:
—...
View original post
LINUX DO - 热门话题 (RSS)
公众号 https://mp.weixin.qq.com/s/zn_H8Gp2wMLUFj6CadQR4A
文章修改了一次,有朋友说看不懂
Claude Code别再使用SPEC了,把需求拆成"专业废纸",实现全是屎,还不如随手撸
核心要点(30秒看完)
问题:Spec 通过一句话生成 requirements → design → tasks,看起来专业完整,实际执行结果是垃圾。
原因:一句话输入 → 自动生成一堆"专业文档" → 但缺少最关键的需求确认环节 → 生成的都是错误假设。
解决方案:requirements-pilot —— 不急着生成文档,先通过对话确认需求(≥90分),再生成可执行规格。
行动:抛弃 Spec,Claude Code 安装 requirements-pilot,从确认需求开始。
一、Spec 的美丽谎言
你肯定见过这样的演示:
— 输入:“为邀请码增加有效期功能”
— Spec 自动生成:
— Requirements 文档(10页)
— Design 文档(15页)
— Tasks 列表(30个)
— 看起来好专业!好完整!
然后呢?执行时全崩了。
二、为什么Spec 生成的是垃圾?
问题1:一句话藏着100个坑
“为邀请码增加有效期功能” —— Kiro Spec 会自作主张脑补:
—...
View original post
GPT-5 难产内幕曝光
LINUX DO - 热门话题 (RSS)
参考资料:
— https://www.theinformation.com/articles/inside-openais-rocky-path-gpt-5?rc=epv9gi
— GPT-5 难产内幕曝光:核心团队遭挖空,推理魔咒难破,靠英伟达续命 - IT之家
20 个帖子 - 17 位参与者
阅读完整话题
LINUX DO - 热门话题 (RSS)
参考资料:
— https://www.theinformation.com/articles/inside-openais-rocky-path-gpt-5?rc=epv9gi
— GPT-5 难产内幕曝光:核心团队遭挖空,推理魔咒难破,靠英伟达续命 - IT之家
20 个帖子 - 17 位参与者
阅读完整话题