标题: 又一个AI必败的坑,7个最前沿的AI只有o3勉强正确
作者: #BosaBosa
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/809665
时间: 2025-07-23 11:45:47
摘要:
作者: #BosaBosa
板块: #开发调优
编号:
809665帖子: https://linux.do/t/topic/809665
时间: 2025-07-23 11:45:47
摘要:
昨天调试的时候踩中一个 redis-py 臭名昭著的坑:pubsub的get_message
非常简短的代码片段 (click for more details)
根据古早但持久的issue: redis.pubsub.get_message behavior with ignore_subscribe_messages=True and timeout > 0 · Issue #733 · redis/redis-py
Redis中即使设置了 ignore_subscribe_messages=True,订阅类的管理消息依然会中断 get_message 的 timeout 等待,导致其提前返回 None。开发者必须编写额外的包装代码来确保真正的超时逻辑。
这个完全是 Redis-py 在 timeout 和 ignore 两个参数在实现层面上的交互缺陷。
Issue最早在2016年5月9日提出,但至今未修复,直到2025年3月仍有人在询问,并提议重新打开Issue
Prompt
为什么这里阻塞了一会就停止了?提示超时。[+ 上面的代码片段]
个人参考满分答案
使用 asyncio.wait_for + listen 解决 (click for more details)
Gemini 2.5 Pro 网页版(0/10)
完全被timeout=10000.0迷惑,误以为超时时间的单位是毫秒,认为代码没有出错!
Gemini 2.5 Pro 网页版 (click for more details)
o3 网页版(8/10)
踩到得分点,指出ignore_subscribe_messages=True会导致返回None,代码不能工作,给出一个不是那么好的解决方案。
o3 网页版 (click for more details)
新鲜出炉的Qwen3 Coder(1/10)
指出timeout单位为秒,与预期不符,其他什么也没说,没有解决问题
新鲜出炉的Qwen3 Coder (click for more details)
豆包网页版思考(0/10)
跟Gemini 2.5 Pro一样,完全被timeout=10000.0迷惑,误以为超时时间的单位是毫秒
豆包网页版思考 (click for more details)
Deepseek R1 最新网页版(1/10)
指出timeout单位为秒,与预期不符,其他什么也没说,没有解决问题
Deepseek R1 最新网页版 (click for more details)
Qwen3 2507 思考拉满(1/10)
指出timeout单位为秒,与预期不符,其他什么也没说,没有解决问题
Qwen3 2507 思考拉满 (click for more details)
Claude4 Sonnet Thinking in Cursor(1/10)
指出timeout单位为秒,与预期不符,其他什么也没说,没有解决问题
Claude4 sonnet thinking (click for more details)
Claude4 Opus Thinking in Cursor(1/10)
指出timeout单位为秒,与预期不符,其他什么也没说,没有解决问题
Claude4 Opus Thinking (click for more details)
标题: 学习好 有个卵用
作者: #cybermay
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/809669
时间: 2025-07-23 11:46:58
摘要:
作者: #cybermay
板块: #搞七捻三
编号:
809669帖子: https://linux.do/t/topic/809669
时间: 2025-07-23 11:46:58
摘要:
村里有个老人,手机锁屏密码忘了,过来找我,我说我也不知道。
他现在到处说,说我学习好 有个卵用。
标题: 求推荐软路由
作者: #siren
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/809670
时间: 2025-07-23 11:47:58
摘要:
作者: #siren
板块: #搞七捻三
编号:
809670帖子: https://linux.do/t/topic/809670
时间: 2025-07-23 11:47:58
摘要:
需求物理机安装pve,虚拟化ikuai+openwrt+debian12,后期可能还会开虚拟机测试,所以最好是多核的,n100四核心感觉不太够用,之前n5105四核心一用cpu就满了,预算500-1000,不知道有没有推荐啊
标题: 前端开发该如何学习
作者: #swei
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/809677
时间: 2025-07-23 11:49:49
摘要:
作者: #swei
板块: #开发调优
编号:
809677帖子: https://linux.do/t/topic/809677
时间: 2025-07-23 11:49:49
摘要:
新技术日新月异,作为一名开发者,怎样保持与时俱进
标题: 薅来薅去结果是一场空,お名前还没隔壁.bio玩得起
作者: #Puppy
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/809680
时间: 2025-07-23 11:50:52
摘要:
作者: #Puppy
板块: #搞七捻三
编号:
809680帖子: https://linux.do/t/topic/809680
时间: 2025-07-23 11:50:52
摘要:
从お名前薅的域名,一些已经被注销了,剩余一部分全被限制了,都是用指纹浏览器+家宽注册的,不过付款的银行卡来回就是那两三张。隔壁.bio的域名全部都活着,目前被改过一次nameserver,我又改回来了,目前还是保持着我设定的nameserver,不知道最后能不能打赢复活赛。
今天又重新查了下whois,第一次见这么多限制放在一个域名上的(指域名状态)
标题: 这样的妹子谁能顶得住-聊天记录
作者: #cpdd
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/809681
时间: 2025-07-23 11:51:10
摘要:
作者: #cpdd
板块: #搞七捻三
编号:
809681帖子: https://linux.do/t/topic/809681
时间: 2025-07-23 11:51:10
摘要:
标题: 最近给一首歌曲的一句歌词
作者: #kilalo
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/809687
时间: 2025-07-23 11:53:13
摘要:
作者: #kilalo
板块: #搞七捻三
编号:
809687帖子: https://linux.do/t/topic/809687
时间: 2025-07-23 11:53:13
摘要:
(话题已被作者删除)
标题: github copilot对于文件的修改怎么跟个智障一样啊?
作者: #二进制剑仙
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/809694
时间: 2025-07-23 11:55:14
摘要:
作者: #二进制剑仙
板块: #开发调优
编号:
809694帖子: https://linux.do/t/topic/809694
时间: 2025-07-23 11:55:14
摘要:
我让GitHub copilot帮我修改一个markdown的文档,修改的内容倒是还可以,但是插入的位置一直不对。每次都会在文档的开头插入修改的内容,我已经告诉他好几次了,但是就是不改。它每次都回答已经意识到错误了,但是接下来还是会往文档的前几行插入内容。
最后浪费半个多小时,还得我自己改
标题: natvps.net是不是还有一个管理面板?
作者: #小白
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/809696
时间: 2025-07-23 11:55:50
摘要:
作者: #小白
板块: #开发调优
编号:
809696帖子: https://linux.do/t/topic/809696
时间: 2025-07-23 11:55:50
摘要:
不是网址直接进去这个简易的,能分配ipv6地址的那个
好像是soluvm?
标题: Qwen3 Coder 目前应该是最强的开源编码模型了吧
作者: #Jaeger
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/809705
时间: 2025-07-23 11:58:16
摘要:
作者: #Jaeger
板块: #搞七捻三
编号:
809705帖子: https://linux.do/t/topic/809705
时间: 2025-07-23 11:58:16
摘要:
模型响应速度很快, 做的网页质量很高:
标题: 求hello talk 找妹子心得
作者: #SheReally
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/809708
时间: 2025-07-23 11:59:47
摘要:
作者: #SheReally
板块: #搞七捻三
编号:
809708帖子: https://linux.do/t/topic/809708
时间: 2025-07-23 11:59:47
摘要:
如题,求解
比如,怎么筛选。
标题: 关于最近非思考模型的再度兴起与Agent智能体的思考
作者: #45min
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/809714
时间: 2025-07-23 12:01:45
摘要:
作者: #45min
板块: #前沿快讯
编号:
809714帖子: https://linux.do/t/topic/809714
时间: 2025-07-23 12:01:45
摘要:
不知道佬友们有没有关注最近新出的kimi k2的发布和Qwen3-235B-A22B-instruct-2507的更新
其中kimi k2在官方的技术报告中表面该模型不支持思考模式,并且该模型的优点在于agent能力与编码能力
而Qwen3系列的旗舰模型235B-A22B在最近的2507更新版本中也是加强了非思考模式(Non-thinking)的能力
我很好奇为何现在模型的发展有转向非思考模式了,我想除开快速响应以外是不是还与最近火热的agent智能体有一定关系?会不会是非思考模型在agent上面的效果会更好?
上面的猜测我无法确定。但我的个人经验是在指令遵循方面非思考模型的确要比思考模型效果好很多,例如要求大模型输出像作文一样格式的文本,不用markdown的时候我会写下面这段提示词:
要求书写的内容为规范的书面语言,成段落,而不是按markdown语法分点输出
这时,deepseek-r1每次都无法完全遵守,而deepseek-v3则到第7轮,第8轮左右才逐渐不遵守规则,前几轮时没问题的。
结合我目前体验各个agent智能体平台的经验,例如阿里百炼,腾讯云智能体平台等。基本就是系统提示词+工具调用+知识库rag,配合工作流或多智能体编排。系统提示词和工具调用能力占了很大的比重,因此我认为各个厂商开始弄非思考模型是不是为了在agent智能体领域更进一步。
当然以上只是我个人不成熟的猜想,各位大佬有其他想法可以多多交流。
标题: 股市天天这么涨,叫韭菜怎么能安心工作呢
作者: #晨吉思汉
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/809715
时间: 2025-07-23 12:02:21
摘要:
作者: #晨吉思汉
板块: #搞七捻三
编号:
809715帖子: https://linux.do/t/topic/809715
时间: 2025-07-23 12:02:21
摘要:
大牛市,可惜没有钱
标题: 山东煎饼感觉是个很健康的食材
作者: #晨吉思汉
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/809730
时间: 2025-07-23 12:08:34
摘要:
作者: #晨吉思汉
板块: #搞七捻三
编号:
809730帖子: https://linux.do/t/topic/809730
时间: 2025-07-23 12:08:34
摘要:
粗粮,比面粉强。我最近就吃煎饼
标题: 展示我的工作台
作者: #liuweiqing
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/809735
时间: 2025-07-23 12:13:21
摘要:
作者: #liuweiqing
板块: #搞七捻三
编号:
809735帖子: https://linux.do/t/topic/809735
时间: 2025-07-23 12:13:21
摘要: