ChatGPT 的 macOS 桌面端还会单独降智吗
刚才在 macOS 的桌面端先开了一个对话询问是什么模型,然后询问了 mac studio 的更新节奏,确认是 5.5 thinking,然后又开了一个新的对话问关于小猫的问题,就明显的不思考了,而且询问模型得到了 5.5 mini 的回复
然后把对话删了,上 web 端重新问了一遍,又开始思考了,并且明显是 5.5 thinking
期间 ip 没有变化,都是新开的客户端和网页,难道是对于客户端单独降智了?
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 一只羊蝎子)
刚才在 macOS 的桌面端先开了一个对话询问是什么模型,然后询问了 mac studio 的更新节奏,确认是 5.5 thinking,然后又开了一个新的对话问关于小猫的问题,就明显的不思考了,而且询问模型得到了 5.5 mini 的回复
然后把对话删了,上 web 端重新问了一遍,又开始思考了,并且明显是 5.5 thinking
期间 ip 没有变化,都是新开的客户端和网页,难道是对于客户端单独降智了?
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 一只羊蝎子)
现在怎么过gpt那个手机验证啊
想手动注册几个自己用,但是都需要手机验证而且是用whatapp,这怎么搞啊
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: niu12503)
想手动注册几个自己用,但是都需要手机验证而且是用whatapp,这怎么搞啊
2 个帖子 - 2 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: niu12503)
土区订阅gpt plus被泼冷水,大家要搞的冷静下!2天都没冲上
兴高采烈的搞了半天土区通过了,然后花了80买了礼品卡充值上了,订阅的时候提示订阅失败,查看了查看下网上说是苹果风控,现在第二天了我联系了苹果客服说48小时给我解决,目前还是失败 开个帖记录下,还有什么性价比高的办法开plus吗?
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 针法自然)
兴高采烈的搞了半天土区通过了,然后花了80买了礼品卡充值上了,订阅的时候提示订阅失败,查看了查看下网上说是苹果风控,现在第二天了我联系了苹果客服说48小时给我解决,目前还是失败 开个帖记录下,还有什么性价比高的办法开plus吗?
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 针法自然)
国内的ai问答类小程序,提供国外模型聊天会被拉去喝茶吗?
问一下各位佬,我在ai问答类小程序提供和openai聊天,但是前端不直接显示,这种的被检查出来会被拉去喝茶吗,后果是什么,但是目前看到国内很多项目也有提供这种服务,并没有被ban啊,甚至有些明目张胆备案域名做中转的还开发票。求解求解
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: HsHsl)
问一下各位佬,我在ai问答类小程序提供和openai聊天,但是前端不直接显示,这种的被检查出来会被拉去喝茶吗,后果是什么,但是目前看到国内很多项目也有提供这种服务,并没有被ban啊,甚至有些明目张胆备案域名做中转的还开发票。求解求解
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: HsHsl)
滴滴出行礼包—腾讯视频V6送的
送一个腾讯视频V5送的滴滴出行礼包,具体啥内容我也不清楚。
ps:掉三级了,跪求大佬们帮忙点个赞就
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: horizon)
送一个腾讯视频V5送的滴滴出行礼包,具体啥内容我也不清楚。
ps:掉三级了,跪求大佬们帮忙点个赞就
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: horizon)
我开车太快了吗,怎么把蚊子撞死了
最近把加速调成运动模式了
----------------------
今天到公司看了一下车头,死了好多蚊子
----------------------
12 个帖子 - 12 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 雨霖木枫)
最近把加速调成运动模式了
----------------------
今天到公司看了一下车头,死了好多蚊子
----------------------
12 个帖子 - 12 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: 雨霖木枫)
有大佬改进CPA的调度算法吗
手搓了不到20个号,希望能保持每个账号每天都使用下(从服务端看,维持一个活跃状态)。
另外看到一个想法,在资源紧张时,优先使用快刷新额度的帐号。
CPA有没有提供相关接口?最好改动后能随着CPA升级而升级
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: yangshan)
手搓了不到20个号,希望能保持每个账号每天都使用下(从服务端看,维持一个活跃状态)。
另外看到一个想法,在资源紧张时,优先使用快刷新额度的帐号。
CPA有没有提供相关接口?最好改动后能随着CPA升级而升级
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: yangshan)
kubesphere 3.3 如何修改前端的baseurl 有佬知道吗?当年3.3刚发布时通过离线包部署的
当年3.3刚发布时通过离线包部署的,目前想修改baseurl,结果试了多次改着没效果
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Alex)
当年3.3刚发布时通过离线包部署的,目前想修改baseurl,结果试了多次改着没效果
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: Alex)
关于千问模型cot over thinking的问题
最近在测试千问系思考模型的表现,意外发现从QWQ开始到Qwen 3.6的一系列模型都存在reasoning loop的问题。具体而言就是模型在cot里不断重复类似的内容或者不断进行检查,导致达到max_token从而不输出content。不知道佬友们有没有遇到过类似的情况 🫠
以下是一个例子: (点击了解更多详细信息)
我使用QWQ-32b,Qwen-3.6-35BA3B,Qwen-3.6-27B在trivial QA,GSM8K,HotpotQA,CoQA上进行测试,具体结果如下:
使用参数为: (点击了解更多详细信息)
数量结果
单例诊断
我检查了一些reasoning的模式,发现存在这样几种情形,就像前面的例子那样。为了阅读体验我就不一一截取具体状况了。
第一类是数值题中的边界解释循环。比如GSM8K的lemon tree问题,模型反复在12年break-even和13年开始盈利之间切换。它已经完成主要计算,但无法停止在一个答案上。
第二类是速度、比例和时间关系的解释循环。比如GSM8K中400-meter hurdles的速度提升问题,模型已经得到400/11秒附近的候选答案,但继续反复确认速度提升10%应该如何作用在时间上,直到耗尽token。
第三类是HotpotQA/TriviaQA的多跳实体候选循环。模型会在多个可能实体、作品、学校、城市、人物之间反复切换,常见语言模式包括repeatedly saying
第四类是有限成功和失败并存。同一个问题在QWQ-32b上可能有的sample成功、有的sample失败。这说明对于QWQ模型似乎是sampling下的reasoning trajectory可能进入不收敛状态。
我打算接下来再去测试Qwen3-32B,看看更早期的模型是不是还是存在这种情况,如果不是的话,也许是千问内部训练策略发生了转变导致的?另外,我使用了Llama3.3-70B进行过对照,没有出现任何的overthinking的问题。剧透
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: elpicio)
最近在测试千问系思考模型的表现,意外发现从QWQ开始到Qwen 3.6的一系列模型都存在reasoning loop的问题。具体而言就是模型在cot里不断重复类似的内容或者不断进行检查,导致达到max_token从而不输出content。不知道佬友们有没有遇到过类似的情况 🫠
以下是一个例子: (点击了解更多详细信息)
我使用QWQ-32b,Qwen-3.6-35BA3B,Qwen-3.6-27B在trivial QA,GSM8K,HotpotQA,CoQA上进行测试,具体结果如下:
使用参数为: (点击了解更多详细信息)
数量结果
单例诊断
我检查了一些reasoning的模式,发现存在这样几种情形,就像前面的例子那样。为了阅读体验我就不一一截取具体状况了。
第一类是数值题中的边界解释循环。比如GSM8K的lemon tree问题,模型反复在12年break-even和13年开始盈利之间切换。它已经完成主要计算,但无法停止在一个答案上。
第二类是速度、比例和时间关系的解释循环。比如GSM8K中400-meter hurdles的速度提升问题,模型已经得到400/11秒附近的候选答案,但继续反复确认速度提升10%应该如何作用在时间上,直到耗尽token。
第三类是HotpotQA/TriviaQA的多跳实体候选循环。模型会在多个可能实体、作品、学校、城市、人物之间反复切换,常见语言模式包括repeatedly saying
Wait, Hmm, Alternatively, maybe。模型似乎无法停止搜索候选。第四类是有限成功和失败并存。同一个问题在QWQ-32b上可能有的sample成功、有的sample失败。这说明对于QWQ模型似乎是sampling下的reasoning trajectory可能进入不收敛状态。
我打算接下来再去测试Qwen3-32B,看看更早期的模型是不是还是存在这种情况,如果不是的话,也许是千问内部训练策略发生了转变导致的?另外,我使用了Llama3.3-70B进行过对照,没有出现任何的overthinking的问题。剧透
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: elpicio)
为什么要搭建cloudmail或者cloudflare temp mail?
cloudmail和cloudflare temp mail哪个更适合注册gpt号?
5 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: yishun)
cloudmail和cloudflare temp mail哪个更适合注册gpt号?
5 个帖子 - 5 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: yishun)
豆包输入法macOS版已经正式发布
现在Mac版iPhone版和安卓都有。
试了下,有AI加持,挺好用,特别是语音输入。最绝的是双拼输入模式下能首字母输入,而且还能整句输入。还能用悄悄话输入。语音输入竟然还能精准识别方言,并把它转化成普通话。
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: cubeking)
现在Mac版iPhone版和安卓都有。
试了下,有AI加持,挺好用,特别是语音输入。最绝的是双拼输入模式下能首字母输入,而且还能整句输入。还能用悄悄话输入。语音输入竟然还能精准识别方言,并把它转化成普通话。
3 个帖子 - 3 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: cubeking)
我用2925邮箱开通的GPT TEAM被人盯上了?
我用2925邮箱开通的TEAM,前几天收到有人想加入我的workspace的邮件,这两天直接有人尝试验证码登录我的邮箱?我怎么检查一下我的GPT账号和邮箱账号在哪里登录了?
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: QYY)
我用2925邮箱开通的TEAM,前几天收到有人想加入我的workspace的邮件,这两天直接有人尝试验证码登录我的邮箱?我怎么检查一下我的GPT账号和邮箱账号在哪里登录了?
1 个帖子 - 1 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: QYY)
因为我们公司就我自己一个开发 ,以前听过人家协作开发用git管理 ,但是没怎么用过。想自己系统的学习下 佬们有推荐的教程吗
6 个帖子 - 6 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: dalang)
6 个帖子 - 6 位参与者
阅读完整话题
via LINUX DO - 最新话题 (author: dalang)