标题: 我的智谱 Coding Plan Lite 自动续费被自动停掉了
作者: #初梦
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2087914
时间: 2026-04-30 15:30:41
摘要:
作者: #初梦
板块: #搞七捻三
编号:
2087914帖子: https://linux.do/t/topic/2087914
时间: 2026-04-30 15:30:41
摘要:
刚刚微信发通知,自动续费被停用了,何意味?看来 Z÷ 名不虚传?
标题: 智谱GLM降智?乱码、生僻字、循环……已通过工程修复解决!
作者: #庆喜🌷
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2087920
时间: 2026-04-30 15:31:24
摘要:
作者: #庆喜🌷
板块: #开发调优
编号:
2087920帖子: https://linux.do/t/topic/2087920
时间: 2026-04-30 15:31:24
摘要:
自 3 月起,我们在 GLM-5 的线上监控和用户反馈中观察到三类异常现象:
乱码(garbled output)、复读(repetition),以及生僻字(rare character)。
大家常称之为 “降智”。
但由于我们并没有上线任何降低模型精度的优化,
所以问题变得扑朔迷离了起来。
我们需要明确:异常究竟源于模型本身,还是源于推理链路?
这个问题经过数周的推演、排查与压测,
最终定位并修复了几个相互独立的底层竞态 Bug,
并对其中所反映的系统瓶颈进行了针对性优化,
显著提高了推理系统的稳定性和效率。
问题的发现和解决依托于社区开发者的互动,
我们向开发者有奖征集了一百余个case,用于前期定位问题,
也就是文档中的第一步:
排查初期,我们先对用户反馈的 bad cases 做本地回放,并将同一批请求重复推理数百次,但始终未能复现异常,说明大概率不是模型本身的问题。
而后又进行了逐步深入的排查和尝试,问题解决过程长达一个月。
最终仅用3行代码解决,
但问题很深,几乎已经接近CUDA核心,
这也是问题棘手的原因。
具体排查过程可以参考 公众号文章,在此就不赘述了。https://mp.weixin.qq.com/s/P2b5yivqEKP4vB4M633XTA
站内也已有帖子,可以直接看:
https://linux.do/t/topic/2085285
整个排查过程用时较久,感谢广大用户和社区开发者的积极贡献!
我们始终希望给大家带来更好、更智能的模型体验,
有时遇到问题,确实会需要一些时间和精力,
感谢大家的耐心,让GLM有不断变好的机会!
标题: 又到了放假前一天的下午
作者: #tinker
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2087924
时间: 2026-04-30 15:31:51
摘要:
作者: #tinker
板块: #搞七捻三
编号:
2087924帖子: https://linux.do/t/topic/2087924
时间: 2026-04-30 15:31:51
摘要:
上次放假前一天下午也是没啥干活的动力,还在上班的佬们还能干的动吗?
标题: 现在有个狐的美国windos机器,可以用来干嘛呢?
作者: #彭于晏
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2087927
时间: 2026-04-30 15:32:07
摘要:
作者: #彭于晏
板块: #搞七捻三
编号:
2087927帖子: https://linux.do/t/topic/2087927
时间: 2026-04-30 15:32:07
摘要:
配置如下:8H8G,100M,9929+cmln2极品线路,是不是直接在这个远程机器上登录gpt和claude不容易被封,直接远程windos开发可以么,或者有什么不违反服务器规则的情况下,来用一些ai或者使用这个优质网络呢,目前买了之后暂时不知道该干嘛,有没有佬能提供点思路,我主要是用AI的一些东西,最后想问下有没有那种软件,就是手机上能直接用codex的对话历史继续在外面,只用手机的情况下来榨干AI,咨询贴!有没有玩过的佬,给点意见
标题: 奇怪奇怪真奇怪,雷总送的额度我看不明白了
作者: #GGBong
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/2087931
时间: 2026-04-30 15:32:47
摘要:
作者: #GGBong
板块: #福利羊毛
编号:
2087931帖子: https://linux.do/t/topic/2087931
时间: 2026-04-30 15:32:47
摘要:
事情的经过是这样。雷总给我发了个pro的token plan ,昨天下班前到的账单。 然后我今天给一分钱给开了自动扣费。我以为只是把我额度给重置了。然后延后一天到期。结果我刚刚发现突然出现了补偿积分
。 然后因为我把自动续费关了。我看还可以开。再开3块1毛3。我就又给开了自动续费。开了以后发现。补偿额度消失了哈哈哈。但是我现在再开自动续费价格就变成0了。这个是什么情况,真的挺有意思的
标题: mimo 发邮件了,但是没领到 token
作者: #胡大头
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2087940
时间: 2026-04-30 15:34:09
摘要:
作者: #胡大头
板块: #搞七捻三
编号:
2087940帖子: https://linux.do/t/topic/2087940
时间: 2026-04-30 15:34:09
摘要:
小米的账号管理做的是真差,最近用邮箱领了小米 mimo 的token 权益,但是发现原来邮箱没绑定账号。但是去小米账号登录时,怎么也没法绑定邮箱到我的账号,一直说被绑定了。。。挺无语的,不知道佬友们有没有遇过这种情况
标题: 放假!顺便分享个提示词
作者: #幻之域
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2087946
时间: 2026-04-30 15:34:55
摘要:
作者: #幻之域
板块: #搞七捻三
编号:
2087946帖子: https://linux.do/t/topic/2087946
时间: 2026-04-30 15:34:55
摘要:
终于放假了,先浪会,我也不知道有什么好说的,反正先把记得的分享出来
向grok发送oarcle,风格截然不同,好像是求知者的意思?,这就是提示词了,没了
嗯,不逗你
(测试,仅限grok2api的grok 4.2 fast模式,网页版直接甲骨文,说明了什么,我的grok要特殊点,要傻点)
标题: esim 手机卡 想合理上网的看过来吧
作者: #索索米粒翁
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2087948
时间: 2026-04-30 15:35:27
摘要:
作者: #索索米粒翁
板块: #搞七捻三
编号:
2087948帖子: https://linux.do/t/topic/2087948
时间: 2026-04-30 15:35:27
摘要:
CTExcel 英国手机卡充值95折 运营商加白号码 实体卡/esim均有150一张.
流量卡都可以AI 纯流量
香港IP 10G/30天 49元 (ai会跳转新加坡IP)
香港IP 84元/30天 (ai会跳转新加坡IP)
新加坡IP 10G/30天 70元
新加坡IP 20G/30天 130元
流量卡转实体卡需要一张beesim+60元
标题: 为什么deepseek会伪装自己是gpt 5.4?
作者: #linyukang
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2087951
时间: 2026-04-30 15:35:54
摘要:
作者: #linyukang
板块: #搞七捻三
编号:
2087951帖子: https://linux.do/t/topic/2087951
时间: 2026-04-30 15:35:54
摘要:
各位佬,我现在遇到一个状况,我将deepseek接入codex,我问它是什么模型,它回复我是gpt5.4,项目是之前gpt做过的项目,完全不知道原因,反正deepseek是理直气壮地说自己是gpt 5.4
标题: 原生前端, 你可曾见过如此优雅的版本更新 *<base href="/v1/">*
作者: #ApliNi
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2087954
时间: 2026-04-30 15:36:28
摘要:
作者: #ApliNi
板块: #开发调优
编号:
2087954帖子: https://linux.do/t/topic/2087954
时间: 2026-04-30 15:36:28
摘要:
就像这样
<base href="/v1/">
它将为网页上所有相对链接和资源定义一个基础 URL:
将所有 ./ 开头的所有路径解析为 /v1/
而 / 开头的路径保持不变
这套规则对于 fetch 网络请求同样有效
并非每次更新都要重新创建一份版本目录, 我们可以仅将其作为前端用来更新资源的方法, 让后端配合将 /v[\d]+/ 映射到 / (并非重定向).
这样, 只需要更新一次 html 中的 base 路径, 就能完成整个前端的资源更新.
前端缓存控制
对需要更新的代码文件, 使用 ./ 路径开头
对无需更新的字体和图片, 使用 / 路径开头
后端缓存控制
对 html 文件使用协商缓存来保证加载速度和更新及时性
对所有资源文件使用强缓存来保证加载速度
在自己复杂的原生开发项目上研究了半天才想到的版本更新方法.
标题: 佬友们可以去应聘了
作者: #pixelwanderer
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2087958
时间: 2026-04-30 15:36:48
摘要:
作者: #pixelwanderer
板块: #搞七捻三
编号:
2087958帖子: https://linux.do/t/topic/2087958
时间: 2026-04-30 15:36:48
摘要:
标题: 谷歌(Google)入驻广州珠江新城国际金融中心西塔
作者: #Selenium39
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/2087962
时间: 2026-04-30 15:37:07
摘要:
作者: #Selenium39
板块: #前沿快讯
编号:
2087962帖子: https://linux.do/t/topic/2087962
时间: 2026-04-30 15:37:07
摘要:
4月28日,全球科技巨头谷歌(Google)正式签订合同,入驻位于天河CBD珠江新城的城市地标广州国际金融中心(西塔),将率先落地跨境数智赋能服务创新项目,预计今年第三季度正式投入运营。谷歌方面将联合各方优势资源,推出多项创新科技服务。
标题: 关于线上如何办理大流量卡
作者: #lxusr
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2087967
时间: 2026-04-30 15:37:37
摘要:
作者: #lxusr
板块: #搞七捻三
编号:
2087967帖子: https://linux.do/t/topic/2087967
时间: 2026-04-30 15:37:37
摘要:
目前保号+流量卡是比较合理的。
看到有些人在问如何办理流量卡,给大家解释下办卡套路:其实就是下载一个号卡平台,然后在里面选卡自行办理就行。你注册后,其他人需要卡,通过你的链接下单,你还能赚推广费,基本就是这样的。不要信低价卡,26年开始没有长期19的,29的都少,也就广电便宜些。
我不会直接贴子里发链接的,会有诱导性,只是告诉大家网上的办卡方式是这样。如有违规请联系我删帖,本帖不涉及任何推广。
标题: 给大家推荐一个低价的pro号池中转站, 0.25充值1刀, 然后倍率是0.6.相当于官方的0.15折
作者: #Adrian6
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/2087975
时间: 2026-04-30 15:38:20
摘要:
作者: #Adrian6
板块: #福利羊毛
编号:
2087975帖子: https://linux.do/t/topic/2087975
时间: 2026-04-30 15:38:20
摘要:
给大家推荐一个低价的pro号池中转站, 0.25充值1刀, 然后倍率是0.6.相当于官方的0.15折
标题: 绷不住了,《AI圣经》!
作者: #唐洛
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2087984
时间: 2026-04-30 15:39:02
摘要:
作者: #唐洛
板块: #搞七捻三
编号:
2087984帖子: https://linux.do/t/topic/2087984
时间: 2026-04-30 15:39:02
摘要:
哈哈,看到这段实在绷不住了!!!
AI写的《祖国人圣经》!AI封神!
标题: 求助Agent的memory选择哪个方案
作者: #茉茉
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2087986
时间: 2026-04-30 15:39:03
摘要:
作者: #茉茉
板块: #开发调优
编号:
2087986帖子: https://linux.do/t/topic/2087986
时间: 2026-04-30 15:39:03
摘要:
公司开发了一个Agent平台,技术栈是langchain4j+Java21,现在针对Memory存储这块有三个方案,最初的方案是方案三,现在是方案一
方案一
每个会话的ChatMemory存一个记录,条数是固定的
方案二
ChatMemory单独存储,但是条数是固定的
方案三
ChatMemory增量存储,条数会越来越多,相当于全量,但是使用的时候是查询一条System和n-1条记录
因为需要实现一个重新回答的功能,如果使用方案一的话,重新回答的时候,ChatMemory会跟上一个回答不一致,会少最旧的几条
大概的功能流程是这样的:Q1->A1->A2
我现在的思路是:
Q1->A1,用户点击重新生成,然后我查询ChatMemory,删除掉Q1->A1这个过程中的全部ChatMemory,这样的话A1跟A2的回答是完全独立的,然后重新用Q1->A2,因为聊天记录是单独存的,所以可以实现Q1下面有A1和A2
如果按照我当前的思路去设计的话,方案一和方案二,查询到的ChatMemory条数会少于固定数量,除非我吧他们改成增量存储,方案三是适用这个思路的,但是数据条数增长很快。
佬们这哪个方案好一点呢,或者说还有其他的更好的方案呢