标题: 大佬们,deepseek v4有sonnet 4.6的水平吗?想看工程实测对比,不是跑分测试那种
作者: #不死之士
板块: #国产替代
编号:
帖子: https://linux.do/t/topic/2092538
时间: 2026-05-01 13:16:47
摘要:
作者: #不死之士
板块: #国产替代
编号:
2092538帖子: https://linux.do/t/topic/2092538
时间: 2026-05-01 13:16:47
摘要:
好奇对比效果,这俩现在的定位是差不多的吧,都是opus4.7和gpt5.5外的次优选择
标题: 佬 请把你心目中能打的UI skill 端上来 😢
作者: #都是额滴
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2092551
时间: 2026-05-01 13:19:09
摘要:
作者: #都是额滴
板块: #搞七捻三
编号:
2092551帖子: https://linux.do/t/topic/2092551
时间: 2026-05-01 13:19:09
摘要:
RT 第一版用ui ux 修改的不如人意,第二版直接来了一句"请依照 UI UX Pro Max 的规范,将网页重新规划与设计,让界面更加专业与高级。先给出设计规划方案" 哇,太cool了,天花板与地板直接具象化。
标题: Github Copilot学生优惠土埋眉毛了
作者: #goldenplums
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2092555
时间: 2026-05-01 13:19:45
摘要:
作者: #goldenplums
板块: #搞七捻三
编号:
2092555帖子: https://linux.do/t/topic/2092555
时间: 2026-05-01 13:19:45
摘要:
五月的第一天,在使用之前都不会看一眼的GPT-5.2-Codex进行了仅仅3个request后,Copilot提示我:
而此时,
所谓Premium requests的额度已经名存实亡,各种weekly limit, daily limit,甚至我不知道是否存在,就算现在不存在之后也很可能会存在的hourly limit,已经将额度卡在了一个极低的值。
就算weekly limit是按自然周进行计算,之前的4天我也就使用了不到5%的总额度,以此计算每周的额度仅有总额度的10%,就算按一个月31天来计算也到不了总额度的50%。
不仅模型受到极大限制,甚至额度都不能自由使用,Github Copilot学生优惠已经名存实亡
最后求佬友推荐一波目前比较划算的订阅方案(AI coding简直和吸毒一样,体验过了天才程序员的威能,又怎么甘心泯然众人 )
标题: 五一小米之家体验店 到店免费领实物
作者: #quio
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/2092556
时间: 2026-05-01 13:19:46
摘要:
作者: #quio
板块: #福利羊毛
编号:
2092556帖子: https://linux.do/t/topic/2092556
时间: 2026-05-01 13:19:46
摘要:
有空的可以去看看哦,还是有蛮多实物的
不过有的地区有专属礼品,到店之前可以问问小米之家还有没有实物免得走空
部分参与门店 mp://VDqger8NkaNaW6A
1.五一各地小米之家实物
5.1-5.5 到指定小米之家-完成添加企微等打咔 即可领取哈
-
湖南专属:1w份非遗钧瓷杯
陕西专属:城市限定冰箱贴
四川专属:1w份胖花冰箱贴
湖北专属:3636瓶STING饮料
2.小米之家到店互动抽实物
5.1-5日 到线下小米之家门店-每个用户可投2次 可抽对应桨品
-
投掷"5"跟"1" 额外得实物-各省礼品不同哈
❶浙江-随行包
❷上海-晴雨伞 ❸陕西-体重称
PS:可能别的省也有 到店可问问
标题: 京东APP购买实体JD卡,光大-10优惠
作者: #茶叶蛋
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/2092561
时间: 2026-05-01 13:20:21
摘要:
作者: #茶叶蛋
板块: #福利羊毛
编号:
2092561帖子: https://linux.do/t/topic/2092561
时间: 2026-05-01 13:20:21
摘要:
在京东APP。搜索JD卡,实体卡,支付的时候,选择银联云闪付,然后选光大银行卡,跳转后支付可以立减10R,最终实付90得100卡,每个月都可以搞一次,
标题: 请问想学习Agent 不知道该怎么去做 感觉什么都会一点 但是就是感觉自己什么都不会
作者: #liang
板块: #读书成诗
编号:
帖子: https://linux.do/t/topic/2092568
时间: 2026-05-01 13:20:40
摘要:
作者: #liang
板块: #读书成诗
编号:
2092568帖子: https://linux.do/t/topic/2092568
时间: 2026-05-01 13:20:40
摘要:
一年后毕业 五一不敢出去玩 在寝室手搓一个项目 但是感觉自己好没用 好多好多都不懂 都不会
标题: 基于DS4proTokenizer和GLM5.1Tokenizer的单次性能测试
作者: #KenithZ
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2092640
时间: 2026-05-01 13:31:33
摘要:
作者: #KenithZ
板块: #开发调优
编号:
2092640帖子: https://linux.do/t/topic/2092640
时间: 2026-05-01 13:31:33
摘要:
3月入了L站后接触到了codex后,觉得以前使用古法chat模式做开发真的是太惨了,同时内心中压抑的很久的想法终于压制不住了,于是在4月19,创建了一个llm工程。工程的作用是什么呢,对,就是妄图在gpt的帮助下手搓一个llm。因为当时最强的开源国模,就是glm5.1,而且还是mit协议的,没有太大的协议风险。想着有现成的Tokenizer干嘛不用。于是就以5.1的Tokenizer作为基础开始手搓模型。于是开始了长达10天的llm工程化,于是什么 SwiGLU、CLA+GQA、RetNet统统扔进模型里面。然后4.29在开发到从单卡训练转FSDP2下跑多卡训练的时候就发现ds4发布了,还是mit协议的。于是本着反正模型都还没彻底定型,多试几个Tokenizer,看看哪个比较好(单纯是因为5060ti16G练不动了,5.1回家把4060ti16g也插上做双卡)。于是就有了下面的对比。前期实验glmTokenizer时发现占用较高,但是训练出来后主观感觉收敛更好。但是因为本身就不是严谨的实验工程,纯个人爱好一时兴起,所以懒得测试两种Tokenizer训练出来的模型性能如何了。
目前单次Tokenizer实验的总结就是:DS伟大无需多言。同样的数据集下,ds4Tokenizer转出来的Token数量更少, Sequence Packing(序列打包)效率更高。不愧是性价比战神!!!
免责声明:这个测试是孤例,秉承科研界中孤证不立的原则,个人声明本次测试什么都不代表,仅作为LPT工程下指定数据集下的数据结果。不具备任何盖棺定论的属性。实验全是个人见解及倾向。不存在拉踩。
而且因为我显卡不够的问题根本不敢跑多轮训练。无法实际测试同样的模型结构下,哪个Tokenizer的语义表达更好。
由GPT实现并执行生成的实验报告及附录如下:
github.com/kenith-z/lpt-llm
help/GLM5.1%E5%8F%8ADS4%E7%9A%84Tokenizer%E5%9F%BA%E5%87%86%E5%AF%B9%E6%AF%94%E5%AE%9E%E9%AA%8C/GLM5.1%E5%8F%8ADS4Tokenizer%E5%9F%BA%E5%87%86%E5%AF%B9%E6%AF%94%E5%AE%9E%E9%AA%8C%E6%8A%A5%E5%91%8A.md
main
# GLM5.1 及 DS4Tokenizer 基准对比实验报告
## 摘要
本实验比较 GLM5.1 tokenizer 与 DS4Tokenizer(本项目 `ds_tokenizer`)在同一批 1-11 号专升本教材语料上的分词规模、训练吞吐、显存占用与 LongRoPE2 候选因子评测表现。实验使用 416 条结构化 text JSONL 样本作为统一材料,并在同一张 `NVIDIA GeForce RTX 5060 Ti` 上执行 sequence packing 训练基准与 LongRoPE2 factor sweep smoke 评测。
结果显示,DS4Tokenizer 的总 token 数较 GLM5.1 降低 5.55%,超过 7680 token 的样本数量由 10 条降至 5 条。在 `batch_size=4, train_max_sequence_length=768` 的训练基准中,DS4Tokenizer 相对 GLM5.1 的 active tokens/s 提升约 9.3%-10.2%,峰值 allocated 显存降低约 1.34 GB。在 `train_max_sequence_length=7680` 的长窗口基准中,两种 tokenizer 在 `batch_size=4` 下均发生 OOM;在 `batch_size=1` 下均可运行,DS4Tokenizer 的 wall-clock 更短且峰值 allocated 显存更低。LongRoPE2 factor sweep 在 `text_pretrain` checkpoint 上已完成同阶段对比,DS4Tokenizer 对应 checkpoint 在 smoke 设置下获得更低的 PPL(128),但生成型 needle 与 retrieval 精确匹配率均为 0.0,说明该结果只能作为链路与相对基线参考,不能作为充分的长上下文能力结论。
## 1. 实验目的
本实验旨在回答以下问题:
1. 在同一语料上,GLM5.1 tokenizer 与 DS4Tokenizer 的 token 规模差异是否显著。
2. tokenizer 切换是否改变 sequence packing 训练基准中的吞吐与显存表现。
3. 在长窗口训练边界下,较小词表的 DS4Tokenizer 是否带来可观察的显存收益。
4. 在已有 GLM5.1 与 DS 同阶段 `text_pretrain` checkpoint 条件下,LongRoPE2 factor sweep 是否可以完成可比评测。
## 2. 实验材料与环境
### 2.1 数据材料
此文件已被截断。 显示原始文件
标题: 五一假期第一天,各位佬都在干嘛
作者: #justdoit1
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2092644
时间: 2026-05-01 13:32:14
摘要:
作者: #justdoit1
板块: #搞七捻三
编号:
2092644帖子: https://linux.do/t/topic/2092644
时间: 2026-05-01 13:32:14
摘要:
五一假期第一天,各位佬都在干嘛呢,都出去玩了吗?
标题: 国产大模型 coding 真实对比
作者: #wangzhe
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2092655
时间: 2026-05-01 13:33:50
摘要:
作者: #wangzhe
板块: #开发调优
编号:
2092655帖子: https://linux.do/t/topic/2092655
时间: 2026-05-01 13:33:50
摘要:
最近萧炎陨落 佬们用国产模型的真实体验如何?日常办公是否够用呢?[poll type=regular results=always public=true chartType=bar]
kimi2.6
glm5.1
qwen
[/poll]
标题: 无法设置智能体沙盒
作者: #zining
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2092663
时间: 2026-05-01 13:36:02
摘要:
作者: #zining
板块: #开发调优
编号:
2092663帖子: https://linux.do/t/topic/2092663
时间: 2026-05-01 13:36:02
摘要:
求助佬友们,今天vibecoding时,我在config.toml中疑似误删了某些代码,结果触发了无法设置管理员沙盒和备份沙盒的错误。我找了一下方法,都不太行,比如重置.codex。由于项目没完成,我又不想丢失已有的上下文管理和一些skills和mcp,所以不走这个方案,佬友们有没有解决方法
标题: 佬的帖子引用
作者: #xxbltop
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2092666
时间: 2026-05-01 13:36:10
摘要:
作者: #xxbltop
板块: #搞七捻三
编号:
2092666帖子: https://linux.do/t/topic/2092666
时间: 2026-05-01 13:36:10
摘要:
(话题已被作者删除)
标题: 求助怎么才能从1级升至2级
作者: #蓝颜
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2092686
时间: 2026-05-01 13:42:03
摘要:
作者: #蓝颜
板块: #搞七捻三
编号:
2092686帖子: https://linux.do/t/topic/2092686
时间: 2026-05-01 13:42:03
摘要:
RT:
求助怎么才能从1级升至2级
一级怎么看升级条件完成多少了
标题: 新手高级教程
作者: #Luochen100
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2092688
时间: 2026-05-01 13:42:56
摘要:
作者: #Luochen100
板块: #搞七捻三
编号:
2092688帖子: https://linux.do/t/topic/2092688
时间: 2026-05-01 13:42:56
摘要:
获取高级教程徽章
@discobot 开始高级教程
标题: 现在的ai的api怎么用啊
作者: #The White House
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2092699
时间: 2026-05-01 13:46:08
摘要:
作者: #The White House
板块: #搞七捻三
编号:
2092699帖子: https://linux.do/t/topic/2092699
时间: 2026-05-01 13:46:08
摘要:
标题: 你们是怎么搞到那么多黑话的
作者: #麻城东
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/2092702
时间: 2026-05-01 13:46:31
摘要:
作者: #麻城东
板块: #前沿快讯
编号:
2092702帖子: https://linux.do/t/topic/2092702
时间: 2026-05-01 13:46:31
摘要:
感觉现在网上各种黑话,完全听不懂,你们是怎么明白,是我老了吗
标题: 奥特曼竟然给塞广告了!
作者: #mengnankk
板块: #前沿快讯
编号:
帖子: https://linux.do/t/topic/2092711
时间: 2026-05-01 13:48:05
摘要:
作者: #mengnankk
板块: #前沿快讯
编号:
2092711帖子: https://linux.do/t/topic/2092711
时间: 2026-05-01 13:48:05
摘要:
openai也要走国产化道路了吗?
直接演都不演了,直接塞推广了
标题: 成功手搓2个gopay的经验总结
作者: #alex6688
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/2092719
时间: 2026-05-01 13:50:20
摘要:
作者: #alex6688
板块: #开发调优
编号:
2092719帖子: https://linux.do/t/topic/2092719
时间: 2026-05-01 13:50:20
摘要:
古法手搓了两个号,总结一下经验,希望能给还在路上的佬们一点儿启发
使用了域名邮箱和163邮箱均通过,实测邮箱影响通过的概率不大
日本节点开号—切印尼----gopay支付 账单地址填的新加坡 如果不通过就切节点刷新界面 实测下来两个号均通过
标题: mimo瞪不完啊啊啊
作者: #Hugo
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/2092721
时间: 2026-05-01 13:50:43
摘要:
作者: #Hugo
板块: #搞七捻三
编号:
2092721帖子: https://linux.do/t/topic/2092721
时间: 2026-05-01 13:50:43
摘要:
mimo到账啦! 16亿做什么好呢?
搞七捻三
[c765f6990fbc78e0cfdd7c79fa8e6fe3]
领取
写小作文
16亿token 一个月内有效
有关邮箱
一个用于接收评估结果及注册/登录Xiaomi MiMo开放平台的邮箱。建议填写GitHub关联邮箱(如有)。
请确保你的开放平台账号已使用此邮箱注册,或已绑定此邮箱,否则权益将无法到账
登录要么小米账号绑定邮箱 要么新注册 要么切国际服 直接邮箱注册
t…
书接前文 获得了16亿积分
我想到我大量调用的情景是汉化翻译
最近vibe了一个自动机翻的项目 (ocr擦字嵌字是程序 只有翻译是AI)
试试翻译了2000多页下了消耗还没1%
不知道佬友拿来用什么可以消耗这么多 要是没有一个月的期限就好了
自动化 翻译效果还挺好的
hub想换换积分貌似没人用呜呜呜