LinuxDo 新帖推送 – Telegram

LinuxDo 新帖推送

180 subscribers

250K photos

312K links

Download Telegram

About

Blog

Apps

Platform

LinuxDo 新帖推送

180 subscribers

LinuxDo 新帖推送

标题: 大佬们，deepseek v4有sonnet 4.6的水平吗？想看工程实测对比，不是跑分测试那种
作者: #不死之士
板块: #国产替代
编号: 2092538
帖子: https://linux.do/t/topic/2092538
时间: 2026-05-01 13:16:47
摘要:

好奇对比效果，这俩现在的定位是差不多的吧，都是opus4.7和gpt5.5外的次优选择

1 view05:18

LinuxDo 新帖推送

标题: 佬请把你心目中能打的UI skill 端上来 😢
作者: #都是额滴
板块: #搞七捻三
编号: 2092551
帖子: https://linux.do/t/topic/2092551
时间: 2026-05-01 13:19:09
摘要:

RT 第一版用ui ux 修改的不如人意，第二版直接来了一句"请依照 UI UX Pro Max 的规范，将网页重新规划与设计，让界面更加专业与高级。先给出设计规划方案" 哇，太cool了，天花板与地板直接具象化。

1 view05:21

LinuxDo 新帖推送

标题: Github Copilot学生优惠土埋眉毛了
作者: #goldenplums
板块: #搞七捻三
编号: 2092555
帖子: https://linux.do/t/topic/2092555
时间: 2026-05-01 13:19:45
摘要:

五月的第一天，在使用之前都不会看一眼的GPT-5.2-Codex进行了仅仅3个request后，Copilot提示我：

而此时，

所谓Premium requests的额度已经名存实亡，各种weekly limit, daily limit，甚至我不知道是否存在，就算现在不存在之后也很可能会存在的hourly limit，已经将额度卡在了一个极低的值。
就算weekly limit是按自然周进行计算，之前的4天我也就使用了不到5%的总额度，以此计算每周的额度仅有总额度的10%，就算按一个月31天来计算也到不了总额度的50%。
不仅模型受到极大限制，甚至额度都不能自由使用，Github Copilot学生优惠已经名存实亡
最后求佬友推荐一波目前比较划算的订阅方案（AI coding简直和吸毒一样，体验过了天才程序员的威能，又怎么甘心泯然众人 ）

2 views05:21

LinuxDo 新帖推送

标题: 五一小米之家体验店到店免费领实物
作者: #quio
板块: #福利羊毛
编号: 2092556
帖子: https://linux.do/t/topic/2092556
时间: 2026-05-01 13:19:46
摘要:

有空的可以去看看哦，还是有蛮多实物的
不过有的地区有专属礼品，到店之前可以问问小米之家还有没有实物免得走空
部分参与门店 mp://VDqger8NkaNaW6A
1.五一各地小米之家实物
5.1-5.5 到指定小米之家-完成添加企微等打咔 即可领取哈
-
湖南专属：1w份非遗钧瓷杯
陕西专属：城市限定冰箱贴
四川专属：1w份胖花冰箱贴
湖北专属：3636瓶STING饮料

2.小米之家到店互动抽实物
5.1-5日 到线下小米之家门店-每个用户可投2次 可抽对应桨品
-
投掷"5"跟"1" 额外得实物-各省礼品不同哈
❶浙江-随行包
❷上海-晴雨伞 ❸陕西-体重称
PS：可能别的省也有 到店可问问

2 views05:21

LinuxDo 新帖推送

标题: 京东APP购买实体JD卡，光大-10优惠
作者: #茶叶蛋
板块: #福利羊毛
编号: 2092561
帖子: https://linux.do/t/topic/2092561
时间: 2026-05-01 13:20:21
摘要:

在京东APP。搜索JD卡，实体卡，支付的时候，选择银联云闪付，然后选光大银行卡，跳转后支付可以立减10R，最终实付90得100卡，每个月都可以搞一次，

5 views05:21

LinuxDo 新帖推送

标题: 请问想学习Agent 不知道该怎么去做感觉什么都会一点但是就是感觉自己什么都不会
作者: #liang
板块: #读书成诗
编号: 2092568
帖子: https://linux.do/t/topic/2092568
时间: 2026-05-01 13:20:40
摘要:

一年后毕业 五一不敢出去玩 在寝室手搓一个项目 但是感觉自己好没用 好多好多都不懂 都不会

3 views05:21

LinuxDo 新帖推送

标题: 基于DS4proTokenizer和GLM5.1Tokenizer的单次性能测试
作者: #KenithZ
板块: #开发调优
编号: 2092640
帖子: https://linux.do/t/topic/2092640
时间: 2026-05-01 13:31:33
摘要:

3月入了L站后接触到了codex后，觉得以前使用古法chat模式做开发真的是太惨了，同时内心中压抑的很久的想法终于压制不住了，于是在4月19，创建了一个llm工程。工程的作用是什么呢，对，就是妄图在gpt的帮助下手搓一个llm。因为当时最强的开源国模，就是glm5.1，而且还是mit协议的，没有太大的协议风险。想着有现成的Tokenizer干嘛不用。于是就以5.1的Tokenizer作为基础开始手搓模型。于是开始了长达10天的llm工程化，于是什么 SwiGLU、CLA+GQA、RetNet统统扔进模型里面。然后4.29在开发到从单卡训练转FSDP2下跑多卡训练的时候就发现ds4发布了，还是mit协议的。于是本着反正模型都还没彻底定型，多试几个Tokenizer，看看哪个比较好（单纯是因为5060ti16G练不动了，5.1回家把4060ti16g也插上做双卡）。于是就有了下面的对比。前期实验glmTokenizer时发现占用较高，但是训练出来后主观感觉收敛更好。但是因为本身就不是严谨的实验工程，纯个人爱好一时兴起，所以懒得测试两种Tokenizer训练出来的模型性能如何了。
目前单次Tokenizer实验的总结就是：DS伟大无需多言。同样的数据集下，ds4Tokenizer转出来的Token数量更少， Sequence Packing（序列打包）效率更高。不愧是性价比战神！！！
免责声明：这个测试是孤例，秉承科研界中孤证不立的原则，个人声明本次测试什么都不代表，仅作为LPT工程下指定数据集下的数据结果。不具备任何盖棺定论的属性。实验全是个人见解及倾向。不存在拉踩。
而且因为我显卡不够的问题根本不敢跑多轮训练。无法实际测试同样的模型结构下，哪个Tokenizer的语义表达更好。
由GPT实现并执行生成的实验报告及附录如下：

  

      github.com/kenith-z/lpt-llm
  

  
    help/GLM5.1%E5%8F%8ADS4%E7%9A%84Tokenizer%E5%9F%BA%E5%87%86%E5%AF%B9%E6%AF%94%E5%AE%9E%E9%AA%8C/GLM5.1%E5%8F%8ADS4Tokenizer%E5%9F%BA%E5%87%86%E5%AF%B9%E6%AF%94%E5%AE%9E%E9%AA%8C%E6%8A%A5%E5%91%8A.md


  main



      # GLM5.1 及 DS4Tokenizer 基准对比实验报告

## 摘要

本实验比较 GLM5.1 tokenizer 与 DS4Tokenizer（本项目 `ds_tokenizer`）在同一批 1-11 号专升本教材语料上的分词规模、训练吞吐、显存占用与 LongRoPE2 候选因子评测表现。实验使用 416 条结构化 text JSONL 样本作为统一材料，并在同一张 `NVIDIA GeForce RTX 5060 Ti` 上执行 sequence packing 训练基准与 LongRoPE2 factor sweep smoke 评测。

结果显示，DS4Tokenizer 的总 token 数较 GLM5.1 降低 5.55%，超过 7680 token 的样本数量由 10 条降至 5 条。在 `batch_size=4, train_max_sequence_length=768` 的训练基准中，DS4Tokenizer 相对 GLM5.1 的 active tokens/s 提升约 9.3%-10.2%，峰值 allocated 显存降低约 1.34 GB。在 `train_max_sequence_length=7680` 的长窗口基准中，两种 tokenizer 在 `batch_size=4` 下均发生 OOM；在 `batch_size=1` 下均可运行，DS4Tokenizer 的 wall-clock 更短且峰值 allocated 显存更低。LongRoPE2 factor sweep 在 `text_pretrain` checkpoint 上已完成同阶段对比，DS4Tokenizer 对应 checkpoint 在 smoke 设置下获得更低的 PPL(128)，但生成型 needle 与 retrieval 精确匹配率均为 0.0，说明该结果只能作为链路与相对基线参考，不能作为充分的长上下文能力结论。

## 1. 实验目的

本实验旨在回答以下问题：

1. 在同一语料上，GLM5.1 tokenizer 与 DS4Tokenizer 的 token 规模差异是否显著。
2. tokenizer 切换是否改变 sequence packing 训练基准中的吞吐与显存表现。
3. 在长窗口训练边界下，较小词表的 DS4Tokenizer 是否带来可观察的显存收益。
4. 在已有 GLM5.1 与 DS 同阶段 `text_pretrain` checkpoint 条件下，LongRoPE2 factor sweep 是否可以完成可比评测。

## 2. 实验材料与环境

### 2.1 数据材料




  此文件已被截断。 显示原始文件

4 views05:34

LinuxDo 新帖推送

标题: 五一假期第一天，各位佬都在干嘛
作者: #justdoit1
板块: #搞七捻三
编号: 2092644
帖子: https://linux.do/t/topic/2092644
时间: 2026-05-01 13:32:14
摘要:

五一假期第一天，各位佬都在干嘛呢，都出去玩了吗？

2 views05:34

LinuxDo 新帖推送

标题: 国产大模型 coding 真实对比
作者: #wangzhe
板块: #开发调优
编号: 2092655
帖子: https://linux.do/t/topic/2092655
时间: 2026-05-01 13:33:50
摘要:

最近萧炎陨落 佬们用国产模型的真实体验如何？日常办公是否够用呢？[poll type=regular results=always public=true chartType=bar]

kimi2.6
glm5.1
qwen
[/poll]

2 views05:34

LinuxDo 新帖推送

标题: 无法设置智能体沙盒
作者: #zining
板块: #开发调优
编号: 2092663
帖子: https://linux.do/t/topic/2092663
时间: 2026-05-01 13:36:02
摘要:

求助佬友们，今天vibecoding时，我在config.toml中疑似误删了某些代码，结果触发了无法设置管理员沙盒和备份沙盒的错误。我找了一下方法，都不太行，比如重置.codex。由于项目没完成，我又不想丢失已有的上下文管理和一些skills和mcp，所以不走这个方案，佬友们有没有解决方法

2 views05:37

LinuxDo 新帖推送

标题: 佬的帖子引用
作者: #xxbltop
板块: #搞七捻三
编号: 2092666
帖子: https://linux.do/t/topic/2092666
时间: 2026-05-01 13:36:10
摘要:

（话题已被作者删除）

1 view05:37

LinuxDo 新帖推送

标题: 求助怎么才能从1级升至2级
作者: #蓝颜
板块: #搞七捻三
编号: 2092686
帖子: https://linux.do/t/topic/2092686
时间: 2026-05-01 13:42:03
摘要:

RT：
求助怎么才能从1级升至2级
一级怎么看升级条件完成多少了

1 view05:44

LinuxDo 新帖推送

标题: 新手高级教程
作者: #Luochen100
板块: #搞七捻三
编号: 2092688
帖子: https://linux.do/t/topic/2092688
时间: 2026-05-01 13:42:56
摘要:

获取高级教程徽章
@discobot 开始高级教程

1 view05:44

LinuxDo 新帖推送

标题: 现在的ai的api怎么用啊
作者: #The White House
板块: #搞七捻三
编号: 2092699
帖子: https://linux.do/t/topic/2092699
时间: 2026-05-01 13:46:08
摘要:

1 view05:47

LinuxDo 新帖推送

标题: 你们是怎么搞到那么多黑话的
作者: #麻城东
板块: #前沿快讯
编号: 2092702
帖子: https://linux.do/t/topic/2092702
时间: 2026-05-01 13:46:31
摘要:

感觉现在网上各种黑话，完全听不懂，你们是怎么明白，是我老了吗

1 view05:47

LinuxDo 新帖推送

标题: 奥特曼竟然给塞广告了！
作者: #mengnankk
板块: #前沿快讯
编号: 2092711
帖子: https://linux.do/t/topic/2092711
时间: 2026-05-01 13:48:05
摘要:

openai也要走国产化道路了吗？
直接演都不演了，直接塞推广了

1 view05:50

LinuxDo 新帖推送

标题: 成功手搓2个gopay的经验总结
作者: #alex6688
板块: #开发调优
编号: 2092719
帖子: https://linux.do/t/topic/2092719
时间: 2026-05-01 13:50:20
摘要:

古法手搓了两个号，总结一下经验，希望能给还在路上的佬们一点儿启发
使用了域名邮箱和163邮箱均通过，实测邮箱影响通过的概率不大
日本节点开号—切印尼----gopay支付  账单地址填的新加坡 如果不通过就切节点刷新界面 实测下来两个号均通过

2 views05:50

LinuxDo 新帖推送

标题: mimo瞪不完啊啊啊
作者: #Hugo
板块: #搞七捻三
编号: 2092721
帖子: https://linux.do/t/topic/2092721
时间: 2026-05-01 13:50:43
摘要:

mimo到账啦！ 16亿做什么好呢？ 
  

搞七捻三
    
  
  
    [c765f6990fbc78e0cfdd7c79fa8e6fe3] 

领取 
写小作文 
16亿token 一个月内有效 
有关邮箱 
一个用于接收评估结果及注册/登录Xiaomi MiMo开放平台的邮箱。建议填写GitHub关联邮箱(如有)。 
请确保你的开放平台账号已使用此邮箱注册，或已绑定此邮箱，否则权益将无法到账 
登录要么小米账号绑定邮箱 要么新注册 要么切国际服 直接邮箱注册 
t…
  


书接前文 获得了16亿积分
我想到我大量调用的情景是汉化翻译
最近vibe了一个自动机翻的项目 （ocr擦字嵌字是程序 只有翻译是AI）
试试翻译了2000多页下了消耗还没1%

不知道佬友拿来用什么可以消耗这么多 要是没有一个月的期限就好了
自动化 翻译效果还挺好的

hub想换换积分貌似没人用呜呜呜

2 views05:53