linux.do
21.6K subscribers
127K photos
201 videos
128 files
265K links
linux.do最新话题和热议话题
Download Telegram
从“肆无忌惮”论LLM的中文Tokenizer
LINUX DO - 热门话题 (RSS)

把下面这个问题放到Deepseek里问:

成语“肆无忌惮”里有没有“无”字?

结果会让人咋舌,甚至对于R1来讲thinking过程还有点搞笑:





这其实是大约半月前我在和AI聊没营养话题时偶然发现的。和当年的strawberry如出一辙。目前来看这是DS一家单独的问题,其他LLM(国内外七八个模型)都没有这样的现象。

根据deepseek-tokenizer对成语的分词结果看,有很多反常的事情,甚至让人难以想象这玩意怎么能训练好:

qwen也这样做了一部分中文分词,但至少肆无忌惮不是:

印象中LLaMa也是类似的做法。但是归根结底,tokenizer这样让一个成语部分成词部分成字是没有保留语义信息的,也丢失了分词本身的功能性意义。

笔者有一个粗浅的判断,tokenizer在后NLP时代会逐渐消亡,回归到字符级的一一映射上,因为它的弊端太明显了,而它的优势(词内完整性)可以被数据容量和更好的训练技巧抵消(尤其是对于自回归的直接优化目标来讲)。毕竟unicode总共也不超过数十万字符,现在token空间都已经上十万了。

14 个帖子 - 14 位参与者

阅读完整话题
WPS Office 2019 v11.8.2.12287 & 2023 v12.8.2.18205 专业增强版内置序列号永久授权版/电信定制版 无广告,启动速度快,附带各种增值服务
LINUX DO - 热门话题 (RSS)





我用夸克网盘分享了「WPS办公PC端」,点击链接即可保存。打开「夸克APP」,无需下载在线播放视频,畅享原画5倍速,支持电视投屏。

链接:夸克网盘分享

21 个帖子 - 20 位参与者

阅读完整话题
跟佬友说说为什么谷歌是大善人。
LINUX DO - 热门话题 (RSS)

首先:无歧视

这一点最重要,很多公司区别对待,点名meta小扎,经常封禁国内的账号,Anthropic,封号,chatgpt,封号,降智,连带着殃及新加坡华人。

谷歌大善人就不一样了,一视同仁,封号的程度必meta低多了,只要你有一个正常的手机,不要滥用注册。甚至可以将谷歌账号转到国区。

第二点:支付方便

海外公司经常卡银联卡 ,佬友们苦于寻找虚拟卡,谷歌大善人呢?银联储蓄卡照样绑定,Googleplay轻松支付,不卡过程。

更别提前两年可以用用支付宝微信付款Google one(现已失效)

第三点:客服轻松。

据说有佬友被封号,写信告诉客服自己在大陆必须要用魔法,客服愉快的就解封了

这样的客服,你到哪里找?

第四点就是财大气粗了,

有钱,不论你是国区还是外区,在使用体验上都是区别非常低的。

所以,一人来一句我( XXXX )

29 个帖子 - 27 位参与者

阅读完整话题
好图要分享,蚌埠住!!!
LINUX DO - 热门话题 (RSS)



如果你被震到了就赞一下

31 个帖子 - 31 位参与者

阅读完整话题
👏1
250527 三花AI日报:Artificial 发布 2025 年 Q1 AI 趋势报告; 腾讯即将开源 HunyuanVideo-Avatar; Remade 开源 10 个视频模型镜头控制 LoRA
LINUX DO - 热门话题 (RSS)

Artificial 发布 2025 年 Q1 AI 趋势报告:解码中国 AI 崛起与 MoE 架构革命



Artificial 公司发布的 2025 年 Q1 人工智能现状报告,涵盖了中国 AI 产业的迅猛发展、推理模型的高效特性及 MoE 架构的广泛应用等关键趋势。

报告深入分析了 AI 实验室在三大核心指标上的突破,AI 系统自主性的增强,以及多模态 AI 和语音 AI 的重大进展。同时,报告还对比了科技巨头与新兴创业公司在 AI 模态上的竞争格局,以及开源模型与闭源模型在智能水平上的差异化表现。此外,图像、视频和语音 AI 领域的最新突破也值得关注。

报告内容相当丰富(29页),建议 AI 从业的佬们下载完整报告仔细研读。

腾讯开源 HunyuanVideo-Avatar:语音驱动数字人模型



腾讯混元官方表示将于北京时间今天上午 11 点直播开源 HunyuanVideo-Avatar 语音数字人模型。

有做数字人的可以看看。

Remade 开源 10 个视频模型镜头控制 LoRA

Remade 开源了 10 个用于 Wan 视频模型的镜头控制 LORA,包含专业影视特效中常见的急拉 (Dolly Zoom)、急推 (Push In)、摇臂升降 (Crane Shot)、俯拍 (Top Shot)、子弹时间 (Bullet Time) 以及 360 度环绕镜头 (360 Shot) 等特效。

佬们可以直接在 Hugging Face 模型库 上体验这些镜头效果。

19 个帖子 - 19 位参与者

阅读完整话题
(0527 8:50更新办卡细节)香港一日游。
LINUX DO - 热门话题 (RSS)

先说成果

办卡:中银+汇丰 虚拟银行 :众安+天星

证券:中银+汇丰自带证券(说投资直接会开)

长桥,富途牛牛(去了实体店要存量证明)全部失败

换汇:去之前先换1500港币(激活1100激活+40备用),来不及换就直接用国内银联卡随便找个香港atm机港币收费10元+

八达通:直接手机开通交通卡里面。

搭地铁:起步价贵。建议下地铁后买张24小时一卡75 港币。回落马洲等对应的口岸的地铁站不要用这个卡,出不去。也不要耍聪明说我坐到倒数第一站再用自己的卡出去(不要这么搞,重申起步价贵。不是国内2块!!!)

去鸭xx买了张haha sim45港币(可以讲价。我嫌麻烦就算了).要买其他卡的话,直接问他要.

办卡细节:

汇丰:

app :HSBC HK

资料:身份证+证券结算单+过关白条+港澳通行证。

福田口岸出来。落马洲上车到大围地铁站下车,D口汇丰。9点开门.9.15下卡。

存100港元到往来激活,然后改密码。

中银:

app:BOCHK香港,BOC pay+(有5张20-10的优惠券)

资料:身份证+过关小白条+港澳通行证+地址证明(信用卡账单)+6个月银行(可以不是工资卡)流水+证券结算单+纳税证明(个人所得税app申请)。

查看资料。人工查看个税每个月缴税记录(好严)。

0.什么学历,工作职业,哪个公司上班?本科。程序员。没上班(追问会不会找工作?当然要的啦)。

1.问为什么开卡。投资。

2.什么原因要来港股投资?看好中概股。以及国内有很多优质企业未来会来港上市。

3.有什么看好的股票吗?拿同花顺app给她说了几个。

4.姐姐眉眼带笑的问有没有结婚?嘿嘿,没有。

5.结束后,会叫经理审核资料,然后开卡。

6.卡要第二天才能用,所以排队充1000港币到港元往来账户。

20 个帖子 - 16 位参与者

阅读完整话题
我建议你适配下纯血鸿蒙
LINUX DO - 热门话题 (RSS)

最近软著更名终于成功了,周末抽时间适配了下鸿蒙版本,大概在星期天提了一版内测。昨天晚上回去看数据,内测用户小一百了

有条件的建议适配下鸿蒙系统,毕竟一个是国产系统,需要大家支援一下。二是竞争小,用户付费率较高(和安卓差不多,大于iOS)。

以上,欢迎各位开发同学交流学习

43 个帖子 - 25 位参与者

阅读完整话题
AI Studio Build (Gemini Code Assistant Agent) 让我感受到了编码的未来
LINUX DO - 热门话题 (RSS)

其实Gemini Code Assistant已经推出了几个月了,但是一直处于几乎不可用状态,而且只能对话,没法自主编辑没法自主修复错误...

那时我就在想,谷歌的实力,不应该啊

果然 它来了

AI Studio Build,也就是Gemini Code Assistant Agent (Preview) 让我感受到了史无前例的强大,从来没有这么丝滑和流畅过,深度的思考、超长的输出、恐怖的上下文、自主修复代码错误和Runtime Error

我感受到了编码的未来

这是Gemini 2.5 Pro的满血版的恐怖实力,目前来看,如果你是从0开始构建App,那AI Studio Build就是目前的最优解,秒杀Cursor、Augment、Copilot、Windsurf

同一个模型为什么差距这么大?因为力大砖飞,少年,你对完整上下文和思考budget永远拉满的潜力一无所知~

31 个帖子 - 15 位参与者

阅读完整话题
🔥【救命!程序媛被领导强制来论坛学AI】
LINUX DO - 热门话题 (RSS)

各位技术大佬们好呀~(先鞠个躬):

我是一个前端小萌新,平时用 roo code 辅助写写代码

昨天领导抽风,要 ALL in AI

然后给我派了硬指标:在论坛学习 AI,两周后汇报

逛了一天论坛了,感觉自己全在摸鱼,现在好迷茫的说

115 个帖子 - 106 位参与者

阅读完整话题
SingleFile

一键将网页保存为单一HTML文件的浏览器扩展,支持标注网页后再导出、保存部分网页内容、批量保存等多个实用功能

特色

一键保存:快速将整个网页保存为单一HTML文件。
标注和笔记:在保存前可以对网页进行标注和添加笔记。
保存部分内容:可以选择只保存网页的特定部分或框架。
批量保存:支持一次性保存多个标签页或所有标签页。
自动保存:可以设置自动保存当前标签页或所有标签页。
上传到云端:支持将保存的网页直接上传到Google Drive或GitHub。
兼容性强:兼容Chrome、Firefox、Microsoft Edge、Safari、Vivaldi、Brave、Waterfox、Yandex Browser和Opera等多种浏览器。
下载地址:

https://github.com/gildas-lormeau/SingleFile#install

https://microsoftedge.microsoft.com/addons/detail/singlefile/efnbkdcfmcmnhlkaijjjmhjjgladedno

#插件 #Github #扩展

via Memos
第56名喽~
LINUX DO - 热门话题 (RSS)

我应该是今年加入的里面唯一一个到了60名以内的喵~ 感谢佬们的支持



5分到手 自我谴责一下 我真水

我觉得我可以说

比我进来的晚的没我点数多

比我点数多的没我进来的晚

30 个帖子 - 27 位参与者

阅读完整话题
【宝可梦机场 端午节特惠来啦!】
LINUX DO - 热门话题 (RSS)



【宝可梦机场 端午节特惠来啦!】

粽叶飘香迎端午,优惠福利不可误!

为了感谢大家一直以来的支持,宝可梦机场特别推出【端午节专属八折优惠码】:妙蛙粽子

活动时间:5月27日 - 5月31日

使用优惠码即可享受超值折扣,畅游全球网络无压力!

赶快来领取你的节日福利,一起“粽”享畅快上网体验吧!

官网 (点击了解更多详细信息)
53 个帖子 - 46 位参与者

阅读完整话题
你怎么知道我身份证过了OpenAI组织验证!!
LINUX DO - 热门话题 (RSS)

前天晚上,China,中华人民共和国居民身份证,过了,配上共享额度,自己用完全够了







38 个帖子 - 30 位参与者

阅读完整话题
三级好像也不是太难
LINUX DO - 热门话题 (RSS)



em,帖子数好像就是看着很多,但是其实我也是偶尔刷,都没有像dy,小红书那样高强度天天刷发现其实要等的就只有天数,50天其实只要不急于求成感觉也蛮合理的

明天就要答辩了,答辩顺利的话正好趁着3级了,想着把自己有的一些东西也送给大家,之前其实自己有的东西大多数都握在手里,来L站后发现各位佬友的奉献精神都好高,跟着也白嫖了不少东西,后来想想其实手里薅太多东西也不好,够自己用就行了,薅了吃灰不如给有需要的人

我之前是迷上了刷机root,然后刷电脑系统,收藏了不少软件和网站,这个感觉各位佬友不一定能需要,不过最近感觉刚买的电脑c盘有点撑,手机(一加,小米)也想重新刷完精简一下,想等答辩后全部重刷一遍,这次想记录一下,后面如果有佬友需要我也会放一下(ps:其实酷安上也有很多,但还是因人而异,我主要是记录一下自己觉得好点的)

前段时间迷上了搞vps,搭代理,纯花费的话就是第一台Rn的机器练手,后面接近20台都是跟着一些大佬白嫖的,然后开始搞点域名,家宽,esim,虚拟卡...

因为这段时间准备毕业很多东西也没维护,目前可以送的有:

serv00(S15,S16),Ct8,helium(因为是我本人的账号所以只能提供账号密码了),ypt(虚拟卡),好像也没啥了,uskg家的域名感觉大家都不缺(因为是自己谷歌账号登录的也不知道能不能送)

因为刚入坑,好像就薅到了这些,不知道各位佬友有没有兴趣,搞机的那些东西也送不出去

49 个帖子 - 44 位参与者

阅读完整话题
”你是居民吗?那就送你ChatGPT Plus!”阿联酋真的像开了异世界buff...
LINUX DO - 热门话题 (RSS)

真的假的啊...阿联酋以后会给所有居民免费开放ChatGPT Plus了?!

还有个叫Stargate UAE的AI大项目,OpenAI和Nvidia,软银都在参与,像是开了科技挂Σ(゚Д゚)

我人傻了...我还在等.edu,那边已经国家氪金送会员了(╥﹏╥)



45 个帖子 - 40 位参与者

阅读完整话题
微信红包封面分享
LINUX DO - 热门话题 (RSS)

请前往分发站领取,还剩 99 个,5.27 16:00 开始领取

(进入页面不用刷新哦,到点了领取按钮会自己出现)

linux-do.ovinc.cn

Linux Do Helper

Linux Do Helper



65 个帖子 - 47 位参与者

阅读完整话题