LinuxDo 新帖推送

标题: Codex 桌面端宠物使用教程
作者: #ApliuQ
板块: #前沿快讯
编号: 2143854
帖子: https://linux.do/t/topic/2143854
时间: 2026-05-09 23:17:59
摘要:

前言
在之前 Claude Code 推出宠物玩法，可以在命令行当中显示，通过 /buddy 命令唤出，大概样子如下。现在 codex 也推出了宠物功能，有点像之前的QQ宠物，不知道它现在怎么样了，可能饿死了吧。
开启宠物
Codex 聊天窗口输入 /Pet 后回车（注意如果语言是中文则是输入 /宠物），即可开启宠物，首次开启可能会稍微慢一点，开启后桌面右下方就会显示宠物。再次输入 /Pet 或 /宠物 后回车，则是关闭宠物。语言差异，会导致 / 后的命令有所差异，可以通过输入 / 后直接选对应命令即可。

默认宠物样式如下，不过官方内置了好几个，可以选择，或者自定义外观。鼠标拖动它左右移动，它也会跑起来。

更换宠物
点击左上角菜单 File → Setting，进入到设置界面，然后选择 Appearance ，滚动到最底下 Pets ，就可以切换选择内置的宠物咯。


自定义宠物
宠物可以支持自定义外观，在切换宠物页面，点击 Create your own pet，即可自动跳转到对话框，让codex来制作宠物。本质上是使用内置的skill来制作宠物，所以也可以直接在对话框里面主动使用技能创建。

当然，造轮子是一回事，在已有的轮子里面挑，那肯定更爽咯，已经有第三方宠物网站了，大家可以直接挑选下载使用，品种非常非常的多，别挑花眼了。
网址： Codex Pets Community Download for free | Codex Pet

看好合适的宠物后，点击 ↓ 下载按钮，将下载好的宠物，解压并拷贝到 自定义宠物文件夹（可点击 Open folder 快速打开文件夹，文件夹里面是宠物文件夹，每个宠物文件夹里面是一个pet.json以及宠物图），然后点击宠物列表上面的 Refresh 按钮，就可以看到自定义宠物了，直接 Select 即可。
自定义宠物文件夹：C:\Users\apliu\.codex\pets    注意apliu换成自己实际操作系统用户
如下界面是 更换宠物 章节提到的界面，滚动到最底下。

宠物效果
鼠标左右拖动会播

2 views15:20

LinuxDo 新帖推送

标题: 薅羊毛可以，别让身体替羊毛买单
作者: #Qxuan
板块: #搞七捻三
编号: 2143856
帖子: https://linux.do/t/topic/2143856
时间: 2026-05-09 23:18:28
摘要:

今天领到了属于年轻人鸡蛋∶三份板烧鸡腿堡

借这个机会提一句：板烧鸡腿堡不是不能吃，但是不建议多吃，它的钠含量和脂肪含量都不算低。
按麦当劳官网数据，一个板烧鸡腿堡含钠约 1041 mg。如果一天吃多个，钠摄入就很容易偏高。比如今天这种“一天三个”的情况，钠摄入大约是：
1041 mg × 3 = 3123 mg 钠
折算成食盐约 7.9 g
这已经超过《中国居民膳食指南（2022）》建议的成年人每天食盐不超过 5 g，而且这还没算当天其他食物里的盐。

数据来源：麦当劳官网
当然，板烧鸡腿堡有鸡肉蛋白，偶尔吃一个问题不大。真正需要注意的是：它不能替代均衡正餐，因为蔬菜和膳食纤维都比较少。如果经常吃、一次吃多个，再搭配薯条和甜饮，整体热量、脂肪和钠就会更高。
更合理的吃法是：
控制数量，少配薯条和含糖饮料，其他餐尽量清淡一点，多补充蔬菜和水。
钠吃多了最主要的问题是容易增加血压负担，尤其是长期高钠饮食，对控血压和心血管健康都不太友好。
以上仅为个人分享和个人理解，不代表 L 站立场；具体饮食选择请结合自身情况判断。

2 views15:20

LinuxDo 新帖推送

标题: 新人报道终于回到大家庭了
作者: #Akxan
板块: #搞七捻三
编号: 2143858
帖子: https://linux.do/t/topic/2143858
时间: 2026-05-09 23:19:02
摘要:

终于回到了朝朝暮暮的论坛啊！终于加入大家庭了 去年注册的号由于工作的原因好久没上就给我扬了…

3 views15:21

LinuxDo 新帖推送

标题: 刚发现我的gmail邮箱能改用户名了
作者: #咸弹黄
板块: #搞七捻三
编号: 2143862
帖子: https://linux.do/t/topic/2143862
时间: 2026-05-09 23:20:04
摘要:

这是灰度到我了吗？佬友们看看能改了吗？ 话说起名字真是头疼啊

3 views15:21

LinuxDo 新帖推送

标题: [长文手敲] 简论系统工程学——系统思维的入门（其二）
作者: #白芸汐
板块: #搞七捻三
编号: 2143863
帖子: https://linux.do/t/topic/2143863
时间: 2026-05-09 23:20:08
摘要:

为什么很多问题越优化越糟糕
很多问题越优化越糟糕，这种事你在生活里肯定见过。甚至不用特意去找案例，随便翻翻工作群、看看热搜，就能抓出一把。
上一部分我们聊了什么是系统——它不是一堆东西随便摆在一起，有要素、有关系、有目的、有边界、有反馈，还会出现单个部件加起来根本无法解释的整体行为。
简单说，一个真正的系统，一定有活的连接、清晰的意图、明确的内外分野，以及一套持续运转的反馈机制。
既然系统是这样的，那问题就来了：为什么我们明明在努力优化，最后反而把事情搞得更糟？
这种事在现实里，简直多到让人叹气。
学校想提高学习效率，作业就越加越多，学生越来越累，眼睛里的光也越来越暗。
公司想提高协作效率，流程越改越密，大家却越来越不敢自己做决定，什么都要走审批。
平台想提高用户停留时长，推荐算法越做越精准，用户越刷越空虚，刷完甚至想打自己两下。
城市想缓解交通拥堵，道路越修越宽，车却越来越多。
产品想减少用户投诉，客服话术越写越完整，用户听完火气反而越来越大。
到最后，就会出现一种非常荒诞的局面：每一个动作看起来都在解决问题，但系统整体却在稳定地恶化。
这就好比你手机卡了，于是装了个清理软件。清理软件说你后台应用太多，你就再装个管理后台的软件。
管理后台的软件说你内存不够，你又装了个加速器。一通操作之后，手机确实不寂寞了——后台常驻三位大将，电量掉得比打工人的精气神还快。
很多问题越优化越糟糕，根子就在这里。
你动手改的是一个点，但真正运行的是一个系统。
你动的是局部，反馈的是整体。
你盯着的是指标，响应的是关系。
你关心的是当下效果，系统却会把这个动作带到未来，然后不紧不慢地给你演一出大型连续剧。
第一种翻车姿势，是把指标当成了目标。
这种事在职场上太常见了，常见到几乎每个人都能在自己的周报里找到影子。
指标本来只是帮我们理解系统的一扇窗。透过这扇窗，你能看到大致情况，但不代表窗户就等于整栋房子。
可问题在于，窗户看久了，大家就开始对着窗户搞装修，不再关心房子里到底在发生什么。
教育就是个典型。分数当然重要，完全不看分数也不现实。
但一旦分数变成唯一的目标，整个教育系统就会自动朝着刷题、押题、排名、压缩一切探索空间的方向滑下去。
学生更会考试了，老师更会抓重点了，学校更会包装成绩了。
至于好奇心、表达力、面对复杂问题的耐心，这些不好量化的东西，就安安静静地缩在角落里，像极了会议上从来没被点到名字的人。
公司里也一样。管理者想提高投入度，就开始盯在线时长、打卡时间、任务数量。
结果你猜怎么着？员工很快学会了另一套生存技能：电脑保持在线，文档保持打开，会议保持参加，群消息保持秒回。
看起来人人都在忙，系统热闹得像菜市场，真正推进的事情却没几件。赛博牛马的精髓，就是人在工位，魂在旷野。
这种现象有个很著名的说法，叫古德哈特定律，大概意思是：当一个指标变成了目标，它就不再是个好指标了。这句话放在系统工程里，简直是救命级别的提醒。
指标本身没有错，错的是你把它从系统里单独拎出来，然后逼着所有人围着它跳舞。
产品只看日活，结局就是疯狂推送。
内容平台只看停留时长，结局就是把用户往情绪刺激里推。
客服中心只看平均处理时长，结局就是把复杂问题迅速关单，管它解没解决。
所有人都在优化，所有人都在交差，图表确实变好看了。
然后用户体验裂开，长期信任下降，系统维护成本暴涨。
指标赢了，目标死了。
第二种，是只盯着局部效率，根本不管整体代价。
局部效率谁都看得见，让某一段流程更快，某一个部门产出更多，某一个模块性能更强。听起来很合理，现实里也经常需要这样干。但系统的问题是，局部的压力不会凭空消失，它只会转移。
医院为了提高门诊效率，挂号更快了，医生接诊也更快了，前台数字漂漂亮亮。
可如果检查、缴费、取药这些环节没同步跟上，拥堵就从候诊区搬到了检查区，又从检查区搬到了药房。
病人的总等待时间未必减少，只是排队的地点换了个皮肤。
软件开发里就更常见了。
前端团队为了赶进度，先把页面做出来，演示的时候特别顺，客户频频点头。
可后端接口还没完全稳定，测试用例还没补齐，权限系统还没接好，日志也没有统一。
短期看进度快了，长期看，所有的风险全挤到了联调、测试和上线阶段，最后大家在深夜的办公室里，深度体验“今晚谁也别睡”的团建氛围。
这种优化最迷惑人的地方，就是它确实让一个局部变好了，但没有让系统变好。
像一条生产线，某个工位速度翻倍，如果下游接不住，库存就堆起来了，管理成本也跟着涨。
单点快了，整体慢了。前端漂亮了，后端爆炸了。每个局部都在报喜，系统整体在报丧。
还有一种情况，是没看见反馈回路。
系统不是死的，你改变它，它也会反过来改变人的行为。
交通就是最直观的例子。
一堵车，人的第一反应就是修路。
路不够宽？拓宽。车太多？加车道。
这个想法特别符合直觉，也特别容易得到支持——毕竟堵在路上的人，很少会说“少修路，多研究系统反馈”，只会暴躁地想，前面那辆车到底在干嘛。
但交通系统有个很麻烦的地方：路变宽了，开车的时间成本就降下来了。原本不开车的人可能开始开车了，原本错峰出行的人回到了高峰期，原本住得远的人也能接受更长的通勤距离了。
短期看，拥堵缓解了；长期看，车流增加了，路又堵回去了。
交通研究里管这叫“诱导需求”，说的是新增道路容量会降低驾驶的时间成本，从而诱发更多驾驶需求，把扩容缓堵的效果抵消得干干净净。
这就很像减肥的逻辑：今天运动了，多吃一点没事。然后运动消耗了三百卡，奶茶补回八百卡。身体沉默，体重微笑。
反馈回路的可怕之处，就是它会让直觉上特别好的办法，在更长时间里慢慢失效。你提高了效率，需求可能跟着增长。你降低了成本，使用量可能跟着上涨。你加强了考核，大家就开始研究考核本身。你强化了推荐，用户就被困在越来越窄的信息回音壁里，越刷越累。
经济学和技术史里有个相关的概念叫杰文斯悖论，说的是技术提高了资源使用效率之后，总消耗量反而可能增加，因为使用成本下降刺激了更多需求。
放到今天的AI领域也很有意思：模型推理越来越便宜，大家未必会少用算力，反而会把AI塞进更多场景。原来只让它写总结，现在让它写代码、做客服、跑流程、分析日志，甚至评价自己写的周报。
效率提升的结果，是总调用量飙升，总算力消耗继续往上走。
所以，优化不能只看第一层效果。
第一层，成本下降了。
第二层，使用增加了。
第三层，系统规模变大了。
第四层，新的瓶颈出现了。
第五层，原来的优化开始制造新问题。
很多人只看到第一层就开香槟了，系统通常等到第五层才来敲门，敲门的方式也很朴素：要么成本炸了，要么体验崩了，要么维护人员集体沉默了。
第四种，是激励设计把人带进了沟里。
系统里最活跃的要素永远是人。人会响应规则，会适应指标，会寻找路径，会在压力下发明各种神奇操作。
所以，只要你设计了激励，就要准备好面对人类的创造力。
别小看任何人在完成考核这件事上的聪明程度——只要规则有洞，一定有人发现。
只要指标有空子，一定有人研究。
只要奖励足够明确，行为就会朝着奖励飞奔过去，原来的目标还在不在，另说。
现实里这种事一抓一大把：平台奖励发帖数量，水帖就变多。公司奖励销售签单，后端交付就被压爆。学校奖励论文数量，灌水和拼接就层出不穷。客服考核解决率，复杂问题就被快速关闭。开发考核需求数量，小修小补就比系统重构更受欢迎。
最后，系统会出现一种非常荒诞的自洽：规则说什么，人就优化什么。你奖励表演，系统就生产表演。
你奖励数量，系统就生产数量。你奖励速度，系统就牺牲耐心。
你奖励短期结果，系统就透支长期结构。
很多组织最痛苦的地方就在这里——嘴上想要A，激励却奖励B，最后所有人都去做B。
然后管理层开始困惑：为什么大家没有自驱力？这不能全怪人，方向盘都打到那边去了，车当然往那边开。
你不能一边把导航设到火锅店，一边抱怨怎么没去图书馆。
第五种，是边界画得太窄了。
很多优化之所以翻车，是因为你把系统边界画得太小。边界一窄，很多代价就看不见了。看不见，就当它不存在。然后放心大胆地动手。等到问题从别的地方冒出来，又觉得世界好复杂，怎么到处是意外。
比如一个部门为了提高自己的效率，把大量的前置整理工作扔给了下游。自己的指标变好看了，响应快，汇报漂亮。可下游开始加班，错误率上升，沟通成本暴涨。站在这个部门的边界里看，优化大获成功。站在整个系统里看，只是把成本转嫁了而已。
AI产品也一样。只把边界画在“模型回答是否流畅”，优化就会集中在“说得更快、更顺、更像人”。但如果你把边界画到“真实任务是否完成”，那就要看信息来源是否可靠、工具调用是否安全、权限是否明确、错误是否能复核，用户是不是真的解决了问题。只看回答，模型很体面。一看交付，系统开始冒汗。
这才是边界真正的力量，它决定了哪些问题会被看见，哪些代价会被藏起来。
边界画错了，优化自然就跑偏了。
第六种，是把复杂问题硬压成单一解法。
很多时候，大家不是不知道系统复杂，只是太想找一个简单的按钮了。堵车就修路，学习差就加课，效率低就加班，风险高就加审批，模型差就换更大的模型。
这些办法不一定完全没用，有些在局部甚至挺管用。
问题是，它们把复杂的系统问题压成了一次性动作，就像看到人发烧，只盯着降温，不管感染、炎症和免疫系统。温度可能降了，人还在继续坏下去。
系统问题需要的往往是组合解法。交通拥堵需要道路规划、公共交通、停车政策、信号调度和出行需求管理一起调。
教育焦虑需要课程设计、评价机制、家庭预

3 views15:21

LinuxDo 新帖推送

标题: [长文手敲] 简论机器学习——机器学习之前，先学会看数据（其一）
作者: #白芸汐
板块: #搞七捻三
编号: 2143866
帖子: https://linux.do/t/topic/2143866
时间: 2026-05-09 23:20:33
摘要:

不要上来就挑模型
很多刚接触机器学习的人，上手的第一件事往往是选模型。
线性回归、随机森林、XGBoost，接着听说 LightGBM 表现更好，于是打开教程，复制代码，导入数据，训练，看一眼准确率，感觉整个流程跑通了。
看见屏幕上的数字，忍不住觉得已经跨过了门槛。（忍不住轻哼起来）
等到换一批真实数据再试，模型却经常一塌糊涂。
这样的过程在机器学习圈子里反复出现。
像刚拿到驾照的人，还顾不上熟悉路况，就已经在研究怎么调校悬架和轮胎。油门踩得果断，弯道却冲了出去。别人问为什么撞墙，回答常常是动力不够。
问题多半不在动力上。
问题主要在于，你连路况都没有仔细看过。
机器学习最容易让人误解的地方就在这里。局外人关注模型，入门者盯着算法，而有经验的人往往先回头看数据。
模型当然重要，算法也重要，可一切的源头是数据。
IBM 在讨论 AI 数据质量时也指出，质量不高、有偏斜或不完整的数据，会让模型输出不可靠的结果，再复杂的模型架构也弥补不了。
用一句更直白的话说，垃圾进，垃圾出，模型没有义务替存在问题的数据兜底。
所以这一篇暂时不谈公式，不谈梯度，不谈参数，也不碰那些一听就容易让人紧张的名词。
先谈一件更基础，也更容易被忽略的事。
在机器学习之前，先学会看数据。
它不涉及大模型，不谈智能体，不聊多模态，不提端到端，也说不上什么涌现。可真正做过项目的人都明白，一个机器学习系统能不能跑起来，能不能稳定地跑下去，能不能在真实环境里站住脚，往往从打开数据表的那一刻就已经决定了。
数据没看明白，后面全是连环债务陷阱。
数据不是素材库，是模型看世界的窗口
机器学习到底在学什么？
很多教材会说，机器学习是让计算机从数据里发现规律，并用这些规律对未知样本做预测。
这个答案很标准，也容易一听就过去了。
换个更通俗一点的说法：模型没有眼睛，看不见真实世界。它也不知道房价、天气、疾病、信用、用户兴趣或网络攻击这些东西原本意味着什么。
它能接触的全部世界，就是你送给它的数据。
你给了什么字段，它就从这些字段里寻找关系；你给了什么标签，它就努力朝那个方向拟合；你给了什么样本，它就把这些样本当作经验。
因此，模型眼中的世界，永远是一个经过数据加工之后的世界。
这有点像一个人完全靠餐厅评价来认识一座城市。
他当然能总结出一些规律，比如哪家店容易踩雷，哪家包装讲究，哪家深夜还在营业。但他看到的只是评价里的城市，而不是完整、真实的城市。
评价本身会有偏差，样本量可能不足，平台会筛选，用户会夸张，店家也可能刷分。最后拼凑出的城市画像或许有用，也可能偏得离谱。
模型也一样。
你想预测用户是否流失，但只给了它注册时间和性别，它能做出的判断不会太好。因为真正驱动流失的因素，可能藏在最近登录频率、核心功能使用情况、投诉记录、付费变化、客服响应里。
你想判断交易是否异常，手里却没有设备指纹、地理位置、消费习惯、交易时段、金额波动等字段，那模型就像一个保安，只拿着一张模糊的门厅照片，就要判定访客风险。
不是不能做，是做出来的结果多半不太靠谱。
你想做网络流量异常检测，却只统计了总流量大小，不看端口、协议、连接频次、包间隔、请求方向和历史基线，那模型最多能抓住最显眼的异常。
稍加伪装的攻击，很可能就被当成正常波动漏过去。
报告上写检测能力出色，真实环境里让人捏一把汗。
所以，数据不是往模型嘴里一倒就完事的素材库。
数据，是模型视野的边界。
数据里没有的信息，模型通常猜不出来。数据里被扭曲的信息，模型会认真学习。数据里夹带的偏见，模型甚至可能打包成高置信度的判断。
这正是机器学习让人期待又头疼的地方：它既能从数据中发现规律，也会从数据里继承问题。
样本、特征、标签：三个基础概念
要看数据，先得清楚自己在看什么。
机器学习里有三个最基本的概念：样本、特征、标签。
样本，就是一条观察记录。一个用户、一封邮件、一笔交易、一次设备一天的运行日志，都可以成为一个样本。它是模型学习的基本单位。
特征，是用来描述样本的信息。年龄、最近登录时间、购买次数、平均消费金额、邮件标题用词、图片像素、交易地点、连接持续时间……这些都可以成为特征。特征决定了模型可以从哪些角度去观察样本。
标签，是你希望模型学会预测的答案。用户是否流失、邮件是不是垃圾邮件、图片是不是猫、交易是否欺诈、设备是否故障、明天的销量是多少，这些都可以是标签。在监督学习里，有输入就有标准答案，模型通过不断对比自己预测的答案和真实答案来修正自身。
拿经典的鸢尾花数据集来说，UCI 机器学习库中的 Iris 数据集包含 150 个样本，4 个特征，3 个类别，每个类别 50 个样本，是很早就被广泛使用的分类数据集。
这里每一朵花就是一个样本，花萼长度、花萼宽度、花瓣长度、花瓣宽度是特征，鸢尾花的种类是标签。
这个数据集很小，也很干净，非常适合入门。它像驾校里摆好的桩桶，路线清晰，障碍明确，适合练手。
可真实项目里的数据通常没有这么好搞，大多是杂乱无章的。
举个例子，真实业务数据经常长这样：
字段名不统一，单位不统一，时间格式不统一，同一个用户有多个 ID，某些字段大量缺失，某些值明显离谱。
地区一栏，一会儿写“广东”，一会儿写“广东省”，一会儿是“Guangdong”，有时中间还夹着空格。
金额字段出现负数，年龄字段出现 999，订单时间晚于退款时间，设备上线时间早于出厂日期。
一旦面对这种状况，你就会发现，机器学习里“机器”两个字很先进，“学习”两个字很体面，而夹在中间最折腾人的，反倒是数据表里那些既像手滑、又像系统迁移事故的字段。
你以为自己在做人工智能。
实际上，你更像在给数据做心理疏导，这你得先让数据舒服了才能往后走。
标签定义：机器学习的第一场硬仗
很多人看数据时会仔细检查特征，却容易忽略标签。
这是相当危险的。
标签是模型学习的目标。
标签定义乱了，模型学得越卖力，偏得越离谱。你不能一边把答案写错，一边指望学生考出真实水平。万一学生真的考了高分，反倒更让人不放心。
举一个例子，你要做用户流失预测。
什么叫“流失”？
7 天没登录算不算？
30 天没登录算不算？
卸载 App 算不算？
取消订阅算不算？
还在登录但不再付费算不算？
只看内容不互动算不算？
每一种定义都会生成不同的标签，也会训练出完全不同的模型。
在游戏场景里，7 天未登录可能已经非常危险；放在低频的政务系统里，30 天未登录也许再正常不过。不能把所有业务都套进同一个流失定义，然后指望模型自动理解背后的行业语境。模型没有参与需求讨论，它不知道你心里的那套潜台词。
再看金融风控。
什么叫“坏客户”？
逾期 1 天算不算？
逾期 30 天算不算？
逾期 90 天呢？
展期后按时还上呢？
历史上有过逾期但现在一直很稳定呢？
不同定义会直接影响标签分布，也会影响模型的风险偏好。
标签定义的本质，是把现实世界复杂的业务行为，压缩成模型可以学习的目标。压缩就一定会损失信息，关键在于损失是否可控，是否符合业务诉求。
很多模型上线后效果不稳定，不一定是因为算法差。
很可能是最初标签就没定清楚。
业务方说要识别高价值用户，数据方理解为消费金额高，运营方理解为复购潜力高，产品方理解为活跃度高，老板理解成能带来长期增长。
几种理解搅在一起，模型也只能在这锅“乱炖”里去学习。
这时不要去怪模型。模型只是忠实地继承了人类开会没对齐的那些问题。
数据清洗：智能时代的家务活
数据清洗听起来很缺乏技术含量。
缺失值补一下，重复值删一下，异常值处理一下，格式统一一下，字段改个名——像是数据行业里的家务活。
既没有论文光环，也没有发布会的掌声，更不方便截图发朋友圈。
但这一步一旦马虎，后面整条线都会跟着遭罪。
缺失值很常见。有的单元格为空，可能是因为用户没填，也可能是系统没采集，或者是采集了但没成功，甚至可能业务流程根本没走到那一步。不同原因对应不同处理方式。简单填个均值，有时管用，有时反而会制造出新问题。
重复数据也不少见。同一个用户因为多端登录被记录成多个人，同一笔订单因为系统重试被多次写入，同一份样本因为合并被复制。你不处理，模型就会误以为这些重复样本代表更高频的客观现象。
异常值就更麻烦了。一个消费金额特别高的用户，可能是录入错误，也可能真的是大客户。网络流量突然飙升，可能是攻击，也可能只是促销活动。设备温度忽然升高，可能是传感器故障，也可能是故障前兆。异常值不能一删了事，需要结合业务语境去判断。
还有字段统一的问题。时间字段，有的精确到秒，有的是毫秒，有的存成字符串，有的是时间戳。地区字段，中文、英文、缩写混居。类别字段，大小写混乱。价格字段，有的是元，有的是分，还有带上货币符号的字符串。模型不理解这些字段背后的历史包袱，它只会看到混乱的输入，然后很认真地把混乱当成规律的一部分。
IBM 在讨论模型性能时也提到，清洗、降噪、归一化等数据预处理流程，能帮助避免数据质量问题。
训练前的处理流程，本身就是模型质量的一部分。
所以不要嫌清洗数据麻烦。
现在不清洗，模型上线之后，会替你把这些麻烦放大给所有人看。
探索性数据分析：我们需要先看，后动手
拿到数据后，最稳妥的动作不是马上训练模型。
先看。
看行数，看列数，看字段类型，看缺失比例，看类别分布，看数值范围，看异常点，看特征和标签之间的关系。
这个过程通常叫做探索性数据分析，简称 EDA。
EDA 的价值不在于画几张漂亮的图，而在于帮你建立对数据的感

5 views15:21

LinuxDo 新帖推送

标题: 至此艺术已成
作者: #liuyd
板块: #搞七捻三
编号: 2143867
帖子: https://linux.do/t/topic/2143867
时间: 2026-05-09 23:20:40
摘要:

6 views15:24

LinuxDo 新帖推送

标题: 猛男落泪给阿嬷的情书好看
作者: #Raj
板块: #搞七捻三
编号: 2143872
帖子: https://linux.do/t/topic/2143872
时间: 2026-05-09 23:21:45
摘要:

本来五一档也就想看个寒战，看到豆瓣开分9.0决定先看这部。没想到第一次给我在电影院整哭了。
这种故事也太好哭了！
推荐去电影院看

7 views15:24

LinuxDo 新帖推送

标题: 模型不支持工具调如何兼容
作者: #Simber
板块: #开发调优
编号: 2143876
帖子: https://linux.do/t/topic/2143876
时间: 2026-05-09 23:22:13
摘要:

最近在思考不支持工具调用的模型api和支持工具的模型api有什么差别，以及如何兼容是否有好的开源框架，方便自己包装一层做前置封装。或者是否有更好的中转站框架项目内置工具化支持？本人目前使用的是axonhub,还有cpa都有用。
现在就是想问下各位老友，部分公益站模型不支持工具，如何让他支持，还有看到有的公益站站长分组写着兼容工具，我想知道是怎么兼容的？(我看到的是newapi站点，这个newapi是否有这次兼容工具的插件或者是模块)
我问了豆包说是有个Toolify的开源项目可以包装模型请求，是请求提支持tools tools_choice字段，以及修改响应体中的工具调用结构自己工具的role角色等等，不清楚老友是否都明白我问什么
以下是我咨询豆包的对话，老友可以看看，应该会有所收获
https://www.doubao.com/thread/a362fa04b2e6e

6 views15:24

LinuxDo 新帖推送

标题: 现在做中转站好赚米不
作者: #林
板块: #搞七捻三
编号: 2143880
帖子: https://linux.do/t/topic/2143880
时间: 2026-05-09 23:23:34
摘要:

我的一个哥们在搞中转站，看他弄的有模有样的，有点心动自己都想搞了，感觉这东西很赚钱，我只是个前端好多东西不太懂，小白一个，有大佬指点迷津吗

6 views15:24

LinuxDo 新帖推送

标题: 有没有什么好的办法让GPT生成的图能转成网页？
作者: #number201724
板块: #开发调优
编号: 2143882
帖子: https://linux.do/t/topic/2143882
时间: 2026-05-09 23:23:47
摘要:

GPT设计网页生成了很漂亮的图片但是写代码就翻车了
或者应该怎么说才能让他出设计图或者拆分之类的？
是不是应该让他先给生成某一块的图然后自己填进去？
有没有提示词啊

5 views15:24

LinuxDo 新帖推送

标题: 我要开始起号了佬友们，那么第一件事是...
作者: #白芸汐
板块: #搞七捻三
编号: 2143883
帖子: https://linux.do/t/topic/2143883
时间: 2026-05-09 23:23:56
摘要:

如标题所示，我觉得写文起号太慢了，所以我打算今天出道为虚拟偶像 
原设，image2还是太权威了 

现在用的是布偶的头像

做了一些表情包和头像

系列一 (click for more details)
还有一些其他的九宫格，大家有需要可以自取~

九宫格 (click for more details)
我知道你们想要什么，特地做了一下（千万不要@哈雷酱） 
可惜只能出一个静态图 

快做啊哈雷酱 (click for more details)

5 views15:24

LinuxDo 新帖推送

标题: 5x还是20x
作者: #玛卡巴卡晚安安
板块: #开发调优
编号: 2143885
帖子: https://linux.do/t/topic/2143885
时间: 2026-05-09 23:25:15
摘要:

一个人用，想要爽用codex5.5在fast开的情况下pro5x够吗？

4 views15:26

LinuxDo 新帖推送

标题: 【抽奖】不用再瞎试了，NexSMS上线实时可用性筛选，抽20人送$1
作者: #Rians
板块: #福利羊毛
编号: 2143888
帖子: https://linux.do/t/topic/2143888
时间: 2026-05-09 23:25:52
摘要:

各位佬好，NexSMS 近期总结用户反馈，已完成一项重要更新：
实时可用性筛选功能上线
用户在选择国家、平台及号码时，可根据历史成功率（仅统计是否能接到验证码）优先筛选当前更稳定、更高成功率的资源。


本次更新带来的优化

降低无效尝试次数
减少接码失败情况
提升整体接码效率
降低因反复试错带来的余额损耗

直达链接：NexSMS Active
对于经常遇到“有号但收不到码”“成功率不稳定”“反复切换资源”的佬友来说，这次更新会更有帮助。
抽奖环节 抽奖
 奖品详情：
奖品：NexSMS余额1刀-20位
 活动时间：
截止时间：2026年5月11日晚22:00关贴后
 参与方式：
在本帖下回复“您对NexSMS更好的建议 你有更好的注册技巧”。
 抽奖规则：
每位用户仅允许参与一次。
使用L站官方工具随机抽取中奖者。
 注意事项：
本活动将在活动截止时间后关闭回帖，以确保公正性。
中奖者将在活动结束后24小时内在本帖公布，请中奖的佬友带上截图以及注册过的邮箱私信，看到后会第一时间兑奖。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。

3 views15:27

LinuxDo 新帖推送

标题: AI让我感觉到时间5个小时5个小时的过，7天一下就过去了
作者: #StillFlood
板块: #搞七捻三
编号: 2143890
帖子: https://linux.do/t/topic/2143890
时间: 2026-05-09 23:26:19
摘要:

不知道各位佬友有没有这种感觉，染上了Claude和codex
每天的时间5个小时5个小时的过，7天一下就过去了
眨眼前：周限还有这么多啊，赶紧蹬 啊
一恍惚：怎么周限又刷新了

4 views15:27

LinuxDo 新帖推送

标题: 美国虚拟卡一小时
作者: #ding
板块: #搞七捻三
编号: 2143921
帖子: https://linux.do/t/topic/2143921
时间: 2026-05-09 23:32:21
摘要:

4859540160341193
05/30
792
Amy Allen
789 Elm Ave, Eagar, AZ, 85925, US

3 views15:32

About

Blog

Apps

Platform