LinuxDo 新帖推送
182 subscribers
251K photos
313K links
Download Telegram
标题: Codex 桌面端宠物使用教程
作者: #ApliuQ
板块: #前沿快讯
编号: 2143854
帖子: https://linux.do/t/topic/2143854
时间: 2026-05-09 23:17:59
摘要:
前言
在之前 Claude Code 推出宠物玩法,可以在命令行当中显示,通过 /buddy 命令唤出,大概样子如下。现在 codex 也推出了宠物功能,有点像之前的QQ宠物,不知道它现在怎么样了,可能饿死了吧。
开启宠物
Codex 聊天窗口输入 /Pet 后回车(注意如果语言是中文则是输入 /宠物),即可开启宠物,首次开启可能会稍微慢一点,开启后桌面右下方就会显示宠物。再次输入 /Pet 或 /宠物 后回车,则是关闭宠物。语言差异,会导致 / 后的命令有所差异,可以通过输入 / 后直接选对应命令即可。

默认宠物样式如下,不过官方内置了好几个,可以选择,或者自定义外观。鼠标拖动它左右移动,它也会跑起来。

更换宠物
点击左上角菜单 File → Setting,进入到设置界面,然后选择 Appearance ,滚动到最底下 Pets ,就可以切换选择内置的宠物咯。


自定义宠物
宠物可以支持自定义外观,在切换宠物页面,点击 Create your own pet,即可自动跳转到对话框,让codex来制作宠物。本质上是使用内置的skill来制作宠物,所以也可以直接在对话框里面主动使用技能创建。

当然,造轮子是一回事,在已有的轮子里面挑,那肯定更爽咯,已经有第三方宠物网站了,大家可以直接挑选下载使用,品种非常非常的多,别挑花眼了。
网址: Codex Pets Community Download for free | Codex Pet

看好合适的宠物后,点击 ↓ 下载按钮,将下载好的宠物,解压并拷贝到 自定义宠物文件夹(可点击 Open folder 快速打开文件夹,文件夹里面是宠物文件夹,每个宠物文件夹里面是一个pet.json以及宠物图),然后点击宠物列表上面的 Refresh 按钮,就可以看到自定义宠物了,直接 Select 即可。
自定义宠物文件夹:C:\Users\apliu\.codex\pets 注意apliu换成自己实际操作系统用户
如下界面是 更换宠物 章节提到的界面,滚动到最底下。

宠物效果
鼠标左右拖动会播
标题: 薅羊毛可以,别让身体替羊毛买单
作者: #Qxuan
板块: #搞七捻三
编号: 2143856
帖子: https://linux.do/t/topic/2143856
时间: 2026-05-09 23:18:28
摘要:
今天领到了属于年轻人鸡蛋∶三份板烧鸡腿堡

借这个机会提一句:板烧鸡腿堡不是不能吃,但是不建议多吃,它的钠含量和脂肪含量都不算低。
按麦当劳官网数据,一个板烧鸡腿堡含钠约 1041 mg。如果一天吃多个,钠摄入就很容易偏高。比如今天这种“一天三个”的情况,钠摄入大约是:
1041 mg × 3 = 3123 mg 钠
折算成食盐约 7.9 g
这已经超过《中国居民膳食指南(2022)》建议的成年人每天食盐不超过 5 g,而且这还没算当天其他食物里的盐。

数据来源:麦当劳官网
当然,板烧鸡腿堡有鸡肉蛋白,偶尔吃一个问题不大。真正需要注意的是:它不能替代均衡正餐,因为蔬菜和膳食纤维都比较少。如果经常吃、一次吃多个,再搭配薯条和甜饮,整体热量、脂肪和钠就会更高。
更合理的吃法是:
控制数量,少配薯条和含糖饮料,其他餐尽量清淡一点,多补充蔬菜和水。
钠吃多了最主要的问题是容易增加血压负担,尤其是长期高钠饮食,对控血压和心血管健康都不太友好。
以上仅为个人分享和个人理解,不代表 L 站立场;具体饮食选择请结合自身情况判断。
标题: 新人报道 终于回到大家庭了
作者: #Akxan
板块: #搞七捻三
编号: 2143858
帖子: https://linux.do/t/topic/2143858
时间: 2026-05-09 23:19:02
摘要:
终于回到了朝朝暮暮的论坛啊!终于加入大家庭了 去年注册的号由于工作的原因好久没上就给我扬了…
标题: 刚发现我的gmail邮箱能改用户名了
作者: #咸弹黄
板块: #搞七捻三
编号: 2143862
帖子: https://linux.do/t/topic/2143862
时间: 2026-05-09 23:20:04
摘要:
这是灰度到我了吗?佬友们看看能改了吗? 话说起名字真是头疼啊
标题: [长文手敲] 简论系统工程学——系统思维的入门(其二)
作者: #白芸汐
板块: #搞七捻三
编号: 2143863
帖子: https://linux.do/t/topic/2143863
时间: 2026-05-09 23:20:08
摘要:
为什么很多问题越优化越糟糕
很多问题越优化越糟糕,这种事你在生活里肯定见过。甚至不用特意去找案例,随便翻翻工作群、看看热搜,就能抓出一把。
上一部分我们聊了什么是系统——它不是一堆东西随便摆在一起,有要素、有关系、有目的、有边界、有反馈,还会出现单个部件加起来根本无法解释的整体行为。
简单说,一个真正的系统,一定有活的连接、清晰的意图、明确的内外分野,以及一套持续运转的反馈机制。
既然系统是这样的,那问题就来了:为什么我们明明在努力优化,最后反而把事情搞得更糟?
这种事在现实里,简直多到让人叹气。
学校想提高学习效率,作业就越加越多,学生越来越累,眼睛里的光也越来越暗。
公司想提高协作效率,流程越改越密,大家却越来越不敢自己做决定,什么都要走审批。
平台想提高用户停留时长,推荐算法越做越精准,用户越刷越空虚,刷完甚至想打自己两下。
城市想缓解交通拥堵,道路越修越宽,车却越来越多。
产品想减少用户投诉,客服话术越写越完整,用户听完火气反而越来越大。
到最后,就会出现一种非常荒诞的局面:每一个动作看起来都在解决问题,但系统整体却在稳定地恶化。
这就好比你手机卡了,于是装了个清理软件。清理软件说你后台应用太多,你就再装个管理后台的软件。
管理后台的软件说你内存不够,你又装了个加速器。一通操作之后,手机确实不寂寞了——后台常驻三位大将,电量掉得比打工人的精气神还快。
很多问题越优化越糟糕,根子就在这里。
你动手改的是一个点,但真正运行的是一个系统。
你动的是局部,反馈的是整体。
你盯着的是指标,响应的是关系。
你关心的是当下效果,系统却会把这个动作带到未来,然后不紧不慢地给你演一出大型连续剧。
第一种翻车姿势,是把指标当成了目标。
这种事在职场上太常见了,常见到几乎每个人都能在自己的周报里找到影子。
指标本来只是帮我们理解系统的一扇窗。透过这扇窗,你能看到大致情况,但不代表窗户就等于整栋房子。
可问题在于,窗户看久了,大家就开始对着窗户搞装修,不再关心房子里到底在发生什么。
教育就是个典型。分数当然重要,完全不看分数也不现实。
但一旦分数变成唯一的目标,整个教育系统就会自动朝着刷题、押题、排名、压缩一切探索空间的方向滑下去。
学生更会考试了,老师更会抓重点了,学校更会包装成绩了。
至于好奇心、表达力、面对复杂问题的耐心,这些不好量化的东西,就安安静静地缩在角落里,像极了会议上从来没被点到名字的人。
公司里也一样。管理者想提高投入度,就开始盯在线时长、打卡时间、任务数量。
结果你猜怎么着?员工很快学会了另一套生存技能:电脑保持在线,文档保持打开,会议保持参加,群消息保持秒回。
看起来人人都在忙,系统热闹得像菜市场,真正推进的事情却没几件。赛博牛马的精髓,就是人在工位,魂在旷野。
这种现象有个很著名的说法,叫古德哈特定律,大概意思是:当一个指标变成了目标,它就不再是个好指标了。这句话放在系统工程里,简直是救命级别的提醒。
指标本身没有错,错的是你把它从系统里单独拎出来,然后逼着所有人围着它跳舞。
产品只看日活,结局就是疯狂推送。
内容平台只看停留时长,结局就是把用户往情绪刺激里推。
客服中心只看平均处理时长,结局就是把复杂问题迅速关单,管它解没解决。
所有人都在优化,所有人都在交差,图表确实变好看了。
然后用户体验裂开,长期信任下降,系统维护成本暴涨。
指标赢了,目标死了。
第二种,是只盯着局部效率,根本不管整体代价。
局部效率谁都看得见,让某一段流程更快,某一个部门产出更多,某一个模块性能更强。听起来很合理,现实里也经常需要这样干。但系统的问题是,局部的压力不会凭空消失,它只会转移。
医院为了提高门诊效率,挂号更快了,医生接诊也更快了,前台数字漂漂亮亮。
可如果检查、缴费、取药这些环节没同步跟上,拥堵就从候诊区搬到了检查区,又从检查区搬到了药房。
病人的总等待时间未必减少,只是排队的地点换了个皮肤。
软件开发里就更常见了。
前端团队为了赶进度,先把页面做出来,演示的时候特别顺,客户频频点头。
可后端接口还没完全稳定,测试用例还没补齐,权限系统还没接好,日志也没有统一。
短期看进度快了,长期看,所有的风险全挤到了联调、测试和上线阶段,最后大家在深夜的办公室里,深度体验“今晚谁也别睡”的团建氛围。
这种优化最迷惑人的地方,就是它确实让一个局部变好了,但没有让系统变好。
像一条生产线,某个工位速度翻倍,如果下游接不住,库存就堆起来了,管理成本也跟着涨。
单点快了,整体慢了。前端漂亮了,后端爆炸了。每个局部都在报喜,系统整体在报丧。
还有一种情况,是没看见反馈回路。
系统不是死的,你改变它,它也会反过来改变人的行为。
交通就是最直观的例子。
一堵车,人的第一反应就是修路。
路不够宽?拓宽。车太多?加车道。
这个想法特别符合直觉,也特别容易得到支持——毕竟堵在路上的人,很少会说“少修路,多研究系统反馈”,只会暴躁地想,前面那辆车到底在干嘛。
但交通系统有个很麻烦的地方:路变宽了,开车的时间成本就降下来了。原本不开车的人可能开始开车了,原本错峰出行的人回到了高峰期,原本住得远的人也能接受更长的通勤距离了。
短期看,拥堵缓解了;长期看,车流增加了,路又堵回去了。
交通研究里管这叫“诱导需求”,说的是新增道路容量会降低驾驶的时间成本,从而诱发更多驾驶需求,把扩容缓堵的效果抵消得干干净净。
这就很像减肥的逻辑:今天运动了,多吃一点没事。然后运动消耗了三百卡,奶茶补回八百卡。身体沉默,体重微笑。
反馈回路的可怕之处,就是它会让直觉上特别好的办法,在更长时间里慢慢失效。你提高了效率,需求可能跟着增长。你降低了成本,使用量可能跟着上涨。你加强了考核,大家就开始研究考核本身。你强化了推荐,用户就被困在越来越窄的信息回音壁里,越刷越累。
经济学和技术史里有个相关的概念叫杰文斯悖论,说的是技术提高了资源使用效率之后,总消耗量反而可能增加,因为使用成本下降刺激了更多需求。
放到今天的AI领域也很有意思:模型推理越来越便宜,大家未必会少用算力,反而会把AI塞进更多场景。原来只让它写总结,现在让它写代码、做客服、跑流程、分析日志,甚至评价自己写的周报。
效率提升的结果,是总调用量飙升,总算力消耗继续往上走。
所以,优化不能只看第一层效果。
第一层,成本下降了。
第二层,使用增加了。
第三层,系统规模变大了。
第四层,新的瓶颈出现了。
第五层,原来的优化开始制造新问题。
很多人只看到第一层就开香槟了,系统通常等到第五层才来敲门,敲门的方式也很朴素:要么成本炸了,要么体验崩了,要么维护人员集体沉默了。
第四种,是激励设计把人带进了沟里。
系统里最活跃的要素永远是人。人会响应规则,会适应指标,会寻找路径,会在压力下发明各种神奇操作。
所以,只要你设计了激励,就要准备好面对人类的创造力。
别小看任何人在完成考核这件事上的聪明程度——只要规则有洞,一定有人发现。
只要指标有空子,一定有人研究。
只要奖励足够明确,行为就会朝着奖励飞奔过去,原来的目标还在不在,另说。
现实里这种事一抓一大把:平台奖励发帖数量,水帖就变多。公司奖励销售签单,后端交付就被压爆。学校奖励论文数量,灌水和拼接就层出不穷。客服考核解决率,复杂问题就被快速关闭。开发考核需求数量,小修小补就比系统重构更受欢迎。
最后,系统会出现一种非常荒诞的自洽:规则说什么,人就优化什么。你奖励表演,系统就生产表演。
你奖励数量,系统就生产数量。你奖励速度,系统就牺牲耐心。
你奖励短期结果,系统就透支长期结构。
很多组织最痛苦的地方就在这里——嘴上想要A,激励却奖励B,最后所有人都去做B。
然后管理层开始困惑:为什么大家没有自驱力?这不能全怪人,方向盘都打到那边去了,车当然往那边开。
你不能一边把导航设到火锅店,一边抱怨怎么没去图书馆。
第五种,是边界画得太窄了。
很多优化之所以翻车,是因为你把系统边界画得太小。边界一窄,很多代价就看不见了。看不见,就当它不存在。然后放心大胆地动手。等到问题从别的地方冒出来,又觉得世界好复杂,怎么到处是意外。
比如一个部门为了提高自己的效率,把大量的前置整理工作扔给了下游。自己的指标变好看了,响应快,汇报漂亮。可下游开始加班,错误率上升,沟通成本暴涨。站在这个部门的边界里看,优化大获成功。站在整个系统里看,只是把成本转嫁了而已。
AI产品也一样。只把边界画在“模型回答是否流畅”,优化就会集中在“说得更快、更顺、更像人”。但如果你把边界画到“真实任务是否完成”,那就要看信息来源是否可靠、工具调用是否安全、权限是否明确、错误是否能复核,用户是不是真的解决了问题。只看回答,模型很体面。一看交付,系统开始冒汗。
这才是边界真正的力量,它决定了哪些问题会被看见,哪些代价会被藏起来。
边界画错了,优化自然就跑偏了。
第六种,是把复杂问题硬压成单一解法。
很多时候,大家不是不知道系统复杂,只是太想找一个简单的按钮了。堵车就修路,学习差就加课,效率低就加班,风险高就加审批,模型差就换更大的模型。
这些办法不一定完全没用,有些在局部甚至挺管用。
问题是,它们把复杂的系统问题压成了一次性动作,就像看到人发烧,只盯着降温,不管感染、炎症和免疫系统。温度可能降了,人还在继续坏下去。
系统问题需要的往往是组合解法。交通拥堵需要道路规划、公共交通、停车政策、信号调度和出行需求管理一起调。
教育焦虑需要课程设计、评价机制、家庭预
标题: [长文手敲] 简论机器学习——机器学习之前,先学会看数据(其一)
作者: #白芸汐
板块: #搞七捻三
编号: 2143866
帖子: https://linux.do/t/topic/2143866
时间: 2026-05-09 23:20:33
摘要:
不要上来就挑模型
很多刚接触机器学习的人,上手的第一件事往往是选模型。
线性回归、随机森林、XGBoost,接着听说 LightGBM 表现更好,于是打开教程,复制代码,导入数据,训练,看一眼准确率,感觉整个流程跑通了。
看见屏幕上的数字,忍不住觉得已经跨过了门槛。(忍不住轻哼起来)
等到换一批真实数据再试,模型却经常一塌糊涂。
这样的过程在机器学习圈子里反复出现。
像刚拿到驾照的人,还顾不上熟悉路况,就已经在研究怎么调校悬架和轮胎。油门踩得果断,弯道却冲了出去。别人问为什么撞墙,回答常常是动力不够。
问题多半不在动力上。
问题主要在于,你连路况都没有仔细看过。
机器学习最容易让人误解的地方就在这里。局外人关注模型,入门者盯着算法,而有经验的人往往先回头看数据。
模型当然重要,算法也重要,可一切的源头是数据。
IBM 在讨论 AI 数据质量时也指出,质量不高、有偏斜或不完整的数据,会让模型输出不可靠的结果,再复杂的模型架构也弥补不了。
用一句更直白的话说,垃圾进,垃圾出,模型没有义务替存在问题的数据兜底。
所以这一篇暂时不谈公式,不谈梯度,不谈参数,也不碰那些一听就容易让人紧张的名词。
先谈一件更基础,也更容易被忽略的事。
在机器学习之前,先学会看数据。
它不涉及大模型,不谈智能体,不聊多模态,不提端到端,也说不上什么涌现。可真正做过项目的人都明白,一个机器学习系统能不能跑起来,能不能稳定地跑下去,能不能在真实环境里站住脚,往往从打开数据表的那一刻就已经决定了。
数据没看明白,后面全是连环债务陷阱。
数据不是素材库,是模型看世界的窗口
机器学习到底在学什么?
很多教材会说,机器学习是让计算机从数据里发现规律,并用这些规律对未知样本做预测。
这个答案很标准,也容易一听就过去了。
换个更通俗一点的说法:模型没有眼睛,看不见真实世界。它也不知道房价、天气、疾病、信用、用户兴趣或网络攻击这些东西原本意味着什么。
它能接触的全部世界,就是你送给它的数据。
你给了什么字段,它就从这些字段里寻找关系;你给了什么标签,它就努力朝那个方向拟合;你给了什么样本,它就把这些样本当作经验。
因此,模型眼中的世界,永远是一个经过数据加工之后的世界。
这有点像一个人完全靠餐厅评价来认识一座城市。
他当然能总结出一些规律,比如哪家店容易踩雷,哪家包装讲究,哪家深夜还在营业。但他看到的只是评价里的城市,而不是完整、真实的城市。
评价本身会有偏差,样本量可能不足,平台会筛选,用户会夸张,店家也可能刷分。最后拼凑出的城市画像或许有用,也可能偏得离谱。
模型也一样。
你想预测用户是否流失,但只给了它注册时间和性别,它能做出的判断不会太好。因为真正驱动流失的因素,可能藏在最近登录频率、核心功能使用情况、投诉记录、付费变化、客服响应里。
你想判断交易是否异常,手里却没有设备指纹、地理位置、消费习惯、交易时段、金额波动等字段,那模型就像一个保安,只拿着一张模糊的门厅照片,就要判定访客风险。
不是不能做,是做出来的结果多半不太靠谱。
你想做网络流量异常检测,却只统计了总流量大小,不看端口、协议、连接频次、包间隔、请求方向和历史基线,那模型最多能抓住最显眼的异常。
稍加伪装的攻击,很可能就被当成正常波动漏过去。
报告上写检测能力出色,真实环境里让人捏一把汗。
所以,数据不是往模型嘴里一倒就完事的素材库。
数据,是模型视野的边界。
数据里没有的信息,模型通常猜不出来。数据里被扭曲的信息,模型会认真学习。数据里夹带的偏见,模型甚至可能打包成高置信度的判断。
这正是机器学习让人期待又头疼的地方:它既能从数据中发现规律,也会从数据里继承问题。
样本、特征、标签:三个基础概念
要看数据,先得清楚自己在看什么。
机器学习里有三个最基本的概念:样本、特征、标签。
样本,就是一条观察记录。一个用户、一封邮件、一笔交易、一次设备一天的运行日志,都可以成为一个样本。它是模型学习的基本单位。
特征,是用来描述样本的信息。年龄、最近登录时间、购买次数、平均消费金额、邮件标题用词、图片像素、交易地点、连接持续时间……这些都可以成为特征。特征决定了模型可以从哪些角度去观察样本。
标签,是你希望模型学会预测的答案。用户是否流失、邮件是不是垃圾邮件、图片是不是猫、交易是否欺诈、设备是否故障、明天的销量是多少,这些都可以是标签。在监督学习里,有输入就有标准答案,模型通过不断对比自己预测的答案和真实答案来修正自身。
拿经典的鸢尾花数据集来说,UCI 机器学习库中的 Iris 数据集包含 150 个样本,4 个特征,3 个类别,每个类别 50 个样本,是很早就被广泛使用的分类数据集。
这里每一朵花就是一个样本,花萼长度、花萼宽度、花瓣长度、花瓣宽度是特征,鸢尾花的种类是标签。
这个数据集很小,也很干净,非常适合入门。它像驾校里摆好的桩桶,路线清晰,障碍明确,适合练手。
可真实项目里的数据通常没有这么好搞,大多是杂乱无章的。
举个例子,真实业务数据经常长这样:
字段名不统一,单位不统一,时间格式不统一,同一个用户有多个 ID,某些字段大量缺失,某些值明显离谱。
地区一栏,一会儿写“广东”,一会儿写“广东省”,一会儿是“Guangdong”,有时中间还夹着空格。
金额字段出现负数,年龄字段出现 999,订单时间晚于退款时间,设备上线时间早于出厂日期。
一旦面对这种状况,你就会发现,机器学习里“机器”两个字很先进,“学习”两个字很体面,而夹在中间最折腾人的,反倒是数据表里那些既像手滑、又像系统迁移事故的字段。
你以为自己在做人工智能。
实际上,你更像在给数据做心理疏导,这你得先让数据舒服了才能往后走。
标签定义:机器学习的第一场硬仗
很多人看数据时会仔细检查特征,却容易忽略标签。
这是相当危险的。
标签是模型学习的目标。
标签定义乱了,模型学得越卖力,偏得越离谱。你不能一边把答案写错,一边指望学生考出真实水平。万一学生真的考了高分,反倒更让人不放心。
举一个例子,你要做用户流失预测。
什么叫“流失”?
7 天没登录算不算?
30 天没登录算不算?
卸载 App 算不算?
取消订阅算不算?
还在登录但不再付费算不算?
只看内容不互动算不算?
每一种定义都会生成不同的标签,也会训练出完全不同的模型。
在游戏场景里,7 天未登录可能已经非常危险;放在低频的政务系统里,30 天未登录也许再正常不过。不能把所有业务都套进同一个流失定义,然后指望模型自动理解背后的行业语境。模型没有参与需求讨论,它不知道你心里的那套潜台词。
再看金融风控。
什么叫“坏客户”?
逾期 1 天算不算?
逾期 30 天算不算?
逾期 90 天呢?
展期后按时还上呢?
历史上有过逾期但现在一直很稳定呢?
不同定义会直接影响标签分布,也会影响模型的风险偏好。
标签定义的本质,是把现实世界复杂的业务行为,压缩成模型可以学习的目标。压缩就一定会损失信息,关键在于损失是否可控,是否符合业务诉求。
很多模型上线后效果不稳定,不一定是因为算法差。
很可能是最初标签就没定清楚。
业务方说要识别高价值用户,数据方理解为消费金额高,运营方理解为复购潜力高,产品方理解为活跃度高,老板理解成能带来长期增长。
几种理解搅在一起,模型也只能在这锅“乱炖”里去学习。
这时不要去怪模型。模型只是忠实地继承了人类开会没对齐的那些问题。
数据清洗:智能时代的家务活
数据清洗听起来很缺乏技术含量。
缺失值补一下,重复值删一下,异常值处理一下,格式统一一下,字段改个名——像是数据行业里的家务活。
既没有论文光环,也没有发布会的掌声,更不方便截图发朋友圈。
但这一步一旦马虎,后面整条线都会跟着遭罪。
缺失值很常见。有的单元格为空,可能是因为用户没填,也可能是系统没采集,或者是采集了但没成功,甚至可能业务流程根本没走到那一步。不同原因对应不同处理方式。简单填个均值,有时管用,有时反而会制造出新问题。
重复数据也不少见。同一个用户因为多端登录被记录成多个人,同一笔订单因为系统重试被多次写入,同一份样本因为合并被复制。你不处理,模型就会误以为这些重复样本代表更高频的客观现象。
异常值就更麻烦了。一个消费金额特别高的用户,可能是录入错误,也可能真的是大客户。网络流量突然飙升,可能是攻击,也可能只是促销活动。设备温度忽然升高,可能是传感器故障,也可能是故障前兆。异常值不能一删了事,需要结合业务语境去判断。
还有字段统一的问题。时间字段,有的精确到秒,有的是毫秒,有的存成字符串,有的是时间戳。地区字段,中文、英文、缩写混居。类别字段,大小写混乱。价格字段,有的是元,有的是分,还有带上货币符号的字符串。模型不理解这些字段背后的历史包袱,它只会看到混乱的输入,然后很认真地把混乱当成规律的一部分。
IBM 在讨论模型性能时也提到,清洗、降噪、归一化等数据预处理流程,能帮助避免数据质量问题。
训练前的处理流程,本身就是模型质量的一部分。
所以不要嫌清洗数据麻烦。
现在不清洗,模型上线之后,会替你把这些麻烦放大给所有人看。
探索性数据分析:我们需要先看,后动手
拿到数据后,最稳妥的动作不是马上训练模型。
先看。
看行数,看列数,看字段类型,看缺失比例,看类别分布,看数值范围,看异常点,看特征和标签之间的关系。
这个过程通常叫做探索性数据分析,简称 EDA。
EDA 的价值不在于画几张漂亮的图,而在于帮你建立对数据的感
标题: 至此艺术已成
作者: #liuyd
板块: #搞七捻三
编号: 2143867
帖子: https://linux.do/t/topic/2143867
时间: 2026-05-09 23:20:40
摘要:
标题: 猛男落泪 给阿嬷的情书 好看
作者: #Raj
板块: #搞七捻三
编号: 2143872
帖子: https://linux.do/t/topic/2143872
时间: 2026-05-09 23:21:45
摘要:
本来五一档也就想看个寒战,看到豆瓣开分9.0决定先看这部。没想到第一次给我在电影院整哭了。
这种故事也太好哭了!
推荐去电影院看
标题: 模型不支持工具调如何兼容
作者: #Simber
板块: #开发调优
编号: 2143876
帖子: https://linux.do/t/topic/2143876
时间: 2026-05-09 23:22:13
摘要:
最近在思考不支持工具调用的模型api和支持工具的模型api有什么差别,以及如何兼容是否有好的开源框架,方便自己包装一层做前置封装。或者是否有更好的中转站框架项目内置工具化支持?本人目前使用的是axonhub,还有cpa都有用。
现在就是想问下各位老友,部分公益站模型不支持工具,如何让他支持,还有看到有的公益站站长分组写着兼容工具,我想知道是怎么兼容的?(我看到的是newapi站点,这个newapi是否有这次兼容工具的插件或者是模块)
我问了豆包说是有个Toolify的开源项目可以包装模型请求,是请求提支持tools tools_choice字段,以及修改响应体中的工具调用结构自己工具的role角色等等,不清楚老友是否都明白我问什么
以下是我咨询豆包的对话,老友可以看看,应该会有所收获
https://www.doubao.com/thread/a362fa04b2e6e
标题: 现在做中转站好赚米不
作者: #林
板块: #搞七捻三
编号: 2143880
帖子: https://linux.do/t/topic/2143880
时间: 2026-05-09 23:23:34
摘要:
我的一个哥们在搞中转站,看他弄的有模有样的,有点心动自己都想搞了,感觉这东西很赚钱,我只是个前端好多东西不太懂,小白一个,有大佬指点迷津吗
标题: 有没有什么好的办法让GPT生成的图能转成网页?
作者: #number201724
板块: #开发调优
编号: 2143882
帖子: https://linux.do/t/topic/2143882
时间: 2026-05-09 23:23:47
摘要:
GPT设计网页生成了很漂亮的图片但是写代码就翻车了
或者应该怎么说才能让他出设计图或者拆分之类的?
是不是应该让他先给生成某一块的图然后自己填进去?
有没有提示词啊
标题: 我要开始起号了佬友们,那么第一件事是...
作者: #白芸汐
板块: #搞七捻三
编号: 2143883
帖子: https://linux.do/t/topic/2143883
时间: 2026-05-09 23:23:56
摘要:
如标题所示,我觉得写文起号太慢了,所以我打算今天出道为虚拟偶像 
原设,image2还是太权威了

现在用的是布偶的头像

做了一些表情包和头像

系列一 (click for more details)
还有一些其他的九宫格,大家有需要可以自取~

九宫格 (click for more details)
我知道你们想要什么,特地做了一下(千万不要@哈雷酱)
可惜只能出一个静态图

快做啊哈雷酱 (click for more details)
标题: 5x还是20x
作者: #玛卡巴卡晚安安
板块: #开发调优
编号: 2143885
帖子: https://linux.do/t/topic/2143885
时间: 2026-05-09 23:25:15
摘要:
一个人用,想要爽用codex5.5在fast开的情况下pro5x够吗?
标题: 【抽奖】不用再瞎试了,NexSMS上线实时可用性筛选,抽20人送$1
作者: #Rians
板块: #福利羊毛
编号: 2143888
帖子: https://linux.do/t/topic/2143888
时间: 2026-05-09 23:25:52
摘要:
各位佬好,NexSMS 近期总结用户反馈,已完成一项重要更新:
实时可用性筛选功能上线
用户在选择国家、平台及号码时,可根据历史成功率(仅统计是否能接到验证码)优先筛选当前更稳定、更高成功率的资源。


本次更新带来的优化

降低无效尝试次数
减少接码失败情况
提升整体接码效率
降低因反复试错带来的余额损耗

直达链接:NexSMS Active
对于经常遇到“有号但收不到码”“成功率不稳定”“反复切换资源”的佬友来说,这次更新会更有帮助。
抽奖环节 抽奖
奖品详情:
奖品:NexSMS余额1刀-20位
活动时间:
截止时间:2026年5月11日晚22:00关贴后
参与方式:
在本帖下回复“您对NexSMS更好的建议 你有更好的注册技巧”。
抽奖规则:
每位用户仅允许参与一次。
使用L站官方工具随机抽取中奖者。
注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后24小时内在本帖公布,请中奖的佬友带上截图以及注册过的邮箱私信,看到后会第一时间兑奖。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。
标题: AI让我感觉到时间5个小时5个小时的过,7天一下就过去了
作者: #StillFlood
板块: #搞七捻三
编号: 2143890
帖子: https://linux.do/t/topic/2143890
时间: 2026-05-09 23:26:19
摘要:
不知道各位佬友有没有这种感觉,染上了Claude和codex
每天的时间5个小时5个小时的过,7天一下就过去了
眨眼前:周限还有这么多啊,赶紧蹬 啊
一恍惚:怎么周限又刷新了
标题: 美国虚拟卡一小时
作者: #ding
板块: #搞七捻三
编号: 2143921
帖子: https://linux.do/t/topic/2143921
时间: 2026-05-09 23:32:21
摘要:
4859540160341193
05/30
792
Amy Allen
789 Elm Ave, Eagar, AZ, 85925, US