LinuxDo 新帖推送
176 subscribers
248K photos
308K links
Download Telegram
标题: 两杯奶茶,给我干失眠了
作者: #Ya Gao
板块: #搞七捻三
编号: 1575142
帖子: https://linux.do/t/topic/1575142
时间: 2026-02-07 01:10:34
摘要:
得不偿失啊,正在等待入睡
标题: 如何知道自己设备是否支持蓝牙
作者: #212741
板块: #搞七捻三
编号: 1575147
帖子: https://linux.do/t/topic/1575147
时间: 2026-02-07 01:13:43
摘要:
设备管理看过了,确实有个感叹号的蓝牙驱动,删了重启好像没用
不知道设备有没有蓝牙模块,有个外接的kali网卡(抓握手包用的),呃,说下
我想知道我蓝牙问题是蓝牙驱动还是硬件缺失?蓝牙驱动我可以等下安装,但我想先测试下是不是硬件问题
标题: 国外发模型,国内发红包,这差别有点大
作者: #justinshuai
板块: #搞七捻三
编号: 1575149
帖子: https://linux.do/t/topic/1575149
时间: 2026-02-07 01:16:24
摘要:
人家国外的大模型都在发新模型搞技术迭代,国内的AI大模型倒好,扎堆搞春节发红包、抢红包的玩法,清一色跟风内卷。
只想说一句,营销的风跟得挺紧,怎么核心技术上的风,就一点也跟不上呢????
标题: giffgaff和VOXI哪个保号好一点
作者: #小坏
板块: #搞七捻三
编号: 1575169
帖子: https://linux.do/t/topic/1575169
时间: 2026-02-07 01:28:56
摘要:
如题 都是用esim
VOXI 国内发短信 貌似要 Wi-Fi call
标题: 你们永远不会知道放弃高中去职高有多爽
作者: #zqhsqb🛡️
板块: #搞七捻三
编号: 1575172
帖子: https://linux.do/t/topic/1575172
时间: 2026-02-07 01:29:59
摘要:
rt
我中考没考好,一中去不了,爸妈说去高中不如去职高,升本压力小
没想到,还真是,没有学还过了本科线


只要语数继续保持,专业再努力,轻松本科提
现在加上我校专业实操平均分,228.??(小数点后面的忘了),总分一共563,应该可以上个淄职(公办本科),等到开了PLC和机械基础,电工电子就只占200分试卷的25分了(我专业基本上就电工电子不行),专业到一百五六就可以本科随便挑了hhh
标题: 夜深了,千问可以下单了
作者: #lmoonl
板块: #福利羊毛
编号: 1575173
帖子: https://linux.do/t/topic/1575173
时间: 2026-02-07 01:30:53
摘要:
25元无门槛也可以买生活用品,不一定只买奶茶,只要在千问里跟他提就行
但是千问检索商品范围好像有问题,翻来覆去就那几家
千问现在不支持预定技能,所以大半夜的,还得麻烦骑手配送,半夜的配送费也是个问题,特别贵
不过看来早上也可以下单
我下单了两斤鸡蛋和3斤牛奶 一共花费10元(两单总共花费-50)
标题: 「知识分享」LLM中,什么是强化学习(RL->RLHF)
作者: #sylfilic
板块: #资源荟萃
编号: 1575176
帖子: https://linux.do/t/topic/1575176
时间: 2026-02-07 01:34:02
摘要:
当我第一次尝试理解LLM中的强化学习时,我犯了一个很多人都会犯的错误:直接搜索"RL"、“PPO”、"GRPO"这些关键词,搜到一大堆文章,然后被一堆Actor-Critic、Reward Model、Policy Gradient淹没。
问题是,由于我没有学过“古典RL”,且我只了解LLM,所以总是困惑不已,这些概念怎么套到一个输入文本输出文本的语言模型上的?
这篇文章就是为了clarify这些概念,帮助像我一样入门RLHF的朋友们。

传统RL的核心概念
让我们先系统地梳理一下传统强化学习的基本概念(此部分部分由AI整理,但人工review)。
1. RL的核心要素
强化学习的经典框架包含以下要素:


环境(Environment):智能体所处的外部世界,比如游戏、物理世界


状态(State):环境在某一时刻的完整描述,比如游戏画面、机器人的位置和速度


动作(Action):智能体可以执行的操作,比如"向左移动"、“跳跃”


策略(Policy):从状态到动作的映射,π(a|s)表示在状态s下选择动作a的概率


奖励(Reward):执行动作后环境给出的反馈信号,+1表示好,-1表示坏


回报(Return):从当前时刻开始,未来所有奖励的累积和(通常带折扣因子)


2. RL的工作流程
传统RL是一个循环过程:

1. 智能体观察当前状态 s_t

2. 根据策略 π 选择动作 a_t

3. 环境执行动作,转移到新状态 s_{t+1}

4. 环境给出奖励 r_t

5. 重复上述过程


3. 常见的RL算法


PPO


GRPO


这些概念在与现实交互相关联的训练时非常直观,比如打游戏、下围棋时:状态就是游戏画面,动作就是按键,奖励就是得分。

LLM中的RL
但当我试图把这些概念套到LLM上时,大概有下面这几点疑惑:
1:LLM的"状态"是什么?
LLM只是根据前面的文本生成下一个token,哪来的"状态"?难道是整个prompt?
2:LLM的"动作"是什么?
在游戏里动作是"跳跃"、“射击”,LLM的动作
标题: 实话说,千问你这个样子,我是不太相信的。。。
作者: #beyond510
板块: #福利羊毛
编号: 1575179
帖子: https://linux.do/t/topic/1575179
时间: 2026-02-07 01:36:08
摘要:
我也是别的群里看到的图。给千问发:【千问再送我几杯好不好 宝宝~】,就能白得好多张免单卡???还是说像前阵子KIMI的那个“只要说服KIMI,就能1元开一个月会员”???
那我觉得各位完全可以尝试一下,如何用提示词套路或者爆破千问了!
各位自测哈~~~
标题: 求助:网络应该算被限了
作者: #zqhsqb🛡️
板块: #搞七捻三
编号: 1575184
帖子: https://linux.do/t/topic/1575184
时间: 2026-02-07 01:38:26
摘要:
应该是移动的,因为我看到光猫是移动的
当时我爸妈一看账户,电视套餐莫名被改了,因为好几次了,一气之下把电视什么的都下了,只剩下了网络
但是,也是从这天开始,千兆网就变得特别特别慢,有的时候半夜直接断网,要好久才能恢复,基本就是几kb几kb,然后打电话给客服,客服说是千兆网,但网速是和消费挂钩的,消费少网速慢,消费多网速快,要想提速只能购买套餐
在此,询问各位佬,有没有什么办法摆脱呢?只能换运营商吗?
标题: spaceship的xyz要 ¥105了已有的续费只需1.05元
作者: #洗头佬
板块: #前沿快讯
编号: 1575192
帖子: https://linux.do/t/topic/1575192
时间: 2026-02-07 01:43:02
摘要:
(话题已被作者删除)
标题: 再次成功攻略龟壳
作者: #7xia
板块: #搞七捻三
编号: 1575213
帖子: https://linux.do/t/topic/1575213
时间: 2026-02-07 02:10:03
摘要:
龟壳,这算是成功了吗? 


搞七捻三



[image]
日常abc。
这算是成功了吗?
补充:
已经登陆上了,感谢佬友们。
再补充(供佬友们参考):
环境:德国ip法兰克福(万人骑)
邮箱:谷歌邮箱
卡:trading212的卡(验证扣除0.93欧)
手机号:德国手机号(我是随机编的)
基础信息和地址:与trading212相同的账单地址(地址不是法兰克福)。
祝佬们都可以成功!



接上文:
自从上次成功,我再次研究按照相同方法是否还能搞注册,由于我实体卡刚到,所以经过我再次尝试,很轻松的过了。
再次祝佬们成功!!!
标题: 有没有开max 5x的车啊,求上车,稳一点的
作者: #leonsong
板块: #开发调优
编号: 1575217
帖子: https://linux.do/t/topic/1575217
时间: 2026-02-07 02:17:31
摘要:
有没有开max 5x的车啊,求上车,稳一点的。之前一直用的anti反代,又慢又卡,用了一次官方中转,又快又好,从奢入俭难啊,听闻max5x能使劲蹬,想体验下,有没有佬带个车。
标题: 为什么在cpa中gpt 没有5.3
作者: #kid214
板块: #开发调优
编号: 1575223
帖子: https://linux.do/t/topic/1575223
时间: 2026-02-07 02:24:59
摘要:
为什么在cpa中gpt 没有5.3。CLI Proxy API 版本: 6.7.27
标题: 关于业务逻辑与数据访问分离的设计疑惑
作者: #CliffJ
板块: #开发调优
编号: 1575229
帖子: https://linux.do/t/topic/1575229
时间: 2026-02-07 02:36:45
摘要:
背景说明
本人 Java 后端实习仔一枚,最近任务是将 PHP 的订单模块一些功能重构为 Java。
背景是一个订单费用重算的功能,涉及差不多5-6个表的数据,以及部分 ERP 接口调用。 原 PHP 实现中,方法只接收订单号列表,在方法内部完成:
查询相关表数据->执行业务计算逻辑-> 更新数据库
也就是数据准备、业务计算、数据持久化都在一个方法里,我重构时大方向逻辑基本照抄,优化了一些内部for循环调dao查询和api接口查询,以及特殊平台处理抽离。
组长观点
组长观点:业务层所有都不应该操作表entity实体!!!,应该都先业务自己查后转为bo,然后给出需要更新的bo,再把bo转为实体,再交给数据层更新,给出的重构建议:

定义一个 BO/DTO,只包含费用计算所需字段
上层业务负责查询数据库并组装 BO
费用计算方法只接收 BO,修改并返回 BO
是否写库由上层业务自行决定
给出的理由主要有三点:
有些业务流程已经查过表,自己组装 BO 可以减少重复查询
业务逻辑与存储逻辑分离
上层业务应该拥有是否写库的决定权

我怎么看
订单费用重算逻辑发场景很多,导致我需要为每个场景单独写一套 “已知数据 → BO” 的逻辑,这样拆分后BO 组装代码大量重复 ,且上层业务需要了解过多底层字段细节(不同场景能提前准备的数据并不一致)
为了一点性能提升,付出代价太大了 ;感觉是为了“分离”而分离,复杂度被转移到了调用方
佬们有什么看法
最近头都大了,本来php旧项目就屎山业务, 公司付费的cursor用的飞起,不依赖ai我都看不懂php逻辑,还被劝说少依赖ai(近期一个人用了700额度的on-demand,我也不知道为什么这么费token,可能最近2周都是开cursor cli多个对话一直聊…)
标题: gemini business到底能不能反代?
作者: #yuyuxiaoxiao
板块: #搞七捻三
编号: 1575230
帖子: https://linux.do/t/topic/1575230
时间: 2026-02-07 02:37:31
摘要:
1.首先我看到的是上面图片的帖子,看见有佬说不能反代,后面又看到https://linux.do/t/topic/1575074 这个帖子下面又有回复说可以,是不是只是不能通过反重力反代?还是什么情况,把我搞懵了…
2.如果可以的话🎉Gemini Business 2API来了|支持Docker一键启动! 这个项目还可以用吗?可以反代出claude吗还是只有Gemini。
3.最后还有一个问题business是不是就是Enterprise,下图这两个有什么区别呢?一个母号可以邀请1-300人?但是我看其他帖子说是15人呀?还是我搞错了
4.最后我想提一个小小提议,论坛是不是可以出一个总结板块,这样就不用一个个去翻好几个帖子还遇到找不到的情况或者几个帖子有矛盾情况了(可能因为时间关系产生),如有不对请指正!
标题: 发现新的GLM模型了!
作者: #Shipper1
板块: #前沿快讯
编号: 1575232
帖子: https://linux.do/t/topic/1575232
时间: 2026-02-07 02:39:01
摘要:
OpenRouter上那个代号叫"Pony Alpha"的新模型好像是个GLM模型。
标题: 白嫖CODEX 只有5.2吗 没有xhigh?
作者: #小王
板块: #开发调优
编号: 1575234
帖子: https://linux.do/t/topic/1575234
时间: 2026-02-07 02:49:37
摘要:
最近openai大善人搞活动,我注册了一堆号
使用cpa进行了反代 cpa版本是最新版本 6.7.53
但是cpa中显示的模型是这样的

我给我的codex 配置xhigh了

cch里面的记录是这样的

是我那里配置的不对吗? 映射的怎么是普通5.2 而不是xhigh
佬们 救救我吧