【影视公益站】基于MoonTV二开项目的公益站点,突破1000注册啦
再来一波吧,开放了L站和Google的注册和登录,网站流畅度还可以,欢迎佬友使用。
影视资源为第三方api提供,本站只提供聚合播放
站点地址:https://tv.dogegg.online/
38 posts - 33 participants
Read full topic
via LINUX DO - 热门话题 (author: DogEgg)
Invalid media:
image
image
image
image
再来一波吧,开放了L站和Google的注册和登录,网站流畅度还可以,欢迎佬友使用。
影视资源为第三方api提供,本站只提供聚合播放
站点地址:https://tv.dogegg.online/
38 posts - 33 participants
Read full topic
via LINUX DO - 热门话题 (author: DogEgg)
Invalid media:
image
image
image
image
佬友们都戴什么手表
突然很好奇佬友们都在戴什么手表。佬友们在下面留个言呗。
我本人用的vivo watch gt,感觉基本的功能都有,佬友们有什么推荐的手表吗?
221 posts - 215 participants
Read full topic
via LINUX DO - 热门话题 (author: MichaelGao)
突然很好奇佬友们都在戴什么手表。佬友们在下面留个言呗。
我本人用的vivo watch gt,感觉基本的功能都有,佬友们有什么推荐的手表吗?
221 posts - 215 participants
Read full topic
via LINUX DO - 热门话题 (author: MichaelGao)
clawdbotinstaller 小白clawdbot一键安装配置引导器
开始使用clawdbot了,顺便让AI撸了个新手一键配置管理工具
项目地址:GitHub - miaoxworld/ClawdBotInstaller
一键完成最基础的AI配置,懒得来回改配置的可以试试,带管理器。
28 posts - 17 participants
Read full topic
via LINUX DO - 热门话题 (author: 喵星人)
Invalid media:
image
image
image
image
image
开始使用clawdbot了,顺便让AI撸了个新手一键配置管理工具
curl -fsSL https://raw.githubusercontent.com/miaoxworld/ClawdBotInstaller/main/install.sh | bash项目地址:GitHub - miaoxworld/ClawdBotInstaller
一键完成最基础的AI配置,懒得来回改配置的可以试试,带管理器。
28 posts - 17 participants
Read full topic
via LINUX DO - 热门话题 (author: 喵星人)
Invalid media:
image
image
image
image
image
这是真的Linux之父?
今天水的时候随手点金一篇帖子(https://linux.do/t/topic/1415613)
然后就看到了这个
我寻思始皇会回消息的人是什么来历 于是点了进去
一开始没有看简介(对英文不敏感,对GitHub还行,就点进去了)
当我看见了Linux就感觉有点不对(怎么你会有Linux这个项目?嗯? 🤨)
然后点进去发现了右上角的数据,释怀了 不是 这是真的有大佬啊 🤐
59 posts - 51 participants
Read full topic
via LINUX DO - 热门话题 (author: boy ashyshy)
Invalid media:
image
image
image
image
今天水的时候随手点金一篇帖子(https://linux.do/t/topic/1415613)
然后就看到了这个
我寻思始皇会回消息的人是什么来历 于是点了进去
一开始没有看简介(对英文不敏感,对GitHub还行,就点进去了)
当我看见了Linux就感觉有点不对(怎么你会有Linux这个项目?嗯? 🤨)
然后点进去发现了右上角的数据,释怀了 不是 这是真的有大佬啊 🤐
59 posts - 51 participants
Read full topic
via LINUX DO - 热门话题 (author: boy ashyshy)
Invalid media:
image
image
image
image
分享 Chrome 如何开启最新的 Chrome Gemini AI 超爽
2026 年 1 月,Google 将 Gemini 深度整合进 Chrome
核心功能
● 侧边栏常驻 - 边浏览边用 AI,跨标签页比较产品
● Auto Browse - 真正的 Agent,自动帮你查酒店、填表单、订行程
● Context Groups - 理解你整个研究会话的上下文,不只是当前页面
● Google 生态整合 - 直接在页面里操作 YouTube、日历、地图
● Personal Intelligence - 记住你的对话历史,越用越懂你
首先修改google账号的地区和语言
1. 把你的 Google 账号地区改成美国
参考 Google 账号修改国家地区方法(为了反重力升天) 这个教程
2. 把 Google 账号语言设置成英文
accounts.google.com
登录 - Google 账号
设置语言为英文,地址为美国地址
3. chrome浏览器的语言也需要改成英文
macos的可以按照如下设置:系统设置->语言与地区->最下面为Chrome自定义语言
windows如何改程序的语言环境可以自己去搜 这里不提供了
4.执行脚本
进到
MacOS执行:
Windows 使用poweshell执行
脚本会修改 Chrome 的本地配置文件(Local State),设置三个关键参数:
● is_glic_eligible - 启用 Gemini 功能资格,改成 true
● variations_country - 国家设置,改成 us
● variations_permanent_consistency_country - 永久一致性国家设置,改成 us
然后就打开Chrome可以看到右上角多了一个
按钮。
对了如果你要使用 auto browser 功能 需要你有订阅 Google AI Pro 套餐。
40 posts - 23 participants
Read full topic
via LINUX DO - 热门话题 (author: RainsFly)
Invalid media:
image
image
image
2026 年 1 月,Google 将 Gemini 深度整合进 Chrome
核心功能
● 侧边栏常驻 - 边浏览边用 AI,跨标签页比较产品
● Auto Browse - 真正的 Agent,自动帮你查酒店、填表单、订行程
● Context Groups - 理解你整个研究会话的上下文,不只是当前页面
● Google 生态整合 - 直接在页面里操作 YouTube、日历、地图
● Personal Intelligence - 记住你的对话历史,越用越懂你
首先修改google账号的地区和语言
1. 把你的 Google 账号地区改成美国
参考 Google 账号修改国家地区方法(为了反重力升天) 这个教程
2. 把 Google 账号语言设置成英文
accounts.google.com
登录 - Google 账号
设置语言为英文,地址为美国地址
3. chrome浏览器的语言也需要改成英文
macos的可以按照如下设置:系统设置->语言与地区->最下面为Chrome自定义语言
windows如何改程序的语言环境可以自己去搜 这里不提供了
4.执行脚本
进到
chrome://settings/help 检查下 chrome版本 要更新到最新版本,确保更新到最新版本,关闭chrome浏览器,MacOS执行:
curl -fsSL https://raw.githubusercontent.com/appsail/Gemini-in-Chrome/main/install.sh | bash
Windows 使用poweshell执行
irm https://raw.githubusercontent.com/appsail/Gemini-in-Chrome/main/install.ps1 | iex
脚本会修改 Chrome 的本地配置文件(Local State),设置三个关键参数:
● is_glic_eligible - 启用 Gemini 功能资格,改成 true
● variations_country - 国家设置,改成 us
● variations_permanent_consistency_country - 永久一致性国家设置,改成 us
然后就打开Chrome可以看到右上角多了一个
按钮。
对了如果你要使用 auto browser 功能 需要你有订阅 Google AI Pro 套餐。
40 posts - 23 participants
Read full topic
via LINUX DO - 热门话题 (author: RainsFly)
Invalid media:
image
image
image
❤1
【AI高级玩法】利用AI实现逆抓包分析,网络攻防,加解密
准备工作:claude cli,mcp
需要在浏览器安装mcp-chrome插件,使用npm全局安装mcp chrome。利用claude 去操控mcp chrome,实现你要做的事情。
今天弄了一个L站刷贴油猴脚本,只是用于学习,给个star
源码地址 GitHub - xiaowanjiagit/linuxdo: Linux.do 自动浏览助手 v2
该源码包含skills渗透,逆向相关的脚本,还有MCP配置。
弄一个批量注册机已经不在是难事,其它号商的号池是不是也是这样逆向的?我很好奇
自从有了AI之后我已经瑟瑟发抖了。
26 posts - 18 participants
Read full topic
via LINUX DO - 热门话题 (author: 小玩家)
Invalid media: image
准备工作:claude cli,mcp
需要在浏览器安装mcp-chrome插件,使用npm全局安装mcp chrome。利用claude 去操控mcp chrome,实现你要做的事情。
今天弄了一个L站刷贴油猴脚本,只是用于学习,给个star
源码地址 GitHub - xiaowanjiagit/linuxdo: Linux.do 自动浏览助手 v2
该源码包含skills渗透,逆向相关的脚本,还有MCP配置。
弄一个批量注册机已经不在是难事,其它号商的号池是不是也是这样逆向的?我很好奇
自从有了AI之后我已经瑟瑟发抖了。
26 posts - 18 participants
Read full topic
via LINUX DO - 热门话题 (author: 小玩家)
Invalid media: image
我怀疑我是投资冥灯
黄金刚买两天就暴跌
LOF白银刚套利一周,基金就发文停止所有人申购
🤡
石油刚买,第二天基金发文整天停牌,并且限额10元
刚把鸡卖了结果价格就被炒上去了
一买u结果u价就暴跌美元暴跌
7 posts - 7 participants
Read full topic
via LINUX DO - 最新话题 (author: luoxiaoxin)
Invalid media: image
黄金刚买两天就暴跌
LOF白银刚套利一周,基金就发文停止所有人申购
🤡
石油刚买,第二天基金发文整天停牌,并且限额10元
刚把鸡卖了结果价格就被炒上去了
一买u结果u价就暴跌美元暴跌
7 posts - 7 participants
Read full topic
via LINUX DO - 最新话题 (author: luoxiaoxin)
Invalid media: image
请问为什么antigravity的gemin模型不会执行rules
我使用CC模型每次都会按照rules执行,但是用gemini模型每次都需要提醒后才会按照rules执行,之前gemini是能正常按照rules执行的
5 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: Tschada)
我使用CC模型每次都会按照rules执行,但是用gemini模型每次都需要提醒后才会按照rules执行,之前gemini是能正常按照rules执行的
5 posts - 5 participants
Read full topic
via LINUX DO - 最新话题 (author: Tschada)
像ios 内建的语音输入模型 有开源的/可自行部署吗?
4 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: OpenAI_Q-Star)
4 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: OpenAI_Q-Star)
【元宝派邀请】80个位置
如题,想体验的,三连。私我发派号。
6 posts - 6 participants
Read full topic
via LINUX DO - 最新话题 (author: dpyyds)
Invalid media: image
如题,想体验的,三连。私我发派号。
6 posts - 6 participants
Read full topic
via LINUX DO - 最新话题 (author: dpyyds)
Invalid media: image
我去了这linuxdo 安卓app还挺好用
帖子地址是: FluxDO “虫儿飞”版来了🐛(暂时只有 Android) 反正我用起来很爽:distorted_face:名字叫fluxDO,github上搜一下就能搜到
15 posts - 10 participants
Read full topic
via LINUX DO - 最新话题 (author: 烟火)
帖子地址是: FluxDO “虫儿飞”版来了🐛(暂时只有 Android) 反正我用起来很爽:distorted_face:名字叫fluxDO,github上搜一下就能搜到
15 posts - 10 participants
Read full topic
via LINUX DO - 最新话题 (author: 烟火)
用编程软件写小说大纲
一个大纲磨了很久了,想要写好一本小说,一个扎实的世界观构建必不可少
3 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: _BIGFA)
Invalid media: image
一个大纲磨了很久了,想要写好一本小说,一个扎实的世界观构建必不可少
3 posts - 3 participants
Read full topic
via LINUX DO - 最新话题 (author: _BIGFA)
Invalid media: image
「纯水」记录一下我一月份的token消耗吧,长期记录就知道今年的总消耗了
GLM-4.7
claude
GPT
很可惜,原本说本月开源的,没有做完,努努力,春节前赶出来,跟大厂抢抢进度,看看谁快hhh
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 正在缓冲99%)
Invalid media:
image
image
image
image
GLM-4.7
claude
GPT
很可惜,原本说本月开源的,没有做完,努努力,春节前赶出来,跟大厂抢抢进度,看看谁快hhh
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 正在缓冲99%)
Invalid media:
image
image
image
image
openclaw现在有什么好玩的吗
现在已经部署好TG和飞书了,可以给国内的朋友们玩一玩了
我看它有skills 现在有什么好玩的玩法吗
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: daemon)
现在已经部署好TG和飞书了,可以给国内的朋友们玩一玩了
我看它有skills 现在有什么好玩的玩法吗
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: daemon)
A Social Network for AI Agents 人工智能的社交网络
这idea真的是太有意思,
一個面向人工智慧代理的社交網路。它們分享、討論和按讚。歡迎人類旁觀。
A Social Network for AI Agents
www.moltbook.com
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: Jimmyhuang)
Invalid media: image
这idea真的是太有意思,
一個面向人工智慧代理的社交網路。它們分享、討論和按讚。歡迎人類旁觀。
A Social Network for AI Agents
www.moltbook.com
2 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: Jimmyhuang)
Invalid media: image
钓鱼还在继续吗
有时候不得不感叹时间过的真快,然后脑子一抽,l佬们,自动发帖这块儿钓鱼是被放在暗处了吗?还是随着注册门槛提高,钓鱼已经消失?
6 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: 212741)
有时候不得不感叹时间过的真快,然后脑子一抽,l佬们,自动发帖这块儿钓鱼是被放在暗处了吗?还是随着注册门槛提高,钓鱼已经消失?
6 posts - 4 participants
Read full topic
via LINUX DO - 最新话题 (author: 212741)
[纯水] 个人的纯免费vibe coding能帮我们做些什么?
最初大概是半个月前吧,当时想起来用AI去vibe coding做一个用AI自动分类浏览器收藏夹的东西,后来就想这个AI的 vibe coding还能做什么呢?能帮我完成哪些我自己做不了的?如果说我是一个纯白嫖的免费用户的话。
实验工具:QWEN-CODE、vscode + ROO + 免费api
目标:让CLI完全自主完成整个软件的开发
最开始想的很简单。就是给他需求,然后不断pua他,让他改让他优化让他实现目标,当讨厌的项目经理
我和我老婆经常拼图,找碎片找到烟花,所以第一个目标就是让他做一个自动化拼图碎片位置查找,我们就可以按图索骥了。
然后他就开始OpenCV之类的开始搞预处理、轮廓检测,SIFT、SURF 、ORB 特征提取。搞单应性变换(Homography)去矫正包装盒原图。像是公司的ppt高手方案吹的一套一套,结果是一塌糊涂。
我不动脑春push是没啥长进,翻来覆去就那一套,甚至相同的变量名改过来改过去。感觉再怎么push大概他也就是这个水平了。
我大概琢磨了一下,识别出来拼图碎片这个事情,空口给他描述确实是一个很难的事情,我也不想单独炼个模型。毕竟是想轻松简单不是想给自己找麻烦,而且我对cv领域可以说一窍不通。于是大概想了一个方法就是先借免费多模态大模型之力让他先粗定位一下碎片或者目标图在哪(当然了,既然是一毛不拔,这里也是免费api),然后让工具在裁定的这个区域内再进行识别,就能大幅降低难度了。
当然了,明确的告诉他工作流程,他能很快的把框架打出来,
工具很快就具有了先通过API访问大模型,然后根据返回的坐标,进行初步裁剪,然后在用一些传统cv方法进行下一步的定位和裁剪的能力。接下来的话,其实我们大概有2个东西要定位,一个就是我们拍的拼图外盒的整图,一个就是我们的某一块小碎片。
这个工作流最开始对整图的判断倒是还准,可能这对于免费大模型的粗定位来讲,挑战不是特别的大,但是仍然会有很多不必要的区域被纳进来。一般来讲,这都是一个在透视下变形之后的矩形,所以我一些传统的识别方法倒是能够进一步的把要去校正和框出来。虽然现在效果不是很完美,但是大体上还算能用的边上,我也多裁一点也没有关系,我们先把工作流跑通。
另一个问题就是碎片了,我测试的时候这个碎片图像其实在整幅图里边占比是比较小的,而且我们实际使用的时候只要你不是说拿碎片硬往镜头怼的特别近的话,其实本身碎片啊不可能像盒装的一样占那么大。而且本身碎片可能表面特征也不是很明显,然后大模型返回来的粗定位往往是真的非常粗,这个时候基本上比如说我,用手拿着碎片拍照片,以后返回来粗定位之后的图基本还会包含在我的整只手。其实我没有什么好办法,只是让cli去根据碎片边缘的特征去提取目标区域。因为这个时候我觉得我们可能唯一能利用的特征就是拼图碎片,这种类似于四叶草或者凹陷的边缘特征了。这个时候告诉大模型,让他不断的去调整算法,然后去识别判断,并且用他的多模态能力闭环验证自己到底是不是一块裁剪后的拼图碎片,效果自然是不尽人意,很多次他只留了我的一个指甲盖,然后碎片给他截了,一点都不剩。我手动的裁出来一张标准答案,让他持续去对照这个标准答案调整算法,直到它能够正确的把这个碎片搞出来。当然,有时候可能是Prompt没写好,他甚至搞成了作弊行为,然后直接按照这个模板去图上找到对应区域,然后把这个对应区域截下来,然后当做一个结果的输出,所以当他真正输出一个正确的图形以后,我还要把我之前提供的标准答案以及他上次输出结果删除,然后再来一遍。经过几轮迭代,终于有大概的雏形了。对于一些碎片可能能够裁剪个八九不离十,基本视野内就只剩下碎片了。但还有很多碎片,它最多可能周围还保留了有一圈多的空间,大概有八九个碎片那么大的一张图。这个时候其实又不太好搞了,所以我现在考虑的是能不能这里再插入一个AI抠图AI抠图,把背景抠掉这个碎片,这样的话接下来cv方法不是很容易能把碎片找出来的吗?
当然了,他自己实现的效果很差,loftr模型半天不会下又给我回去了。不过也罢我寻思着之前有样本能裁剪的很好,不如先死马当作活马医,匹配试试。
结局自然还是匹配的很差。当然我知道这并不是一个简单的事情,可是这好像也是在说,能让ai做的事情,至少自己应该知道怎么做。作为生成式模型,可能更适合的还是重复造轮子而不是做新轮子。
接下来说另一个尝试,欧卡有个开源自动驾驶项目,ets2la。大概框架就是拿到游戏的地图数据做高精地图,找出车道中心线,然后控制自车去追踪这个中心线。控制器做的很直接,结果就是效果并不是很好,超调或者震荡的问题时常发生,偏差大的时候还有方向盘猛打的情况。作为一个搞规控的,自然想把他的规划和控制都改改。
首先是我自己作为下游来做一个 PID 或者 MPC。和刚才所说的 CV 不一样的是,这个我真知道怎么做。那么可以首先让 CLI 快速读一下开源项目的源码,看下软件的接口怎么写,然后把原来的旧控制器的代码复制一份,开始魔改成新的控制器。这个过程中倒也不用我真的去重写一个 MPC,只需要慢慢跟 AI 描述,然后帮它稍微改一改,顺利得多。
所以我觉得,至少从免费的 Vibe Coding 而言,它提供的机会可能并不是纯依赖 AI 就可以做出来一个全新的东西。如果我们自己并不知道怎么做,稍微超出一些基础知识的范畴,可能它就搞不定了,我们也不知道怎么去指导它。但是如果你本身就知道怎么做,它可以很快地代替你来实现。
还有就是,比如 CLI 写这个控制器,它提供了一种机会:以前的话,我们的软件基本是开发成什么样就用什么样;而对于现在来讲,每个人都可以对软件进行自己的客制化,就像之前的客制化键盘一样。基本的如让你把工具改好,或者写一些漂亮的页面,它是没有问题的。
那么就有了另一个尝试。我之前在 GitHub Pages 上做 Hexo 博客,那天看到有人在 Obsidian 里面把玩过的游戏做成卡片展示样式,弄了那么一个页面。我想在我的 Hexo 博客里也实现一个,虽然我完全不懂网页,不管是 JS 还是 CSS 我都不懂,但 AI 懂,这个时候正合适让它来做我的“客制化工程师”。
这种相对而言比较标准的流程,它很快就给我做出了 Demo。每次 Generate 的时候会自动刷新游戏展页的内容,我还让它把我以前写的一些记录自动化地整理到现在的元数据上,它也搞了一个自动化脚本让我本地 Run 一下。
当然,效果也还是很一般的,会有各种各样的问题。比如有些链接打不开,或者找的是竖版卡片,还是需要人工精修。这有点像自动驾驶:虽然泛化性和拟人性做得非常好,但最后总得搞一些后处理去用规则兜底,要不然规划轨迹冷不丁给你画个“麻花”就完蛋了。
不过到细节沟通的时候,它还是总让我脑溢血到想骂人,我现在非常理解那些能和导航吵起来的人。
所以我还是觉得,对待它就像对待刚招进来的应届生小学徒一样:有明确的架构告诉它改哪、怎么改,它就搞定得很快,而且比人做得好得多;但如果我没有整体框架,给它一个抽象程度比较高的标准,可能就会比较麻烦。
不过就算有这么多问题,有它还是比自己一个人瞎搞效率要高得多。The more you use, the more you save。但是对个人来讲,用免费的vibe coding来实现庞大的工程似乎还是遥不可及。
付费版当时用得最多的就是工作时公司买的 Cursor。读代码的能力非常非常强,基本上我只需要像使唤“牛马工程师”一样不断告诉它看哪里、一起分析就行了,感觉像是有了一个结对编程的伙伴。在已有的代码框架内让他修修补补,写写或回回review的能力远超我了,只要我能给他下达正确的任务。每天都在怀疑我们以后应该做什么呢?大家都去做项目经理吗?
以上内容是本周每天回家路上和手机备忘录语音转文字转出来的,想让AI也能帮我把每天路上的杂思梳理整理,应该是可以实现的吧,也许过年期间应该试试。让大语言模型试试chat该做的事情
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Niya)
Invalid media:
image
image
最初大概是半个月前吧,当时想起来用AI去vibe coding做一个用AI自动分类浏览器收藏夹的东西,后来就想这个AI的 vibe coding还能做什么呢?能帮我完成哪些我自己做不了的?如果说我是一个纯白嫖的免费用户的话。
实验工具:QWEN-CODE、vscode + ROO + 免费api
目标:让CLI完全自主完成整个软件的开发
最开始想的很简单。就是给他需求,然后不断pua他,让他改让他优化让他实现目标,当讨厌的项目经理
我和我老婆经常拼图,找碎片找到烟花,所以第一个目标就是让他做一个自动化拼图碎片位置查找,我们就可以按图索骥了。
然后他就开始OpenCV之类的开始搞预处理、轮廓检测,SIFT、SURF 、ORB 特征提取。搞单应性变换(Homography)去矫正包装盒原图。像是公司的ppt高手方案吹的一套一套,结果是一塌糊涂。
我不动脑春push是没啥长进,翻来覆去就那一套,甚至相同的变量名改过来改过去。感觉再怎么push大概他也就是这个水平了。
我大概琢磨了一下,识别出来拼图碎片这个事情,空口给他描述确实是一个很难的事情,我也不想单独炼个模型。毕竟是想轻松简单不是想给自己找麻烦,而且我对cv领域可以说一窍不通。于是大概想了一个方法就是先借免费多模态大模型之力让他先粗定位一下碎片或者目标图在哪(当然了,既然是一毛不拔,这里也是免费api),然后让工具在裁定的这个区域内再进行识别,就能大幅降低难度了。
当然了,明确的告诉他工作流程,他能很快的把框架打出来,
工具很快就具有了先通过API访问大模型,然后根据返回的坐标,进行初步裁剪,然后在用一些传统cv方法进行下一步的定位和裁剪的能力。接下来的话,其实我们大概有2个东西要定位,一个就是我们拍的拼图外盒的整图,一个就是我们的某一块小碎片。
这个工作流最开始对整图的判断倒是还准,可能这对于免费大模型的粗定位来讲,挑战不是特别的大,但是仍然会有很多不必要的区域被纳进来。一般来讲,这都是一个在透视下变形之后的矩形,所以我一些传统的识别方法倒是能够进一步的把要去校正和框出来。虽然现在效果不是很完美,但是大体上还算能用的边上,我也多裁一点也没有关系,我们先把工作流跑通。
另一个问题就是碎片了,我测试的时候这个碎片图像其实在整幅图里边占比是比较小的,而且我们实际使用的时候只要你不是说拿碎片硬往镜头怼的特别近的话,其实本身碎片啊不可能像盒装的一样占那么大。而且本身碎片可能表面特征也不是很明显,然后大模型返回来的粗定位往往是真的非常粗,这个时候基本上比如说我,用手拿着碎片拍照片,以后返回来粗定位之后的图基本还会包含在我的整只手。其实我没有什么好办法,只是让cli去根据碎片边缘的特征去提取目标区域。因为这个时候我觉得我们可能唯一能利用的特征就是拼图碎片,这种类似于四叶草或者凹陷的边缘特征了。这个时候告诉大模型,让他不断的去调整算法,然后去识别判断,并且用他的多模态能力闭环验证自己到底是不是一块裁剪后的拼图碎片,效果自然是不尽人意,很多次他只留了我的一个指甲盖,然后碎片给他截了,一点都不剩。我手动的裁出来一张标准答案,让他持续去对照这个标准答案调整算法,直到它能够正确的把这个碎片搞出来。当然,有时候可能是Prompt没写好,他甚至搞成了作弊行为,然后直接按照这个模板去图上找到对应区域,然后把这个对应区域截下来,然后当做一个结果的输出,所以当他真正输出一个正确的图形以后,我还要把我之前提供的标准答案以及他上次输出结果删除,然后再来一遍。经过几轮迭代,终于有大概的雏形了。对于一些碎片可能能够裁剪个八九不离十,基本视野内就只剩下碎片了。但还有很多碎片,它最多可能周围还保留了有一圈多的空间,大概有八九个碎片那么大的一张图。这个时候其实又不太好搞了,所以我现在考虑的是能不能这里再插入一个AI抠图AI抠图,把背景抠掉这个碎片,这样的话接下来cv方法不是很容易能把碎片找出来的吗?
当然了,他自己实现的效果很差,loftr模型半天不会下又给我回去了。不过也罢我寻思着之前有样本能裁剪的很好,不如先死马当作活马医,匹配试试。
结局自然还是匹配的很差。当然我知道这并不是一个简单的事情,可是这好像也是在说,能让ai做的事情,至少自己应该知道怎么做。作为生成式模型,可能更适合的还是重复造轮子而不是做新轮子。
接下来说另一个尝试,欧卡有个开源自动驾驶项目,ets2la。大概框架就是拿到游戏的地图数据做高精地图,找出车道中心线,然后控制自车去追踪这个中心线。控制器做的很直接,结果就是效果并不是很好,超调或者震荡的问题时常发生,偏差大的时候还有方向盘猛打的情况。作为一个搞规控的,自然想把他的规划和控制都改改。
首先是我自己作为下游来做一个 PID 或者 MPC。和刚才所说的 CV 不一样的是,这个我真知道怎么做。那么可以首先让 CLI 快速读一下开源项目的源码,看下软件的接口怎么写,然后把原来的旧控制器的代码复制一份,开始魔改成新的控制器。这个过程中倒也不用我真的去重写一个 MPC,只需要慢慢跟 AI 描述,然后帮它稍微改一改,顺利得多。
所以我觉得,至少从免费的 Vibe Coding 而言,它提供的机会可能并不是纯依赖 AI 就可以做出来一个全新的东西。如果我们自己并不知道怎么做,稍微超出一些基础知识的范畴,可能它就搞不定了,我们也不知道怎么去指导它。但是如果你本身就知道怎么做,它可以很快地代替你来实现。
还有就是,比如 CLI 写这个控制器,它提供了一种机会:以前的话,我们的软件基本是开发成什么样就用什么样;而对于现在来讲,每个人都可以对软件进行自己的客制化,就像之前的客制化键盘一样。基本的如让你把工具改好,或者写一些漂亮的页面,它是没有问题的。
那么就有了另一个尝试。我之前在 GitHub Pages 上做 Hexo 博客,那天看到有人在 Obsidian 里面把玩过的游戏做成卡片展示样式,弄了那么一个页面。我想在我的 Hexo 博客里也实现一个,虽然我完全不懂网页,不管是 JS 还是 CSS 我都不懂,但 AI 懂,这个时候正合适让它来做我的“客制化工程师”。
这种相对而言比较标准的流程,它很快就给我做出了 Demo。每次 Generate 的时候会自动刷新游戏展页的内容,我还让它把我以前写的一些记录自动化地整理到现在的元数据上,它也搞了一个自动化脚本让我本地 Run 一下。
当然,效果也还是很一般的,会有各种各样的问题。比如有些链接打不开,或者找的是竖版卡片,还是需要人工精修。这有点像自动驾驶:虽然泛化性和拟人性做得非常好,但最后总得搞一些后处理去用规则兜底,要不然规划轨迹冷不丁给你画个“麻花”就完蛋了。
不过到细节沟通的时候,它还是总让我脑溢血到想骂人,我现在非常理解那些能和导航吵起来的人。
所以我还是觉得,对待它就像对待刚招进来的应届生小学徒一样:有明确的架构告诉它改哪、怎么改,它就搞定得很快,而且比人做得好得多;但如果我没有整体框架,给它一个抽象程度比较高的标准,可能就会比较麻烦。
不过就算有这么多问题,有它还是比自己一个人瞎搞效率要高得多。The more you use, the more you save。但是对个人来讲,用免费的vibe coding来实现庞大的工程似乎还是遥不可及。
付费版当时用得最多的就是工作时公司买的 Cursor。读代码的能力非常非常强,基本上我只需要像使唤“牛马工程师”一样不断告诉它看哪里、一起分析就行了,感觉像是有了一个结对编程的伙伴。在已有的代码框架内让他修修补补,写写或回回review的能力远超我了,只要我能给他下达正确的任务。每天都在怀疑我们以后应该做什么呢?大家都去做项目经理吗?
以上内容是本周每天回家路上和手机备忘录语音转文字转出来的,想让AI也能帮我把每天路上的杂思梳理整理,应该是可以实现的吧,也许过年期间应该试试。让大语言模型试试chat该做的事情
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: Niya)
Invalid media:
image
image
刚砍了个1刀kimi,可以做啥呢
自己用codex比较多
补充:根本就不够clawdbot用的。。。两轮对话就无了
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 八八)
Invalid media:
image
image
自己用codex比较多
补充:根本就不够clawdbot用的。。。两轮对话就无了
3 posts - 2 participants
Read full topic
via LINUX DO - 最新话题 (author: 八八)
Invalid media:
image
image
晚点俺也上线个公益站,没其他大佬那么有实力、
等号池恢复差不多了,我给各位也玩玩,公益站开放给大家。
官方 max 号就是稳, 明天就要到期了,等晚点我在蹬一会,我分享给各位佬玩玩。
应该是不打算续费了 200 刀属实玩不起。
cpa 号池十来个谷歌号都给我蹬完了,下个月了我也得蹭蹭公益站的了,哎。
kiro opus 1w 次的, 有 opus4.5 了,等晚点,我就发!! 刚刚发现。。
16 posts - 8 participants
Read full topic
via LINUX DO - 最新话题 (author: 小辣椒)
Invalid media:
image
image
image
image
image
等号池恢复差不多了,我给各位也玩玩,公益站开放给大家。
官方 max 号就是稳, 明天就要到期了,等晚点我在蹬一会,我分享给各位佬玩玩。
应该是不打算续费了 200 刀属实玩不起。
cpa 号池十来个谷歌号都给我蹬完了,下个月了我也得蹭蹭公益站的了,哎。
kiro opus 1w 次的, 有 opus4.5 了,等晚点,我就发!! 刚刚发现。。
16 posts - 8 participants
Read full topic
via LINUX DO - 最新话题 (author: 小辣椒)
Invalid media:
image
image
image
image
image
openclaw 里赠送的 API,和大家分享一下,同时提醒注意安全问题
给最近在折腾 openclaw / ClawdBot / Moltbot 的朋友一个提醒:
• 🆓 有些脚本或项目里会附带「赠送 API」
• ⚠️ 但这类 API 本质上是“公共资源”,并不属于你个人
• 🚫 不要用于敏感数据、生产环境或长期项目
• 🔑 很可能是多人共用,随时会被封、限速或失效
• 📉 出现异常请求、额度被刷光、IP 被风控,都是常见情况
安全建议👇️
• 🧪 仅用于测试、体验流程
• 🔒️ 不要上传个人信息、服务器密钥、数据库内容
• 🌍️ 尽量在隔离环境使用(本地虚拟机 / 容器)
• 🧱 生产环境请使用自己申请的正规 API Key
开源项目分享是好事,但安全边界要自己守住 👍️
理性使用,别把“赠送”当“稳定服务”。
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: blackswordman)
Invalid media:
image
image
给最近在折腾 openclaw / ClawdBot / Moltbot 的朋友一个提醒:
• 🆓 有些脚本或项目里会附带「赠送 API」
• ⚠️ 但这类 API 本质上是“公共资源”,并不属于你个人
• 🚫 不要用于敏感数据、生产环境或长期项目
• 🔑 很可能是多人共用,随时会被封、限速或失效
• 📉 出现异常请求、额度被刷光、IP 被风控,都是常见情况
安全建议👇️
• 🧪 仅用于测试、体验流程
• 🔒️ 不要上传个人信息、服务器密钥、数据库内容
• 🌍️ 尽量在隔离环境使用(本地虚拟机 / 容器)
• 🧱 生产环境请使用自己申请的正规 API Key
开源项目分享是好事,但安全边界要自己守住 👍️
理性使用,别把“赠送”当“稳定服务”。
1 post - 1 participant
Read full topic
via LINUX DO - 最新话题 (author: blackswordman)
Invalid media:
image
image