linux.do
21.5K subscribers
123K photos
199 videos
122 files
259K links
linux.do最新话题和热议话题
Download Telegram
有没有在用gpt开发ios应用的佬

这个客户端UI各位佬都是怎么解决的,这个UI写的甚至可以说是简陋(还不如AI味呢)。尝试过先用image2生成的图片作为设计图然后让他写,但可能是我拆设计风格的能力还比较差(有没有什么好的办法或者skill能帮忙拆的),同时gpt也不能完全还原图内容,两个加在一起最后的结果就很差了。想问问各位佬是怎么解决的

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: lelele1)
免费试用 Google AI Pro 4 个月,还剩7个席位,需要的佬友自取吧

accounts.google.com

登录 - Google 账号

7 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: carmycar)
有入金N26成功的佬嘛?

用fait24信用卡充值,后面弹出一个你的银行卡资金不足,可是我刚充值的23欧元在fiat24卡里啊,在fiat24里面也能看到余额,怎么回事呀?🫥

6 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: wow)
感觉能不抽奖就不要抽奖啊

之前抽奖随便回复了一下,被禁言了,今天终于放出来了😭

10 个帖子 - 7 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 温雅)
pixel小号拉家庭组

用小号搞了个pixel的google one一年,然后大号和小号的归属地都是一个地方,但是小号发邀请后,还是显示大号和小号不在一个国家/地区,用的也是该国家的节点,都是美国,就很神奇,有佬知道怎么解决吗

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: ljhxka)
linux开发环境选择困难

佬友们,最近有任务说是要开发ros,之前一直是玩单片机的,倒也用过wsl2里面的Ubuntu,但似乎不是原生的Ubuntu。
老东西也有留文档,说是使用virtualbox装个Ubuntu得了。
我现在在想要不要去整个双系统,也正好有100G的盘空出来可以利用利用
还有一个方案是去整个linux开发板,但似乎这个好像不如虚拟机?
有没有佬友懂一点,初学有没有必要去整一个双系统

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 孤独小偷哐哐喵)
公司给了codex的api

但是使用记录、聊天记录在管理这些key的人那里完全可见的 有没有办法隐藏呢感觉没招

5 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: zzzdonks)
本地使用cc和cx请教

目前都是自己开号自用为主,租赁了海外伪家宽服务器,在上面部署cpa然后本地直连使用cx。

但是如果现在想同时使用cc是不是这个方案就行不通了会被检测到封号?

一个合理的方案是不是在那台服务器上部署代理,然后本地clash写规则连cx和cc(不懂)

求佬解惑

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: gjx1)
所以 Google 收购 Windsurf 的目的是什么?

为了使用 Codex 把 Windsurf 改成 Codex 吗? 😅

2 个帖子 - 2 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: uhnmkio)
如何低价保一个海外手机号

各位佬,最近由于codex要接码了,而接码网感觉都用不了,我现在好不容易白嫖个plus,但是codex登陆不了,必须接码,我试了很久没一个成功的。

所以我在想有必要去搞个海外手机号吗,短期来看我可以去接codex的码,但是长期来看好像又没什么用。目前gemini给我推荐了一个gifgaff一个google voice,但是我都没有找到渠道。想知道各位佬的看法。🤔

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: w1at)
矿龙飞店铺被封了

矿龙飞背景:靠卖矿卡和二手显卡起家
今年进军一手全新显卡(但大多为海外版-仅店保)
自5.15日开始(520&618活动)截至今日,抖音显卡销量榜第一,销售额超过5000w元
主要销售近期热门显卡:
5060ti-8g-2198(发抖音积攒100个再减100),可以说是全网史低中的史低
昨天(5.19日),21点左右直播突然中断,抖音店铺商品被全部下架,然后官方账号发了这个公告,要召回显卡,而且已经很多人反馈,显卡快递一落地就被召回了

目前知道的消息是,资金被冻结了,如果你也买了他家显卡,并且已经用上了,别退,退了之后抖音给你退不出来钱,本来我当时也是下单了的,但是2天没发货,就退了。收到货的就安心用吧,显卡没那么容易坏,而且还是新卡

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: lynn)
大四下过了 3 个月了也找不到工作,想请教一下大佬们能不能帮忙看一下

我是专升本上来的,感觉自己水分其实挺严重的,20-21 疫情那段时间开始接触服务器什么的,搭建网站,学着怎么运维,也是小小的开了两个几万人的网盘 qwq,然后到从 23,24 年左右的时候开始接触 AI 编程,然后到现在,感觉现在也只会 Vibe Coding 了,真正手敲代码已经是 21 年左右的时候了,还是刚刚高考完弄的,也在思考要不要踏踏实实学一门语言下来。

然后最近在研究开发 Agent,正在 Vibe Coding 一个,准备在简历加进去,看看能不能有更多出路。

下面是简历咪,麻烦大佬们看看有没有可以需要修改的或者优化的部分,也想请教一下我这样的找什么工作比较适合。

碎碎念,可以不用点开看喵 (点击了解更多详细信息)
1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 是小绵羊咩)
佬友那边彩礼多少呢

今天520,镇上有对刚领证一个月的分了,男的阳痿,女方提的分,彩礼60多w,男方拿回20w,金首饰和其他的,一点没拿回

6 个帖子 - 4 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Henrer)
有没有佬用atomicmail邮箱啊

有没有人用这个邮箱呀,最近还能打开嘛,🥹

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Hunk66)
自用中转站,求服务器推荐

佬友们,想搭一个自用的中转站,有没有推荐的服务器,腾讯云的这个可以吗

5 个帖子 - 5 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: 海鱼v)
账号存在风险提示怎么解决

因为这个,抢pipi佬的邀请码的时候,卡死我了,然后进来还要过一边cf,是节点太拉了的原因吗?有没有什么推荐的机场
1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Amiya_desi)
[开源/硬核] 2.4k小时干翻100万小时?我们开源了一个颠覆大规模硬怼的音频分离数据集 Hive

各位佬友,今天给大家分享一个我们团队最近刚中/刚放出来的硬核工作:Hive 一个用于通用声音分离(Universal Sound Separation, USS)的高纯度、语义一致性合成数据集。

一句话总结这个工作的含金量:用它训练的模型,仅用 ~0.2% 的数据量,在零样本(Zero-shot)通用声音分离任务上,硬刚并平替了 Meta 等大厂用 100 万小时数据堆出来的音频大模型(如 SAM-Audio)。

● 项目主页 & 试听 Demo: https://cslikai.cn/Hive/
● ArXiv 论文: https://arxiv.org/abs/2601.22599

----------------------

为什么要做这个?

玩过 AI 音频分离(比如把一段视频里的环境音、狗叫、下雨声单独剥离出来)的佬友应该知道,目前主流的做法和 LLM 一样:大力出奇迹。把网上的油管视频、各种野外录音(In-the-wild)打包几个 T 直接喂给模型。

但这里面有一个巨大的上下文欺骗(Co-occurrence Bias)
比如下雨的音频里通常自带风声或雷声。模型没那么聪明,它会误以为“风声”也是“雨声”的一部分。当你让它单独分离“雨声”时,它就把风声也当作雨声给一起吐出来了,分离不干净。
既然大厂喜欢用百万小时的脏数据“力大砖飞”,那我们就决定走另一条路:把数据纯度做到极致

----------------------

我们是怎么做的?(自动化洗数据流水线)

我们设计了一套完全自动化的数据清洗和高保真合成管线(Pipeline),直接对 12 个主流开源音频数据集进行了“降维打击式”的清洗:

1. 标签重构 (Ontology Pruning):基于 AudioSet 的 474 个类目,精简合并掉模糊的、纯环境描述的标签,提炼出 283 个真正物理可分离的声音类目。
2. 多模态清洗 (Polyphony Detection):直接调用 Qwen3-Omni 等多模态大模型进行 Zero-shot 声音排他性审计,把含有杂音、多声源重叠的脏片段全部卡掉,只留绝对纯净的单声源(Single-event)。
3. 超分辨率标准化 (Super-Resolution):利用 Apollo 模型,把各种参差不齐的低采样率音频全部无损重构放大到全局 44.1 kHz
4. 语义一致性混合 (Semantic Mixing):用大模型生成声音共存逻辑矩阵。绝对不干“让一条深海鱼在赛车场里叫”这种反逻辑的乱混,确保合成出来的多声源 Mixture 完全符合现实物理场景。

最终,我们整出了 2,442 小时的高纯度原始音频,并合成出了包含 2 到 5 种并发声音的 19.6M 个混合片段(总计 ~22.4k 小时数据集)。

----------------------

我们把经典的判别式模型(AudioSep)和生成式模型(FlowSep)放在 Hive 上从头训练,然后去硬怼那些巨型大模型,结果非常震撼:

● 数据效率狂飙 500 倍:在三方盲测集(USS-Bench、MUSDB18-HQ 音乐分离)上,Hive 训练的模型指标不仅远超原版 AudioSep(14k小时训练),甚至在感知质量(FAD)和语义贴合度上打平或超越了用 1,000,000(100万)小时训练的 8B 参数地表最强模型 SAM-Audio
● 打破“作弊码”:在密集的 5 种声音混杂极端场景下,Hive 模型依然有极强的鲁棒性,不会因为没有环境暗示就两眼一抹黑。
● 更低的部署成本:生成式模型虽然好,但推理动辄几万 MACs 还要吃 32G 显存。有了 Hive 的高质量监督信号,用极小的判别式网络(比如 200M 参数量级)就能跑出高品质音频,部署到软路由、Edge 设备或边缘 CPU 上实时跑完全成为了可能

----------------------

开源

代码、论文和数据集已经全线放出来了。
如果你是对 语音增强、智能音频剪辑、游戏音效提取、AR/VR 听觉渲染 感兴趣的技术佬,或者单纯想看热闹、听听分离对比效果的,欢迎去我们的 Demo 页面 踩踩。

欢迎各位佬友盖楼调戏、Star、提 Issue!有关于音频大模型、数据清洗管线、多模态音频打标技术的问题,随时在帖子里拍我,知无不言!

1 个帖子 - 1 位参与者

阅读完整话题

via LINUX DO - 最新话题 (author: Kai Li (李凯))