LinuxDo 新帖推送
193 subscribers
255K photos
319K links
Download Telegram
标题: 在没法逃避人工校对的情况下,继续死磕自动化流程和AI质量还有意义吗
作者: #alizoed
板块: #搞七捻三
编号: 1617188
帖子: https://linux.do/t/topic/1617188
时间: 2026-02-15 13:02:03
摘要:
我一直在弄一个输入视频然后输出精美字幕的项目
最开始就很简单的,用whisper直出,然后人工切,差不多能打个30分,顶多省去自己听的步骤
后来了解后用上whisperX,后来换到stable-ts,感觉有个70分,起码很多地方只需要切开,不需要自己划范围了
然后后来有看到一个项目,试了一下那个项目,是:音频分离-人声分离-whisperX听写-NLP分句-标点分句-连词分句-LLM分句-AI分块粗翻-AI分块润色-对齐-输出,这时候就感觉有个85分的意思,你要是要求很低的话,直接给人看也没问题了
之后在这个项目基础上魔改了很多,一点点往上加功能,一开始把whisperX换成stable-ts,然后开启VAD,后来加上人声频段识别,再后来又加声学对齐,然后又打算力大砖飞把什么标点分句,NLP分句,连词分句统统换成LLM分句,感觉有个95分的意思了
这几天,尤其是开源后,又改了很多,现在最后的流程
音频分离-人声分离-whisper第一次听写-LLM修正专有名词听写错误-stable-ts对齐-mfa对齐-超过1.5s停顿强行分句-NLP分句-修正NLP将专有名词分到两行-LLM分句-分块并发翻译-全文一次润色-译文二次断句-对齐-输出,现在感觉是有99分了
但是那1分就永远膈应着人,比如有一句话
has got like 20,000 miles on or something like that on a full charge,
285 miles of range with the off road tires.
实际上应该为
has got like 20,000 miles on or something like that
on a full charge, 285 miles of range with the off road tires.
这种的实际上除非LLM本身能传入时间戳信息判断,唯一的方案就是去反复微调那个“超过1.5s停顿强行分句”这里的参数1.5,它最后可能取0.9最好,也可能1.1最好,很难说
但是我最终不可能把未经校对的字幕真的端上来发,所以就导致我在纠结到底要不要再死磕调参
标题: 续大专人工智能那篇帖子(2)
作者: #Ke Ji
板块: #开发调优
编号: 1617189
帖子: https://linux.do/t/topic/1617189
时间: 2026-02-15 13:02:17
摘要:
嗯,看了很多人的评论,其实我自己心里也很清楚,我知道人工智能这个专业,专科其实没有啥用,其实我内心想的是,提升提升自己的能力,然后对以后就业有个不错的选择,我在学校没有参加任何学生会,和社团,也没有任何职位,
现在就是心里很慌,因为时间很快,我不知道以后要干什么,
结合了几个佬友说的 专升本 写开源项目 提升自己的英语, 和自身写代码能力,
主打一个听劝,我也不玩游戏, ,那我要继续参加老师推荐的比赛吗,挑战杯等等,
我会听劝 学英语,和补代码基础, 至于写项目,我目前感觉我太菜了,估计写不出来,‘’
上一篇帖子:我大专,人工智能专业,如何规划给点建议
标题: :fire:【大模型系列23】关于gemini-3-pro-deepthink新版,你想知道的一切【长期更新】
作者: #dwqxq1
板块: #文档共建
编号: 1617191
帖子: https://linux.do/t/topic/1617191
时间: 2026-02-15 13:03:32
摘要:
介绍
官网:Gemini 3 Deep Think: AI model update designed for science
.Gemini Deep Think: Redefining the Future of Scientific Research — Google DeepMind
评测
官方自评



Chat渠道
必须Ultra会员,$250/月,头三月半价$125,可以家庭组6人用,额度独立
每天可用10次
L站拼车¥一百多/月
API渠道:未开放
标题: 玩积木还得是玩乐高呀
作者: #猫猫团子
板块: #搞七捻三
编号: 1617197
帖子: https://linux.do/t/topic/1617197
时间: 2026-02-15 13:07:34
摘要:
人生这么大,第一次玩正版乐高,手感太丝滑了,终于明白为什么卖得这么贵了
希望我和佬友们能像这个招财猫肚子上写的那样“年入千万两”
标题: 现在有能过hcpatcha的人工打码网站吗
作者: #谢谢不吃香菜
板块: #开发调优
编号: 1617205
帖子: https://linux.do/t/topic/1617205
时间: 2026-02-15 13:09:49
摘要:
我找了好多好像支持hcap的好少,基本上recap
标题: 我来抄作业!大家移动端 写代码 都用的啥方案啊 急急急!!!
作者: #pawa
板块: #开发调优
编号: 1617211
帖子: https://linux.do/t/topic/1617211
时间: 2026-02-15 13:12:13
摘要:
求作业抄 o.O
之前了解过一些比如 happy alma
但是都没深度用过
想直接看看佬们怎么解决的
能用 cc codex 这些 o.O
急急急 马上到家 准备 coding
标题: 这个年,从凑热闹开始
作者: #md5
板块: #活动
编号: 1617214
帖子: https://linux.do/t/topic/1617214
时间: 2026-02-15 13:12:49
摘要:
过年了,过两天去老婆家,总得带点东西吧。
早上去山姆买了点水果礼盒什么的,人真多啊。
标题: 我愿称终末地为我见过优化最差的游戏(
作者: #550W
板块: #搞七捻三
编号: 1617215
帖子: https://linux.do/t/topic/1617215
时间: 2026-02-15 13:13:08
摘要:
(我拿着终末地去烤我的三星S21,fps的时候高帧率高画质都没问题
(结果终末地60fps中画质跑了一会图告诉我:终末地使您的手机过热,已将其自动关闭,您稍后可以重新打开它
好家伙w……
标题: 【内购限免】 All To Live - 实况动态壁纸制作器
作者: #zoops
板块: #福利羊毛
编号: 1617221
帖子: https://linux.do/t/topic/1617221
时间: 2026-02-15 13:16:00
摘要:
实况照片(Live Photo)制作与编辑工具,集视频转换、AI特效、动态壁纸制作于一体。无论是想把喜欢的视频做成锁屏壁纸,还是让静态照片动起来,都能轻松实现。




App Store





All To Live-Live Wallpapers App - App Store

Download All To Live-Live Wallpapers by 海岸 徐 on the App Store. See screenshots, ratings and reviews, user tips, and more apps like All To Live-Live Wallpapers.












限免三天,原价 $7.99
标题: openrouter是不是比较靠谱
作者: #Ben2008
板块: #开发调优
编号: 1617223
帖子: https://linux.do/t/topic/1617223
时间: 2026-02-15 13:16:24
摘要:
opus 4.6?
标题: 开始摸索怎么领老马的低保了,X创作者收益
作者: #旺仔仙贝
板块: #搞七捻三
编号: 1617225
帖子: https://linux.do/t/topic/1617225
时间: 2026-02-15 13:17:44
摘要:
冷启动了一周,开了蓝V,好像是要3个月内500万展示量,现在170万了,粉丝每天少量增加,纯当朋友圈刷了。
标题: 邀请码查找问题
作者: #Simshen
板块: #运营反馈
编号: 1617235
帖子: https://linux.do/t/topic/1617235
时间: 2026-02-15 13:20:32
摘要:
邀请页面不小心关掉了生成的邀请码在哪能看到
标题: 有人研究过 Notion AI 是怎么低价开通的吗
作者: #1st
板块: #福利羊毛
编号: 1617237
帖子: https://linux.do/t/topic/1617237
时间: 2026-02-15 13:20:57
摘要:
看到淘宝闲鱼有低价的 notion ai 在卖,是什么渠道,如果能便宜搞定,是不是能反代出来用
标题: GPT-5.2-Pro vs Gemini-3-pro-deepthink 评测转载: 两者在严谨数学证明层面仍然存在比较多的问题
作者: #ZHEN
板块: #前沿快讯
编号: 1617239
帖子: https://linux.do/t/topic/1617239
时间: 2026-02-15 13:25:05
摘要:
codeberg.org





FirstProofSolutionsComments.pdf












这里有对佬们平常能接触到的研究级主流模型 GPT-5.2-Pro 以及 Gemini-3-pro-deepthink的简单评测。(但只是定性观察,不存在打分或者排名或者胜负结论)
简单而言,使用两者完成第一手证明还是存在较大的抽卡和幻觉。这和我平常使用GPT-5.2-Pro讨论科研问题的感受是一样的;有时突然不知道哪里冒出来的推导以及结论,但是仔细推导会发现不够严谨(或者说漏了条件),好像模型是通过某种联想得到的结论而不是严格reasoning. Gemini-3-pro-deepthink我没有尝试过,但是就gemini系列模型的幻觉来看,或许还要比GPT更差。
在文章中也确实是这么讲的,Gemini相比于GPT会更加笃定地给出所谓的完整证明(但实际上中间会存在很多严重幻觉和漏洞);而GPT更加保守以及严谨,遇到真的不会的问题,就承认自己确实无法完成,并且给出能够完成的部分证明.
当然模型也可能给出比较优美的证明,但是也是看概率。
标题: 新年到了,也不知道咋祝贺,就祝各位佬友们新年大吉吧
作者: #Pre
板块: #福利羊毛
编号: 1617247
帖子: https://linux.do/t/topic/1617247
时间: 2026-02-15 13:30:14
摘要:
抽奖主题: [新年到了,也不知道咋祝贺,就祝各位佬友们新年大吉吧]
奖品详情: 京东E卡10元*1张
活动时间:
Sun, Feb 15, 2026 1:30 PM CST→Mon, Feb 16, 2026 1:30 PM CST
(明天是除夕,有点忙,结束后会晚一些抽奖和发放,所以实际结束时间不定时,但不早于13点30分)
参与方式:
在本帖下回复任意的新年新春祝福。
(必须是新年新春祝福噢,抽中不是的话就顺延到是的为止)
抽奖规则:
使用官方抽奖工具随机抽取中奖者。
注意事项:
本活动将在活动截止时间后关闭回帖,以确保公正性。
中奖者将在活动结束后24小时内(大概)在本帖公布,并通过私信发送奖品。
奖品自行去京东APP兑换,本人不提供任何质保、售后。
所有规则及抽奖结果由活动发起人和论坛管理团队最终解释。