标题: 一个很简单的基于Gemini API的视频总结工具
作者: #NothingToSay
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1233964
时间: 2025-11-28 22:52:27
摘要:
作者: #NothingToSay
板块: #开发调优
编号:
1233964帖子: https://linux.do/t/topic/1233964
时间: 2025-11-28 22:52:27
摘要:
AI自动生成笔记的B站-YouTube视频总结小工具 - 个人玩具分享
从阅读到视觉笔记的个人效率探索
分享一个我在效率探索路上的小玩具——一个基于大模型的视频总结工具。
它不是一个成熟的产品,而是我个人LLM辅助学习工作流的最新一步实践。
心路历程:从阅读到视频的效率迁移
大概半年前,我开始尝试用 LLM 来辅助我阅读硬核资料。我的策略是:先让 AI 提取主干脉络,再带着问题和结构去阅读冗长的原文。 事实证明,这能极大地提升效率。
比如这篇对《Real-Time Rendering, Fourth Edition》的章节总结:Chapter 11 Global Illumination。
最近,我决定把这套行之有效的方法迁移到视频学习 中。
最初的用法很简单:
用工具提取视频字幕稿。
将字幕稿喂给 Gemini进行总结。
带着这份总结稿(提前知晓视频要讲什么 ),去观看视频。
这样可以:
定向加速/跳过 视频中已了解的部分。
提前理解 复杂概念的背景,降低认知门槛。
减少“口音折磨” ,集中精力于内容本身。
效果让我感到满意,比如这些游戏引擎相关的笔记:Delta_UFSH2025,GAMES104 07。
进阶:如何让总结“看得见”
纯文字总结仍然有局限性。如果想要做到单纯看笔记,就能快速了解到讲座的大部分内容,截图和画面必不可少的。
但这部分做起来很复杂,充满了权衡:
上下文长度和成本的博弈:
我发现,输入给 Gemini 的文本长度控制在 10 分钟视频量 左右时,总结效果最好,细节保留完整。再长,AI 就会开始省略。
最理想的做法是把带时间戳的 SRT 字幕全丢给 AI,让它自己挑关键时间点截图。不过一方面这样上下文多了,不知道效果会怎么样,另一方面我心疼token()。
“权衡”之后的 HACK 做法:
我退而求其次,写了一个比较 Hack 的版本,实现了目前对我来说“够用”的效果:
步骤一:切片总结。 将视频字幕切割成多段(每段 3-10 分钟效果都还不错,可以根据个人需要进行调节),对每段分别进行 Gemini 总结
标题: 快哭了,怎么设置或者禁止Chrome的AI模式
作者: #松坂砂糖
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1233968
时间: 2025-11-28 22:53:56
摘要:
作者: #松坂砂糖
板块: #开发调优
编号:
1233968帖子: https://linux.do/t/topic/1233968
时间: 2025-11-28 22:53:56
摘要:
习惯了Tab补全URL+Enter进入,结果不知道哪个神人给Chrome搞出一个鬼模式,Tab+Enter进入AI模式。
折磨我一星期了。
怎么关闭这东西太烦人了……
标题: 江湖救急!!!windsurf切号报错
作者: #baixiaochong
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1233977
时间: 2025-11-28 22:55:53
摘要:
作者: #baixiaochong
板块: #开发调优
编号:
1233977帖子: https://linux.do/t/topic/1233977
时间: 2025-11-28 22:55:53
摘要:
另外还有一种报错
Permission denied: internal server error: error number 12 (error ID: ba5e0f6c55ba4087887dcb95b91b0e4e)
有佬友知道这种情况如何解决吗?退出登录,用过站里的重置工具,然后也还是一样的无效。
标题: windsurf的学生6.9刀怎么薅的?
作者: #星渊清梦
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/1233981
时间: 2025-11-28 22:56:49
摘要:
作者: #星渊清梦
板块: #福利羊毛
编号:
1233981帖子: https://linux.do/t/topic/1233981
时间: 2025-11-28 22:56:49
摘要:
试了几个edu邮箱注册都还是15刀,是必须要以edu结尾的邮箱才行吗,edu.xx结尾的是不是用不了,以及现在还能弄到合适的邮箱吗
标题: 来看看顶级AI大佬对于 AI的一场关于AI泡沫和AGI的讨论
作者: #unsafetrait
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1233988
时间: 2025-11-28 22:59:13
摘要:
作者: #unsafetrait
板块: #搞七捻三
编号:
1233988帖子: https://linux.do/t/topic/1233988
时间: 2025-11-28 22:59:13
摘要:
感谢UP主 Akinokoe 的分析和总结。
标题: 非常怀疑微信新的语音输入有AI
作者: #欣欣|林可欣
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1233992
时间: 2025-11-28 22:59:58
摘要:
作者: #欣欣|林可欣
板块: #搞七捻三
编号:
1233992帖子: https://linux.do/t/topic/1233992
时间: 2025-11-28 22:59:58
摘要:
当然也可能是固定智能算法
我也不太懂呢
标题: Sollin | 一个在线音乐播放器客户端
作者: #氯雷他定
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1234001
时间: 2025-11-28 23:01:24
摘要:
作者: #氯雷他定
板块: #开发调优
编号:
1234001帖子: https://linux.do/t/topic/1234001
时间: 2025-11-28 23:01:24
摘要:
整合了网易云、QQ音乐、酷我、酷狗、咪咕五大平台。
界面参考了 Apple Music 的设计,支持深色模式,看着舒服。该有的功能都有:歌词同步、歌单管理、播放历史。
无在线账号功能,采用本地数据存储方式,支持数据导出导入。
下载地址(蓝奏):
安装版:https://mirentu.lanzoub.com/i7olr3ceqbfc
绿色版:https://mirentu.lanzoub.com/iP1Vp3ceqesd
目前仅打包了Windows,过段时间打包macOS。安卓和ipa看后续。
*音乐接口由 @sayqz 提供,非常感谢付出!
演示图片:*
标题: 请问现在修改视频的ai ,能满足把固定机会修改成微微手动机位的ai 用哪个??
作者: #老王
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1234005
时间: 2025-11-28 23:02:24
摘要:
作者: #老王
板块: #搞七捻三
编号:
1234005帖子: https://linux.do/t/topic/1234005
时间: 2025-11-28 23:02:24
摘要:
我想到一个需求,就是拍抖音自拍,我是放在三脚架上固定机位拍“自己”。
是否有ai ,可以把视频加入抖动形成类似于 “手持机位拍摄”, 这样会有一点点自然的抖动,看起来更加舒服。
标题: 请问大佬们AI驱动的Python处理调研数据的问题
作者: #edawrz
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1234010
时间: 2025-11-28 23:03:59
摘要:
作者: #edawrz
板块: #开发调优
编号:
1234010帖子: https://linux.do/t/topic/1234010
时间: 2025-11-28 23:03:59
摘要:
盲目跟风搞了好多会员kiro,v0,antigravity等平台,是不是这些平台适合写前端?而我这个人工智能驱动的Python,最合适的软件是cursor吗?还有其他匹配我需求的平台吗?
标题: QQ重大bug
作者: #SSS.SS
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1234011
时间: 2025-11-28 23:04:12
摘要:
作者: #SSS.SS
板块: #搞七捻三
编号:
1234011帖子: https://linux.do/t/topic/1234011
时间: 2025-11-28 23:04:12
摘要:
QQ灰度测试版本,可以运行任意js代码
想玩的话我晚点找个方式贴个安装包
标题: 公益项目寻志同道合的伙伴
作者: #菜狗图图
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1234013
时间: 2025-11-28 23:04:19
摘要:
作者: #菜狗图图
板块: #开发调优
编号:
1234013帖子: https://linux.do/t/topic/1234013
时间: 2025-11-28 23:04:19
摘要:
公益项目寻志同道合的伙伴
网盘项目,寻找志同道合的伙伴!
纯公益!资金我这边提供!
有兴趣可以私我!
取文件网盘&取文件 这个项目
一直公益的一个项目,可以了解一下
标题: vscode是否有高效的differ插件
作者: #stevessr
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1234014
时间: 2025-11-28 23:04:28
摘要:
作者: #stevessr
板块: #开发调优
编号:
1234014帖子: https://linux.do/t/topic/1234014
时间: 2025-11-28 23:04:28
摘要:
内置才3.1MB的json直接就累趴下了
我要裂开了
标题: 推荐给大家一首歌《看着你看着他》动力火车
作者: #yang shuo
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1234024
时间: 2025-11-28 23:10:07
摘要:
作者: #yang shuo
板块: #搞七捻三
编号:
1234024帖子: https://linux.do/t/topic/1234024
时间: 2025-11-28 23:10:07
摘要:
这首歌在刚才随机播放的时候获取到的,动力火车的少见的前面有点R&B味道,但是后面又很抒情摇滚,给我听哭了,分享给大家
标题: google family
作者: #SenseHu
板块: #福利羊毛
编号:
帖子: https://linux.do/t/topic/1234030
时间: 2025-11-28 23:12:17
摘要:
作者: #SenseHu
板块: #福利羊毛
编号:
1234030帖子: https://linux.do/t/topic/1234030
时间: 2025-11-28 23:12:17
摘要:
前几天通过 教育优惠订阅上了 google one, 昨天拉了3个账号进家庭组共享 Gemini pro, 当时还用了2次, 今天突然发现家庭成员的Gemini pro 订阅掉了, 但是司机的还在, 这啥情况
标题: 如何降级 iOS / iPadOS App
作者: #Haibara
板块: #开发调优
编号:
帖子: https://linux.do/t/topic/1234036
时间: 2025-11-28 23:15:31
摘要:
作者: #Haibara
板块: #开发调优
编号:
1234036帖子: https://linux.do/t/topic/1234036
时间: 2025-11-28 23:15:31
摘要:
起因是发现 Wakeup 课程表更新后被塞入了一大堆冗余功能(搜题、提示登录等),本来想去官方反馈一下好歹给一个关闭的选项,结果到了 QQ 频道发现此 App 已经被售出并商业化,只能自己设法回退版本。
谷歌搜索之后,得到了如下解决方法,在此记录一下,方便以后使用。
ipatool
首先,下载 ipatool:
brew install ipatool
然后,执行登录:
ipatool auth login -e <your_apple_id_email>
随后输入提示和 2FA 码,完成登录:
9:52PM INF email=<your_apple_id_email> name="Your Name" success=true
使用 search 命令搜索你想要降级的 App:
ipatool search <app_name>
此例中,搜索:
ipatool search Wakeup --format json
得到如下 JSON 结果:
{
"level": "info",
"count": 5,
"apps": [
{
"id": 1553402284,
"bundleID": "com.wakeup.schedule",
"name": "WakeUp课程表-超级好用的课程表",
"version": "6.0.80",
"price": 0
},
// ...
],
"time": "2025-11-28T22:21:57+08:00"
}
很明显,第一个是我们要的,记录下来他的 bundleID,也即 com.wakeup.schedule。
使用 list-versions 命令列出该 App 的所有版本
ipatool list-versions -b com.wakeup.schedule --format
标题: 分享一个推特上看到的大香蕉图片增强提示词
作者: #vfx
板块: #搞七捻三
编号:
帖子: https://linux.do/t/topic/1234041
时间: 2025-11-28 23:16:35
摘要:
作者: #vfx
板块: #搞七捻三
编号:
1234041帖子: https://linux.do/t/topic/1234041
时间: 2025-11-28 23:16:35
摘要:
可以把flux2dev出图虚化人物的脚都给拯救回来,真就是赛博神医.
“将这张图片转换成最完美、最逼真、最高端的版本。
在保持原有主题、氛围和风格的同时,巧妙地增强所有内容:
去除噪点、颗粒感、压缩伪影、运动模糊和相机抖动
修复焦点,恢复丢失的细节,提高清晰度和微对比度
以自然锐利的方式细化边缘、纹理和细节(头发、胡须、织物、物体、表面),绝不生硬。
在保持真实纹理和材质触感的同时,清洁并平滑图像。
如果有人物,请巧妙地调整面部特征、嘴部和表情,改善姿势和体态,使其呈现最自然、最讨喜的效果,并根据需要修正比例和解剖结构。
如果是场景、产品或风景照,请整理背景,去除视觉杂乱元素,并适当改善构图和取景。
校正色彩、白平衡和对比度,营造丰富而自然的电影质感
添加柔和的编辑风格灯光,营造优美的景深、柔和的光晕以及平衡的高光和阴影。
将图像放大至超高分辨率,边缘清晰锐利,画面完美清晰
使最终效果看起来像一张经过专业修饰的超逼真编辑图片,给人以高端、现代且可立即分享的感觉。”