黑洞资源笔记
76.7K subscribers
19.7K photos
895 videos
962 files
16.7K links
Download Telegram
❤‍🔥4👎2👍1🔥1😁1
如何找到 NVIDA GTC 视频的字幕内容,其实也适用于大部分在线视频的 srt/vtt 字幕。

1. 打开 Chrome 开发工具,然后刷新网页(确保字幕是在开发工具打开后加载的)
2. 开启视频字幕,拖放到有字幕的位置,找一个比较特别一点的字幕单词(更容易搜索到)
3. 再开发工具中切换到“Source”,在 “Top” 上点右键,选择“Search In All Files”
4. 输入关键字,然后按回车
5. 从下面的列表找到相应的字幕文件,双击打开,就可以将内容复制出来,保存成 .srt 或者 .vtt 格式的文件
利用 AI 进行实时语音绘图 | Livestory | #工具

该工具将传统的提示词输入换成了语音输入,帮你实时生成图像,做到语音控制绘图。

使用到的技术框架,如下:

- WhisperCPP(实时语音转文本)
- SDXL Turbo on Coreweave(图像生成模型)
- LCM (different versions) on Replicate(加速图像生成)

目前代码已经开源,感兴趣的可以部署使用。
👍51
Arcee 的 MergeKit:用于合并大型语言模型的工具包 | paper

提出MergeKit,一个开源、模块化、可扩展的模型合并库,使研究人员和实践者可以高效地合并预训练语言模型,从而创造出性能更优异、适应范围更广的新模型。
研究人员设计了一种低成本的模型参数提取攻击,可针对商业语言模型API恢复部分关键参数,提醒需要警惕模型泄露风险,并采取适当防御措施。| paper
👍1
TagGUI:用于快速添加和编辑图像标签和描述的跨平台桌面应用,旨在为生成器式 AI 模型(如 Stable Diffusion)创建图像数据集,支持自动生成描述。

特征
键盘友好的界面,可快速标记
根据您自己最常用的标签自动完成标签
集成稳定扩散令牌计数器
使用 CogVLM、LLaVA、WD Tagger 等模型自动生成标题和标签
可选择加载 4 位自动字幕模型以减少 VRAM 使用
批量标签操作,对标签进行重命名、删除、排序等操作
高级图像列表过滤
👍3🤯1😇1😎1
Media is too big
VIEW IN TELEGRAM
MoneyPrinterTurbo - 利用大模型,一键生成短视频

只需提供一个视频主题或关键词,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。

功能特性 🎯
1.完整的 MVC架构,代码 结构清晰,易于维护,支持API和Web界面
2.支持视频文案 AI自动生成,也可以自定义文案
3.支持多种 高清视频 尺寸
-竖屏 9:16,1080x1920
-横屏 16:9,1920x1080
4.支持批量视频生成,可以一次生成多个视频,然后选择一个最满意的
5.支持视频片段时长设置,方便调节素材切换频率
6.支持中文和英文视频文案
7.支持多种语音合成
8.支持字幕生成,可以调整字体、位置、颜色、大小,同时支持字幕描边`设置
9.支持背景音乐,随机或者指定音乐文件,可设置背景音乐音量
10.视频素材来源无版权问题

后期计划 🚀
1.优化语音合成,利用大模型,使其合成的声音,更加自然,情绪更加丰富
2.增加视频转场效果,使其看起来更加的流畅
3.优化视频素材的匹配度
8👍4👏1❤‍🔥1😇1
WavCraft:基于 LLM 的音频内容创作和编辑 Agent,通过连接各种音频专家模型和 DSP 函数,实现音频内容的创建和编辑
👍2👏1🤯1🤩1👌1❤‍🔥1😎1
This media is not supported in your browser
VIEW IN TELEGRAM
npx lumentis:用单个命令从转录文本和非结构化信息生成精美的文档
❤‍🔥21
简洁易用的 Python 测试调试工具,可帮助追踪代码执行过程并使用自然语言回溯代码状态,以便在代码运行期间查看其状态。

Leaping | #工具
😎21🔥1🥰1
gpt-investor:一个实验性投资分析Agent,利用 Claude 3 Opus 和 Haiku 模型提供给特定行业股票的全面分析和推荐。

工作流程
●生成指定行业主要公司的股票代码列表
●检索每家公司的历史价格数据、资产负债表、财务报表和新闻文章
●对新闻文章进行情绪分析以衡量市场情绪
●检索每家公司的分析师评级和价格目标
●进行行业和部门分析,以了解市场趋势和竞争格局
●生成所选公司与其同行之间的比较分析
●根据综合分析为每家公司提供最终的投资建议,包括价格目标
●根据投资吸引力对行业内的公司进行排名
7🤯2👍1❤‍🔥1
ReverserAI:通过使用本地大语言模型 (LLM),自动推荐函数名称,帮用户进行软件逆向工程

核心特点
离线操作:完全在本地CPU/GPU上运行LLM,确保数据隐私和安全。

自动函数命名:从反编译器输出中自动建议具有语义意义的函数名称。

Binary Ninja 集成:作为插件与 Binary Ninja 无缝集成。

模块化架构:专为轻松扩展而设计,以支持 IDA 和 Ghidra 等其他逆向工程工具。

消费类硬件兼容性:经过优化,可在消费级硬件(例如 Apple 芯片架构)上运行。
6👍3😎2🥰1🤯1😍1❤‍🔥1
轻量Python框架,类似于 React,使用组件的方式构建 HTML 页面。它与 htmx.org框架集成在一起,无需编写大量 JavaScript,可以与 Starlette框架一起使用。

Ludic | #框架
😇42🥰1😍1😎1
Devika:基于开源的 AI 软件工程师,可以理解人类的高级指令,并根据这些指令,分解成步骤,进行相关信息的研究,并编写代码实现目标。

Devika的系统架构由以下关键组件组成:

用户界面:基于网络的聊天界面,用于与 Devika 交互、查看项目文件以及监控代理的状态。
Agent Core:编排AI规划、推理和执行过程的核心组件。它与各种子代理和模块通信以完成任务。
大型语言模型:Devika 利用Claude、GPT-4和Ollama 的本地 LLM等最先进的语言模型进行自然语言理解、生成和推理。
规划和推理引擎:负责将高层目标分解为可操作的步骤,并根据当前环境做出决策。
研究模块:利用关键字提取和网页浏览功能来收集当前任务的相关信息。
代码编写模块:根据计划、研究结果和用户需求生成代码。支持多种编程语言。
浏览器交互模块:使 Devika 能够根据需要导航网站、提取信息并与 Web 元素交互。
知识库:存储和检索项目特定信息、代码片段和学到的知识,以便高效访问。
数据库:保存项目数据、代理状态和配置设置。
👍53❤‍🔥3👏1🤯1🤩1