黑洞资源笔记
75.5K subscribers
19.4K photos
886 videos
970 files
16.5K links
Download Telegram
如何使用Stable Diffusion实现文字生成视频 | link | #教程

stable-diffusion-art出的一套教程,分别讲解了AnimateDiff、ModelScope、Deforum的安装流程和用法。
2
Media is too big
VIEW IN TELEGRAM
将YouTube打造为你的专属英语学习教室。

这是个Chrome插件,能够显示双语字幕,提供便捷的查词和收藏功能,便于提升词汇量。同时,可以打开或者关闭翻译字幕,方便练习英语听力

EnglishXYZ | #插件
👍9🤔2
Micros Culpture:这个网站收集了大量的可放大查看各种昆虫细节的高清效果图
👍13
This media is not supported in your browser
VIEW IN TELEGRAM
Project IDX:一个基于 AI 的浏览器开发环境(集成 AI,支持全栈编程语言,跨平台真机预览,一键部署)| 详文 | 申请地址
Forwarded from hodo-Course Combination
1
Google更新了闲置帐号政策

“从 2023年12月1日开始,Google 会删除闲置帐号以及其中的所有内容。”
👍8👎3
英伟达提供了一个 AI PlayGround ,免费使用,速度很快。支持4种AI工具:
NeVA:具备视觉的LLM,能根据图片聊天。
SD XL:免费使用SD XL进行绘画,默认种子是1,手动改成-1。
CLIP:图片识别和物体检测。
LLaMa 2:在线使用LLaMa 2 聊天。
👍8
AudioCraft Plus:Audiocraft是一个用于音频生成深度学习研究的 PyTorch 库,包含了最先进的EnCodec音频压缩器,以及MusicGen,一个简单且可控的音频生成模型。

AudioCraft Plus 是原版 AudioCraft 的一体化 WebUI,在其基础上添加了许多优质功能。

AudioGen 模型
多波段扩散
定制模型支持
生成元数据和音频信息选项卡
单声道转立体声
多重提示/带结构提示的提示分段
视频输出定制
音乐延续
👍2
VirtualWife - 一个虚拟主播项目,目前支持在B站进行直播,用户可以自由更换VRM人物模型,可将其作为一个虚拟主播入门demo,在上面扩展自己喜欢的功能。
👍1
一个可以用来打造个人数字形象的深度学习模型工具,仅需要提供最低三张照片即可获得独属于自己的个人形象数字替身

FaceChain由阿里达摩院开发。使用了多个模型,包括面部检测模型、图像旋转模型、人体解析模型、肤色修饰模型等。

算法介绍:

训练阶段: 输入用户上传的清晰面部区域图像,输出Face LoRA模型。通过一系列的图像处理和模型微调,获取高质量的面部训练图像,并获得面部LoRA模型。

推断阶段: 基于面部LoRA模型和样式LoRA模型生成个人肖像图像,然后进一步改善肖像图像的面部细节。

你可以通过FaceChain的Python脚本或熟悉的Gradio界面训练你的数字孪生模型并生成照片,也可以直接通过ModelScope Studio体验FaceChain。

FaceChain | #工具
😱5👍2
Media is too big
VIEW IN TELEGRAM
用AI生成高质量电子书

视频教程:Youtube | B站
在线阅读:link | #教程
👍4
基于canvas/svg的在线富文本编辑器

canvas-editor | #编辑器
基于Stable Diffusion XL的免费的离线文本图像生成软件

Fooocus 包含并自动化了许多内部优化和质量改进。用户可以忘记所有那些困难的技术参数,只享受人与计算机之间的交互,“探索新的思维媒介,扩展人类的想象力”。

Fooocus 简化了安装。在按下“下载”和生成第一张图像之间,所需的鼠标点击次数严格限制在 3 次以内。最低 GPU 内存要求为 4GB (Nvidia)。

Fooocus | #工具
🎄4
企业定制LLM应用构建方案,将内部知识库作为模型的上下文,即作为提示的一部分,通过Fine-Tuning开源LLM,或者检索增强生成(RAG)的方式。性能取决于许多因素,如块的大小、块之间的重叠、嵌入技术等 | blog
This media is not supported in your browser
VIEW IN TELEGRAM
Baserun:该测试平台可帮助开发者快速可靠地发布LLM应用,支持从提示测试场景到端到端测试,使用 baserun 的 SDK 可以在测试过程中监控 LLM 特性和智能体行为,在生产环境中监控其行为。

平台提供了全面的端到端测试和用户流程可视化,方便比较测试运行结果、编辑提示并重新运行测试。
👍1
FAn是一个开放集、多模态的实时机器人系统,能通过文本、图像或点击等方式检测、追踪和跟随任意目标,具有灵活适应、实时处理和高效优化的优势。
👍1
一个自动化工具,可以评估生成图像中的人物,对图像的真实性和合理性进行审查,还可以确保图像与提示相符,自动检测不适内容。

Rubbrband | #工具
1
This media is not supported in your browser
VIEW IN TELEGRAM
Obsidian Importer 1.1 推出,可以更轻松地将数据转换为持久的纯文本文件,供永久离线访问。可与Notion、Bear、Google Keep、Evernote和HTML文件文件夹配合使用
👍21
一个来自于「聪明的阅读者」整理的通识类的书单,包括了各个领域的知识和理解,其中分成了最小 50 本,以及完整的 1000+ 书籍整理 | Excel
👍22
国外高质量视频课程:Crash Course,中文字幕。| YouTube
17