Data Science by ODS.ai 🦜
49.7K subscribers
395 photos
43 videos
7 files
1.54K links
First Telegram Data Science channel. Covering all technical and popular staff about anything related to Data Science: AI, Big Data, Machine Learning, Statistics, general Math and the applications of former. To reach editors contact: @haarrp
Download Telegram
​​Martin Calvino's AI-inspired art is such an evoking meta-narrative of "art imitating tech imitating art"

https://www.martincalvino.co/paintings

#ai #art #abstract
​​Philosopher AI β€” website to generate text with #GPT3

Tool to generate text on different topics. Sensible topics such as sex, religion or even nationality are blocked.

Great way to spread the awareness on #ai and to show nontechnical friends that #Skynet is not a problem to be concerned with yet.

Website: https://philosopherai.com/philosopher/humanity-on-mars-73ac00

#nlu #nlp
State of AI Report 2022 - ONLINE.pdf
22.9 MB
State of AI Report 2022

TLDR: We are moving forward and effective international collaboration is the key to progress.

Major Themes:

* New independent research labs are rapidly open sourcing the closed source output of major labs
* Safety is gaining awareness among major AI research entities
* The China-US AI research gap has continued to widen
* AI-driven scientific research continues to lead to breakthroughs

Website: https://www.stateof.ai

#report #stateofai #AI
Forwarded from Kirill from TOP
Some might have wondered what application will #Midjourney and #ChatGPT have.

What products will creators to build with them?

Here is one of examples of such human-AI collaboration β€” short illustrated story on TikTok having millions of views.

https://vt.tiktok.com/ZS8MENP51/

#AI_tools
Left picture is one generated by #Midjourney with a bell curve with mu = 18 sigma = 4 request.

Right one was generated with a bell curve with mu = 18 sigma = 1 request.

Looks like Midjourney is not aware of concept of distributions yet.

#AI #AGI #vizualization
Forwarded from Kirill from TOP
GPT-3 for self-therapy

Just came across an interesting article about using #GPT-3 to analyze past journal entries and summarize therapy sessions for gaining new perspectives on personal struggles. Dan Shipper loaded person journal into the neural network so he could ask different questions, including asking about his own Myers-Briggs personality type (INTJ for those who wondered).

It's a powerful example of how AI tools can help individuals become more productive, effective, and happy. As we continue to see the integration of #AI in various industries, it's important for modern blue collar workers to learn how to properly work with these tools in order to stay at the peak of efficiency.

Let's embrace the future and learn to use AI to our advantage rather than to spread FUD about AI replacing workforce. It won’t but it will enable some people to achieve more and be way more productive.

Link: https://every.to/chain-of-thought/can-gpt-3-explain-my-past-and-tell-me-my-future

#aiusecase #toolsnotactors
​​ReBotNet: Fast Real-time Video Enhancement

The authors introduce a novel Recurrent Bottleneck Mixer Network (ReBotNet) method, designed for real-time video enhancement in practical scenarios, such as live video calls and video streams. ReBotNet employs a dual-branch framework, where one branch focuses on learning spatio-temporal features, and the other aims to enhance temporal consistency. A common decoder combines the features from both branches to generate the improved frame. This method incorporates a recurrent training approach that utilizes predictions from previous frames for more efficient enhancement and superior temporal consistency.

To assess ReBotNet, the authors use two new datasets that simulate real-world situations and show that their technique surpasses existing methods in terms of reduced computations, decreased memory requirements, and quicker inference times.

Paper: https://arxiv.org/abs/2303.13504
Project link: https://jeya-maria-jose.github.io/rebotnet-web/

A detailed unofficial overview of the paper: https://andlukyane.com/blog/paper-review-rebotnet

#deeplearning #cv #MachineLearning #VideoEnhancement #AI #Innovation #RealTimeVideo
πŸ”₯ Say Goodbye to LoRA, Hello to DoRA 🀩🀩

DoRA consistently outperforms LoRA with various tasks (LLM, LVLM, etc.) and backbones (LLaMA, LLaVA, etc.)

[Paper] https://arxiv.org/abs/2402.09353
[Code] https://github.com/NVlabs/DoRA

#Nvidia
#icml #PEFT #lora #ML #ai

@opendatascience
Forwarded from Machinelearning
🌟 FoleyCrafter: ГСнСрация Π·Π²ΡƒΠΊΠΎΠ²Ρ‹Ρ… эффСктов для Π±Π΅Π·Π·Π²ΡƒΡ‡Π½Ρ‹Ρ… Π²ΠΈΠ΄Π΅ΠΎ.

FoleyCrafter - ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠ°, разработанная для автоматичСского создания Π·Π²ΡƒΠΊΠΎΠ²Ρ‹Ρ… эффСктов, синхронизированных с Ρ†Π΅Π»Π΅Π²Ρ‹ΠΌ видСорядом
АрхитСктура ΠΌΠ΅Ρ‚ΠΎΠ΄Π° построСна Π½Π° основС ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΠ±ΡƒΡ‡Π΅Π½Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ прСобразования тСкста Π² Π°ΡƒΠ΄ΠΈΠΎ (Text2Audio). БистСма состоит ΠΈΠ· Π΄Π²ΡƒΡ… ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ΠΎΠ²:

πŸŸ’Π‘Π΅ΠΌΠ°Π½Ρ‚ΠΈΡ‡Π΅ΡΠΊΠΈΠΉ Π°Π΄Π°ΠΏΡ‚Π΅Ρ€ - ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½Ρ‹Π΅ слои cross-attention для обусловливания Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ Π°ΡƒΠ΄ΠΈΠΎ Π½Π° основС Π²ΠΈΠ΄Π΅ΠΎΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ². ВыполняСт сСмантичСскоС соотвСтствиС Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΠ΅ΠΌΡ‹Ρ… Π·Π²ΡƒΠΊΠΎΠ² Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½ΠΎΠΌΡƒ ΠΊΠΎΠ½Ρ‚Π΅Π½Ρ‚Ρƒ.
πŸŸ’Π’Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»Π»Π΅Ρ€ - Π΄Π΅Ρ‚Π΅ΠΊΡ‚ΠΎΡ€ Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠΊ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΈ прСдсказываСт ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Ρ‹ Π·Π²ΡƒΠΊΠ° ΠΈ Ρ‚ΠΈΡˆΠΈΠ½Ρ‹ Π² Π²ΠΈΠ΄Π΅ΠΎ. Π’Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ Π°Π΄Π°ΠΏΡ‚Π΅Ρ€ синхронизируСт Π°ΡƒΠ΄ΠΈΠΎ с Π²ΠΈΠ΄Π΅ΠΎ Π½Π° основС выставлСнных Π΄Π΅Ρ‚Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠΊ.

Оба ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Π° ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΎΠ±ΡƒΡ‡Π°Π΅ΠΌΡ‹ΠΌΠΈ модулями, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°ΡŽΡ‚ Π²ΠΈΠ΄Π΅ΠΎ Π² качСствС Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… для синтСза Π°ΡƒΠ΄ΠΈΠΎ. ΠŸΡ€ΠΈ этом модСль Text2Audio остаСтся фиксированной для сохранСния Π΅Π΅ способности ΠΊ синтСзу Π°ΡƒΠ΄ΠΈΠΎ постоянного качСства.

Π Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΈ FoleyCrafter ΠΏΡ€ΠΎΠ²Π΅Π»ΠΈ количСствСнныС ΠΈ качСствСнныС экспСримСнты Π½Π° Π½Π°Π±ΠΎΡ€Π°Ρ… Π΄Π°Π½Π½Ρ‹Ρ… VGGSound ΠΈ AVSync15 ΠΏΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°ΠΌ сСмантичСского соотвСтствия MKL, CLIP Score, FID ΠΈ Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ синхронизации Onset ACC, Onset AP.
По ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΌΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌΠΈ Text2Audio (SpecVQGAN, Diff-Foley ΠΈ V2A-Mapper) FoleyCrafter ΠΏΠΎΠΊΠ°Π·Π°Π» Π»ΡƒΡ‡ΡˆΠΈΠ΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹.

▢️ Π›ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ запуск с использованиСм GradioUI:


# Clone the Repository
git clone https://github.com/open-mmlab/foleycrafter.git

# Navigate to the Repository
cd projects/foleycrafter

# Create Virtual Environment with Conda & Install Dependencies
conda create env create -f requirements/environment.yaml
conda activate foleycrafter

# Install GiT LFS
conda install git-lfs
git lfs install

# Download checkpoints
git clone https://huggingface.co/auffusion/auffusion-full-no-adapter checkpoints/auffusion
git clone https://huggingface.co/ymzhang319/FoleyCrafter checkpoints/

# Run Gradio
python app.py --share


πŸ”— Π›ΠΈΡ†Π΅Π½Π·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅: Apache-2.0


πŸ”—Π‘Ρ‚Ρ€Π°Π½ΠΈΡ†Π° ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π°
πŸ”—Arxiv
πŸ”—ΠœΠΎΠ΄Π΅Π»ΠΈ Π½Π° HF
πŸ”—Demo
πŸ”—Github [ Stars: 272 | Issues: 4 | Forks: 15]

@ai_machinelearning_big_data

#AI #Text2Audio #FoleyCrafter #ML
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
⚑️ ControlNet ProMax: ОбновлСниС Π½Π°Π±ΠΎΡ€Π° ControlNet++ для Stable Diffusion XL.

ControlNet++ - это Π½Π°Π±ΠΎΡ€ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ControlNet, собранный Π½Π° Π½ΠΎΠ²ΠΎΠΉ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅ ΠΈ ΡƒΠΏΠ°ΠΊΠΎΠ²Π°Π½Π½Ρ‹ΠΉ Π² ΠΎΠ΄ΠΈΠ½ Π΅Π΄ΠΈΠ½Ρ‹ΠΉ Ρ„Π°ΠΉΠ» Π±Π΅Π· нСобходимости ΡΠΊΠ°Ρ‡ΠΈΠ²Π°Ρ‚ΡŒ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ прСпроцСссоры ΠΈ Π½Π°Π±ΠΎΡ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.

ОбновлСниС ProMaΡ… Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ Π² сСбя вСсь ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΉ Π½Π°Π±ΠΎΡ€ ControlNet Union, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π±Ρ‹Π»ΠΈ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½Ρ‹ возмоТности ΠΊΠΎΠΌΠ±ΠΈΠ½Π°Ρ†ΠΈΠΈ Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… Ρ‚ΠΈΠΏΠΎΠ² ControlNet ΠΊ ΠΎΠ΄Π½ΠΎΠΌΡƒ исходному ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΡŽ ΠΈ Π½ΠΎΠ²Ρ‹Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Tile Deblur, Tile Superresolution, Tile Variation, Inpaint ΠΈ Outpaint.

C ΡƒΡ‡Π΅Ρ‚ΠΎΠΌ обновлСния, Π½Π°Π±ΠΎΡ€ ControlNet ProMax выполняСт 12 Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ΠΈ 5 Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊ рСдактирования ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ:

🟒Openpose. ΠžΡ†Π΅Π½ΠΈΠ²Π°Π΅Ρ‚ ΠΈ Π°Π½Π½ΠΎΡ‚ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Π΅ Ρ‚ΠΎΡ‡ΠΊΠΈ Π½Π° Ρ‚Π΅Π»Π΅, Π»ΠΈΡ†Π΅ ΠΈ Ρ€ΡƒΠΊΠ°Ρ… Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°, выполняСт ΠΊΠΎΠΌΠΏΠ»Π΅ΠΊΡΠ½ΡƒΡŽ ΠΎΡ†Π΅Π½ΠΊΡƒ ΠΏΠΎΠ·Ρ‹;
🟒Depth. ΠŸΡ€Π΅Π΄Π½Π°Π·Π½Π°Ρ‡Π΅Π½ для Π·Π°Π΄Π°Ρ‡ ΠΎΡ†Π΅Π½ΠΊΠΈ Π³Π»ΡƒΠ±ΠΈΠ½Ρ‹;
🟒Бanny. ΠžΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Π΅Ρ‚ края Π½Π° изобраТСниях с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Π΄Π΅Ρ‚Π΅ΠΊΡ‚ΠΎΡ€Π° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Canny;
🟒Lineart. Π˜Π·Π²Π»Π΅ΠΊΠ°Π΅Ρ‚ ΠΊΠΎΠ½Ρ‚ΡƒΡ€Ρ‹ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΈΠ· ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, Π² частности для создания рСалистичного воспроизвСдСния с ΡƒΡ‚ΠΎΡ‡Π½Π΅Π½ΠΈΠ΅ΠΌ Ρ‚ΠΎΠ»Ρ‰ΠΈΠ½ ΠΊΠΎΠ½Ρ‚ΡƒΡ€ΠΎΠ²;
🟒AnimeLineart. Π˜Π·Π²Π»Π΅ΠΊΠ°Π΅Ρ‚ ΠΊΠΎΠ½Ρ‚ΡƒΡ€Ρ‹, Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€Π½Ρ‹Π΅ для Ρ‚Π΅Ρ…Π½ΠΈΠΊ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… Π² Π°Π½ΠΈΠΌΠ΅;
🟒MLSD (Mobile Line Segment Detection). ВыдСляСт Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Π΅ структуры;
🟒Scribble. ΠžΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Π΅Ρ‚ Π½Π΅Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ ΠΈ Π½Π΅Ρ€ΠΎΠ²Π½Ρ‹Π΅ Π»ΠΈΠ½ΠΈΠΈ. Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для ΠΈΠΌΠΈΡ‚Π°Ρ†ΠΈΠΈ рисунков, ΠΏΠΎΡ…ΠΎΠΆΠΈΡ… Π½Π° скСтчи;
🟒HED (Holistically-Nested Edge Detection). Π˜Π·Π²Π»Π΅ΠΊΠ°Π΅Ρ‚ Π»ΠΈΠ½ΠΈΠΈ с мягкими краями. Он ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π΅Ρ‚ изобраТСния, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡƒΡΠΈΠ»ΠΈΡ‚ΡŒ ΠΈΠ»ΠΈ ΠΈΠ·ΠΎΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ особСнности Π»ΠΈΠ½ΠΈΠΉ для Π·Π°Π΄Π°Ρ‡, Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‰ΠΈΡ… Π΄Π΅Ρ‚Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ обнаруТСния ΠΊΡ€Π°Π΅Π² ΠΈΠ»ΠΈ Π»ΠΈΠ½ΠΈΠΉ;
🟒Pidi (Softedge). ВыдСляСт Π»ΠΈΠ½ΠΈΠΈ мягких ΠΊΡ€Π°Π΅Π² с использованиСм ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² PiDiNet. Π•Π³ΠΎ Ρ†Π΅Π»ΡŒ - ΡƒΠ»ΡƒΡ‡ΡˆΠΈΡ‚ΡŒ Π·Π°Π΄Π°Ρ‡ΠΈ Π°Π½Π°Π»ΠΈΠ·Π° ΠΈ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΈ ΠΏΡ€Π΅Π΄ΠΎΡΡ‚Π°Π²ΠΈΡ‚ΡŒ ΡƒΡ‚ΠΎΡ‡Π½Π΅Π½Π½Ρ‹Π΅ исходныС Π΄Π°Π½Π½Ρ‹Π΅ для дальнСйшСй ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΈΠ»ΠΈ Π°Π½Π°Π»ΠΈΠ·Π°;
🟒TEED. Π˜Π·Π²Π»Π΅ΠΊΠ°Π΅Ρ‚ Π»ΠΈΠ½ΠΈΠΈ мягких ΠΊΡ€Π°Π΅Π² с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ‚Π΅Ρ…Π½ΠΈΠΊΠΈ TEDDetector;
🟒Segment. ВыполняСт Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½ΡƒΡŽ ΡΠ΅Π³ΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΡŽ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΈ ΠΈΡ… частСй;
🟒Normal. Π‘ΠΎΠ·Π΄Π°Π΅Ρ‚ ΠΊΠ°Ρ€Ρ‚Ρƒ Π½ΠΎΡ€ΠΌΠ°Π»Π΅ΠΉ Π½Π° основС Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½ΠΎ-Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ· Π³Π»ΡƒΠ±ΠΈΠ½Ρ‹;
🟠Tile Deblur. УстраняСт Ρ€Π°Π·ΠΌΡ‹Ρ‚ΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ Π°Π½Π°Π»ΠΈΠ·Π° Π½Π°Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… ΠΏΠ»ΠΈΡ‚ΠΎΠΊ (Tiles) Π·Π°Π΄Π°Π½Π½ΠΎΠ³ΠΎ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° (ΠΎΡ‚ 64Ρ…64 Π΄ΠΎ 1024Ρ…1024);
🟠Tile Variation. Π“Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΠ΅Ρ‚ Π²Π°Ρ€ΠΈΠ°Ρ†ΠΈΠΈ с нСбольшим ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ΠΌ Π² дСталях ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ Tiles;
🟠Tile Super Resolution. ΠšΡ€Π°Ρ‚Π½ΠΎ ΠΏΠΎΠ²Ρ‹ΡˆΠ°Π΅Ρ‚ Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ Π°Π½Π°Π»ΠΈΠ·Π° Π½Π°Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Ρ… ΠΏΠ»ΠΈΡ‚ΠΎΠΊ;
🟠Inpainting. ЗамСняСт ΠΈΠ»ΠΈ добавляСт ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π½Π° ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰Π΅Π΅ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅;
🟠Outpainting. Π Π°ΡΡˆΠΈΡ€ΡΠ΅Ρ‚ Π³Ρ€Π°Π½ΠΈΡ†Ρ‹ изобраТСния, сохраняя ΠΎΠ±Ρ‰ΡƒΡŽ ΠΊΠΎΠΌΠΏΠΎΠ·ΠΈΡ†ΠΈΡŽ.

Π’ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅ ControlNet++ Π±Ρ‹Π»ΠΈ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Ρ‹ Π΄Π²Π° Π½ΠΎΠ²Ρ‹Ρ… модуля: Condition Transformer ΠΈ Control Encoder, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΡƒΠ»ΡƒΡ‡ΡˆΠ°ΡŽΡ‚ прСдставлСниС ΠΈ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΡƒ условий Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ.
ΠšΠ°ΠΆΠ΄ΠΎΠΌΡƒ ΡƒΡΠ»ΠΎΠ²ΠΈΡŽ назначаСтся ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€ Ρ‚ΠΈΠΏΠ° управлСния, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ прСобразуСтся Π² эмбСддинги.
Condition Transformer позволяСт ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Ρ‚ΡŒ нСсколько условий ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΎΠ΄ΠΈΠ½ ΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊ ΠΈ Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ слой трансформСра для ΠΎΠ±ΠΌΠ΅Π½Π° ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠ΅ΠΉ ΠΌΠ΅ΠΆΠ΄Ρƒ исходным ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ΠΌ ΠΈ условными изобраТСниями.
Condition Encoder ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΠ²Π°Π΅Ρ‚ количСство ΠΊΠ°Π½Π°Π»ΠΎΠ² свСртки для ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΡ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ способности, сохраняя ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»ΡŒΠ½ΡƒΡŽ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρƒ.
Π’Π°ΠΊΠΆΠ΅ Π±Ρ‹Π»Π° использована Сдиная стратСгия обучСния, которая ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π»Π° ΡΡ…ΠΎΠ΄ΠΈΠΌΠΎΡΡ‚ΡŒ для ΠΎΠ΄ΠΈΠ½ΠΎΡ‡Π½Ρ‹Ρ… условий ΠΈ управляла слияниСм мноТСствСнных условий, ΠΏΠΎΠ²Ρ‹ΡˆΠ°Ρ ΡƒΡΡ‚ΠΎΠΉΡ‡ΠΈΠ²ΠΎΡΡ‚ΡŒ сСти ΠΈ Π΅Π΅ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ ΠΊ Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ качСствСнных ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ.

▢️Набор ControlNet Pro Max ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ использован ΠΊΠ°ΠΊ Π² Π²ΠΈΠ΄Π΅ консольного инфСрСнса, Ρ‚Π°ΠΊ ΠΈ Π² интСрфСйсС ComfyUI, Π³Π΄Π΅ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠ°ΠΌΠΈ Π±Ρ‹Π»ΠΈ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½Ρ‹ Π½Π°Π±ΠΎΡ€Ρ‹ Π½ΠΎΠ΄ для Ρ€Π°Π±ΠΎΡ‚Ρ‹ с модСлями ControlNet.
ControlNet Pro Max ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅Ρ‚ Ρ€Π°Π±ΠΎΡ‚Ρƒ с любой Π³Π΅Π½Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ модСлью сСмСйства Stable Diffusion XL. ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° сСмСйства Stable Diffusion 3 находится Π² Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅.


πŸ“ŒΠ›ΠΈΡ†Π΅Π½Π·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ : Apache-2.0 license


🟑МодСль на HF
πŸ–₯Github [ Stars: 1.4K | Issues: 31 | Forks: 22]


@ai_machinelearning_big_data

#AI #ControlNet #ML #Diffusers #SDXL
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM