Derp Learning – Telegram

Derp Learning

13.1K subscribers

3.18K photos

916 videos

9 files

1.32K links

Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.

Download Telegram

About

Blog

Apps

Platform

13.1K subscribers

Forwarded from AbstractDL

This media is not supported in your browser

VIEW IN TELEGRAM

GradInit: перебор гиперпараметров оптимизатора и warmup больше не нужны (by Google)

В гугл предложили супер крутой универсальный architecture-agnostic метод инициализации весов моделей.

Идея очень простая: добавить множители перед каждым блоком параметров и запустить по ним несколько итераций оптимизации лосса. Дальше эти множители фиксируем и учим модель как обычно. Такая инициализация не зависит от глубины и типа архитектуры (работает и на резнетах и на трансформерах) и почти полностью решает проблему взрывающихся\затухающих градиентов.

В итоге отпадает необходимость в переборе гиперпараметров оптимизатора, а трансформер вообще получилось обучить без warmup’a, что считалось практически невозможным. Как бонус, такая инициализация даёт небольшой буст на многих бенчмарках (и картиночных и текстовых).

Статья, GitHub

1.01K views18:04

Forwarded from эйай ньюз

This media is not supported in your browser

VIEW IN TELEGRAM

Отвал башки! Тут пацаны из гугла обучили NERF на RAW фотках. Получается просто башенного качества рендеринг HDR изображений. Можно менять экспозицию, фокус. Вы только посмотрите на получаемый эффект боке в ночных сценах!

Дополнительное преимущество этого метода перед обычным нерфом - это то, что он хорошо работает на шумных снимках с малым освещением. За счет того, что информация агрегируется с нескольких фотографий, метод хорошо справляется с шумом и недостатком освещения, превосходя специализированные single-photo denoising модели.

Статью ознаменовали как NeRF in the Dark: High Dynamic Range View Synthesis from Noisy Raw Images. Ну, разве что кода еще нет.

Сайт проекта | Arxiv

828 views04:30

Forwarded from AbstractDL

This media is not supported in your browser

VIEW IN TELEGRAM

🔥MTTR: End-to-End Text Referring Video Object Segmentation

Представлена новая SOTA в сегментации объектов на видео по их текстовому описанию. Качество просто невероятное!

Модель основана на мультимодальном трансформере, в который подаются фичи от текстового энкодера (RoBERTa) и видео энкодера (Video Swin). Примечательно, что в отличие от предыдущих решений, обучение здесь end2end — sequence prediction problem.

P.S. Авторы опубликали и код, и веса моделей 👍

Статья, GitHub

1.09K views11:10

It's face2arcane time!

1.23K views11:25

Face2arcane. Пока полет нормальный.

1.28K views23:14

Forwarded from PHYGITAL+CREATIVE

This media is not supported in your browser

VIEW IN TELEGRAM

С помощью HyperStyle (отдельная версия StyleGAN) можно делать интересные переходы для онлайн-магазинов

1.22K views06:51

Forwarded from Говорит AI (Artem R)

Привет! Я ушел из Реплики (проработал там почти 7 лет и построил один из лучших в мире Conversational AI для десятков миллионов пользователей), поднял инвестиции от Питера Тиля, Давида Яна, кофаундеров Тиндера и запустил новый AI стартап.

Сегодня релизим наш апп Botify на Product Hunt! Botify позволяет создавать фотореалистичные говорящие аватары. Аватар моргает, улыбается, шевелит губами и орно чатится. Более того, у каждого аватара можно настроить характер и интересы, и таким образом получить какую угодно персону. Хотели поговорить с Маском про колонизацию Марса? Может у Иисуса спросить про NFT хайп? Или загрузить фотку своей бывшей и 😏. По сути Botify - это микс дипфейков и чатботов, интерактивные Digital humans.

Из тех жира - под капотом диалоговая GPT-Neo на 2.7B параметров, разные BERT'ы, first-order-motion, Wav2Lip, Super Resolution, face restoration, Stylegan, WaveNet, etc. Мы используем мультимодальный подход комбинируя генеративный текст, аудио и видео для создания интерактивных Digital Humans. Все работает около риал-тайм, чек ит аут.

Нам очень важна ваша поддержка на продакт-ханте и ваш честный фидбек 🙏 Заценить и поддержать апвоутом/комментом можно тут - https://www.producthunt.com/posts/botify-ai

Botify AI: Create digital humans for engaging conversations | Product Hunt

Create photorealistic avatars for engaging conversations. Have fun interacting with your Digital Human.

👍1

1.17K views16:30

Накидал колаб по смешиванию слоев stylegan3/stylegan2 для stylegan3 репо.
Основное отличие - я смешиваю слои по маске (своя сила смешивания для каждого слоя), и последний слой обычно ближе к оригиналу, чем к стилизованной модели. Позволяет получить более чистую картинку, с меньшим количеством низкочастотного шума
Подробнее тут (бесплатно)

1.28K views07:14

Forwarded from нёрд хаб

Media is too big

VIEW IN TELEGRAM

#VR
В VR учиться рисовать проще: можно отменить неудачный штрих + ничего не отвлекает. Пример прогресса за неделю с нуля до неплохого уровня по урокам Stuart Davies. Рисует с помощью Vermillion

1.2K views07:44

Forwarded from Reddit

r/ #technology
В США создали «дрон на курьих ножках» — птичьи роболапы позволяют ему садиться на ветки и хватать предметы

Конструкцию «воздушного захвата, вдохновлённого природой» (так расшифровывается SNAG) инженеры Стэнфордского университета создали, изучая работу лап попугаев. «Кости» напечатали на 3D-принтере из полимерной массы, а роль мускулов и сухожилий взяли на себя электромоторы и нити из лески. За два десятка попыток инженерам удалось прийти к рабочему варианту роболап, которые реагируют всего за 20 миллисекунд, цепко обхватывая предмет или поверхность и погашая удар при посадке.

Дроны с такими роболапами можно использовать «в бесчисленном множестве сценариев» — например, для близкого наблюдения за птицами, экологического мониторинга лесов или перемещения небольших грузов неправильной формы.

Stanford engineers create perching bird-like robot

With feet and legs like a peregrine falcon, engineers have created a robot that can perch and carry objects like a bird.

Read the full story: https://news.stanford.edu/2021/12/01/bird-like-robot-perches-grasps/

MB01LX6WKAE5364

1.32K views17:26

Закинул первый парный 512x10k датасет face2arcane в ранний доступ на патреон.
Забрать тут

1.29K viewsedited 04:02

Ну вы знаете эту одну единственную нейросеть :D

1.5K views08:50

Жду публикацию "neural network is all you need"

1.29K views09:53

Forwarded from Технологии | Нейросети | NanoBanana

https://youtu.be/0aFH5lcwmvY

Manga Restoration with AI

You can get NordVPN here: https://nordvpn.com/bycloud
or use my coupon code: bycloud

This AI research focuses on restoring manga panels, and it's actually pretty cool. They focus on what other super resolution AI lacks, especially in the manga/drawing aspects.…

1.16K views07:59

Голодный \ Бахнув пельменiв

1.3K views08:00

Закинул face2comics на producthunt. Как говорится, го тыкать!
https://www.producthunt.com/posts/face2comics

InspiroBot - Product Information, Latest Updates, and Reviews 2023 | Product Hunt

InspiroBot is an artificial intelligence dedicated to generating unlimited amounts of unique inspirational quotes for endless enrichment of pointless human existence.

1.38K views08:03

Stylegan2 из репо stylegan3 как-то очень быстро тюнится. Результат за 60 итераций. В старом репо stylegan2-ada нужно было >600 итераций для похожего результата.

1.31K views07:55