Мишин Лернинг 🇺🇦🇮🇱
7.98K subscribers
1.15K photos
139 videos
4 files
617 links
Субъективный канал об искусстве машинного обучения, нейронных сетях и новостях из мира искусственного интеллекта.
Download Telegram
🥑 Avocado Armchair Collection | DALL•E 2

Главный символ нейросети DALL•E — это кресло авокадо. Еще с первой версии повелось тестировать качество генерации этим текстовым запросом. Но DALL•E 2 действительно создает невероятные концепты.

Уверен что генеративный дизайн станет важным направлением дизайна 20-30х годов нашего века.
🏆 CoCA — новая SOTA на первом месте! Papers With Code обновили свою "рейтинговую таблцу" по ImageNet-1k

Я был в восторге в CLIP и Image Captioning претрейнов (e.g.: SimVLM), восхищался изящностью ViT, верил в направление гибридного обучения, начатого в BLIP.

Но при всем этом, сказать, что я не удивлен первому месту, это ничего не сказать. Казалось, что такой дженерал претрейн должен выстрелить рано или поздно. И это произошло.

91% точности на ImageNet — новый рубеж! И хотя мой друг сказал, что ImageNet — новый MNIST, мы все в восторге от Zero-Shot возможностей CoCa — 86.3%, это невероятно.

p.s.: Посмотрите, какой путь прошло цивильное человечество за каких-то 11 лет! Skyrim'у тоже 11ый год.

👾 Ретроспектива ImageNet Top1:
50% — SIFT+FVs (2011)
63% — AlexNet (2012)
64% — ZFNet (2013)
74% — VGG (2014)
78% — ResNet (2015)
81% — ResNeXt (2016)
82% — NASNET (2017)
85% — ResNeXt 32x48d (2018)
87% — EfficientNet (2019)
90% — EfficientNet L2 (2020)
90.5% — ViT-G (2021)
91% — CoCa / ViT (2022)

ImageNet SOTA
🦦 Забавно, что диффузионую модель просят создать картинку к твиттер посту про уход из Apple создателя GAN‘о-в, мистера BADgoodFELLOW.

Желаем Яну всего наилучшего! Думаю, что ему действительно хочется быть более свободным. МЛ-директор Apple, судя по его твиту, не согласен с планами компании по возврату своей команды в офис. Вот такое начало жизни в «постковидный период» айти истории. Ещё одну интересную и прагматичную версию по поводу ухода подкинул эйай ньюз.

p.s.: Кстати Ian Goodfellow соавтор (совместно с Yoshua Bengio) одной из лучших книг по Deep Learning. Бесплатно, без регистрации и смс. Кидаю:

🎓 deeplearningbook.org
Forwarded from эйай ньюз
Media is too big
VIEW IN TELEGRAM
😢 Snap выпустил плачущий фильтр. И это пушка!

Реализм зашкаливает. Если сильно не вглядываться, то и не скажешь, что человек на самом деле совсем не плачет. И выражение лица реалистичное, и маска не прыгает, круто!

А все благодаря чему? Благодаря генеративными сетям (ака ганам).
This media is not supported in your browser
VIEW IN TELEGRAM
😭 Вот попробовал плачущий фильтр от Snap.
🍳 Завтрак от DALL•E 2 выглядит идеально
🦩Нейросеть Flamingo на собесе по Deep Learning

Недавно общался с GPT-3 175B по поводу Deep Learning. Задавал вопросы, которые обычно возникали, когда я собесил на DL позицию. Ответами я был удивлен. Все было очень хорошо. Но можно и возразить, мол «GPT-3 съела большой кусок интернета. Что ей ваш Deep Learning?»

Но вот на днях увидел как Flamingo 🦩 от DeepMind справляется с visual question-answering по fully-connected нейронке. И тут уже не скажешь, что Flamingo просто выплевывает заученные ответы про эти ваши SwiGLU активации и пр. Тут хоть вопрос и простой, но требует понимания того, что на картинке. Да еще и инференс-флоу в режиме диалога, браво!

📑 Flamingo DeepMind 2022 PDF
🗄 Arxiv
💻 Code / lucidrains
🦩 Flamingo от DeepMind это вам не шутки шутить

Помните этот пример из cs231 курса по сверхточным сетями от Stanford? Пример привел Andrej Karpathy (Tesla), понимание которого, можно рассматривать как один из серьезных бенчмарков для ИИ.

Еще совсем «недавно», в каком-то «далеком» 2016-2017 казалось, что, процитирую Justin Johnson’а, «Наши алгоритмы компьютерного зрения очень далеки, как я думаю, от действительно глубокого понимания изображений»

👉 тот самый момент https://youtu.be/vT1JzLTH4G4?t=47m51s
👟 Дизайн в эпоху Нейромодерна

Нейронные сети могут стать архитекторами новых форм продолжения человека в вещах. Экстенсия — процесс в который мы так или иначе вовлечены с рождения и до самой смерти. Экстенсия — форма взаимодействия между Я и вещью. Хороший дизайн позволяет сделать бесшовной подобную экстенсию, интерфейс между человеком и вещью.

Задача нейромодерна — переосмысление интерфейса «Я — вещь». Нейродизайнер находится в авангарде. Чтобы стать нейромодернистом, прежде всего, нужно стать исследователем.

Благодаря развитию новых способов коммуникации, искусственному интеллекту и нейроморфингу возможен выход за пределы «конечности», и быть может, это основная цель нейромодерна и интерфейса «Я — вещь».

Библиография

Gilles Deleuze. Le Zéro et le Noé: Essai sur une existence vers une nécessité de l'existence. Paris: Payot, 1979.

Paul Feyerabend. Response to the Manifesto of a Certain Author. Imagination, vol. 3, no. 1, pp. 1–28.

p.s.: сгенерировано все кроме названия, включая список литературы
😒 1,017 избранных получили доступ к DALL•E 2 от OpenAI или 10 шагов успеха

Вообще интересное время:
- Выпускаешь реально крутую сеть
- Делаешь блог пост с хайповыми примерами
- Заводишь страницы сетки в соцсетях
- Сначала постишь сам с коллегами, хайпуешь в твиттере и инсте
- Создаешь вейтлист, и делаешь пост о том, что теперь попробовать сможет Каждый
- Не забудь: в вейтлсите необходимо (не)обязательное поле: ссылка на социальные сети
- Если человечек — инфлюенсер, то делаешь ему приятно. Даёшь доступ.
- Обязательно делаешь перепосты, лайкаешь и показываешь, что вот оно: демократизация ИИ. Очевидный плюс: их посты приведут инфлюенсеров покрупнее!
- Делаешь еженедельные акции, типа пришли в директ (лучше чем в комменты) свой варинт. Осчастливь пару подписчиков из не инфлюенсеров, но публично. А то как об этом узнают.
- Наслаждайся, ведь хайп превыше всего.

p.s.: а да, чуть не забыл: ссылка на вейтлист, вдруг тебе повезет, любимый подписчик 😉

👉 https://labs.openai.com/waitlist
Forwarded from Derp Learning
Удобный интерфейс к text-image датасетам LAION 400m и 5B (400млн и 5млрд картинок соответственно)

Вводите текстовый запрос, CLIP находит нужные картинки, качаете табличку со ссылками, скачиваете и вуаля - датасет готов.

Тык
🦅🗽 Prompt engineering генеративные трюки работают и для DALL•E 2!

Помните в безобидном 2021ом была такая мода — генерить картинки, используя связку из VQGAN и CLIP, приписывая «unreal engine, trending on artstation».

Prompt трюки заслужили места в истории нейро(де)генеративного искусства. Появилась даже галлерея того, как prompt-конкатенации влияют на результат генерации.

Прелесть подобного подхода в том, что можно «выехать» из-за стилистики. Это как если бы художник, писатель или музыкант использовал популярную в этом сезоне форму, запихивая в нее свое уникальное госодержание. Как сказал поэт: «Культура это палимпсест: один ******, другой поест».

Так вот, подобное стилистическое жонглирование возможно благодаря умной сети CLIP, которая умеет отличить Моне от Мане. А decoder в DALL•E 2 это unCLIP. Так что набиваем голову prompt трюками и развиваем чувство прекрасного.

e.g. картина по запросу: «A bald eagle perched atop a NYC skyscraper, concept art, artstation, unreal engine, 3d render, HD, Bokeh»
Forwarded from ExMuffin
This media is not supported in your browser
VIEW IN TELEGRAM
🐶 PetBreeder 1.1 🐱

Если (ну вдруг) у вас когда-либо возникало желание взглянуть на себя в облике пёселя или кошары, то сейчас появилась прекрасная возможность. Почему я это собрал? Дело в том, что я наткнулся на стайлгановские веса ffhq, дотюниные собачим и кошачим датасетами, которые дают весьма хорошие результаты и при этом «черты» лица человека (с входного изображения) сохраняются. Разве это не повод сделать что-нибудь забавное? Плюс сейчас такое время, когда в опенсорсе мало интересных проектов. В общем, по ссылке ниже можно генерировать как простое изображение своего психологического питомца, так и анимацию морфинга.

P.S. время удобства колаба медленно, но верно уходит. Возможно следующую нейронку соберу каким-нибудь градио, но не факт. Плюс хотел бы все-таки постить время от времени что-то новостное, обзорное, образовательное или тому подобное. А то канал пустует, а мне иногда есть что рассказать.

https://colab.research.google.com/github/tg-bomze/collection-of-notebooks/blob/master/PetBreeder.ipynb