Техножрица 👩‍💻👩‍🏫👩‍🔧
14K subscribers
1.44K photos
65 videos
28 files
765 links
Люблю высокие технологии и кушать.

Добро пожаловать, если в сферу твоих интересов тоже входят математика, DL, NLP, программирование на Python, или тебе просто любопытно, о чем на досуге размышляют люди, занимающиеся разработкой и исследованиями в ML.
Download Telegram
В последнее время поговаривают, что в сервисе Image Creator от майкрософта ( https://www.bing.com/images/create/ ) изображения стали генерироваться с помощью DALLE-3. Я не нашла официального подтверждения этой информации от OpenAI или Microsoft, но решила проверить качество генерации опытным путем.
Было быстро замечено, что генерация техножриц на фоне хрущевок (рис. 1) стала куда качественнее, чем 3 месяца назад, когда существовали только DALLE-1 и 2 (можно сравнить с аватаркой канала, которая была сгенерирована в тот период).
Далее я попробовала нагенерировать техножрецов, едущих на гигантских механических боевых котах. Более, чем в половине случаев, генерация оказывалась годной (см., например, рис. 2). Правда, модель время от времени добавляет на картинку лишних маленьких котов (см. рис. 3) и иногда делает картинки с низкой детализацией (рис. 4).
Генерация с большим количеством персонажей стала также лучше, чем раньше (см., например, рис. 5), но модель все ещё часто путает атрибуты разных персонажей. Например, на рис. 6 присутствуют не только жрецы, оседлавшие котов, но и все варианты смешивания жрецов и котов в единое целое.
Кроме этого, получились хорошие результаты по сложным или заведомо невозможным запросам. Например, "Tensor is riding a giant cat", "The fire that is darker than black", "Eerie love of two manifolds", "The Colour Out Of Space" (рис. 7, 8, 9, 10 соответственно).
Три месяца назад он бы так не нарисовал. 🤔
29👍14🔥9👀2
Немного мудрости на ночь.
😁719🥴1
Интересный рассказ с картинками про то, как приноровились менять поведение предтренированной модели, воздействуя непосредственно на её эмбеддинги:

https://t.me/seeallochnaya/682
https://t.me/seeallochnaya/685
https://t.me/seeallochnaya/687
(Три последовательных поста)

Акцент делается на задачах alignment и детекции галлюцинаций. Но я думаю, что если подтвердится информация о том, что эти задачи хорошо решаются, то можно будет приспособить метод и для многого другого.

Основой поста служит статья Representation Engineering: A Top-Down Approach to AI Transparency ( https://arxiv.org/abs/2310.01405 ), надо будет ее разобрать, чтобы понять детали того, как именно "сдвигают" представления в пространстве эмбеддингов для получения нужного эффекта, потому что мне понравилась идея.

#объяснения_статей
🔥24👍422
Ну что, раз генератор, проживающий по адресу https://www.bing.com/images/create , неплохо рисует текст, настало время выполнить рекурсивный долг: сгенерировать мемы про нейросети с помощью нейросети.

Список промптов:
Рис. 1: Funny meme about perceptron;
Рис. 2: Funny meme about LSTM;
Рис. 3: Funny meme about GPT-4;
Рис. 4: Meme about DALLE-3 neutral network.

Рекомендую внимательно присмотреться к тому, что нейросеть попыталась написать. 🧐

P.S. Когда приеду домой, скину сгенерированные мемы про математику 🤓
😁15🤯8👍3🔥3🤩2