💭 Anything you can Imagen 🌏
Про модель генерации DALL-E 2 (очевидно созвучную фамилии великого художника Дали) мы написали несколько подробных постов: про запуск модели, про устройство модели и про её ограничения. Однако, это не все, что просходит в сфере AI на данный момент. 24 мая Google тоже выпустили модель "text-to-image", которая называется Imagen (созвучно imagine – представлять, воображать). К сожалению, Google пока что не открыл доступ к модели по причине возможного злоупотребления полученными результатами.
🤔 Imagen работает с естественным языком, например «Золотистый ретривер в синем клетчатом берете и водолазке с красными точками», а затем используя "замороженный кодировщик" T5-XXL, преобразует этот текст во эмбединги. Затем «условная диффузионная модель» отображает встроенный текст в маленькое изображение размером 64x64. На последнем этапе Imagen использует текстовые диффузионные модели сверхвысокого разрешения для повышения дискретизации изображения 64x64 до 256x256 и 1024x1024. Чуть подробнее об этом рассказывают здесь.
Поскольку вы уже погружены в контекст работы DALL-E 2 (если нет, скорее погрузитесь), то мы сделаем акцент на отличиях моделей.
🎨 Во-первых, многие отмечают разницу в реалистичности изображений. DALL-E 2 превосходно создаст картину в определенном стиле с заданными объектами, а реальные изображения почти всегда вызывают сомнения. Imagen же поражает «беспрецедентным фотореализмом» и по оценкам Google, Imagen побеждает DALL-E 2 в тестах на человеческую оценку как по точности, так и по достоверности.
🛠 Во-вторых, Imagen сильно превосзодит предшественника в работе с деталями. Вы можете задать очень подробное описание объектов и их расположения и, скорее всего, результат даже превзойдет ваши ожидания. В то время как DALL-E 2 скорее всего либо перегрузится, либо упустит какую-то часть деталей.
📦 В третьих, коротко опишем разницу в устройстве моделей. Несмотря на то что модели создавались параллельно и разработки не пересекались, смысловые блоки элементов, преобразующих текст в изображение, достаточно похожи. Однако, одним из основных отличий является первый этап – text encoding. Разработчики Google AI используют большую обученную модель, похожую на GPT-3, для того чтобы понять текст так хорошо, как только это можжет сделать AI система. Вместо того, чтобы обучить текстовую и генерирующию изображения модели, они используют предобученную модель и "замораживают" ее на время обучения модели генерации изображений. Исходя из исследования, сопровождающего выход модели, именно это сильно улучшило эффективность модели.
#leftjoin_ai
Про модель генерации DALL-E 2 (очевидно созвучную фамилии великого художника Дали) мы написали несколько подробных постов: про запуск модели, про устройство модели и про её ограничения. Однако, это не все, что просходит в сфере AI на данный момент. 24 мая Google тоже выпустили модель "text-to-image", которая называется Imagen (созвучно imagine – представлять, воображать). К сожалению, Google пока что не открыл доступ к модели по причине возможного злоупотребления полученными результатами.
🤔 Imagen работает с естественным языком, например «Золотистый ретривер в синем клетчатом берете и водолазке с красными точками», а затем используя "замороженный кодировщик" T5-XXL, преобразует этот текст во эмбединги. Затем «условная диффузионная модель» отображает встроенный текст в маленькое изображение размером 64x64. На последнем этапе Imagen использует текстовые диффузионные модели сверхвысокого разрешения для повышения дискретизации изображения 64x64 до 256x256 и 1024x1024. Чуть подробнее об этом рассказывают здесь.
Поскольку вы уже погружены в контекст работы DALL-E 2 (если нет, скорее погрузитесь), то мы сделаем акцент на отличиях моделей.
🎨 Во-первых, многие отмечают разницу в реалистичности изображений. DALL-E 2 превосходно создаст картину в определенном стиле с заданными объектами, а реальные изображения почти всегда вызывают сомнения. Imagen же поражает «беспрецедентным фотореализмом» и по оценкам Google, Imagen побеждает DALL-E 2 в тестах на человеческую оценку как по точности, так и по достоверности.
🛠 Во-вторых, Imagen сильно превосзодит предшественника в работе с деталями. Вы можете задать очень подробное описание объектов и их расположения и, скорее всего, результат даже превзойдет ваши ожидания. В то время как DALL-E 2 скорее всего либо перегрузится, либо упустит какую-то часть деталей.
📦 В третьих, коротко опишем разницу в устройстве моделей. Несмотря на то что модели создавались параллельно и разработки не пересекались, смысловые блоки элементов, преобразующих текст в изображение, достаточно похожи. Однако, одним из основных отличий является первый этап – text encoding. Разработчики Google AI используют большую обученную модель, похожую на GPT-3, для того чтобы понять текст так хорошо, как только это можжет сделать AI система. Вместо того, чтобы обучить текстовую и генерирующию изображения модели, они используют предобученную модель и "замораживают" ее на время обучения модели генерации изображений. Исходя из исследования, сопровождающего выход модели, именно это сильно улучшило эффективность модели.
#leftjoin_ai
Telegram
LEFT JOIN
Совершенно удивительные достижения из мира AI
Еще одна новость про AI-модель: DALL·E 2 — новая система искусственного интеллекта, которая может создавать реалистичные изображения и рисунки исходя из описания на естественном языке. Ну, то есть, вы даете на…
Еще одна новость про AI-модель: DALL·E 2 — новая система искусственного интеллекта, которая может создавать реалистичные изображения и рисунки исходя из описания на естественном языке. Ну, то есть, вы даете на…
👍11🥰1
Хотя предпочтения моделей и их сравнения субъективны, поделитесь вашим мнением, какая модель по-вашему лучше? Для примера, слева изображение, созданное Imagen, справа – DALL-E, а, для большего понимания работы моделей, советуем посмотреть другие варианты изображений с одинаковыми входными данными.
🔥 за свежую гугловскую Imagen и ❤️ за хорошо изученную DALL-E 2!
🔥 за свежую гугловскую Imagen и ❤️ за хорошо изученную DALL-E 2!
🔥68❤12👍1
Рома Бунин сделал новые классные карточки по вакансиям аналитиков 🤩
Telegram
Reveal the Data
Канал Ромы Бунина про визуализацию данных, дашборды и развитие BI-систем.
Подробнее про канал, рубрики, правила и контакты — https://t.me/revealthedata/386
Сайт и блог — https://revealthedata.com/
Подробнее про канал, рубрики, правила и контакты — https://t.me/revealthedata/386
Сайт и блог — https://revealthedata.com/
Forwarded from Reveal the Data
Вакансии аналитиков март-май 2022
Количество вакансий аналитиков относительно прошлого года упало не на много, всего на 14%. Но по сравнению с предыдущими тремя месяцами сократилось на более значительную цифру в 27%. Это можно было бы списать на сезонность и меньшую активность весной. Она и вправду есть, но в прошлом году весной вакансий в сумме было больше, чем зимой.
Зарплаты относительно прошлого года выросли на приличные 20%. И рынок при этом всё ещё перегрет — на одно активное резюме на сайте приходится в среднем две вакансии.
В разбивке по срезам просели все типы вакансий, кроме удалённых. Таких стало на 16% больше даже с учетом отступающего ковида. Больше всего упали позиции младших аналитиков, на целых 40%, получить первую работу, к сожалению, станет сложнее. Зарплаты выросли больше всего у инженеров данных и дата саентистов.
Данные и обзор подготовили:
@revealthedata @leftjoin
Количество вакансий аналитиков относительно прошлого года упало не на много, всего на 14%. Но по сравнению с предыдущими тремя месяцами сократилось на более значительную цифру в 27%. Это можно было бы списать на сезонность и меньшую активность весной. Она и вправду есть, но в прошлом году весной вакансий в сумме было больше, чем зимой.
Зарплаты относительно прошлого года выросли на приличные 20%. И рынок при этом всё ещё перегрет — на одно активное резюме на сайте приходится в среднем две вакансии.
В разбивке по срезам просели все типы вакансий, кроме удалённых. Таких стало на 16% больше даже с учетом отступающего ковида. Больше всего упали позиции младших аналитиков, на целых 40%, получить первую работу, к сожалению, станет сложнее. Зарплаты выросли больше всего у инженеров данных и дата саентистов.
Данные и обзор подготовили:
@revealthedata @leftjoin
👍22
Forwarded from Reveal the Data
Ещё повторили карточки с прошлого годового обзора. Здесь данные для Москвы и Питера с декабря 2020 по май 2022 и лучше видно общую динамику.
Основной дашборд
Данные и обзор подготовили:
@revealthedata @leftjoin
Основной дашборд
Данные и обзор подготовили:
@revealthedata @leftjoin
👍19
Продолжаем путешествие по другим странам вместе с DataHeroes!🚀
Помните наш выпуск про релокацию? Мы много внимания уделили процессу переезда в другую страну, дали рекомендации для тех, кто собирается переехать в ближайшее время и обсудили общие сложности, с которыми сталкиваются люди при переезде. Но ведь в каждой стране все по-разному? Поэтому сегодня мы продолжим обсуждать релокейт и в этот раз больше внимания уделим адаптации на новом месте, а, самое главное, поговорим про особенности жизни в разных странах! 🗺️
Кстати, а вы знали, что у релокейта есть интересная побочка – желание еще больше перемещатсья по миру и узнавать новые места? Включайте подкаст, чтобы узнать больше! 🎧
Подкаст доступен на платформах: Spotify, Anchor, Apple Podcasts, Google, Yandex, Overcast, Castbox, Telegram (↓)
#подкаст #DataHeroes
Помните наш выпуск про релокацию? Мы много внимания уделили процессу переезда в другую страну, дали рекомендации для тех, кто собирается переехать в ближайшее время и обсудили общие сложности, с которыми сталкиваются люди при переезде. Но ведь в каждой стране все по-разному? Поэтому сегодня мы продолжим обсуждать релокейт и в этот раз больше внимания уделим адаптации на новом месте, а, самое главное, поговорим про особенности жизни в разных странах! 🗺️
Кстати, а вы знали, что у релокейта есть интересная побочка – желание еще больше перемещатсья по миру и узнавать новые места? Включайте подкаст, чтобы узнать больше! 🎧
Подкаст доступен на платформах: Spotify, Anchor, Apple Podcasts, Google, Yandex, Overcast, Castbox, Telegram (↓)
#подкаст #DataHeroes
🔥17👍3
Сбор требований на дашборд не всегда является тривиальной задачей. Особенно, когда непонятно, что именно делать и какие практики существуют в этом направлении. Данную технику можно смело подглядеть в смежной области айти - у бизнес- и системных аналитиков в канале Бизнес-анализ & IT.
На Бизнес-анализ & IT ребята расскажут, как общаться с заказчиком и управлять приоритетами, а также публикуют классные мемы, анонсы мероприятий, пруфы про зп и дельные советы, как войти в айти!
Подписывайтесь 👉 @bamrus
На Бизнес-анализ & IT ребята расскажут, как общаться с заказчиком и управлять приоритетами, а также публикуют классные мемы, анонсы мероприятий, пруфы про зп и дельные советы, как войти в айти!
Подписывайтесь 👉 @bamrus
👍1