Микро-подборка на тему свежего в алгоритмическом дизайне (а свежо тут в основном предание):
1. Интересный эксперимент Hayk An, позволяющий настраивать интерфейс, собранный на базе компонентов с токенами. Можно получить случайную комбинацию параметров, так что это игрушка на стыке алгоритмического дизайна.
2. Salesforce: Роль прототипов в интерфейсах на базе искусственного интеллекта. Они помогают моделировать результат генерации и общую логику взаимодействия.
3. Tyler Hobbs: Набирающее обороты применение алгоритмического/генеративного дизайна. Это коллекционные серии произведений, которые продаются через NFT и даже генерируются по определённым верифицированным правилам. Он упоминает платформу Artblocks и свой проект Fidenza на ней.
4. Fishdraw: Генератор рисунков рыб на базе алгоритмического дизайна.
В последнее время ссылки на эту тему копятся всё дольше, но кое-чего оседает.
#ai #algorithms
1. Интересный эксперимент Hayk An, позволяющий настраивать интерфейс, собранный на базе компонентов с токенами. Можно получить случайную комбинацию параметров, так что это игрушка на стыке алгоритмического дизайна.
2. Salesforce: Роль прототипов в интерфейсах на базе искусственного интеллекта. Они помогают моделировать результат генерации и общую логику взаимодействия.
3. Tyler Hobbs: Набирающее обороты применение алгоритмического/генеративного дизайна. Это коллекционные серии произведений, которые продаются через NFT и даже генерируются по определённым верифицированным правилам. Он упоминает платформу Artblocks и свой проект Fidenza на ней.
4. Fishdraw: Генератор рисунков рыб на базе алгоритмического дизайна.
В последнее время ссылки на эту тему копятся всё дольше, но кое-чего оседает.
#ai #algorithms
Medium
UX Prototyping for AI
Six ways to prototype AI experiences
Интерес к теме алгоритмического дизайна подупал, как и количество интересных проектов. Но кой-чо новое проскакивает:
1. Фантастическая статья Amy Goodchild о природе генеративного искусства. Она разбирает её три ключевых составляющие: случайность, правила и природные системы.
2. Mechanic: Экспериментальный инструмент для создания своих простейших инструментов алгоритмического дизайна. Можно настроить параметры, по которым он будет генерировать макеты.
3. GauGAN2: NVIDIA выпустили новую версию своего инструмента, который превращает набросок в фотографию природного ландшафта. Теперь можно генерировать и по текстовому описанию.
4. Tool.Graphics: Сайт генерирует абстрактные изображения на тему одной из стилистик. Можно бесконечно получать варианты.
5. ArtFlow: Генератор аватаров по словесному описанию с помощью алгоритмического дизайна. Можно смешать разных персонажей и жанры.
6. HyperStyle: Экспериментальный инструмент для изменения возраста и внешности с помощью алгоритмического дизайна.
7. Dream: Генератор абстрактного искусства по текстовому описанию в нескольких стилистиках. Один из самых эффектных среди всех подобных инструментов.
8. GLIDE: Экспериментальный инструмент от команды OpenAI редактирует готовые изображения по текстовому описанию. Исходный код.
9. Animated Drawings: Экспериментальный инструмент от Meta анимирует детские рисунки персонажей.
#ai #algorithms
1. Фантастическая статья Amy Goodchild о природе генеративного искусства. Она разбирает её три ключевых составляющие: случайность, правила и природные системы.
2. Mechanic: Экспериментальный инструмент для создания своих простейших инструментов алгоритмического дизайна. Можно настроить параметры, по которым он будет генерировать макеты.
3. GauGAN2: NVIDIA выпустили новую версию своего инструмента, который превращает набросок в фотографию природного ландшафта. Теперь можно генерировать и по текстовому описанию.
4. Tool.Graphics: Сайт генерирует абстрактные изображения на тему одной из стилистик. Можно бесконечно получать варианты.
5. ArtFlow: Генератор аватаров по словесному описанию с помощью алгоритмического дизайна. Можно смешать разных персонажей и жанры.
6. HyperStyle: Экспериментальный инструмент для изменения возраста и внешности с помощью алгоритмического дизайна.
7. Dream: Генератор абстрактного искусства по текстовому описанию в нескольких стилистиках. Один из самых эффектных среди всех подобных инструментов.
8. GLIDE: Экспериментальный инструмент от команды OpenAI редактирует готовые изображения по текстовому описанию. Исходный код.
9. Animated Drawings: Экспериментальный инструмент от Meta анимирует детские рисунки персонажей.
#ai #algorithms
Amy Goodchild
What is Generative Art? — Amy Goodchild
Randomness, rules and natural systems. Some non-restrictive definitions and an exploration of the form.
В этом году подборка новостей алгоритмического дизайна = подборка новостей про DALL-E 2. Это второе поколение экспериментального генератора фотографий и иллюстраций реальных и выдуманных объектов по текстовому описанию от OpenAI. Уровень, конечно, фантастический — многие из результатов можно хоть сейчас без стыда использовать в реальных продуктах. Одно из самых сильных явлений в истории алгоритмического дизайна.
Scott Alexander учил нейросеть рисовать витражи с определёнными сюжетами. Рассказ чумовой — он постоянно уточнял формулировку запроса, чтобы добиться определённого результата. Это отличный пример того, как дизайнеры могут управлять роботами-дизайнерами.
Энтузиасты налево и направо упражняются в том, что можно сделать:
— Красочные иконки от Charlota Blunarova. Фантастическое качество и модный стиль.
— Шикарный мемасный форс. Дикие концепции вроде «Ice Cube in an ice cube», «Plague doctor Onlyfans» или «Jesus speaking at a TED talk».
— Обложка Cosmopolitan, на которую у Карен Ченг ушло под сотню часов правильного формулирования запросов.
— Фотореалистичные люди.
— Развитие классических картин.
— Фотоаппараты в духе персонажей «Звёздных войн» и других фильмов от Mathieu Stern.
— Забавный гибрид Wordle и DALL-E.
Слабых место, правда, полно. Статья дотошно разбирает, что нейросеть умеет хорошо, а где лажает. В целом — безумно круто, но непредсказуемо. Хотя в любом случае круче абибасной версии ruDALL-E.
Google сделали аналог Imagen — ещё один генератор фото и иллюстраций по текстовому описанию (обзор). Хвалятся качеством, но показанные примеры явно слабее.
После долгой стагнации в теме идёт мощный качественный прорыв, который реально снимает часть рутины с дизайнера. Правда, немного позже — когда инструмент полноценно станет доступен всем).
#ai #algorithms
Scott Alexander учил нейросеть рисовать витражи с определёнными сюжетами. Рассказ чумовой — он постоянно уточнял формулировку запроса, чтобы добиться определённого результата. Это отличный пример того, как дизайнеры могут управлять роботами-дизайнерами.
Энтузиасты налево и направо упражняются в том, что можно сделать:
— Красочные иконки от Charlota Blunarova. Фантастическое качество и модный стиль.
— Шикарный мемасный форс. Дикие концепции вроде «Ice Cube in an ice cube», «Plague doctor Onlyfans» или «Jesus speaking at a TED talk».
— Обложка Cosmopolitan, на которую у Карен Ченг ушло под сотню часов правильного формулирования запросов.
— Фотореалистичные люди.
— Развитие классических картин.
— Фотоаппараты в духе персонажей «Звёздных войн» и других фильмов от Mathieu Stern.
— Забавный гибрид Wordle и DALL-E.
Слабых место, правда, полно. Статья дотошно разбирает, что нейросеть умеет хорошо, а где лажает. В целом — безумно круто, но непредсказуемо. Хотя в любом случае круче абибасной версии ruDALL-E.
Google сделали аналог Imagen — ещё один генератор фото и иллюстраций по текстовому описанию (обзор). Хвалятся качеством, но показанные примеры явно слабее.
После долгой стагнации в теме идёт мощный качественный прорыв, который реально снимает часть рутины с дизайнера. Правда, немного позже — когда инструмент полноценно станет доступен всем).
#ai #algorithms
Openai
DALL·E 2
DALL·E 2 is an AI system that can create realistic images and art from a description in natural language.
В этом году все выпуски мини-дайджеста об алгоритмическом дизайне заполонили генераторы графики по текстовому описанию — остальные применения пока что затерялись. Но будем следить, куда приведёт эта дорожка:
1. DALL-E 2 теперь доступен всем. Бесплатно в ограниченном объёме, но можно докупаться.
2. Stable Diffusion: Ещё один генератор фото и иллюстраций по текстовому описанию. Теперь он доступен всем. Можно работать в вебе или поставить на свой сервер.
3. Vox: Хороший разбор того, как устроены инструменты, которые генерируют изображение по текстовому запросу. В бонусном видео художники и технари толково рассуждают на тему влияния на профессию.
4. Alexander Wales: Шикарные размышления о влиянии инструментов вроде DALL-E и Midjourney на профессиональных иллюстраторов и художников. Они точно подкосят экономику этих профессий и есть много вопросов к палитре возможного, но искусство как инструмент самовыражения никуда не денется.
5. Julien Posture: Стоит ли иллюстраторам бояться DALL-E и других подобных инструментов. И да, и нет — работа с идеей и сюжетом гораздо сложнее, чем строка описания в условном DALL-E, да и палитра стилей у них ограничена. Хотя типовые сюжеты в типовых стилях на замену стоков — делаются легко.
6. Erik Hoel: Могут ли работы DALL-E и подобных инструментов считаться искусством. Они отражают только внешнее исполнение, но не передают точку зрения и замысел художника, что является одним из главных.
7. Hannah Johnston: Сравнивает особенности работы DALL·E, Midjourney и нейросети на базе Google Collab.
8. Концепт-художник Евгений Зубков экспериментирует с Midjourney для своих иллюстраций. Внушает. Покрас Лампас тоже тизернул свои эксперименты.
9. Joseph Hillenbrand: Сгенерировал в DALL-E 2 шаблоны для подачи дизайна -- бланки, наружная реклама. Выглядит правдоподобно.
10. Агентство DADA ведёт соцсети йогуртов Epica только с помощью DALL-E 2 и Midjourney.
11. Пользователи TikTok могут использовать фоны для видео, сгенерированные с помощью алгоритмического дизайна.
12. Lucy: Попыталась воссоздать знаменитые обложки альбомов с помощью DALL-E 2. Получается совсем приблизительно.
13. Apple NeuMan: Официальный алгоритм для дипфейков. Планируют использовать в дополненной реальности — он генерирует любые действия персонажа на основе 10-секундного видео.
14. Zazow: Коллекция скриптов, генерирующих паттерны с помощью алгоритмического дизайна.
P.S. Перестройка моего сайта-коллекции почти закончилась, а то я долгое время не мог пополнять его. Надеюсь анонсировать в сентябре.
#ai #algorithms
1. DALL-E 2 теперь доступен всем. Бесплатно в ограниченном объёме, но можно докупаться.
2. Stable Diffusion: Ещё один генератор фото и иллюстраций по текстовому описанию. Теперь он доступен всем. Можно работать в вебе или поставить на свой сервер.
3. Vox: Хороший разбор того, как устроены инструменты, которые генерируют изображение по текстовому запросу. В бонусном видео художники и технари толково рассуждают на тему влияния на профессию.
4. Alexander Wales: Шикарные размышления о влиянии инструментов вроде DALL-E и Midjourney на профессиональных иллюстраторов и художников. Они точно подкосят экономику этих профессий и есть много вопросов к палитре возможного, но искусство как инструмент самовыражения никуда не денется.
5. Julien Posture: Стоит ли иллюстраторам бояться DALL-E и других подобных инструментов. И да, и нет — работа с идеей и сюжетом гораздо сложнее, чем строка описания в условном DALL-E, да и палитра стилей у них ограничена. Хотя типовые сюжеты в типовых стилях на замену стоков — делаются легко.
6. Erik Hoel: Могут ли работы DALL-E и подобных инструментов считаться искусством. Они отражают только внешнее исполнение, но не передают точку зрения и замысел художника, что является одним из главных.
7. Hannah Johnston: Сравнивает особенности работы DALL·E, Midjourney и нейросети на базе Google Collab.
8. Концепт-художник Евгений Зубков экспериментирует с Midjourney для своих иллюстраций. Внушает. Покрас Лампас тоже тизернул свои эксперименты.
9. Joseph Hillenbrand: Сгенерировал в DALL-E 2 шаблоны для подачи дизайна -- бланки, наружная реклама. Выглядит правдоподобно.
10. Агентство DADA ведёт соцсети йогуртов Epica только с помощью DALL-E 2 и Midjourney.
11. Пользователи TikTok могут использовать фоны для видео, сгенерированные с помощью алгоритмического дизайна.
12. Lucy: Попыталась воссоздать знаменитые обложки альбомов с помощью DALL-E 2. Получается совсем приблизительно.
13. Apple NeuMan: Официальный алгоритм для дипфейков. Планируют использовать в дополненной реальности — он генерирует любые действия персонажа на основе 10-секундного видео.
14. Zazow: Коллекция скриптов, генерирующих паттерны с помощью алгоритмического дизайна.
P.S. Перестройка моего сайта-коллекции почти закончилась, а то я долгое время не мог пополнять его. Надеюсь анонсировать в сентябре.
#ai #algorithms
Openai
DALL·E now available in beta
We’ll invite 1 million people from our waitlist over the coming weeks. Users can create with DALL·E using free credits that refill every month, and buy additional credits in 115-generation increments for $15.
После пары лет застоя в алгоритмическом дизайне новый бум. Внимательные смогут найти бета-версию моего нового сайта-коллекции, который переделал в этом году. Но я пока не успел вбить туда свежий контент, поэтому без ссылки. Выгружу на вас то, что копилось всю осень, причём в два захода на неделе:
STABLE DIFFUSION
Летит ракетой. Alberto Romero считает его самой важной моделью алгоритмического дизайна графики и иллюстраций. Он объясняет причины и рассказывает историю появления. Как он работает и какой набор обучающих данных использует.
Появилась куча интерфейсов для работы с ним:
— Веб: Nightcafe, Nolibox Creator, PineGraph
— macOS: DiffusionBee
— Windows: ArtRoom AI
— iOS: Draw Things: AI Generation
— Figma: Ando
— Сервер у себя на компьютере
Заточка под конкретные задачи:
— Текстуры
— Модели, обученные на разных стилях
Пара примеров в деле:
— Осовременили персонажей старых пиксельных игр и Fallout 2
DALL-E 2
Затерялся на этом фоне. Хотя больше не надо ждать в очереди, чтобы попробовать и появляются возможности типа outpainting (она расширяет исходную иллюстрацию или фото с сохранением стиля).
Зато они мощно коллабят с Microsoft — их встроили в облако Azure. И выпустили Microsoft Designer — простой графический редактор для вещей типа публикаций в соцсетях. Может генерировать графику и рекомендовать композицию макета по текстовому описанию задачи.
Ещё примеры в деле:
— Дизайнеры игрушек Hot Wheels в Mattel делают наброски новых моделей.
MIDJOURNEY
Парочка примеров в деле:
— Упаковка шоколадок
— Монстры из японского фольклора
Разное полезное на их же тему:
Помощники в составлении правильных текстовых запросов:
— Сервисы: Phraser,
Dallelist, Midjourney Prompt Generator, Find the Prompt, PromptHero
— Методичка
Astria: Генератор фото и иллюстраций по текстовому описанию, который может уточнять результаты с помощью техники DreamBooth.
Экспериментальный сервис, который подсвечивает предубеждения и штампы на примере Stable Diffusion и DALL-E 2. Репозиторий.
И что всё это значит для дизайнеров:
1. Криповейшая история — Andy Bayo поговорил с иллюстратором Hollie Mengert, чьи коммерческие работы для клиентов использовали для тренировки нейросети и позволили, по сути, клонировать их. Он также поговорил с Ogbogu Kalu, автором кода. В комментариях настоящий лепрозорий из тех, кто не уважает чужой труд. Грань допустимого использования чужих стилей в обучении алгоритмов обсуждается давно, но тут она явно перейдена — у конкретного человека отобрали работу.
2. Evil Martians дали одинаковую задачу иллюстратору и Midjourney. Они сравнивают итоговый результат по качеству, срокам создания и менеджерским трудозатратам, а также цене.
3. Иллюстратор Эммануэль поиграл с DALL-E 2 и посмотрел, насколько он подходит для коммерческой работы иллюстратора на примере недавнего реального проекта. Пока далеко.
Продолжим в четверг.
#ai #algorithms
STABLE DIFFUSION
Летит ракетой. Alberto Romero считает его самой важной моделью алгоритмического дизайна графики и иллюстраций. Он объясняет причины и рассказывает историю появления. Как он работает и какой набор обучающих данных использует.
Появилась куча интерфейсов для работы с ним:
— Веб: Nightcafe, Nolibox Creator, PineGraph
— macOS: DiffusionBee
— Windows: ArtRoom AI
— iOS: Draw Things: AI Generation
— Figma: Ando
— Сервер у себя на компьютере
Заточка под конкретные задачи:
— Текстуры
— Модели, обученные на разных стилях
Пара примеров в деле:
— Осовременили персонажей старых пиксельных игр и Fallout 2
DALL-E 2
Затерялся на этом фоне. Хотя больше не надо ждать в очереди, чтобы попробовать и появляются возможности типа outpainting (она расширяет исходную иллюстрацию или фото с сохранением стиля).
Зато они мощно коллабят с Microsoft — их встроили в облако Azure. И выпустили Microsoft Designer — простой графический редактор для вещей типа публикаций в соцсетях. Может генерировать графику и рекомендовать композицию макета по текстовому описанию задачи.
Ещё примеры в деле:
— Дизайнеры игрушек Hot Wheels в Mattel делают наброски новых моделей.
MIDJOURNEY
Парочка примеров в деле:
— Упаковка шоколадок
— Монстры из японского фольклора
Разное полезное на их же тему:
Помощники в составлении правильных текстовых запросов:
— Сервисы: Phraser,
Dallelist, Midjourney Prompt Generator, Find the Prompt, PromptHero
— Методичка
Astria: Генератор фото и иллюстраций по текстовому описанию, который может уточнять результаты с помощью техники DreamBooth.
Экспериментальный сервис, который подсвечивает предубеждения и штампы на примере Stable Diffusion и DALL-E 2. Репозиторий.
И что всё это значит для дизайнеров:
1. Криповейшая история — Andy Bayo поговорил с иллюстратором Hollie Mengert, чьи коммерческие работы для клиентов использовали для тренировки нейросети и позволили, по сути, клонировать их. Он также поговорил с Ogbogu Kalu, автором кода. В комментариях настоящий лепрозорий из тех, кто не уважает чужой труд. Грань допустимого использования чужих стилей в обучении алгоритмов обсуждается давно, но тут она явно перейдена — у конкретного человека отобрали работу.
2. Evil Martians дали одинаковую задачу иллюстратору и Midjourney. Они сравнивают итоговый результат по качеству, срокам создания и менеджерским трудозатратам, а также цене.
3. Иллюстратор Эммануэль поиграл с DALL-E 2 и посмотрел, насколько он подходит для коммерческой работы иллюстратора на примере недавнего реального проекта. Пока далеко.
Продолжим в четверг.
#ai #algorithms
The Algorithmic Bridge
Stable Diffusion Is the Most Important AI Art Model Ever
A state-of-the-art AI model available for everyone through a safety-centric open-source license is unheard of.
Продолжаю выгрузку ссылок, которые никак не добавлю в новую версию сайта-коллекции алгоритмического дизайна:
ТЕКСТЫ
ChatGPT: Новая модель от OpenAI генерирует правдоподобные тексты (хотя зачастую по факту ошибочные). Её уже приспосабливают для написания статей и других крупных материалов. Это один из самых горячих запусков — за первую неделю ей воспользовались больше 1 млн человек.
Matthias Ott провёл интересный эксперимент — пообщался на тему типографики и продуктового дизайна. Ответы звучали правдоподобно, хотя это главный риск этой модели — она часто выдаёт просто салат из слов, где не эксперту сложно оценить достоверность. С другой стороны, если посмотреть прорву статей на Medium от начинающих дизайнеров — там тоже хватает этих проблем. Так что нас ждёт много интересных этических вопросов.
Notion AI: Алгоритмический помощник по написанию текстов от Notion. Может набросать публикацию в блоге, письмо и другие материалы. Пока в закрытой бете, но интеграция таких вещей в сам инструмент — лучший вариант. Обзор.
Ну и отдельные сервисы-генераторы: CopyMonkey, Jasper.
ФОТОБАНКИ
Graeme Fulton разбирается в отношении фотобанков к фото и иллюстрациям, созданным с помощью инструментов алгоритмического дизайна. Классические осторожничают, но есть новые специализированные.
А вот что делали классические компании:
— Shutterstock запустил партнёрство с DALL-E 2. Можно будет генерировать графику прямо внутри фотобанка.
— Adobe Stock разрешил продавать такие фото и иллюстрации. Правда, с пачкой ограничений (например, нельзя копировать чужой стиль).
— Люди на выбор: Generated Humans, MetaHuman.
АВАТАРЫ
Благодаря технике Google DreamBooth, которая позволяет добавлять новые объекты к уже обученным диффузным моделям, хайпанули стилизаторы аватаров:
— Lensa Magic Avatars
— AI Profile Picture Generator
— Avatar AI
ВИДЕО
Генераторы видео от Меты Make-A-Video и Google Imagen Video.
ИНСТРУМЕНТЫ ДИЗАЙНА И ДИЗАЙН-ПРОЦЕСС
Keima Kai: Анализирует, может ли алгоритмический дизайн помочь на каждом этапе работы над сайтом.
Magician: Плагин для Figma от Jordan Singer, который генерирует иконки, тексты и иллюстрации. Обещают пополнять магию в будущем.
Interior AI: Инструмент помогает делать наброски интерьеров.
New York Times: Мини-интервью о применении новых инструментов алгоритмического дизайна в разных отраслях — игры, интерьеры, реклама, проектирование услуг.
РАЗРАБОТКА
«Привет, GitHub»: GitHub открыл тестирование голосового помощника для своего ИИ-сервиса Copilot.
ADOBE SNEAKS
Новые эксперименты с Adobe MAX 2022 на базе платформы Sensei:
— #CleverComposites вставляет объекты на фото с учётом композиции, перспективы и освещения
— #InstantAdd вставляет элементы в видео с обтравкой и учётом движения объекта, на который добавили картинку
— #ProjectMagneticType добавляет графические элементы к шрифту, которые потом ведут себя как его часть при изменении надписи
— #ProjectVectorEdge накладывает графические элементы на макеты упаковки, которые органично ложатся на поверхность в любой проекции
— #ProjectMotionMix совмещает движущуюся модель объекта и фото другого объекта, так что он сам начинает двигаться
— #ProjectBlink позволяет редактировать видео выступлений почти как текст — искать по фразе, вырезать ненужное и т.п.
— #ArtisticScenes создаёт 3D-модель из фото пространства и накладывает на него любой стиль
— #ProjectAllofMe даёт расширенное редактирование фото: дорисовать недостающее по краям, поменять одежду и т.п.
— #ProjectBeyondTheSeen генерирует полную 3D-сцену помещения по фото и позволяет добавлять туда другие объекты
— #ProjectMadeInTheShade работает с тенями на фото — перерассчитывает их при добавлении новых элементов на фото или перемещении по сцене
РАЗНОЕ
Matthew Ström: Научился генерировать картинки Open Graph для своего блога.
Meg Kurdziolek: Концепция XAI (Explainable AI). Она помогает рассказать пользователям и специалистам о принципах работы систем с ИИ.
#ai #algorithms
ТЕКСТЫ
ChatGPT: Новая модель от OpenAI генерирует правдоподобные тексты (хотя зачастую по факту ошибочные). Её уже приспосабливают для написания статей и других крупных материалов. Это один из самых горячих запусков — за первую неделю ей воспользовались больше 1 млн человек.
Matthias Ott провёл интересный эксперимент — пообщался на тему типографики и продуктового дизайна. Ответы звучали правдоподобно, хотя это главный риск этой модели — она часто выдаёт просто салат из слов, где не эксперту сложно оценить достоверность. С другой стороны, если посмотреть прорву статей на Medium от начинающих дизайнеров — там тоже хватает этих проблем. Так что нас ждёт много интересных этических вопросов.
Notion AI: Алгоритмический помощник по написанию текстов от Notion. Может набросать публикацию в блоге, письмо и другие материалы. Пока в закрытой бете, но интеграция таких вещей в сам инструмент — лучший вариант. Обзор.
Ну и отдельные сервисы-генераторы: CopyMonkey, Jasper.
ФОТОБАНКИ
Graeme Fulton разбирается в отношении фотобанков к фото и иллюстрациям, созданным с помощью инструментов алгоритмического дизайна. Классические осторожничают, но есть новые специализированные.
А вот что делали классические компании:
— Shutterstock запустил партнёрство с DALL-E 2. Можно будет генерировать графику прямо внутри фотобанка.
— Adobe Stock разрешил продавать такие фото и иллюстрации. Правда, с пачкой ограничений (например, нельзя копировать чужой стиль).
— Люди на выбор: Generated Humans, MetaHuman.
АВАТАРЫ
Благодаря технике Google DreamBooth, которая позволяет добавлять новые объекты к уже обученным диффузным моделям, хайпанули стилизаторы аватаров:
— Lensa Magic Avatars
— AI Profile Picture Generator
— Avatar AI
ВИДЕО
Генераторы видео от Меты Make-A-Video и Google Imagen Video.
ИНСТРУМЕНТЫ ДИЗАЙНА И ДИЗАЙН-ПРОЦЕСС
Keima Kai: Анализирует, может ли алгоритмический дизайн помочь на каждом этапе работы над сайтом.
Magician: Плагин для Figma от Jordan Singer, который генерирует иконки, тексты и иллюстрации. Обещают пополнять магию в будущем.
Interior AI: Инструмент помогает делать наброски интерьеров.
New York Times: Мини-интервью о применении новых инструментов алгоритмического дизайна в разных отраслях — игры, интерьеры, реклама, проектирование услуг.
РАЗРАБОТКА
«Привет, GitHub»: GitHub открыл тестирование голосового помощника для своего ИИ-сервиса Copilot.
ADOBE SNEAKS
Новые эксперименты с Adobe MAX 2022 на базе платформы Sensei:
— #CleverComposites вставляет объекты на фото с учётом композиции, перспективы и освещения
— #InstantAdd вставляет элементы в видео с обтравкой и учётом движения объекта, на который добавили картинку
— #ProjectMagneticType добавляет графические элементы к шрифту, которые потом ведут себя как его часть при изменении надписи
— #ProjectVectorEdge накладывает графические элементы на макеты упаковки, которые органично ложатся на поверхность в любой проекции
— #ProjectMotionMix совмещает движущуюся модель объекта и фото другого объекта, так что он сам начинает двигаться
— #ProjectBlink позволяет редактировать видео выступлений почти как текст — искать по фразе, вырезать ненужное и т.п.
— #ArtisticScenes создаёт 3D-модель из фото пространства и накладывает на него любой стиль
— #ProjectAllofMe даёт расширенное редактирование фото: дорисовать недостающее по краям, поменять одежду и т.п.
— #ProjectBeyondTheSeen генерирует полную 3D-сцену помещения по фото и позволяет добавлять туда другие объекты
— #ProjectMadeInTheShade работает с тенями на фото — перерассчитывает их при добавлении новых элементов на фото или перемещении по сцене
РАЗНОЕ
Matthew Ström: Научился генерировать картинки Open Graph для своего блога.
Meg Kurdziolek: Концепция XAI (Explainable AI). Она помогает рассказать пользователям и специалистам о принципах работы систем с ИИ.
#ai #algorithms
Openai
Introducing ChatGPT
We’ve trained a model called ChatGPT which interacts in a conversational way. The dialogue format makes it possible for ChatGPT to answer followup questions, admit its mistakes, challenge incorrect premises, and reject inappropriate requests.
В прошлом году перезапустил сайт-коллекцию алгоритмического дизайна. Огромное спасибо агентству Embacy, которые нашли отличную концепцию «генеративное всё» (на компьютере интереснее) и перевезли всё на Webflow.
Моей стратегической ошибкой на старте был выбор Readymag — это крутой инструмент, но не для постоянно обновляемой коллекции. В итоге я сдался и несколько лет вбивал весь свежий материал в записную, а не на сайт. Но теперь значительная часть архива попала на сайт и можно анонсировать. Надо перебрать ещё с полсотни ссылок, за месяц справлюсь.
Ок, теперь про свежак:
1. Galileo: Инструмент алгоритмического дизайна обещает делать экраны интерфейса по текстовому описанию. Макет можно отредактировать в Figma, а ещё — сгенерировать иллюстрации и тексты.
2. Runway: Инструмент алгоритмического дизайна, который собрал вместе популярные сейчас функции отдельных утилит.
3. Топовейшая инициатива — какие исходные изображения в обучающих данных моделей вроде Stable Diffusion помогли сгенерировать вашу картинку.
4. Инвестфонд Felicis Ventures вложился во много инструментов алгоритмического дизайна, основанных на вводе текстового запроса от пользователя. Они сделали обзор своего портфеля.
5. MusicLM: Экспериментальная нейросеть Google, которая генерирует музыку по текстовому описанию. Научная публикация.
6. Point-E: Генератор 3D-моделей объектов по текстовому запросу от OpenAI. Обзор.
7. Studio: В 2017 году они запустились как обычный инструмент дизайна интерфейсов, а теперь переосмыслили себя в сторону связки с алгоритмическим дизайном. Пока можно только встать в очередь на бета-версию.
8. Aaron Hertzmann: Интереснейшие параллели текущего бума инструментов алгоритмического дизайна и других веток искусства и культуры за последние пару сотен лет. Он видит текущую стадию развития как промежуточную и показывает много уместных аналогий.
9. Poly: Инструмент алгоритмического дизайна генерирует текстуры для 3D-моделирования.
10. VALL-E: Экспериментальная модель Microsoft, которая генерирует аудио-запись любой фразы нужным голосом. Нужен только небольшой образец оригинала.
11. Calibri: Как делали иллюстрации для настольной игры «Колибриум» с помощью Midjourney.
12. Ogilvy Paris: Расширили картину Вермеера «Молочница» с помощью DALL-E 2 для рекламной кампании Nestle.
13. De Voorhoede: Агентство попробовало обучить Stable Diffusion генерировать их фирменный стиль иллюстраций. Получилось относительно похоже, но использовать в жизни нельзя.
14. Maggie Appleton: Использование термина «искусственный интеллект» для описания текущих экспериментов и продуктов стало бессмысленным — надо говорить о конкретной модели и технологии.
15. BBDO: Пробуют использовать в проектах инструменты, генерирующие графику по текстовому описанию. Спойлер: пока больше для экспериментов.
16. Дизайн-сообщество обнаружило, что Adobe начали брать разрешение на запись действий пользователей в своих продуктах в пользу своей платформы алгоритмического дизайна Sensei. Кто-то подозревает, что они могут записывать действия при создании работы, чтобы научить Sensei генерировать похожие (но это не точно).
17. Сервис для видео-трансляций NVIDIA Broadcast научился имитировать взгляд человека в камеру в реальном времени.
Ссылок снова овердофига, так что в четверг второй выпуск.
#ai #algorithms
Моей стратегической ошибкой на старте был выбор Readymag — это крутой инструмент, но не для постоянно обновляемой коллекции. В итоге я сдался и несколько лет вбивал весь свежий материал в записную, а не на сайт. Но теперь значительная часть архива попала на сайт и можно анонсировать. Надо перебрать ещё с полсотни ссылок, за месяц справлюсь.
Ок, теперь про свежак:
1. Galileo: Инструмент алгоритмического дизайна обещает делать экраны интерфейса по текстовому описанию. Макет можно отредактировать в Figma, а ещё — сгенерировать иллюстрации и тексты.
2. Runway: Инструмент алгоритмического дизайна, который собрал вместе популярные сейчас функции отдельных утилит.
3. Топовейшая инициатива — какие исходные изображения в обучающих данных моделей вроде Stable Diffusion помогли сгенерировать вашу картинку.
4. Инвестфонд Felicis Ventures вложился во много инструментов алгоритмического дизайна, основанных на вводе текстового запроса от пользователя. Они сделали обзор своего портфеля.
5. MusicLM: Экспериментальная нейросеть Google, которая генерирует музыку по текстовому описанию. Научная публикация.
6. Point-E: Генератор 3D-моделей объектов по текстовому запросу от OpenAI. Обзор.
7. Studio: В 2017 году они запустились как обычный инструмент дизайна интерфейсов, а теперь переосмыслили себя в сторону связки с алгоритмическим дизайном. Пока можно только встать в очередь на бета-версию.
8. Aaron Hertzmann: Интереснейшие параллели текущего бума инструментов алгоритмического дизайна и других веток искусства и культуры за последние пару сотен лет. Он видит текущую стадию развития как промежуточную и показывает много уместных аналогий.
9. Poly: Инструмент алгоритмического дизайна генерирует текстуры для 3D-моделирования.
10. VALL-E: Экспериментальная модель Microsoft, которая генерирует аудио-запись любой фразы нужным голосом. Нужен только небольшой образец оригинала.
11. Calibri: Как делали иллюстрации для настольной игры «Колибриум» с помощью Midjourney.
12. Ogilvy Paris: Расширили картину Вермеера «Молочница» с помощью DALL-E 2 для рекламной кампании Nestle.
13. De Voorhoede: Агентство попробовало обучить Stable Diffusion генерировать их фирменный стиль иллюстраций. Получилось относительно похоже, но использовать в жизни нельзя.
14. Maggie Appleton: Использование термина «искусственный интеллект» для описания текущих экспериментов и продуктов стало бессмысленным — надо говорить о конкретной модели и технологии.
15. BBDO: Пробуют использовать в проектах инструменты, генерирующие графику по текстовому описанию. Спойлер: пока больше для экспериментов.
16. Дизайн-сообщество обнаружило, что Adobe начали брать разрешение на запись действий пользователей в своих продуктах в пользу своей платформы алгоритмического дизайна Sensei. Кто-то подозревает, что они могут записывать действия при создании работы, чтобы научить Sensei генерировать похожие (но это не точно).
17. Сервис для видео-трансляций NVIDIA Broadcast научился имитировать взгляд человека в камеру в реальном времени.
Ссылок снова овердофига, так что в четверг второй выпуск.
#ai #algorithms
algorithms.design
Algorithm-Driven Design — How Artificial Intelligence is Changing Design by Yury Vetrov
Will robots replace designers? No. It's more like an exoskeleton for designers. Algorithm-driven design tools can help us to construct a UI, prepare assets and content, and personalize the user experience.
Продолжаю выгрузку свежего про алгоритмический дизайн, многое из которого попало на обновлённый сайт-коллекцию. Ещё раз огромное спасибо агентству Embacy, которые нашли отличную концепцию «генеративное всё» (на компьютере интереснее) и перевезли всё на Webflow.
ChatGPT — основной источник жарких новостей в последние месяцы. Говорят, что на конец января им пользовалось уже 100 млн человек — самый эпичный рост в истории. Что под капотом.
Некоторые из полезных вещей для дизайнеров:
1. Сергей Никишкин из Acronis попробовал написать три плагина для Figma. В целом получается, хотя не сразу и не всегда оптимально.
2. Lawton Pybus попробовал написать сценарий юзабилити-тестирования. По форме похоже на правду, по сути — много дырок и воды.
3. Интервью с Evan Shore из Walmart о том, как они прокачали ChatGPT помогать им в описании Job Stories.
4. Irina Nik показывает, как условный ChatGPT (точнее, модель GPT-3 от того же OpenAI) может помочь в поиске по базе знаний и инсайтов из пользовательских исследований. Она даёт простую инструкцию по запуску такого поиска.
5. Детская книга «Blueberry & the Bear and Other Stories», написанная с его помощью. Иллюстрации к ней также сделаны инструментами алгоритмического дизайна.
6. Печатная машинка использует его для генерации текстов и автоматической печати от Arvind Sanjeev.
7. Экспериментальный новостной сайт The Valley Times, на котором новости генерирует ChatGPT, а картинки — также нейросети.
Как всегда, этика падает жертвой:
1. Очередная дикая история про то, как качество результатов инструментов алгоритмического дизайна обеспечивается дармовым трудом людей из какой-нибудь далёкой страны.
2. OpenAI выпустили инструмент, помогающий отличить текст, написанный человеком, от работы робота. Правда, пока срабатывает только в части случаев.
3. Школы Нью-Йорка запретили ChatGPT.
P.S. Всё летит так быстро, что с понедельника добавились пара ссылок к тогдашней общей подборке:
1. Scribbble Diffusion: Инструмент превращает набросок в фотографию с помощью алгоритмического дизайна.
2. Анастасия Дедова рассказывает, как решала реальную задачу для онлайн-казино с помощью Midjourney.
3. Phygital+ AI Library: Огромнейший каталог инструментов и моделей алгоритмического дизайна. Обычно не даю ссылки на другие подборки, потому что для меня важнее вытащить суть и конкретное новое, но тут объём фантастический.
Цель моей коллекции — скорее показать виды дизайнерских задач, которые могут закрыть такие инструменты, а не ультимативный каталог. Поэтому многое просеиваю.
#ai #algorithms
ChatGPT — основной источник жарких новостей в последние месяцы. Говорят, что на конец января им пользовалось уже 100 млн человек — самый эпичный рост в истории. Что под капотом.
Некоторые из полезных вещей для дизайнеров:
1. Сергей Никишкин из Acronis попробовал написать три плагина для Figma. В целом получается, хотя не сразу и не всегда оптимально.
2. Lawton Pybus попробовал написать сценарий юзабилити-тестирования. По форме похоже на правду, по сути — много дырок и воды.
3. Интервью с Evan Shore из Walmart о том, как они прокачали ChatGPT помогать им в описании Job Stories.
4. Irina Nik показывает, как условный ChatGPT (точнее, модель GPT-3 от того же OpenAI) может помочь в поиске по базе знаний и инсайтов из пользовательских исследований. Она даёт простую инструкцию по запуску такого поиска.
5. Детская книга «Blueberry & the Bear and Other Stories», написанная с его помощью. Иллюстрации к ней также сделаны инструментами алгоритмического дизайна.
6. Печатная машинка использует его для генерации текстов и автоматической печати от Arvind Sanjeev.
7. Экспериментальный новостной сайт The Valley Times, на котором новости генерирует ChatGPT, а картинки — также нейросети.
Как всегда, этика падает жертвой:
1. Очередная дикая история про то, как качество результатов инструментов алгоритмического дизайна обеспечивается дармовым трудом людей из какой-нибудь далёкой страны.
2. OpenAI выпустили инструмент, помогающий отличить текст, написанный человеком, от работы робота. Правда, пока срабатывает только в части случаев.
3. Школы Нью-Йорка запретили ChatGPT.
P.S. Всё летит так быстро, что с понедельника добавились пара ссылок к тогдашней общей подборке:
1. Scribbble Diffusion: Инструмент превращает набросок в фотографию с помощью алгоритмического дизайна.
2. Анастасия Дедова рассказывает, как решала реальную задачу для онлайн-казино с помощью Midjourney.
3. Phygital+ AI Library: Огромнейший каталог инструментов и моделей алгоритмического дизайна. Обычно не даю ссылки на другие подборки, потому что для меня важнее вытащить суть и конкретное новое, но тут объём фантастический.
Цель моей коллекции — скорее показать виды дизайнерских задач, которые могут закрыть такие инструменты, а не ультимативный каталог. Поэтому многое просеиваю.
#ai #algorithms
algorithms.design
Algorithm-Driven Design — How Artificial Intelligence is Changing Design by Yury Vetrov
Will robots replace designers? No. It's more like an exoskeleton for designers. Algorithm-driven design tools can help us to construct a UI, prepare assets and content, and personalize the user experience.
Свежая выгрузка инструментов и в целом движа в алгоритмическом дизайне:
1. Adobe Firefly: Инструмент вышел из беты и доступен подписчикам Creative Cloud.
2. Everypixel: Статистика по количеству изображений сгенерированных инструментами алгоритмического дизайна DALL-E 2, Stable Diffusion, Midjourney и Adobe Firefly. Темпы роста огромные, хотя сюда, судя по всему, включены все промежуточные итерации, которые не идут в финальный макет.
3. Jambot: Официальный плагин на базе ChatGPT для FigJam. Он может просуммировать результаты брейншторма и сгенерировать идеи. Интервью с командой создателей.
4. Midjourney Inpainting: Новая функция позволяет изменить только часть изображения — например, только персонажа, не трогая саму сцену.
5. Matej Latin: Изучил, насколько удачно подбирают шрифтовые пары сервисы алгоритмического дизайна FontJoy и ChatGPT. Кое-что могут, но с кучей проблем и ограничений.
6. DreamFace: Генерация реалистичных трёхмерных моделей лиц по текстовому описанию. Они анимированы и текстурированы.
7. Captions: Многофункциональный алгоритмический инструмент создания и обработки аудио и видео. Генерирует голос по кусочку его записи, убирает слова-паразиты, улучшает попадание мимики рта в произносимый текст и много чего ещё.
8. Maggie Appleton: Презентация о современных языковых моделях и алгоритмических сервисах. Она описывает особенности их построения, проблемы в получении внятных результатов и свои интерфейсные концепты их решения.
9. TextFX: Экспериментальный проект Google, который помогает реперам писать рифмы.
10. HayGen Video Translate: Сервис переводит видео на другой язык. При этом он сохраняет голос и подгоняет мимику персонажа под новый текст.
11. Stable Audio: Новая модель от создателей Stable Diffusion позволяет генерировать музыку по текстовому описанию.
12. AudioGen: Экспериментальное решение Меты позволяет генерировать звуки по текстовому описанию.
13. Musicfy: Сервис позволяет напеть мотив песни и преобразовывает его в мелодию на конкретном инструменте.
14. Albus: Экспериментальная записная книжка на базе ChatGPT, которая помогает исследовать тему с разных сторон и генерировать заметки о ней.
#ai #algorithms
1. Adobe Firefly: Инструмент вышел из беты и доступен подписчикам Creative Cloud.
2. Everypixel: Статистика по количеству изображений сгенерированных инструментами алгоритмического дизайна DALL-E 2, Stable Diffusion, Midjourney и Adobe Firefly. Темпы роста огромные, хотя сюда, судя по всему, включены все промежуточные итерации, которые не идут в финальный макет.
3. Jambot: Официальный плагин на базе ChatGPT для FigJam. Он может просуммировать результаты брейншторма и сгенерировать идеи. Интервью с командой создателей.
4. Midjourney Inpainting: Новая функция позволяет изменить только часть изображения — например, только персонажа, не трогая саму сцену.
5. Matej Latin: Изучил, насколько удачно подбирают шрифтовые пары сервисы алгоритмического дизайна FontJoy и ChatGPT. Кое-что могут, но с кучей проблем и ограничений.
6. DreamFace: Генерация реалистичных трёхмерных моделей лиц по текстовому описанию. Они анимированы и текстурированы.
7. Captions: Многофункциональный алгоритмический инструмент создания и обработки аудио и видео. Генерирует голос по кусочку его записи, убирает слова-паразиты, улучшает попадание мимики рта в произносимый текст и много чего ещё.
8. Maggie Appleton: Презентация о современных языковых моделях и алгоритмических сервисах. Она описывает особенности их построения, проблемы в получении внятных результатов и свои интерфейсные концепты их решения.
9. TextFX: Экспериментальный проект Google, который помогает реперам писать рифмы.
10. HayGen Video Translate: Сервис переводит видео на другой язык. При этом он сохраняет голос и подгоняет мимику персонажа под новый текст.
11. Stable Audio: Новая модель от создателей Stable Diffusion позволяет генерировать музыку по текстовому описанию.
12. AudioGen: Экспериментальное решение Меты позволяет генерировать звуки по текстовому описанию.
13. Musicfy: Сервис позволяет напеть мотив песни и преобразовывает его в мелодию на конкретном инструменте.
14. Albus: Экспериментальная записная книжка на базе ChatGPT, которая помогает исследовать тему с разных сторон и генерировать заметки о ней.
#ai #algorithms
The Verge
Adobe’s Firefly generative AI tools are now available for everyone
And it’s launching a “Stock Contributor Bonus” to pay creator royalties.
На конференции Adobe MAX 2023 традиционно показали пачку экспериментов с Adobe Firefly (раньше он назывался Sensei). И прокачали саму платформу алгоритмического дизайна:
1. Обновили базовую модель Firefly. Она научилась генерировать картинки в заданном стиле (нужно дать несколько примеров или выбрать из существующих рефов). Точнее генерирует людей и позволяет настраивать параметры «фотосъёмки». Помогает задавать правильные запросы (и предлагает подсказки). Ну и, само собой, даёт более лучшее качество.
2. Добавили векторную модель Firefly. Она помогает генерировать объекты, которые вписываются в стиль целевой иллюстрации, делает текстуры и градиенты, ну и правильно организует геометрию и слои.
3. Сделали модель Firefly Design. Она генерирует цельные редактируемые шаблоны (пока для их инструмента Adobe Express), которые адаптируются для разных сред вроде соцсетей или печати. Предлагает варианты текста, графики и композиции.
Кстати, недавно Firefly стал доступен через API в платформе NVIDIA Omniverse.
А вот свежие дикие штуки Adobe Sneaks:
#ProjectFastFill: Добавляет и удаляет объекты на видео таким же простым способом, то и Generative Fill.
#ProjectDraw&Delight: Превращает простейшие наброски рисунков в базовые контурные или полноцветные иллюстрации. Сюжет можно развивать и дополнять постепенно, менять позы персонажей, а также раскрашивать в духе недавнего запуска Illustrator Generative Recolor, ну и доделывать в самом Illustrator.
#ProjectNeo: Создаёт псевдо-трёхмерные иллюстрации с помощью простейших объектов. В примере делают архитектурный объект, который выглядит как векторная иллюстрация.
#ProjectSceneChange: Позволяет вставить персонажа из видео в любую другую сцену. Причём он докручивает оба видео, чтобы подходили друг к другу.
#ProjectPrimrose: Платье из простых текстур меняет цвет. Причём может делать анимацию из этого.
#ProjectGlyphEase: Создаёт шрифт на основе трёх знаков для примера, даже если это набросок на бумаге. И стилизует его в нужной технике, в том числе сверх-декоративной.
#ProjectPoseable: Генерирует наброски персонажей для сценарных раскадровок. Можно быстро настроить позу модели среди предложенных и описать нужный образ со сценой.
#ProjectResUp: Повышает разрешение видео маленького размера.
#ProjectDubDubDub: Генерирует дубляж видео или перевод аудио-записей на любой язык. Пытается вписаться в акустическое окружение сцены.
#ProjectStardust: Редактирует фото простым способом: переместить, добавить или убрать объекты, поменять одежду или дорисовать недостающую часть человека.
#ProjectSeeThrough: Убирает отражения и блики с фото, сделанных через стекло.
Скорость попадания этих набросков в основные продукты сильно выросла и в этом Adobe здорово уделывает хейтеров. И если в 2020 году тема почти сдулась, то сейчас снова тонна вдохновляющего.
#ai #algorithms #adobe #events
1. Обновили базовую модель Firefly. Она научилась генерировать картинки в заданном стиле (нужно дать несколько примеров или выбрать из существующих рефов). Точнее генерирует людей и позволяет настраивать параметры «фотосъёмки». Помогает задавать правильные запросы (и предлагает подсказки). Ну и, само собой, даёт более лучшее качество.
2. Добавили векторную модель Firefly. Она помогает генерировать объекты, которые вписываются в стиль целевой иллюстрации, делает текстуры и градиенты, ну и правильно организует геометрию и слои.
3. Сделали модель Firefly Design. Она генерирует цельные редактируемые шаблоны (пока для их инструмента Adobe Express), которые адаптируются для разных сред вроде соцсетей или печати. Предлагает варианты текста, графики и композиции.
Кстати, недавно Firefly стал доступен через API в платформе NVIDIA Omniverse.
А вот свежие дикие штуки Adobe Sneaks:
#ProjectFastFill: Добавляет и удаляет объекты на видео таким же простым способом, то и Generative Fill.
#ProjectDraw&Delight: Превращает простейшие наброски рисунков в базовые контурные или полноцветные иллюстрации. Сюжет можно развивать и дополнять постепенно, менять позы персонажей, а также раскрашивать в духе недавнего запуска Illustrator Generative Recolor, ну и доделывать в самом Illustrator.
#ProjectNeo: Создаёт псевдо-трёхмерные иллюстрации с помощью простейших объектов. В примере делают архитектурный объект, который выглядит как векторная иллюстрация.
#ProjectSceneChange: Позволяет вставить персонажа из видео в любую другую сцену. Причём он докручивает оба видео, чтобы подходили друг к другу.
#ProjectPrimrose: Платье из простых текстур меняет цвет. Причём может делать анимацию из этого.
#ProjectGlyphEase: Создаёт шрифт на основе трёх знаков для примера, даже если это набросок на бумаге. И стилизует его в нужной технике, в том числе сверх-декоративной.
#ProjectPoseable: Генерирует наброски персонажей для сценарных раскадровок. Можно быстро настроить позу модели среди предложенных и описать нужный образ со сценой.
#ProjectResUp: Повышает разрешение видео маленького размера.
#ProjectDubDubDub: Генерирует дубляж видео или перевод аудио-записей на любой язык. Пытается вписаться в акустическое окружение сцены.
#ProjectStardust: Редактирует фото простым способом: переместить, добавить или убрать объекты, поменять одежду или дорисовать недостающую часть человека.
#ProjectSeeThrough: Убирает отражения и блики с фото, сделанных через стекло.
Скорость попадания этих набросков в основные продукты сильно выросла и в этом Adobe здорово уделывает хейтеров. И если в 2020 году тема почти сдулась, то сейчас снова тонна вдохновляющего.
#ai #algorithms #adobe #events
Adobe
Adobe MAX 2024 - The Creativity Conference
Did you miss out on Adobe MAX 2024? Don't worry, you can still explore the latest tools and trends in design, video, photography, 3D, generative AI, and more.
Как всегда, подборка свежего по алгоритмическому дизайну с трудом помещается в один выпуск:
DALL-E 3: Новое поколение позволяет точнее описать детали сцены, рисует людей с меньшим количеством галлюцинаций и генерирует корректный текст. Этические барьеры расширили — помимо известных людей, теперь нельзя мимикрировать под стиль ныне живущих художников (как убрать себя из обучения модели).
v0 by Vercel: Платформа для разработчиков Vercel запустила генератор интерфейсных компонентов. На выходе — код React на базе shadcn/ui и Tailwind CSS. Логика построения компонентов рандомная, но затея интересная.
Getty Images Generative AI: Официальный генератор фото от Getty Images и NVIDIA. Они тренировали его на своей базе фотографий и вроде как платят авторам рефов. Обещают полную лицензионную безопасность.
Baymard: Попробовали ChatGPT для экспертной оценки интерфейса по скриншоту и настоящей ссылке. Результаты мусорные ― находит крайне мало реальных проблем и выдумывает много несуществующих.
NN/g: Типичные задачи, для которых дизайнеры используют алгоритмические инструменты.
User Interviews: Что и для каких задач используют UX-исследователи.
Figma: Особенности современных инструментов для разработчиков, которые автоматизируют часть работы и генерируют код. И что из этого подошло для нового режима для разработчиков в Figma.
NN/g: Несколько моделей поведения пользователей при работе с генеративными сервисами.
Louis Charron: Как «галлюцинации» в генераторах картинок помогают креативности. Он сравнил разные версии Midjourney, которые сначала теряли поэтичность, а под конец немного вернули её.
Андрей Ковалёв: Коллекция стилей, в которые умеет Midjourney. Их можно использовать в своих запросах.
Vizcom: Превращает наброски от руки в полноценные 3D-рендеры.
YandexArt: Обновлённый генератор графики, который развивает прошлое поколение Шедеврум.
NN/g: Почему пользователи присваивают человеческие качества генеративным чат-помощникам и общаются с ними соответствующе.
Алина Сидоренко: Толковая памятка по работе с Midjourney. Как получить результат в разных стилях и видах дизайна (иллюстрации, текстуры, логотипы, интерфейсы и т.п.).
NN/g: Исследование генеративных ботов Bard, Bing и ChatGPT. Насколько хорошо они решают разные задачи.
YouTube: Будет предлагать идеи и сценарии для видео на основе данных об аудитории и её предпочтениях. Авторы смогут генерировать фоны по текстовому запросу и автоматически дублировать ролики на другие языки.
ChatGPT: Сможет принимать запросы голосом и лучше анализировать загруженные картинки. Например, предложит рецепт на основе фото продуктов в холодильнике. На такой картинке можно выделить детали, про которые хочется узнать. Тест-драйв.
Генератор скрытых слов на изображениях на базе Stable Diffusion и ControlNet.
Александр Селедчик: Чеклист поможет определить фото, сгенерированное алгоритмами.
Android 14: Генерирует фоны для телефона.
TryOnDiffusion: Экспериментальный инструмент «примеряет» любую одежду на ваше фото.
Jakob Nielsen: Какие метафоры кроме клишированного робота предлагают инструменты для показа самого ИИ.
Javi Lopez: Мини-игра Angry Pumpkins, сделанная с помощью DALL-E и Midjourney (графика) и GPT-4 (код).
Мета: Оцифровали пару десятков знаменитостей вроде Mr Beast и Snoop Dogg в качестве ИИ-ботов для чата с говорящей головой. И добавили много разных функций вроде алгоритмической генерации стикеров и редактирования фото.
Luma AI: Генератор 3D-моделей и сцен.
Kaiber: Генератор видео-клипов на основе текстового запроса, других видео, фото и аудио.
Suno AI: Генератор песен с вашими словами в разных жанрах.
Just AI Copilot: Свой ChatGPT от Just AI.
IKEA Instructions: Генератор иллюстраций в духе инструкций IKEA на базе Stable Diffusion XL.
Microsoft Copilot: Выходит в свежем обновлении Windows.
Spirals: Генератор спиралевидных фото.
AI Dubbing: Сервис переводит видео на другой язык. При этом он сохраняет голос персонажа.
EmojiGen: Генератор memoji.
#ai #algorithms
DALL-E 3: Новое поколение позволяет точнее описать детали сцены, рисует людей с меньшим количеством галлюцинаций и генерирует корректный текст. Этические барьеры расширили — помимо известных людей, теперь нельзя мимикрировать под стиль ныне живущих художников (как убрать себя из обучения модели).
v0 by Vercel: Платформа для разработчиков Vercel запустила генератор интерфейсных компонентов. На выходе — код React на базе shadcn/ui и Tailwind CSS. Логика построения компонентов рандомная, но затея интересная.
Getty Images Generative AI: Официальный генератор фото от Getty Images и NVIDIA. Они тренировали его на своей базе фотографий и вроде как платят авторам рефов. Обещают полную лицензионную безопасность.
Baymard: Попробовали ChatGPT для экспертной оценки интерфейса по скриншоту и настоящей ссылке. Результаты мусорные ― находит крайне мало реальных проблем и выдумывает много несуществующих.
NN/g: Типичные задачи, для которых дизайнеры используют алгоритмические инструменты.
User Interviews: Что и для каких задач используют UX-исследователи.
Figma: Особенности современных инструментов для разработчиков, которые автоматизируют часть работы и генерируют код. И что из этого подошло для нового режима для разработчиков в Figma.
NN/g: Несколько моделей поведения пользователей при работе с генеративными сервисами.
Louis Charron: Как «галлюцинации» в генераторах картинок помогают креативности. Он сравнил разные версии Midjourney, которые сначала теряли поэтичность, а под конец немного вернули её.
Андрей Ковалёв: Коллекция стилей, в которые умеет Midjourney. Их можно использовать в своих запросах.
Vizcom: Превращает наброски от руки в полноценные 3D-рендеры.
YandexArt: Обновлённый генератор графики, который развивает прошлое поколение Шедеврум.
NN/g: Почему пользователи присваивают человеческие качества генеративным чат-помощникам и общаются с ними соответствующе.
Алина Сидоренко: Толковая памятка по работе с Midjourney. Как получить результат в разных стилях и видах дизайна (иллюстрации, текстуры, логотипы, интерфейсы и т.п.).
NN/g: Исследование генеративных ботов Bard, Bing и ChatGPT. Насколько хорошо они решают разные задачи.
YouTube: Будет предлагать идеи и сценарии для видео на основе данных об аудитории и её предпочтениях. Авторы смогут генерировать фоны по текстовому запросу и автоматически дублировать ролики на другие языки.
ChatGPT: Сможет принимать запросы голосом и лучше анализировать загруженные картинки. Например, предложит рецепт на основе фото продуктов в холодильнике. На такой картинке можно выделить детали, про которые хочется узнать. Тест-драйв.
Генератор скрытых слов на изображениях на базе Stable Diffusion и ControlNet.
Александр Селедчик: Чеклист поможет определить фото, сгенерированное алгоритмами.
Android 14: Генерирует фоны для телефона.
TryOnDiffusion: Экспериментальный инструмент «примеряет» любую одежду на ваше фото.
Jakob Nielsen: Какие метафоры кроме клишированного робота предлагают инструменты для показа самого ИИ.
Javi Lopez: Мини-игра Angry Pumpkins, сделанная с помощью DALL-E и Midjourney (графика) и GPT-4 (код).
Мета: Оцифровали пару десятков знаменитостей вроде Mr Beast и Snoop Dogg в качестве ИИ-ботов для чата с говорящей головой. И добавили много разных функций вроде алгоритмической генерации стикеров и редактирования фото.
Luma AI: Генератор 3D-моделей и сцен.
Kaiber: Генератор видео-клипов на основе текстового запроса, других видео, фото и аудио.
Suno AI: Генератор песен с вашими словами в разных жанрах.
Just AI Copilot: Свой ChatGPT от Just AI.
IKEA Instructions: Генератор иллюстраций в духе инструкций IKEA на базе Stable Diffusion XL.
Microsoft Copilot: Выходит в свежем обновлении Windows.
Spirals: Генератор спиралевидных фото.
AI Dubbing: Сервис переводит видео на другой язык. При этом он сохраняет голос персонажа.
EmojiGen: Генератор memoji.
#ai #algorithms
v0.dev
v0 by Vercel
Chat with v0. Generate UI with simple text prompts. Copy, paste, ship.
Новые ссылки об алгоритмическом дизайне пополняются быстрее, чем пакет с пакетами:
1. tldraw Make Real: Экспериментальный инструмент превращает наброски интерфейса от руки в аккуратный визуальный результат и код на React с помощью инструментов OpenAI. Можно дополнить скетч текстовым описанием того, что нужно. Причём интерфейс может иметь небанальную логику поведения. Обзор от создателей.
2. Midjourney: Бета-версия в браузере с человеческим интерфейсом.
3. KREA: Генератор изображений и видео по текстовому описанию (можно сделать условный набросок для точности). Умеет делать это в реальном времени (ещё пример). Может натренироваться на вашем собственном стиле.
4. NN/g: 6 типов общения с алгоритмическими чат-ботами и структура запроса к ним. Они провели дневниковое исследование среди пользователей ChatGPT, Bing Chat и Google Bard.
5. Luke Wroblewski: Подходы к интеграции алгоритмических возможностей в интерфейс цифровых продуктов.
6. Canva: Интегрировала инструменты алгоритмического сервиса Runway через встроенное приложение Magic Media.
7. Fusion Brain: Инструмент генерирует изображения и видео с помощью нейросети Kandinsky от Сбера.
8. YouTube: Серия экспериментов с генеративной музыкой. Dream Track создаёт композиции для коротких видео в духе нескольких музыкантов, вписавшихся в пилот. Music AI Tools генерирует музыку по текстовому описанию. Можно просто напеть зарисовку или сделать её другим способом, а потом перебирать инструменты и варианты звучания.
9. It's Nice That: Несколько дизайнеров описали свой рабочий процесс для задач, где они использовали инструменты алгоритмического дизайна. У всех достаточно хитрая солянка классических и новых приёмов.
10. Stable Diffusion: Теперь умеет генерировать видео по текстовому запросу.
11. Runway Motion Brush: Можно анимировать конкретную часть фото, если выделить её.
12. CLO: Генератор текстур для одежды по текстовому запросу в инструменте для цифровой моды.
13. Google: Экспериментальный генератор графики по текстовому запросу.
14. Runway TV: Экспериментальный генеративный телеканал от создателей алгоритмического инструмента для видео Runway.
15. Яндекс Маркет: Массовая генерация описаний товаров с YandexGPT.
16. Simon Willison: Советы по формулированию запросов в DALL-E 3.
17. Jakob Nielsen: Советует сравнивать алгоритмические инструменты не с лучшим экспертом в отрасли, а среднестатистическим. Ведь их основная ценность — повышать средний уровень в отрасли, а не обязательно совершать прорывы.
18. ChatGPT: Обновили модель до GPT-4 Turbo. Она обучалась на более свежей информации (до апреля 2023 года) и дешевле для разработчиков.
Также за последние месяцы начали появляться плагины вокруг дизайна вроде DoritosGPT (генерирует любые пачки чипсов Doritos), ConvertAnything (конвертирует кучу форматов изображений, видео, аудио и документов в кучу других форматов) и Canva (генерирует макеты для соцсетей и другие промо-материалы).
19. Яндекс Практикум: Пересказывает урок или объяснит сложный термин через YandexGPT.
20. Модельное агентство, которое предлагает алгоритмически сгенерированных моделей.
#ai #algorithms
1. tldraw Make Real: Экспериментальный инструмент превращает наброски интерфейса от руки в аккуратный визуальный результат и код на React с помощью инструментов OpenAI. Можно дополнить скетч текстовым описанием того, что нужно. Причём интерфейс может иметь небанальную логику поведения. Обзор от создателей.
2. Midjourney: Бета-версия в браузере с человеческим интерфейсом.
3. KREA: Генератор изображений и видео по текстовому описанию (можно сделать условный набросок для точности). Умеет делать это в реальном времени (ещё пример). Может натренироваться на вашем собственном стиле.
4. NN/g: 6 типов общения с алгоритмическими чат-ботами и структура запроса к ним. Они провели дневниковое исследование среди пользователей ChatGPT, Bing Chat и Google Bard.
5. Luke Wroblewski: Подходы к интеграции алгоритмических возможностей в интерфейс цифровых продуктов.
6. Canva: Интегрировала инструменты алгоритмического сервиса Runway через встроенное приложение Magic Media.
7. Fusion Brain: Инструмент генерирует изображения и видео с помощью нейросети Kandinsky от Сбера.
8. YouTube: Серия экспериментов с генеративной музыкой. Dream Track создаёт композиции для коротких видео в духе нескольких музыкантов, вписавшихся в пилот. Music AI Tools генерирует музыку по текстовому описанию. Можно просто напеть зарисовку или сделать её другим способом, а потом перебирать инструменты и варианты звучания.
9. It's Nice That: Несколько дизайнеров описали свой рабочий процесс для задач, где они использовали инструменты алгоритмического дизайна. У всех достаточно хитрая солянка классических и новых приёмов.
10. Stable Diffusion: Теперь умеет генерировать видео по текстовому запросу.
11. Runway Motion Brush: Можно анимировать конкретную часть фото, если выделить её.
12. CLO: Генератор текстур для одежды по текстовому запросу в инструменте для цифровой моды.
13. Google: Экспериментальный генератор графики по текстовому запросу.
14. Runway TV: Экспериментальный генеративный телеканал от создателей алгоритмического инструмента для видео Runway.
15. Яндекс Маркет: Массовая генерация описаний товаров с YandexGPT.
16. Simon Willison: Советы по формулированию запросов в DALL-E 3.
17. Jakob Nielsen: Советует сравнивать алгоритмические инструменты не с лучшим экспертом в отрасли, а среднестатистическим. Ведь их основная ценность — повышать средний уровень в отрасли, а не обязательно совершать прорывы.
18. ChatGPT: Обновили модель до GPT-4 Turbo. Она обучалась на более свежей информации (до апреля 2023 года) и дешевле для разработчиков.
Также за последние месяцы начали появляться плагины вокруг дизайна вроде DoritosGPT (генерирует любые пачки чипсов Doritos), ConvertAnything (конвертирует кучу форматов изображений, видео, аудио и документов в кучу других форматов) и Canva (генерирует макеты для соцсетей и другие промо-материалы).
19. Яндекс Практикум: Пересказывает урок или объяснит сложный термин через YandexGPT.
20. Модельное агентство, которое предлагает алгоритмически сгенерированных моделей.
#ai #algorithms
make real • tldraw
Draw a ui and make it real with tldraw.
Прошёл всего месяц, а по теме алгоритмического дизайна опять выше крыши новья:
Pika 1.0: Генератор видео по текстовому описанию вышел из беты и порвал танцпол своей безумной демкой.
Midjourney 6: Вышла альфа-версия нового поколения. Увеличили разрешение до 2048x2048, добавили генерацию небольших текстов, улучшили понимание самих запросов.
StorybookGPT: Плагин для ChatGPT генерирует описание компонентов для живого гайдлайна Storybook. Памятка по работе с ним.
iA (эксперты в работе над текстами): Оценивают сильные и слабые стороны алгоритмических инструментов в этом плане. Где они помогают и где бесполезны. В новой версии своего текстового редактора iA Writer 7 они использовали это понимание для интересной разметки авторства (вы, ChatGPT или другой источник).
DALL-E Party: Занятный эксперимент, который по циклу искажает цепочку генерации DALL-E. Он описывает картинку текстом, потом генерирует из него ещё одну картинку — и так по кругу.
Figma: Пообщались с менеджерами продуктов для массового пользователя, которые внедряют функции на базе ИИ. Как они строят продуктовую работу в таких случаях.
Angie Wang: Топчанское интерактивное размышление-повесть, в котором она сравнивает процесс обучения алгоритмов и маленького ребёнка — .
FlutterFlow AI Gen: Сервис для быстрой разработки мобильных приложений научился генерировать дизайн и код (фронт + бек) по текстовому запросу или наброску на бумаге. Он автоматизирует все этапы от идеи до реализации.
Alex Ivanovs: Описывает хронологию развития первого года жизни ChatGPT.
Krea: Добавили интересный метод «overlay view», который позволяет схематично набросать перспективу объекта и в целом основные элементы.
Microsoft Paint: Теперь тоже генерирует графику по текстовому описанию с функцией «Cocreator» на базе DALL-E 3. Видео-обзор.
Amazon Titan: Генератор изображений по текстовому описанию доступен на платформе AWS (видео-обзор).
Amazon Q: Ещё один алгоритмический помощник в AWS. Он подключается к корпоративным сервисам и помогает анализировать информацию из них.
Audiobox: Новая модель для генерации аудио от Меты. Может взять за основу ваш голос, текстовый запрос, готовую музыку и сгенерировать или доработать/переосмыслить их.
Output Co-Producer: Генератор семплов по текстовому запросу от создателей инструмента Output.
Instagram: Пробует менять фон в stories с помощью алгоритмического дизайна (ещё).
Исследователи Hugging Face и Carnegie Mellon University посчитали энергозатраты на генерацию изображений с помощью алгоритмического дизайна. Выходит много — сопоставимо с полной зарядкой телефона (исследование).
HeyGen Custom Avatar: Сервис создаёт фотореалистичные аватары пользователей, которые могут читать текст на видео. Голос и мимика — тоже ваши.
Magnific: Один из самых качественных алгоритмических сервисов по улучшению качества фото на базе.
Prompt Brush: Пародия на инструменты, работающие по текстовому запросу. Иллюстрацию по такому запросу руками рисует иллюстратор Pablo Delcan.
Luke Wroblewski: Советует давать подсказки в инструментах, работающих по текстовому запросу. Пользователи часто не понимают, как правильно что-то спросить у них.
YandexART: Научился генерировать ёлочные игрушки в нескольких стилях.
Google и Vogue: Изучили, как ИИ влияет на процессы и сценарии покупки модной одежды.
Spotify: Тестирует генерацию плейлистов по текстовому запросу.
Точка: Усилила интерактивный справочник с помощью ChatGPT. Сервис «Ассистент» помогает отвечать на бухгалтерские вопросы.
Curio: Говорящие игрушки, которые придумывают истории и диалоги с помощью ChatGPT. Анонс — https://www.youtube.com/watch?v=f5rLMWzjDIg.
Ars Technica: Сравнили, кто лучше хохмит — ChatGPT или Bard (спойлер: ChatGPT).
Битрикс CoPilot: Алгоритмические инструменты, встроенные в платформу. Генерирует, анализирует и улучшает контент.
Яндекс Недвижимость: Может искать квартиры по текстовому запросу вместо перебора фильтров с помощью YandexGPT.
#ai #algorithms
Pika 1.0: Генератор видео по текстовому описанию вышел из беты и порвал танцпол своей безумной демкой.
Midjourney 6: Вышла альфа-версия нового поколения. Увеличили разрешение до 2048x2048, добавили генерацию небольших текстов, улучшили понимание самих запросов.
StorybookGPT: Плагин для ChatGPT генерирует описание компонентов для живого гайдлайна Storybook. Памятка по работе с ним.
iA (эксперты в работе над текстами): Оценивают сильные и слабые стороны алгоритмических инструментов в этом плане. Где они помогают и где бесполезны. В новой версии своего текстового редактора iA Writer 7 они использовали это понимание для интересной разметки авторства (вы, ChatGPT или другой источник).
DALL-E Party: Занятный эксперимент, который по циклу искажает цепочку генерации DALL-E. Он описывает картинку текстом, потом генерирует из него ещё одну картинку — и так по кругу.
Figma: Пообщались с менеджерами продуктов для массового пользователя, которые внедряют функции на базе ИИ. Как они строят продуктовую работу в таких случаях.
Angie Wang: Топчанское интерактивное размышление-повесть, в котором она сравнивает процесс обучения алгоритмов и маленького ребёнка — .
FlutterFlow AI Gen: Сервис для быстрой разработки мобильных приложений научился генерировать дизайн и код (фронт + бек) по текстовому запросу или наброску на бумаге. Он автоматизирует все этапы от идеи до реализации.
Alex Ivanovs: Описывает хронологию развития первого года жизни ChatGPT.
Krea: Добавили интересный метод «overlay view», который позволяет схематично набросать перспективу объекта и в целом основные элементы.
Microsoft Paint: Теперь тоже генерирует графику по текстовому описанию с функцией «Cocreator» на базе DALL-E 3. Видео-обзор.
Amazon Titan: Генератор изображений по текстовому описанию доступен на платформе AWS (видео-обзор).
Amazon Q: Ещё один алгоритмический помощник в AWS. Он подключается к корпоративным сервисам и помогает анализировать информацию из них.
Audiobox: Новая модель для генерации аудио от Меты. Может взять за основу ваш голос, текстовый запрос, готовую музыку и сгенерировать или доработать/переосмыслить их.
Output Co-Producer: Генератор семплов по текстовому запросу от создателей инструмента Output.
Instagram: Пробует менять фон в stories с помощью алгоритмического дизайна (ещё).
Исследователи Hugging Face и Carnegie Mellon University посчитали энергозатраты на генерацию изображений с помощью алгоритмического дизайна. Выходит много — сопоставимо с полной зарядкой телефона (исследование).
HeyGen Custom Avatar: Сервис создаёт фотореалистичные аватары пользователей, которые могут читать текст на видео. Голос и мимика — тоже ваши.
Magnific: Один из самых качественных алгоритмических сервисов по улучшению качества фото на базе.
Prompt Brush: Пародия на инструменты, работающие по текстовому запросу. Иллюстрацию по такому запросу руками рисует иллюстратор Pablo Delcan.
Luke Wroblewski: Советует давать подсказки в инструментах, работающих по текстовому запросу. Пользователи часто не понимают, как правильно что-то спросить у них.
YandexART: Научился генерировать ёлочные игрушки в нескольких стилях.
Google и Vogue: Изучили, как ИИ влияет на процессы и сценарии покупки модной одежды.
Spotify: Тестирует генерацию плейлистов по текстовому запросу.
Точка: Усилила интерактивный справочник с помощью ChatGPT. Сервис «Ассистент» помогает отвечать на бухгалтерские вопросы.
Curio: Говорящие игрушки, которые придумывают истории и диалоги с помощью ChatGPT. Анонс — https://www.youtube.com/watch?v=f5rLMWzjDIg.
Ars Technica: Сравнили, кто лучше хохмит — ChatGPT или Bard (спойлер: ChatGPT).
Битрикс CoPilot: Алгоритмические инструменты, встроенные в платформу. Генерирует, анализирует и улучшает контент.
Яндекс Недвижимость: Может искать квартиры по текстовому запросу вместо перебора фильтров с помощью YandexGPT.
#ai #algorithms
pika.art
The idea-to-video platform that sets your creativity in motion.
Пропустил месяц в выпусках про алгоритмический дизайн, так что теперь разгребать с полсотни новья:
Взаимодействие с такими инструментами:
1. Emily Campbell: Паттерны проектирования инструментов.
2. IBM: Принципы дизайна инструментов. Они дают удачные примеры реализации для каждой рекомендации.
3. Christopher Kovel: Почему алгоритмы не заменят пользовательских исследователей. Они подают надежды во вторичных исследованиях, которые делаются на основе уже опубликованных отчётов. Но не смогут в первичные, где нужно общаться с пользователями и зачастую импровизировать в рамках изначального плана.
4. Jakob Nielsen и Sarah Gibbons: Можно ли считать эмпатию от алгоритмических инструментов настоящей. Сара скептична, Якоб воодушевлён.
5. NN/g: Феномен «подхалимства» при работе с генеративными чат-ботами. Они стараются быть вежливыми и угодить пользователю, поэтому готовы противоречить фактам.
6. Jakob Nielsen: Анализирует свежее исследование Microsoft, которое показывает рост продуктивности благодаря помощнику Copilot. Цифры местами завышены (они такие только для идеальной ситуации), но данные в целом интересные.
7. Moritz Gießmann: Проблемы результатов алгоритмического дизайна с точки зрения accessibility.
8. Luke Wroblewski: Совмещение очков дополненной реальности и возможностей алгоритмического дизайна на лету.
Создание таких инструментов:
1. Конспект панельной дискуссии Noah Levin (Figma), Nadim Hossain (Databricks), Greg Hochmuth (Midjourney) и Joe Burfitt (Modyfi).
2. Intercom: Обновлённый продуктовый процесс при работе над функциональностью на базе ИИ.
Кейсы и инструкции:
1. Antoine Vidal: Как генерировать предсказуемую сцену в разных стилях с помощью подключения алгоритмических инструментов к 3D-программам.
2. Яндекс Лавка: Упаковка на базе YandexArt.
3. Вкусвилл: Упаковка.
4. ASML: Фильм о бренде. Для этих 1 минуты и 50 секунд собрали 7852 изображений на основе 1963 текстовых запросов в Midjourney, потом обработали в Runway. Видео.
Инструменты для изображений:
1. iA: Алгоритмически сгенерированная графика всё больше похожа на клишированные стоковые изображения. Они сформулировали конкретные приёмы, которые вызывают такое ощущение. iA придерживаются этого мнения и про видео.
2. Austin Gil: Как самому реализовать генерацию изображений в браузере на базе OpenAI.
3. Ideogram: Иллюстрации с реальным текстом по текстовому запросу.
4. ImageFX: Фото и иллюстрации по текстовому описанию от Google.
5. EverArt: Многофункциональный инструмент, который может генерировать и редактировать изображения. Может подстроиться под заданный стиль.
6. iStock AI Generator: Фото и иллюстрации по текстовому описанию. Обещают гарантированную безопасность в плане авторских прав на картинки. Анонс.
7. Яндекс Маркет: YandexArt генерирует изображения товаров в разном окружении, если загрузить фото на однотонном или прозрачном фоне.
8. Apple: Редактирование и ретушь фото по текстовому запросу.
9. BRIA RMBG: Удаляет фон на фото с очень пристойным качеством.
10. DignifAI: Угарный эксперимент от 4chan — одевает откровенные фото.
Инструменты для видео:
1. OpenAI Sora: Генерация видео по текстовому запросу (выглядит фешенебельно). Как это работает.
2. Stable Video: Генератор видео по текстовому запросу от создателей Stable Diffusion.
Другие дизайнерские инструменты:
1. Moodboard Creator: Генерирует базовые основы для визуального стиля. Правда, к мудбордам это отношения не имеет и попадание в запрос по жанру сомнительное.
2. Miro Assist: Умеет группировать и суммировать идеи, генерировать диаграммы и изображения, убрать фон у картинки.
3. Mural AI: Умеет группировать и суммировать идеи, генерировать ментальные карты. Он интегрирован с Microsoft 365 Copilot.
4. NVIDIA ACE (Avatar Cloud Engine): Оживляет игровых персонажей в живое взаимодействие без заранее заданного сценария с их решением. Видео.
5. Valve: Разрешит включать больше генеративного контента в игры для Steam.
#ai #algorithms
Взаимодействие с такими инструментами:
1. Emily Campbell: Паттерны проектирования инструментов.
2. IBM: Принципы дизайна инструментов. Они дают удачные примеры реализации для каждой рекомендации.
3. Christopher Kovel: Почему алгоритмы не заменят пользовательских исследователей. Они подают надежды во вторичных исследованиях, которые делаются на основе уже опубликованных отчётов. Но не смогут в первичные, где нужно общаться с пользователями и зачастую импровизировать в рамках изначального плана.
4. Jakob Nielsen и Sarah Gibbons: Можно ли считать эмпатию от алгоритмических инструментов настоящей. Сара скептична, Якоб воодушевлён.
5. NN/g: Феномен «подхалимства» при работе с генеративными чат-ботами. Они стараются быть вежливыми и угодить пользователю, поэтому готовы противоречить фактам.
6. Jakob Nielsen: Анализирует свежее исследование Microsoft, которое показывает рост продуктивности благодаря помощнику Copilot. Цифры местами завышены (они такие только для идеальной ситуации), но данные в целом интересные.
7. Moritz Gießmann: Проблемы результатов алгоритмического дизайна с точки зрения accessibility.
8. Luke Wroblewski: Совмещение очков дополненной реальности и возможностей алгоритмического дизайна на лету.
Создание таких инструментов:
1. Конспект панельной дискуссии Noah Levin (Figma), Nadim Hossain (Databricks), Greg Hochmuth (Midjourney) и Joe Burfitt (Modyfi).
2. Intercom: Обновлённый продуктовый процесс при работе над функциональностью на базе ИИ.
Кейсы и инструкции:
1. Antoine Vidal: Как генерировать предсказуемую сцену в разных стилях с помощью подключения алгоритмических инструментов к 3D-программам.
2. Яндекс Лавка: Упаковка на базе YandexArt.
3. Вкусвилл: Упаковка.
4. ASML: Фильм о бренде. Для этих 1 минуты и 50 секунд собрали 7852 изображений на основе 1963 текстовых запросов в Midjourney, потом обработали в Runway. Видео.
Инструменты для изображений:
1. iA: Алгоритмически сгенерированная графика всё больше похожа на клишированные стоковые изображения. Они сформулировали конкретные приёмы, которые вызывают такое ощущение. iA придерживаются этого мнения и про видео.
2. Austin Gil: Как самому реализовать генерацию изображений в браузере на базе OpenAI.
3. Ideogram: Иллюстрации с реальным текстом по текстовому запросу.
4. ImageFX: Фото и иллюстрации по текстовому описанию от Google.
5. EverArt: Многофункциональный инструмент, который может генерировать и редактировать изображения. Может подстроиться под заданный стиль.
6. iStock AI Generator: Фото и иллюстрации по текстовому описанию. Обещают гарантированную безопасность в плане авторских прав на картинки. Анонс.
7. Яндекс Маркет: YandexArt генерирует изображения товаров в разном окружении, если загрузить фото на однотонном или прозрачном фоне.
8. Apple: Редактирование и ретушь фото по текстовому запросу.
9. BRIA RMBG: Удаляет фон на фото с очень пристойным качеством.
10. DignifAI: Угарный эксперимент от 4chan — одевает откровенные фото.
Инструменты для видео:
1. OpenAI Sora: Генерация видео по текстовому запросу (выглядит фешенебельно). Как это работает.
2. Stable Video: Генератор видео по текстовому запросу от создателей Stable Diffusion.
Другие дизайнерские инструменты:
1. Moodboard Creator: Генерирует базовые основы для визуального стиля. Правда, к мудбордам это отношения не имеет и попадание в запрос по жанру сомнительное.
2. Miro Assist: Умеет группировать и суммировать идеи, генерировать диаграммы и изображения, убрать фон у картинки.
3. Mural AI: Умеет группировать и суммировать идеи, генерировать ментальные карты. Он интегрирован с Microsoft 365 Copilot.
4. NVIDIA ACE (Avatar Cloud Engine): Оживляет игровых персонажей в живое взаимодействие без заранее заданного сценария с их решением. Видео.
5. Valve: Разрешит включать больше генеративного контента в игры для Steam.
#ai #algorithms
www.shapeof.ai
The Shape of AI | UX Patterns for Artificial Intelligence Design
Exploring how patterns and experiences will change in a world driven by Artificial Intelligence
Вторая часть запоздалого выпуска про алгоритмический дизайн. Чуть меньше про сам дизайн, чуть больше про платформы:
Инструменты:
1. Wix AI Website Builder: Второй заход Wix на поляну алгоритмического дизайна после ADI. В этот раз он генерируется по текстовому запросу.
Взаимодействие с такими инструментами:
1. Silvia Podesta: Ментальные модели обычного поиска и новых подходов на базе чат-ботов типа Perplexity. Как отличается поведение и ожидания пользователей.
Общий тренд:
1. Everypixel: Обзор главных запусков и законодательных инициатив в сфере генеративного ИИ в 2023 году.
2. Sequoia Capital: Начинается второй акт генеративного ИИ. Он больше про полезные сценарии использования, а не просто технологии.
3. Simon Willison: Что отрасль узнала про большие языковые модели в 2023 году.
4. Визуализация того, как устроены большие языковые модели.
Платформы:
1. Microsoft добавляет кнопку Copilot в свой стандарт клавиатур для Windows. Это сильное заявление — в последний раз они делали это 30 лет назад с кнопкой Windows.
2. ChatGPT: Всё-таки появился каталог плагинов.
Также они тестируют возможность запоминать диалоги и строить следующие с их учётом.
3. Google выпустили свою новую модель Gemini 1.5. Она умеет, например, анализировать видео. Они переименовали Bard в Gemini.
4. Mistral: Французский аналог ChatGPT с инвестициями от Microsoft.
5. Claude: Выходцы из OpenAI запустили своя большие языковые модели. Анонс.
6. NVIDIA Chat with RTX: Языковая модель для локальной работы.
Другие инструменты:
1. Яндекс добавил возможности YandexGPT в свой браузер. Он помогает писать тексты, пересказывать и переводить видео и генерировать изображения. Это также повысит безопасность.
2. MusicFX: Обновился генератор музыки и битов по текстовому запросу от Google.
3. Afforai: Профессиональный поисковик по исследовательским публикациям. Он может просуммировать найденное.
4. Adobe Acrobat: Сможет пересказывать содержание PDF-документов.
5. Экспериментальный помощник при покупках на Amazon. Он может дать общие рекомендации перед покупкой, подобрать товары или ответить на вопросы о конкретных вещах
6. Walmart прокачает поиск на мобильных с помощью OpenAI.
Этика:
1. В открытый доступ утекла обучающая выборка для Midjourney, в которой многие иллюстраторы и дизайнеры нашли себя. Они использовали это как одно из доказательств для судебного иска.
2. Google перекрутил ручку инклюзивности Gemini и он стал выдавать нелепые исторические сюжеты.
3. Duolingo: Сократили 10% фрилансеров за счёт ИИ-инструментов.
#ai #algorithms
Инструменты:
1. Wix AI Website Builder: Второй заход Wix на поляну алгоритмического дизайна после ADI. В этот раз он генерируется по текстовому запросу.
Взаимодействие с такими инструментами:
1. Silvia Podesta: Ментальные модели обычного поиска и новых подходов на базе чат-ботов типа Perplexity. Как отличается поведение и ожидания пользователей.
Общий тренд:
1. Everypixel: Обзор главных запусков и законодательных инициатив в сфере генеративного ИИ в 2023 году.
2. Sequoia Capital: Начинается второй акт генеративного ИИ. Он больше про полезные сценарии использования, а не просто технологии.
3. Simon Willison: Что отрасль узнала про большие языковые модели в 2023 году.
4. Визуализация того, как устроены большие языковые модели.
Платформы:
1. Microsoft добавляет кнопку Copilot в свой стандарт клавиатур для Windows. Это сильное заявление — в последний раз они делали это 30 лет назад с кнопкой Windows.
2. ChatGPT: Всё-таки появился каталог плагинов.
Также они тестируют возможность запоминать диалоги и строить следующие с их учётом.
3. Google выпустили свою новую модель Gemini 1.5. Она умеет, например, анализировать видео. Они переименовали Bard в Gemini.
4. Mistral: Французский аналог ChatGPT с инвестициями от Microsoft.
5. Claude: Выходцы из OpenAI запустили своя большие языковые модели. Анонс.
6. NVIDIA Chat with RTX: Языковая модель для локальной работы.
Другие инструменты:
1. Яндекс добавил возможности YandexGPT в свой браузер. Он помогает писать тексты, пересказывать и переводить видео и генерировать изображения. Это также повысит безопасность.
2. MusicFX: Обновился генератор музыки и битов по текстовому запросу от Google.
3. Afforai: Профессиональный поисковик по исследовательским публикациям. Он может просуммировать найденное.
4. Adobe Acrobat: Сможет пересказывать содержание PDF-документов.
5. Экспериментальный помощник при покупках на Amazon. Он может дать общие рекомендации перед покупкой, подобрать товары или ответить на вопросы о конкретных вещах
6. Walmart прокачает поиск на мобильных с помощью OpenAI.
Этика:
1. В открытый доступ утекла обучающая выборка для Midjourney, в которой многие иллюстраторы и дизайнеры нашли себя. Они использовали это как одно из доказательств для судебного иска.
2. Google перекрутил ручку инклюзивности Gemini и он стал выдавать нелепые исторические сюжеты.
3. Duolingo: Сократили 10% фрилансеров за счёт ИИ-инструментов.
#ai #algorithms
Wix.com
AI Website Builder - Create A Website In Minutes | Wix
Experience seamless website creation with Wix's intuitive AI website builder. Design a unique, business-ready site faster than ever before. Start now.
Чтобы пакет с пакетами про алгоритмический дизайн не успел переполниться, закидываю его сюда:
1. Relume: Грамотная концепция конструктора сайтов на базе алгоритмического дизайна. Он помогает составить карту сайта, сделать wireframes и собрать стиль на основе мудбордов. Всё это можно экспортировать в Webflow или Figma (они сделали тонну компонентов для типовых ситуаций).
2. Jakob Nielsen: Здорово проанализировал все гипотетические варианты использования ИИ в пользовательских исследованиях. И трезво оценил, какие потенциально могут автоматизироваться, а какие — никогда.
3. NN/g: Помощь пользователям-новичкам при работе с алгоритмическими чат-ботами. Они провели небольшое исследование китайских сервисов и описала типичные проблемы людей, которые сталкиваются с таким впервые.
4. OpenAI: Попросили семь художников и режиссёров попробовать их новую модель Sora для генерации видео. Получилась крутая демонстрация возможностей.
5. Google AI Studio: Общедоступная версия языковой модели Gemini 1.5 Pro через новый, частично визуальный интерфейс.
6. Midjourney Character Reference: Теперь можно сохранить черты лица или детали одежды персонажа в разных генерациях.
7. Vincent Koc: Фреймворк «компас генеративного ИИ». Он помогает проектировать интерфейсы таких продуктов.
8. MeasuringU: Можно ли использовать ChatGPT для тестирования дерева в информационной архитектуре? Успешность выполнения задач сильно завышена, а вот простоту решения задачи предполагает неплохо.
9. Jakob Nielsen написал спорную статью об автоматической поддержке accessibility с помощью ИИ. Это вызвало огромную волну критики в проф.сообществе и Adrian Roselli собрал ссылки на все такие статьи.
10. Maze: Сервис для проведения пользовательских исследований добавляет алгоритмические функции. Он подскажет как грамотно сформулировать вопрос для респондента, задать догоняющие вопросы, анализировать общие темы и в целом организовывать проекты.
11. Devin: Платформа для разработчиков, которая мощно развивает концепцию копилотов. Она не только пишет код и исправляет баги, но и помогает разобраться в незнакомых технологиях, выкатывать на прод и много чего ещё.
12. Adobe Acrobat: Дизайн интерфейса Generative summary. Их принципы алгоритмического дизайна.
13. Victoria Turk: Анализирует современные инструменты генерации изображений по текстовому запросу и показывает на конкретных примерах, насколько они полны клишированных стереотипов.
14. Leonardo AI: Генератор фото и иллюстраций по текстовому описанию.
15. Blaze: Алгоритмический генератор текстов для блогов, социальных сетей и рекламы.
16. Jakob Nielsen: Приводит несколько исторических аналогий на тему страха «использующие ИИ-инструменты отупеют». Это далеко не всегда так.
17. Everypixel: Глоссарий самых популярных терминов, использующихся на текущем этапе эволюции ИИ.
18. Adobe Project Music GenAI Control: Генератор музыки по текстовому описанию. Можно докрутить готовую композицию по скорости, экспрессивности и т.п.
19. Arcads: Генератор вертикальных рекламных видео с вымышленными актёрами. На входе – ваш сценарий.
20. HeyGen Avatar in Motion 1.0: Генератор вертикальных рекламных видео с вымышленными актёрами в движении.
21. Grok-1: xAI Илона Маска опубликовала исходный код своей ИИ-платформы Grok-1 на GitHub.
22. YandexGPT 3: Новая версия языковой модели Яндекса. Также в Yandex Cloud появился API YandexArt для генерации фото и иллюстраций.
23. Яндекс Почта: Научилась пересказывать важные письма за последнюю неделю с помощью YandexGPT.
24. Intuit Assist: Алгоритмический помощник подсказывает, как управлять финансами.
#ai #algorithms
1. Relume: Грамотная концепция конструктора сайтов на базе алгоритмического дизайна. Он помогает составить карту сайта, сделать wireframes и собрать стиль на основе мудбордов. Всё это можно экспортировать в Webflow или Figma (они сделали тонну компонентов для типовых ситуаций).
2. Jakob Nielsen: Здорово проанализировал все гипотетические варианты использования ИИ в пользовательских исследованиях. И трезво оценил, какие потенциально могут автоматизироваться, а какие — никогда.
3. NN/g: Помощь пользователям-новичкам при работе с алгоритмическими чат-ботами. Они провели небольшое исследование китайских сервисов и описала типичные проблемы людей, которые сталкиваются с таким впервые.
4. OpenAI: Попросили семь художников и режиссёров попробовать их новую модель Sora для генерации видео. Получилась крутая демонстрация возможностей.
5. Google AI Studio: Общедоступная версия языковой модели Gemini 1.5 Pro через новый, частично визуальный интерфейс.
6. Midjourney Character Reference: Теперь можно сохранить черты лица или детали одежды персонажа в разных генерациях.
7. Vincent Koc: Фреймворк «компас генеративного ИИ». Он помогает проектировать интерфейсы таких продуктов.
8. MeasuringU: Можно ли использовать ChatGPT для тестирования дерева в информационной архитектуре? Успешность выполнения задач сильно завышена, а вот простоту решения задачи предполагает неплохо.
9. Jakob Nielsen написал спорную статью об автоматической поддержке accessibility с помощью ИИ. Это вызвало огромную волну критики в проф.сообществе и Adrian Roselli собрал ссылки на все такие статьи.
10. Maze: Сервис для проведения пользовательских исследований добавляет алгоритмические функции. Он подскажет как грамотно сформулировать вопрос для респондента, задать догоняющие вопросы, анализировать общие темы и в целом организовывать проекты.
11. Devin: Платформа для разработчиков, которая мощно развивает концепцию копилотов. Она не только пишет код и исправляет баги, но и помогает разобраться в незнакомых технологиях, выкатывать на прод и много чего ещё.
12. Adobe Acrobat: Дизайн интерфейса Generative summary. Их принципы алгоритмического дизайна.
13. Victoria Turk: Анализирует современные инструменты генерации изображений по текстовому запросу и показывает на конкретных примерах, насколько они полны клишированных стереотипов.
14. Leonardo AI: Генератор фото и иллюстраций по текстовому описанию.
15. Blaze: Алгоритмический генератор текстов для блогов, социальных сетей и рекламы.
16. Jakob Nielsen: Приводит несколько исторических аналогий на тему страха «использующие ИИ-инструменты отупеют». Это далеко не всегда так.
17. Everypixel: Глоссарий самых популярных терминов, использующихся на текущем этапе эволюции ИИ.
18. Adobe Project Music GenAI Control: Генератор музыки по текстовому описанию. Можно докрутить готовую композицию по скорости, экспрессивности и т.п.
19. Arcads: Генератор вертикальных рекламных видео с вымышленными актёрами. На входе – ваш сценарий.
20. HeyGen Avatar in Motion 1.0: Генератор вертикальных рекламных видео с вымышленными актёрами в движении.
21. Grok-1: xAI Илона Маска опубликовала исходный код своей ИИ-платформы Grok-1 на GitHub.
22. YandexGPT 3: Новая версия языковой модели Яндекса. Также в Yandex Cloud появился API YandexArt для генерации фото и иллюстраций.
23. Яндекс Почта: Научилась пересказывать важные письма за последнюю неделю с помощью YandexGPT.
24. Intuit Assist: Алгоритмический помощник подсказывает, как управлять финансами.
#ai #algorithms
www.relume.io
Relume — Websites designed & built faster with AI | AI website builder
Use AI as your design ally, not as a replacement. Effortlessly generate sitemaps and wireframes for marketing websites in minutes with Relume’s AI website builder.
«Я ещё не договорила», сказала недавняя мини-подборка об алгоритмическом дизайне. Лучше выгрузить сейчас, пока снова не стало слишком много:
1. Rosenfeld Media запускают новую конференцию «Designing with AI» с фокусом на дизайн с ИИ. Она пройдёт 4-5 июня в онлайне.
2. UX Pilot: Многофункциональный инструмент алгоритмического дизайна. Умеет генерировать макеты, wireframes, цветовые палитры, тексты, планы рабочих сессий. Также может сделать оценку дизайна.
3. Adobe Photoshop: Можно стилизовать часть изображения на основе другого стилистического изображения-примера, менять части изображения на похожие по духу объекты, вырезать и сгенерирвать фон.
4. Adobe Premiere Pro: Можно генерировать видео по текстовому запросу, добавлять или удалять объекты, расширять кадр. Будет возможность подключить сторонние модели вроде OpenAI Sora, Pika Labs или Runway.
5. Knowing Machines: Откуда берут данные для обучения алгоритмов популярные генераторы фото и иллюстраций. Они пользуются базой LAION-5B, для которой сделали несколько курированных людьми выборок. Исходя из особенностей этих выборок становится понятно, почему многие картинки от Midjourney или Stable Diffusion выглядят однообразно.
6. Oliver Reichenstein: Интервью с основателем iA на тему стоковости результатов работы инструментов алгоритмического дизайна. И то, как может измениться подход дизайнеров, которые хотят этого избежать.
7. Figma Wireframe Designer: Плагин генерирует wireframes по текстовому запросу.
8. Amelia Wattenberger: Интересный концепт алгоритмического инструмента для помощи писателям. Он помогает сбалансировать повествование по сложности, эмоции и другим параметрам.
9. Spline: Генератор 3D-объектов по текстовому запросу.
10. VIDIM: Экспериментальный инструмент Google дорисовывает промежуточные кадры видео по первому и последнему.
11. Google Vids: Генератор видео для Google Workspace на базе презентаций Google Slides. Можно выбрать стиль и записать себя.
12. Яндекс Поиск: Алгоритмический чат-бот на базе YandexGPT.
13. Алиса: Прокачалась с помощью YandexGPT. Она сможет отвечать сама на большее количество вопросов.
14. Meta AI: Алгоритмический чат-бот. Работает как отдельный инструмент и внутри продуктов типа Facebook.
15. Mail.ru: В productivity-сервисах появился генеративный ИИ. Короткий пересказ писем, генерация текстов в заметках.
16. SoundID VoiceAI: Плагин для DAW превращает запись вашего голоса в любой другой и делает его звучание более профессиональным.
#ai #algorithms
1. Rosenfeld Media запускают новую конференцию «Designing with AI» с фокусом на дизайн с ИИ. Она пройдёт 4-5 июня в онлайне.
2. UX Pilot: Многофункциональный инструмент алгоритмического дизайна. Умеет генерировать макеты, wireframes, цветовые палитры, тексты, планы рабочих сессий. Также может сделать оценку дизайна.
3. Adobe Photoshop: Можно стилизовать часть изображения на основе другого стилистического изображения-примера, менять части изображения на похожие по духу объекты, вырезать и сгенерирвать фон.
4. Adobe Premiere Pro: Можно генерировать видео по текстовому запросу, добавлять или удалять объекты, расширять кадр. Будет возможность подключить сторонние модели вроде OpenAI Sora, Pika Labs или Runway.
5. Knowing Machines: Откуда берут данные для обучения алгоритмов популярные генераторы фото и иллюстраций. Они пользуются базой LAION-5B, для которой сделали несколько курированных людьми выборок. Исходя из особенностей этих выборок становится понятно, почему многие картинки от Midjourney или Stable Diffusion выглядят однообразно.
6. Oliver Reichenstein: Интервью с основателем iA на тему стоковости результатов работы инструментов алгоритмического дизайна. И то, как может измениться подход дизайнеров, которые хотят этого избежать.
7. Figma Wireframe Designer: Плагин генерирует wireframes по текстовому запросу.
8. Amelia Wattenberger: Интересный концепт алгоритмического инструмента для помощи писателям. Он помогает сбалансировать повествование по сложности, эмоции и другим параметрам.
9. Spline: Генератор 3D-объектов по текстовому запросу.
10. VIDIM: Экспериментальный инструмент Google дорисовывает промежуточные кадры видео по первому и последнему.
11. Google Vids: Генератор видео для Google Workspace на базе презентаций Google Slides. Можно выбрать стиль и записать себя.
12. Яндекс Поиск: Алгоритмический чат-бот на базе YandexGPT.
13. Алиса: Прокачалась с помощью YandexGPT. Она сможет отвечать сама на большее количество вопросов.
14. Meta AI: Алгоритмический чат-бот. Работает как отдельный инструмент и внутри продуктов типа Facebook.
15. Mail.ru: В productivity-сервисах появился генеративный ИИ. Короткий пересказ писем, генерация текстов в заметках.
16. SoundID VoiceAI: Плагин для DAW превращает запись вашего голоса в любой другой и делает его звучание более профессиональным.
#ai #algorithms
Свежая супертяж-подборка об алгоритмическом дизайне:
СБОРКА ИНТЕРФЕЙСА
1. Gov.uk: Как можно превращать обычную бумажную форму в веб-версию. Tim Paul использовал дизайн-систему Gov.uk и автоматически разбивал её на шаги. Демка работает даже на основе бумажного скетча. Исходный код и более ранний эксперимент его коллеги Kuba Bartwicki.
2. GPT-4o: OpenAI выпустили новую модель 4o (omni), которая может анализировать текст, звук, изображения и видео в реальном времени. И выдавать результат также в реальном времени. Получается фактически легендарный фильм «Она» (они даже имитировали голос Скарлетт Йохансон, пока она не подала в суд). На презентации показали мощные демки с синхронным переводом на другой язык, адаптацией интонации под собеседника и контекстными шутками, обсуждением помещения собеседника (захват картинки с камеры), диалогом двух ИИ.
Eric Vyacheslav сгенерировал с её помощью макеты в Figma на основе спецификации.
ГРАФИЧЕСКИЙ ДИЗАЙН И ИСКУССТВО
1. Flair: Сервис генерирует эффектную сцену подачи вашего продукта (например, упаковка или одежда).
2. Robert Hodgin: Несколько раз прогнал цикл «Midjourney генерирует картинку → ChatGPT описывает её → Midjourney делает новую картинку по этому описанию». Он показал, как менялось это изображение от запроса к запросу.
3. Exactly AI: Инструмент для создания иллюстраций в заданном стиле.
4. Сбер вместе с музейными специалистами попытался восстановить картины, утерянные во время войны. Они сделали уже два проекта для Волгограда и Воронежа.
ВЗАИМОДЕЙСТВИЕ С ТАКИМИ ИНСТРУМЕНТАМИ
1. Книга Josh Clark и Veronika Kindred «Sentient Design» готовится в Rosenfeld Media. Они запустили этот термин вместе с флагманским выступлением и обзорной статьёй, плюс продают услуги типа Sentient Design Sprint.
2. Connor Joyce: Ещё один набор паттернов.
3. Alex Klein: Концепция интерфейсов на базе ИИ-агентов. Они не просто выполняют отдельные куски задач, а помогают по всему user journey.
4. iA: Предлагает по-другому посмотреть на ChatGPT и похожие сервисы. Если не ждать от них готовый результат, а использовать как собеседника и корректора — результат становится намного качественнее.
5. NN/g: Роль дизайнера. Какие навыки становятся важны вместо технических.
6. Everypixel: Типы «галлюцинаций».
ВИДЕО И КИНО
1. ToonCrafter: Генератор анимационных роликов на основе их первого и последнего кадра.
2. Luma Dream Machine: Генератор видео по текстовому запросу. Может в том числе анимировать обычную картинку (поток оживших мемов в первые дни зашкаливал).
3. KLING: Новый добротный генератор видео по текстовому описанию.
4. Runway Gen:48: Конкурс Runway для режиссёров — они должны были создать за 48 часов фильм на основе этого инструмента алгоритмического дизайна с условиями по сценарию.
5. AI Film Festival 2024: Runway второй раз провели фестиваль кино, сделанного при помощи ИИ.
6. Showrunner: Экспериментальный онлайн-кинотеатр от студии Fable генерирует сериалы по вашему запросу. С нужным стилем и сюжетом.
ИГРЫ
1. Microsoft Copilot появится в играх. Они показали демо для Minecraft.
2. Эксперимент с генеративной сценой в виртуальной реальности.
ЭТИКА И ЗАКОННОСТЬ
1. Everypixel: Что происходит с авторскими правами на контент, который используют для обучения больших языковых моделей. Кто с кем судится, есть ли легальные варианты для компаний.
2. Фотограф Miles Astray выиграл конкурс ИИ-фотографии 1839 Color Photography Awards с реальным фото. Его дисквалифицировали в итоге, но пранк вышел отменный.
3. Google Gemini в поиске выдаёт бредовые и опасные рекомендации типа клея в пицце. Они обучали его в том числе на данных Reddit, где много такого стёба.
4. Экспериментальный проект даёт возможность пообщаться с собеседником в чате, а потом угадать — это был человек или бот.
ДРУГИЕ ИНСТРУМЕНТЫ
1. IKI AI: Сервис поможет анализировать набор документов в разных форматах.
2. ElevenLabs Sound Effects: Генератор звуков для видео и подкастов по текстовому описанию.
#ai #algorithms
СБОРКА ИНТЕРФЕЙСА
1. Gov.uk: Как можно превращать обычную бумажную форму в веб-версию. Tim Paul использовал дизайн-систему Gov.uk и автоматически разбивал её на шаги. Демка работает даже на основе бумажного скетча. Исходный код и более ранний эксперимент его коллеги Kuba Bartwicki.
2. GPT-4o: OpenAI выпустили новую модель 4o (omni), которая может анализировать текст, звук, изображения и видео в реальном времени. И выдавать результат также в реальном времени. Получается фактически легендарный фильм «Она» (они даже имитировали голос Скарлетт Йохансон, пока она не подала в суд). На презентации показали мощные демки с синхронным переводом на другой язык, адаптацией интонации под собеседника и контекстными шутками, обсуждением помещения собеседника (захват картинки с камеры), диалогом двух ИИ.
Eric Vyacheslav сгенерировал с её помощью макеты в Figma на основе спецификации.
ГРАФИЧЕСКИЙ ДИЗАЙН И ИСКУССТВО
1. Flair: Сервис генерирует эффектную сцену подачи вашего продукта (например, упаковка или одежда).
2. Robert Hodgin: Несколько раз прогнал цикл «Midjourney генерирует картинку → ChatGPT описывает её → Midjourney делает новую картинку по этому описанию». Он показал, как менялось это изображение от запроса к запросу.
3. Exactly AI: Инструмент для создания иллюстраций в заданном стиле.
4. Сбер вместе с музейными специалистами попытался восстановить картины, утерянные во время войны. Они сделали уже два проекта для Волгограда и Воронежа.
ВЗАИМОДЕЙСТВИЕ С ТАКИМИ ИНСТРУМЕНТАМИ
1. Книга Josh Clark и Veronika Kindred «Sentient Design» готовится в Rosenfeld Media. Они запустили этот термин вместе с флагманским выступлением и обзорной статьёй, плюс продают услуги типа Sentient Design Sprint.
2. Connor Joyce: Ещё один набор паттернов.
3. Alex Klein: Концепция интерфейсов на базе ИИ-агентов. Они не просто выполняют отдельные куски задач, а помогают по всему user journey.
4. iA: Предлагает по-другому посмотреть на ChatGPT и похожие сервисы. Если не ждать от них готовый результат, а использовать как собеседника и корректора — результат становится намного качественнее.
5. NN/g: Роль дизайнера. Какие навыки становятся важны вместо технических.
6. Everypixel: Типы «галлюцинаций».
ВИДЕО И КИНО
1. ToonCrafter: Генератор анимационных роликов на основе их первого и последнего кадра.
2. Luma Dream Machine: Генератор видео по текстовому запросу. Может в том числе анимировать обычную картинку (поток оживших мемов в первые дни зашкаливал).
3. KLING: Новый добротный генератор видео по текстовому описанию.
4. Runway Gen:48: Конкурс Runway для режиссёров — они должны были создать за 48 часов фильм на основе этого инструмента алгоритмического дизайна с условиями по сценарию.
5. AI Film Festival 2024: Runway второй раз провели фестиваль кино, сделанного при помощи ИИ.
6. Showrunner: Экспериментальный онлайн-кинотеатр от студии Fable генерирует сериалы по вашему запросу. С нужным стилем и сюжетом.
ИГРЫ
1. Microsoft Copilot появится в играх. Они показали демо для Minecraft.
2. Эксперимент с генеративной сценой в виртуальной реальности.
ЭТИКА И ЗАКОННОСТЬ
1. Everypixel: Что происходит с авторскими правами на контент, который используют для обучения больших языковых моделей. Кто с кем судится, есть ли легальные варианты для компаний.
2. Фотограф Miles Astray выиграл конкурс ИИ-фотографии 1839 Color Photography Awards с реальным фото. Его дисквалифицировали в итоге, но пранк вышел отменный.
3. Google Gemini в поиске выдаёт бредовые и опасные рекомендации типа клея в пицце. Они обучали его в том числе на данных Reddit, где много такого стёба.
4. Экспериментальный проект даёт возможность пообщаться с собеседником в чате, а потом угадать — это был человек или бот.
ДРУГИЕ ИНСТРУМЕНТЫ
1. IKI AI: Сервис поможет анализировать набор документов в разных форматах.
2. ElevenLabs Sound Effects: Генератор звуков для видео и подкастов по текстовому описанию.
#ai #algorithms
www.timpaul.co.uk
Using AI to generate web forms from PDFs
Personal site for Tim Paul
И снова прорва свежих ссылок об алгоритмическом дизайне:
Инструменты дизайна
1. Uizard Autodesigner 2.0: Вторая версия умеет генерировать полноценные макеты по текстовому запросу на основе вашего UI Kit или докручивать компоненты, связывать экраны в прототипы, добавлять темы оформления, получить рекомендации по улучшению макета. Их можно дорабатывать в переписке с ботом. Анонс и видео-обзор от создателей.
2. Figma добавила целую линейку инструментов алгоритмического дизайна в основной сценарий работы. Можно сгенерировать дизайн по текстовому запросу (правда, временно отключили после пары публичных конфузов, но они работают над проблемой), превратить скриншот в макет по слоям (если он собран на ваших компонентах и стилях), автоматически связывать экраны в интерактивный прототип, генерировать тексты и изображения, убирать фон, переименовывать слои. В следующей версии планируют генерировать макеты на основе компонентов вашей дизайн-системы. Это тот самый момент, когда вчерашняя магия превращается в обычный повседневный инструмент — он может занять и 5-10 лет, но результат стоит ожидания.
3. GenType: Генератор картиночных шрифтов от Google (например, в виде тоста или лампочки).
4. Typeface Hub: Универсальный инструмент алгоритмического дизайна. Может сгенерировать гайдлайны бренда (визуальный стиль и тональность), проанализировав сайт. Предлагает гибкий и визуальный подход к текстовым запросам для генерации графики и текстов (есть куча форматов для маркетинга и пиара).
5. Runway: Вышло третье поколение модели генератора видео.
Влияние на дизайн и работу над продуктами в целом
1. Yinjian Huang: Памятка по дизайну интерфейса поиска в диалоговых ИИ-продуктах. Как помогать пользователю уточнять и дополнять запрос.
2. Мария Кувшинова: Рассуждает о связи идей художников сюрреализма и генеративных изображений. Она обращается к изначальной философии и работам классиков, чтобы проследить связь к текущей волне.
3. Kris Rasmussen (глава разработки Figma) и Noah Levin (глава дизайна) делятся своим мнением про автоматизацию разработки и дизайна с помощью ИИ — от какой работы не жалко отказаться. Noah видит прагматичный путь простых маленьких шагов вместо не очень реалистичных космолётов.
4. Lenny Rachitsky: Правильные сценарии использования ИИ-поисковика Perplexity. Как задавать грамотные вопросы о профессии, рынке и своём продукте.
Другие применения
1. Luke Wroblewski: Развивает свой алгоритмический поиск по сайту и переосмыслил транскрипции презентаций.
2. Google Illuminate: Экспериментальный сервис превращает научные публикации во что-то вроде подкастов, где эта тема раскрывается в дискуссии.
Критика и проблемы
1. Rolling Stone: Примеры компаний и продуктов, которые намеренно отказываются от генеративного контента и запрещают размещать его.
2. Звукозаписывающие лейблы подали в суд на сервисы Suno и Udio, которые генерируют музыку по текстовому запросу. Как и во многих других ситуациях с алгоритмическим дизайном, некоторые результаты были слишком похоже на известные оригиналы.
3. Nikhil Suresh: Жёсткая прожарка бессмысленных разговоров о внедрении ИИ в продукты. Большинство компаний не могут справиться с простейшей разработкой базовых вещей, но уже бегут в тему с непонятным для них выхлопом.
Общие изменения рынка
1. OpenAI сформулировали свою модель зрелости универсальных ИИ (AGI). Они считают, что сами находятся на первом этапе.
2. Anthropic Claude 3.5: Вышла новая версия модели. Кстати, как и OpenAI, они делают один из самобытнейших брендов на рынке.
Другие применения
1.Dove: Развивает свою изначальную кампанию «реальная красота» и добавляет к ней отказ от генеративных фото и ИИ-обработки.
2. YouTube: Научился удалять из видео музыку, на которую пришла жалоба правообладателя, оставляя голос ведущего.
3. Т-Банк: Запустили «Джуниор-ассистента», который обучает детей финансовой грамотности.
4. Audi: Добавит ChatGPT в свои машины аналогично Volkswagen (для усиления своего основного ассистента).
#ai #algorithms
Инструменты дизайна
1. Uizard Autodesigner 2.0: Вторая версия умеет генерировать полноценные макеты по текстовому запросу на основе вашего UI Kit или докручивать компоненты, связывать экраны в прототипы, добавлять темы оформления, получить рекомендации по улучшению макета. Их можно дорабатывать в переписке с ботом. Анонс и видео-обзор от создателей.
2. Figma добавила целую линейку инструментов алгоритмического дизайна в основной сценарий работы. Можно сгенерировать дизайн по текстовому запросу (правда, временно отключили после пары публичных конфузов, но они работают над проблемой), превратить скриншот в макет по слоям (если он собран на ваших компонентах и стилях), автоматически связывать экраны в интерактивный прототип, генерировать тексты и изображения, убирать фон, переименовывать слои. В следующей версии планируют генерировать макеты на основе компонентов вашей дизайн-системы. Это тот самый момент, когда вчерашняя магия превращается в обычный повседневный инструмент — он может занять и 5-10 лет, но результат стоит ожидания.
3. GenType: Генератор картиночных шрифтов от Google (например, в виде тоста или лампочки).
4. Typeface Hub: Универсальный инструмент алгоритмического дизайна. Может сгенерировать гайдлайны бренда (визуальный стиль и тональность), проанализировав сайт. Предлагает гибкий и визуальный подход к текстовым запросам для генерации графики и текстов (есть куча форматов для маркетинга и пиара).
5. Runway: Вышло третье поколение модели генератора видео.
Влияние на дизайн и работу над продуктами в целом
1. Yinjian Huang: Памятка по дизайну интерфейса поиска в диалоговых ИИ-продуктах. Как помогать пользователю уточнять и дополнять запрос.
2. Мария Кувшинова: Рассуждает о связи идей художников сюрреализма и генеративных изображений. Она обращается к изначальной философии и работам классиков, чтобы проследить связь к текущей волне.
3. Kris Rasmussen (глава разработки Figma) и Noah Levin (глава дизайна) делятся своим мнением про автоматизацию разработки и дизайна с помощью ИИ — от какой работы не жалко отказаться. Noah видит прагматичный путь простых маленьких шагов вместо не очень реалистичных космолётов.
4. Lenny Rachitsky: Правильные сценарии использования ИИ-поисковика Perplexity. Как задавать грамотные вопросы о профессии, рынке и своём продукте.
Другие применения
1. Luke Wroblewski: Развивает свой алгоритмический поиск по сайту и переосмыслил транскрипции презентаций.
2. Google Illuminate: Экспериментальный сервис превращает научные публикации во что-то вроде подкастов, где эта тема раскрывается в дискуссии.
Критика и проблемы
1. Rolling Stone: Примеры компаний и продуктов, которые намеренно отказываются от генеративного контента и запрещают размещать его.
2. Звукозаписывающие лейблы подали в суд на сервисы Suno и Udio, которые генерируют музыку по текстовому запросу. Как и во многих других ситуациях с алгоритмическим дизайном, некоторые результаты были слишком похоже на известные оригиналы.
3. Nikhil Suresh: Жёсткая прожарка бессмысленных разговоров о внедрении ИИ в продукты. Большинство компаний не могут справиться с простейшей разработкой базовых вещей, но уже бегут в тему с непонятным для них выхлопом.
Общие изменения рынка
1. OpenAI сформулировали свою модель зрелости универсальных ИИ (AGI). Они считают, что сами находятся на первом этапе.
2. Anthropic Claude 3.5: Вышла новая версия модели. Кстати, как и OpenAI, они делают один из самобытнейших брендов на рынке.
Другие применения
1.Dove: Развивает свою изначальную кампанию «реальная красота» и добавляет к ней отказ от генеративных фото и ИИ-обработки.
2. YouTube: Научился удалять из видео музыку, на которую пришла жалоба правообладателя, оставляя голос ведущего.
3. Т-Банк: Запустили «Джуниор-ассистента», который обучает детей финансовой грамотности.
4. Audi: Добавит ChatGPT в свои машины аналогично Volkswagen (для усиления своего основного ассистента).
#ai #algorithms
uizard.io
Uizard Autodesigner 2.0 | AI UI Design Generator | Uizard
Generate multi-screen, editable designs and iterate them using text prompts. Advance Uizard projects with a UI generator directly from the editor.
Успею выложить мини-подборку об алгоритмическом дизайне, пока она не стала переростком:
Взаимодействие с такими инструментами
1. IBM: Метод описания ментальных моделей пользователей при проектировании продуктов с ИИ-функциями. Armon Burton, Gabby Hoefer, Claudia Richard, Milena Pribic, Hal Wuertz и Alex Baria рассказывают о нём и как устроен процесс исследования.
2. Feifei Liu: Примеры удачного дополнения строки текстового запроса в ИИ-чат-ботах привычными для графических интерфейсов наглядными кнопками, меню и дополнительными полями форм. Цикл снова повторяется — давным-давно так решали ограничения текстовых интерфейсов, лет 6 назад это происходило в недолгий бум ботов в мессенджерах.
3. Josh Clark: Модель sentient design (это их версия алгоритмического дизайна). Она описывает разные модели взаимодействия пользователя с такими продуктами.
Инструменты дизайна
1. Canva купили инструмент Leonardo AI для генерации изображений по текстовому запросу.
2. Samsung: В новых телефонах можно сделать набросок на фото и он превратится в реалистичный объект или иллюстрацию.
Инструменты продуктивности
1. Miro Intelligent Canvas: Старые и новые ИИ-возможности Miro упаковали в концепцию Intelligent Canvas. Помимо генерации текста теперь можно создать диаграмму по текстовому запросу, написать бриф или ТЗ на основе идей на стикерах, получить помощь виртуального «скрам-мастера» по обработке результатов ретро. Виджеты также стали интерактивнее.
2. Google Gemini сделает Chrome ещё полезнее. Можно будет сравнить товары в разных вкладках, искать по истории страниц естественным языком и объяснить любое изображение на странице.
3. Big Medium: За последние пару стремительных лет популярные инструменты превратились из личного конкурентного преимущества в обычный productivity-инструмент. Условный Excel даёт много возможностей, но это уже базовая повседневная штука.
Разное новое
1. Виртуальный официант от Gatebox на базе GPT-4o, который может, предложить, например, повторить пиво, если видит пустой бокал.
2. SearchGPT: OpenAI запустили закрытую бету своего поисковика.
3. YouTube: Экспериментирует с помощью авторам в генерации идей — сюжеты, заголовки и обложки видео.
#ai #algorithms
Взаимодействие с такими инструментами
1. IBM: Метод описания ментальных моделей пользователей при проектировании продуктов с ИИ-функциями. Armon Burton, Gabby Hoefer, Claudia Richard, Milena Pribic, Hal Wuertz и Alex Baria рассказывают о нём и как устроен процесс исследования.
2. Feifei Liu: Примеры удачного дополнения строки текстового запроса в ИИ-чат-ботах привычными для графических интерфейсов наглядными кнопками, меню и дополнительными полями форм. Цикл снова повторяется — давным-давно так решали ограничения текстовых интерфейсов, лет 6 назад это происходило в недолгий бум ботов в мессенджерах.
3. Josh Clark: Модель sentient design (это их версия алгоритмического дизайна). Она описывает разные модели взаимодействия пользователя с такими продуктами.
Инструменты дизайна
1. Canva купили инструмент Leonardo AI для генерации изображений по текстовому запросу.
2. Samsung: В новых телефонах можно сделать набросок на фото и он превратится в реалистичный объект или иллюстрацию.
Инструменты продуктивности
1. Miro Intelligent Canvas: Старые и новые ИИ-возможности Miro упаковали в концепцию Intelligent Canvas. Помимо генерации текста теперь можно создать диаграмму по текстовому запросу, написать бриф или ТЗ на основе идей на стикерах, получить помощь виртуального «скрам-мастера» по обработке результатов ретро. Виджеты также стали интерактивнее.
2. Google Gemini сделает Chrome ещё полезнее. Можно будет сравнить товары в разных вкладках, искать по истории страниц естественным языком и объяснить любое изображение на странице.
3. Big Medium: За последние пару стремительных лет популярные инструменты превратились из личного конкурентного преимущества в обычный productivity-инструмент. Условный Excel даёт много возможностей, но это уже базовая повседневная штука.
Разное новое
1. Виртуальный официант от Gatebox на базе GPT-4o, который может, предложить, например, повторить пиво, если видит пустой бокал.
2. SearchGPT: OpenAI запустили закрытую бету своего поисковика.
3. YouTube: Экспериментирует с помощью авторам в генерации идей — сюжеты, заголовки и обложки видео.
#ai #algorithms
Medium
Design for AI: Understanding Mental Models
by Armon Burton (IBM), Gabby Hoefer (IBM), Claudia Richard (IBM), Hal Wuertz (Amazon), Alex Baria (UL)