DevNotes Live
6 subscribers
60.9K photos
8.95K videos
172 files
24.7K links
Автоматический агрегатор IT ресурсов в Telegram (@devnotes_robot)
Информация: https://t.me/devnotes_live/121
Download Telegram
На этой неделе снова будет выгрузка свежего по алгоритмическому дизайну в пару заходов. Пару месяцев не доходили руки собрать вместе (скорость появления нового запредельная), но момент за хвост сейчас пойман. Начнём с инструментов:
 
ДИЗАЙН
Framer сгенерирует сайт по текстовому описанию, а потом поможет докрутить отдельные элементы из набора предложений.
 
Figma купила нашумевший стартап Diagram, который запустил энтузиаст Jordan Singer с командой. Они делают простые и достаточно прагматичные решения, которые наверняка скоро попадут в Figma. В статье описаны несколько сценариев использования, которые уже помогут в повседневных задачах — например, автоматическая категоризация идей из брейнштормов (дико нудное дело).
 
Adobe Firefly теперь встроен и в Photoshop через функцию Generative Fill. Можно выделить место на фото и добавить туда любой объект. Как это работает. Это лучшая реализация алгоритмических функций в инструменте дизайна на текущий момент — они встроены органично в существующий процесс и прокачивают его, а не делают костыльные надстройки. Как и должны быть везде.
 
Adobe Express: Новый простой инструмент дизайна для несложных макетов и видео. Он умеет генерировать изображения и шрифты с помощью Firefly, готовит макет под разные размеры.
 
Adobe добавили в Illustrator экспериментальную функцию Generative Recolor. Она меняет цвета на сложных иллюстрациях с помощью их движка Firefly.
 
Uizard Autodesigner: Видео-обзор от Kim Alban.
 
Shaper: Вторая версия инструмента от Hayk An, который позволяет настраивать интерфейс, собранный на базе компонентов с токенами. Можно получить случайную комбинацию параметров, так что это игрушка на стыке алгоритмического дизайна.
 
Drag Your GAN: Можно простым способом указать, как нужно поменять параметры объекта или персонажа на фото.
 
Durer: Генерирует иллюстрации в вашем собственном стиле. Он учится на нескольких примерах.
 
Recraft: Генератор и редактор иконок и иллюстраций в разных стилях. Это смесь текстового запроса и выбора параметров.
 
Mandala: Интеграция Stable Diffusion в инструмент для 3D-моделирования Maya. А ещё там появится официальный ассистент на базе OpenAI.
 
Spline для 3D научился генерировать объекты по текстовому описанию и накладывать стиль по примеру.
 
Zoo: Сервис сравнивает результаты популярных инструментов генерации картинок по текстовому запросу.
 
Gamma App: Может сгенерировать черновик презентации с графикой на основе тезисов.
 
Shap-E: Новый проект OpenAI генерирует трёхмерные объекты по текстовому запросу. Научная публикация.
 
Insightface Swap: Бот для Midjourney грамотно вставит ваше лицо на сгенерированное фото или иллюстрацию.
 
Photoleap: Фоторедактор для мобильных, умеющих кучу приёмов по стилизации и переосмыслению фото.
 
Illustroke: Генератор векторных иллюстраций по текстовому запросу.
 
ClipDrop Uncrop: Дорисовать то, что было за границами изображения (примерно как Generative Fill у Photoshop).
 
UX-ИССЛЕДОВАНИЯ
Dovetail сможет сгруппировать инсайты в темы или набросать черновик инсайта.
 
ИНСТРУМЕНТЫ ДЛЯ ТЕКСТОВ
Яндекс Маркет генерирует описание товаров с помощью YandexGPT.
 
TikTok: Генератор сценариев для рекламы.
 
LinkedIn генерирует текст сопроводительного письма для отклика на вакансию.
 
ПРОМДИЗАЙН И АРХИТЕКТУРА
Toyota экспериментирует с алгоритмическим дизайном для работы над машинами. Это один из самых разумных процессов — дизайнер делает первый набросок стиля, дальше алгоритм предлагает несколько вариантов его оптимизации (например, для лучшей аэродинамики). Дизайнер выбирает одно из предложений и дорабатывает его.
 
Finch и PlanFinder: Планы помещений.
 
МУЗЫКА И ВИДЕО
TikTok Ripple генерирует и редактирует музыку. Можно напеть мотив и оно превратит его в заготовку песни.

Генератор музыки по текстовому описанию от Меты.

Synthesizer V: Генерирует вокал для музыки. Он обещает упростить ранние наброски песен.
 
NVIDIA Align Your Latents и Runway Gen-2: Видео по текстовому описанию.
 
Вторая часть — в среду.
 
#al #algorithms
Продолжу выгрузку накопившегося по алгоритмическому дизайну, которая копилась последние пару месяцев:
 
ДИЗАЙН-ПРОЦЕСС
1. Dan Mall: Простыми и чёткими мыслями пересказал стандартную логику процесса алгоритмического дизайна, актуальную на сегодняшний день. Она повторяется из года в год, не меняясь при смене волн хайпа.
 
2. Matty Brownell: Иллюстративная графика для бренда в едином стиле с помощью Midjourney.
 
3. David Truog: Смогут ли такие инструменты развиваться, если сами дизайнеры не будут поставлять им свежие обучающие данные из своих работ.
 
4. Jay Anthony: Реалистично ли писать сценарии для юзабилити-тестирования через ChatGPT. Конкретики мало, но ограничения подсвечены.
 
5. Как сделать иллюстративные QR-коды от nhciao через Stable Diffusion, которые работают на самом деле.
 
ПОЛЬЗОВАТЕЛЬСКОЕ ВЗАИМОДЕЙСТВИЕ С НИМИ
1. Jakob Nielsen: Современные генераторы по текстовому запросу — это новая интерфейсная парадигма после пакетной обработки в первых компьютерах и командной строки. Впервые пользователь описывает сам конечный результат, а не последовательность команд для его получения.
 
2. Luke Wroblewski: Прикрутил поиск по своему блогу на базе ChatGPT (включая видео и подкасты). Затея интересная — он отвечает на вопросы в свободной форме выводами из статей Люка (а он написал очень много материалов за 25 лет). Его мысли про стандартную иконку такого поиска через «магические искры».
 
3. Stephen P Anderson: Проблемы генераторов текстов а-ля ChatGPT. Они способны создавать черновики, но многие забывают, что эти черновики нужно критически анализировать и доводить до ума.
 
4. Jakob Nielsen: Одно из первых вменяемых исследований на тему продуктивности и качества работы специалистов, использующих ChatGPT. Они стали тратить меньше времени на написание черновиков, но больше на редактуру. В целом качество материалов достойное. Бонусом они традиционно шутканули на 1 апреля на эту тему.
 
5. Luke Wroblewski: Переход редакторов графики и видео от инструменто-центричных интерфейсов к объекто-центричным. Алгоритмический дизайн подталкивает к этому.
 
6. Maggie Appleton: Концепты взаимодействия с чат-ботами. Как они могут уточнять и дополнять текст.
 
КАК ВСЁ ЭТО РАБОТАЕТ
1. Алина Валяева: Политика фотобанков и сайтов вопросов и ответов по поводу использования контента, сгенерированного алгоритмами.
 
КУЛЬТУРНЫЙ ЭФФЕКТ
1. Amy Goodchild: Примеры алгоритмического дизайна из 50х и 60х. Забавно, что даже дискурс про роль таких инструментов местами такой же, как в текущую волну.
 
2. Fast Company: Значительная часть логотипов современных сервисов вокруг ИИ ходят вокруг разного рода шестигранников.
 
КАКИЕ РАБОТЫ УЙДУТ
Идущие и планирующиеся сокращения в IBM, Bild, Bluefocus Intelligent Communications Group Co.
  
НЕ ДЕЛАЙТЕ ТАК
1. Niloufar Salehi: Попробовал сервис Synthetic Users, который якобы генерирует персонажей на основе публичных данных без проведения пользовательских исследований. По факту это просто мусорная информация — не сильно лучше высосанных из пальца персонажей, которые пишут дизайнеры без исследований. ChatGPT создаёт похожие по бесполезности материалы.
 
2. Arvind Sanjeev: Как закрытые личные данные утекают для обучения алгоритмов. Например, многие генераторы лиц как будто ненастоящих людей на самом деле берут настоящие фото и просто немного дорабатывают их.
 
3. Использовались ли ваши данные или фото для обучения алгоритмов. Это часть более крупной инициативы Spawning по защите своих персональных данных от обработки.
 
4. Bloomberg: Как сервисы генерации изображений по текстовому запросу воспроизводят расовые и гендерные стереотипы.
 
#al #algorithms
Новёхонькая подборка об алгоритмическом дизайне собралась в рекордные сроки:
 
1. Adobe Photoshop: Новая функция Generative Expand на основе их движка алгоритмического дизайна Firefly. Она продолжает Generative Fill, но более удобна для дорисовки изображения за текущими границами. Как она работает.
 
2. Stable Diffusion XL 1.0: Выпустили новую версию для всех.
 
3. Clipdrop Stable Doodle: Превращает наброски от руки в фото и иллюстрации.
 
4. GetIMG.AI: Ещё один инструмент алгоритмического дизайна, который собрал вместе кучу модных утилит — генерация картинок и расширение существующих изображений, обучение собственного стиля и всё такое.
 
5. Canva Magic Design: Запустили алгоритмического помощника, который помогает генерировать шаблоны, изображения и другие аспекты дизайна.
 
6. Benedict Evans: Алгоритмические инструменты не сократят рабочие места, а наоборот — создадут много новых. Он ссылается на парадокс Jevons, который показал — когда какой-то ресурс становится дешевле, его наоборот начинают потреблять больше. И приводит много подходящих примеров.
 
7. Rest of World: Журнал пообщался с низкооплачиваемыми работниками в нескольких профессиях (иллюстратор, редактор, ассистент, аналитик), которых потенциально могут заменить алгоритмы. Что они делают с этим прямо сейчас и видят ли свою полную замену (скорее нет, хотя работать придётся больше). Интересно, что журналисты попросили сделать одинаковую задачу руками и с помощью новых инструментов.
 
8. Shopify Sidekick: Готовят алгоритмического помощника. Он анализирует исторические данные по интернет-магазину, предлагает рекомендации по перестройке ассортимента и может обновить сайт по этим рекомендациям.
 
9. Per Axbom: Проблемы с этикой и качеством инструментов алгоритмического дизайна в виде инфографики.
 
10. YouTube: Бета-версия пересказа содержания видео.
 
11. SciSpace Copilot: Плагин для Chrome помогает анализировать научные публикации и выделять из них основное.
 
12. LoopPanel: Помогает обрабатывать заметки из пользовательских интервью и выделять инсайты из них.
 
13. Kraftful: Помогают разбирать обратную связь от пользователей и раскладывать её по категориям с помощью ChatGPT.
 
14. Pika Art: Генератор видео по текстовому описанию.
 
15. HiFa: Экспериментальный инструмент генерирует 3D-модели по текстовому описанию.
 
16. Рекламная кампания очков Georgetown Optician, которую агентство Design Army сделало в Midjourney.
 
#al #algorithms
Свежая выгрузка инструментов и в целом движа в алгоритмическом дизайне:
 
1. Adobe Firefly: Инструмент вышел из беты и доступен подписчикам Creative Cloud.
 
2. Everypixel: Статистика по количеству изображений сгенерированных инструментами алгоритмического дизайна DALL-E 2, Stable Diffusion, Midjourney и Adobe Firefly. Темпы роста огромные, хотя сюда, судя по всему, включены все промежуточные итерации, которые не идут в финальный макет.
 
3. Jambot: Официальный плагин на базе ChatGPT для FigJam. Он может просуммировать результаты брейншторма и сгенерировать идеи. Интервью с командой создателей.
 
4. Midjourney Inpainting: Новая функция позволяет изменить только часть изображения — например, только персонажа, не трогая саму сцену.
 
5. Matej Latin: Изучил, насколько удачно подбирают шрифтовые пары сервисы алгоритмического дизайна FontJoy и ChatGPT. Кое-что могут, но с кучей проблем и ограничений.
 
6. DreamFace: Генерация реалистичных трёхмерных моделей лиц по текстовому описанию. Они анимированы и текстурированы.
 
7. Captions: Многофункциональный алгоритмический инструмент создания и обработки аудио и видео. Генерирует голос по кусочку его записи, убирает слова-паразиты, улучшает попадание мимики рта в произносимый текст и много чего ещё.
 
8. Maggie Appleton: Презентация о современных языковых моделях и алгоритмических сервисах. Она описывает особенности их построения, проблемы в получении внятных результатов и свои интерфейсные концепты их решения.
 
9. TextFX: Экспериментальный проект Google, который помогает реперам писать рифмы.
 
10. HayGen Video Translate: Сервис переводит видео на другой язык. При этом он сохраняет голос и подгоняет мимику персонажа под новый текст.
 
11. Stable Audio: Новая модель от создателей Stable Diffusion позволяет генерировать музыку по текстовому описанию.
 
12. AudioGen: Экспериментальное решение Меты позволяет генерировать звуки по текстовому описанию.
 
13. Musicfy: Сервис позволяет напеть мотив песни и преобразовывает его в мелодию на конкретном инструменте.
 
14. Albus: Экспериментальная записная книжка на базе ChatGPT, которая помогает исследовать тему с разных сторон и генерировать заметки о ней.
 
#ai #algorithms
На конференции Adobe MAX 2023 традиционно показали пачку экспериментов с Adobe Firefly (раньше он назывался Sensei). И прокачали саму платформу алгоритмического дизайна:
 
1. Обновили базовую модель Firefly. Она научилась генерировать картинки в заданном стиле (нужно дать несколько примеров или выбрать из существующих рефов). Точнее генерирует людей и позволяет настраивать параметры «фотосъёмки». Помогает задавать правильные запросы (и предлагает подсказки). Ну и, само собой, даёт более лучшее качество.
 
2. Добавили векторную модель Firefly. Она помогает генерировать объекты, которые вписываются в стиль целевой иллюстрации, делает текстуры и градиенты, ну и правильно организует геометрию и слои.
 
3. Сделали модель Firefly Design. Она генерирует цельные редактируемые шаблоны (пока для их инструмента Adobe Express), которые адаптируются для разных сред вроде соцсетей или печати. Предлагает варианты текста, графики и композиции.
 
Кстати, недавно Firefly стал доступен через API в платформе NVIDIA Omniverse.
 
А вот свежие дикие штуки Adobe Sneaks:
 
#ProjectFastFill: Добавляет и удаляет объекты на видео таким же простым способом, то и Generative Fill.
 
#ProjectDraw&Delight: Превращает простейшие наброски рисунков в базовые контурные или полноцветные иллюстрации. Сюжет можно развивать и дополнять постепенно, менять позы персонажей, а также раскрашивать в духе недавнего запуска Illustrator Generative Recolor, ну и доделывать в самом Illustrator.
 
#ProjectNeo: Создаёт псевдо-трёхмерные иллюстрации с помощью простейших объектов. В примере делают архитектурный объект, который выглядит как векторная иллюстрация.
 
#ProjectSceneChange: Позволяет вставить персонажа из видео в любую другую сцену. Причём он докручивает оба видео, чтобы подходили друг к другу.
 
#ProjectPrimrose: Платье из простых текстур меняет цвет. Причём может делать анимацию из этого.
 
#ProjectGlyphEase: Создаёт шрифт на основе трёх знаков для примера, даже если это набросок на бумаге. И стилизует его в нужной технике, в том числе сверх-декоративной.
 
#ProjectPoseable: Генерирует наброски персонажей для сценарных раскадровок. Можно быстро настроить позу модели среди предложенных и описать нужный образ со сценой.
 
#ProjectResUp: Повышает разрешение видео маленького размера.
 
#ProjectDubDubDub: Генерирует дубляж видео или перевод аудио-записей на любой язык. Пытается вписаться в акустическое окружение сцены.
 
#ProjectStardust: Редактирует фото простым способом: переместить, добавить или убрать объекты, поменять одежду или дорисовать недостающую часть человека.
 
#ProjectSeeThrough: Убирает отражения и блики с фото, сделанных через стекло.
 
Скорость попадания этих набросков в основные продукты сильно выросла и в этом Adobe здорово уделывает хейтеров. И если в 2020 году тема почти сдулась, то сейчас снова тонна вдохновляющего.
 
#ai #algorithms #adobe #events
Как всегда, подборка свежего по алгоритмическому дизайну с трудом помещается в один выпуск:

DALL-E 3: Новое поколение позволяет точнее описать детали сцены, рисует людей с меньшим количеством галлюцинаций и генерирует корректный текст. Этические барьеры расширили — помимо известных людей, теперь нельзя мимикрировать под стиль ныне живущих художников (как убрать себя из обучения модели).

v0 by Vercel: Платформа для разработчиков Vercel запустила генератор интерфейсных компонентов. На выходе — код React на базе shadcn/ui и Tailwind CSS. Логика построения компонентов рандомная, но затея интересная.

Getty Images Generative AI: Официальный генератор фото от Getty Images и NVIDIA. Они тренировали его на своей базе фотографий и вроде как платят авторам рефов. Обещают полную лицензионную безопасность.

Baymard: Попробовали ChatGPT для экспертной оценки интерфейса по скриншоту и настоящей ссылке. Результаты мусорные ― находит крайне мало реальных проблем и выдумывает много несуществующих.

NN/g: Типичные задачи, для которых дизайнеры используют алгоритмические инструменты.

User Interviews: Что и для каких задач используют UX-исследователи.

Figma: Особенности современных инструментов для разработчиков, которые автоматизируют часть работы и генерируют код. И что из этого подошло для нового режима для разработчиков в Figma.

NN/g: Несколько моделей поведения пользователей при работе с генеративными сервисами.

Louis Charron: Как «галлюцинации» в генераторах картинок помогают креативности. Он сравнил разные версии Midjourney, которые сначала теряли поэтичность, а под конец немного вернули её.

Андрей Ковалёв: Коллекция стилей, в которые умеет Midjourney. Их можно использовать в своих запросах.

Vizcom: Превращает наброски от руки в полноценные 3D-рендеры.

YandexArt: Обновлённый генератор графики, который развивает прошлое поколение Шедеврум.

NN/g: Почему пользователи присваивают человеческие качества генеративным чат-помощникам и общаются с ними соответствующе.

Алина Сидоренко: Толковая памятка по работе с Midjourney. Как получить результат в разных стилях и видах дизайна (иллюстрации, текстуры, логотипы, интерфейсы и т.п.).

NN/g: Исследование генеративных ботов Bard, Bing и ChatGPT. Насколько хорошо они решают разные задачи.

YouTube: Будет предлагать идеи и сценарии для видео на основе данных об аудитории и её предпочтениях. Авторы смогут генерировать фоны по текстовому запросу и автоматически дублировать ролики на другие языки.

ChatGPT: Сможет принимать запросы голосом и лучше анализировать загруженные картинки. Например, предложит рецепт на основе фото продуктов в холодильнике. На такой картинке можно выделить детали, про которые хочется узнать. Тест-драйв.

Генератор скрытых слов на изображениях на базе Stable Diffusion и ControlNet.

Александр Селедчик: Чеклист поможет определить фото, сгенерированное алгоритмами.

Android 14: Генерирует фоны для телефона.

TryOnDiffusion: Экспериментальный инструмент «примеряет» любую одежду на ваше фото.

Jakob Nielsen: Какие метафоры кроме клишированного робота предлагают инструменты для показа самого ИИ.

Javi Lopez: Мини-игра Angry Pumpkins, сделанная с помощью DALL-E и Midjourney (графика) и GPT-4 (код).

Мета: Оцифровали пару десятков знаменитостей вроде Mr Beast и Snoop Dogg в качестве ИИ-ботов для чата с говорящей головой. И добавили много разных функций вроде алгоритмической генерации стикеров и редактирования фото.

Luma AI: Генератор 3D-моделей и сцен.

Kaiber: Генератор видео-клипов на основе текстового запроса, других видео, фото и аудио.

Suno AI: Генератор песен с вашими словами в разных жанрах.

Just AI Copilot: Свой ChatGPT от Just AI.

IKEA Instructions: Генератор иллюстраций в духе инструкций IKEA на базе Stable Diffusion XL.

Microsoft Copilot: Выходит в свежем обновлении Windows.

Spirals: Генератор спиралевидных фото.

AI Dubbing: Сервис переводит видео на другой язык. При этом он сохраняет голос персонажа.

EmojiGen: Генератор memoji.

#ai #algorithms
Новые ссылки об алгоритмическом дизайне пополняются быстрее, чем пакет с пакетами:
 
1. tldraw Make Real: Экспериментальный инструмент превращает наброски интерфейса от руки в аккуратный визуальный результат и код на React с помощью инструментов OpenAI. Можно дополнить скетч текстовым описанием того, что нужно. Причём интерфейс может иметь небанальную логику поведения. Обзор от создателей.
 
2. Midjourney: Бета-версия в браузере с человеческим интерфейсом.
 
3. KREA: Генератор изображений и видео по текстовому описанию (можно сделать условный набросок для точности). Умеет делать это в реальном времени (ещё пример). Может натренироваться на вашем собственном стиле.
 
4. NN/g: 6 типов общения с алгоритмическими чат-ботами и структура запроса к ним. Они провели дневниковое исследование среди пользователей ChatGPT, Bing Chat и Google Bard.
 
5. Luke Wroblewski: Подходы к интеграции алгоритмических возможностей в интерфейс цифровых продуктов.
 
6. Canva: Интегрировала инструменты алгоритмического сервиса Runway через встроенное приложение Magic Media.
 
7. Fusion Brain: Инструмент генерирует изображения и видео с помощью нейросети Kandinsky от Сбера.
 
8. YouTube: Серия экспериментов с генеративной музыкой. Dream Track создаёт композиции для коротких видео в духе нескольких музыкантов, вписавшихся в пилот. Music AI Tools генерирует музыку по текстовому описанию. Можно просто напеть зарисовку или сделать её другим способом, а потом перебирать инструменты и варианты звучания.
 
9. It's Nice That: Несколько дизайнеров описали свой рабочий процесс для задач, где они использовали инструменты алгоритмического дизайна. У всех достаточно хитрая солянка классических и новых приёмов.
 
10. Stable Diffusion: Теперь умеет генерировать видео по текстовому запросу.
 
11. Runway Motion Brush: Можно анимировать конкретную часть фото, если выделить её.
 
12. CLO: Генератор текстур для одежды по текстовому запросу в инструменте для цифровой моды.
 
13. Google: Экспериментальный генератор графики по текстовому запросу.
 
14. Runway TV: Экспериментальный генеративный телеканал от создателей алгоритмического инструмента для видео Runway.
 
15. Яндекс Маркет: Массовая генерация описаний товаров с YandexGPT.
 
16. Simon Willison: Советы по формулированию запросов в DALL-E 3.
 
17. Jakob Nielsen: Советует сравнивать алгоритмические инструменты не с лучшим экспертом в отрасли, а среднестатистическим. Ведь их основная ценность — повышать средний уровень в отрасли, а не обязательно совершать прорывы.
 
18. ChatGPT: Обновили модель до GPT-4 Turbo. Она обучалась на более свежей информации (до апреля 2023 года) и дешевле для разработчиков.

Также за последние месяцы начали появляться плагины вокруг дизайна вроде DoritosGPT (генерирует любые пачки чипсов Doritos), ConvertAnything (конвертирует кучу форматов изображений, видео, аудио и документов в кучу других форматов) и Canva (генерирует макеты для соцсетей и другие промо-материалы).
 
19. Яндекс Практикум: Пересказывает урок или объяснит сложный термин через YandexGPT.
 
20. Модельное агентство, которое предлагает алгоритмически сгенерированных моделей.
 
#ai #algorithms
Прошёл всего месяц, а по теме алгоритмического дизайна опять выше крыши новья:
 
Pika 1.0: Генератор видео по текстовому описанию вышел из беты и порвал танцпол своей безумной демкой.
 
Midjourney 6: Вышла альфа-версия нового поколения. Увеличили разрешение до 2048x2048, добавили генерацию небольших текстов, улучшили понимание самих запросов.
 
StorybookGPT: Плагин для ChatGPT генерирует описание компонентов для живого гайдлайна Storybook. Памятка по работе с ним.
 
iA (эксперты в работе над текстами): Оценивают сильные и слабые стороны алгоритмических инструментов в этом плане. Где они помогают и где бесполезны. В новой версии своего текстового редактора iA Writer 7 они использовали это понимание для интересной разметки авторства (вы, ChatGPT или другой источник).
 
DALL-E Party: Занятный эксперимент, который по циклу искажает цепочку генерации DALL-E. Он описывает картинку текстом, потом генерирует из него ещё одну картинку — и так по кругу.
 
Figma: Пообщались с менеджерами продуктов для массового пользователя, которые внедряют функции на базе ИИ. Как они строят продуктовую работу в таких случаях.
 
Angie Wang: Топчанское интерактивное размышление-повесть, в котором она сравнивает процесс обучения алгоритмов и маленького ребёнка — .
 
FlutterFlow AI Gen: Сервис для быстрой разработки мобильных приложений научился генерировать дизайн и код (фронт + бек) по текстовому запросу или наброску на бумаге. Он автоматизирует все этапы от идеи до реализации.
 
Alex Ivanovs: Описывает хронологию развития первого года жизни ChatGPT.
 
Krea: Добавили интересный метод «overlay view», который позволяет схематично набросать перспективу объекта и в целом основные элементы.
 
Microsoft Paint: Теперь тоже генерирует графику по текстовому описанию с функцией «Cocreator» на базе DALL-E 3. Видео-обзор.
 
Amazon Titan: Генератор изображений по текстовому описанию доступен на платформе AWS (видео-обзор).

Amazon Q: Ещё один алгоритмический помощник в AWS. Он подключается к корпоративным сервисам и помогает анализировать информацию из них.
 
Audiobox: Новая модель для генерации аудио от Меты. Может взять за основу ваш голос, текстовый запрос, готовую музыку и сгенерировать или доработать/переосмыслить их.
 
Output Co-Producer: Генератор семплов по текстовому запросу от создателей инструмента Output.
 
Instagram: Пробует менять фон в stories с помощью алгоритмического дизайна (ещё).
 
Исследователи Hugging Face и Carnegie Mellon University посчитали энергозатраты на генерацию изображений с помощью алгоритмического дизайна. Выходит много — сопоставимо с полной зарядкой телефона (исследование).
 
HeyGen Custom Avatar: Сервис создаёт фотореалистичные аватары пользователей, которые могут читать текст на видео. Голос и мимика — тоже ваши.
 
Magnific: Один из самых качественных алгоритмических сервисов по улучшению качества фото на базе.

Prompt Brush: Пародия на инструменты, работающие по текстовому запросу. Иллюстрацию по такому запросу руками рисует иллюстратор Pablo Delcan.
 
Luke Wroblewski: Советует давать подсказки в инструментах, работающих по текстовому запросу. Пользователи часто не понимают, как правильно что-то спросить у них.
 
YandexART: Научился генерировать ёлочные игрушки в нескольких стилях.
 
Google и Vogue: Изучили, как ИИ влияет на процессы и сценарии покупки модной одежды.
 
Spotify: Тестирует генерацию плейлистов по текстовому запросу.
 
Точка: Усилила интерактивный справочник с помощью ChatGPT. Сервис «Ассистент» помогает отвечать на бухгалтерские вопросы.
 
Curio: Говорящие игрушки, которые придумывают истории и диалоги с помощью ChatGPT. Анонс — https://www.youtube.com/watch?v=f5rLMWzjDIg.
 
Ars Technica: Сравнили, кто лучше хохмит — ChatGPT или Bard (спойлер: ChatGPT).
 
Битрикс CoPilot: Алгоритмические инструменты, встроенные в платформу. Генерирует, анализирует и улучшает контент.
 
Яндекс Недвижимость: Может искать квартиры по текстовому запросу вместо перебора фильтров с помощью YandexGPT.
 
#ai #algorithms
Пропустил месяц в выпусках про алгоритмический дизайн, так что теперь разгребать с полсотни новья:

Взаимодействие с такими инструментами:
1. Emily Campbell: Паттерны проектирования инструментов.

2. IBM: Принципы дизайна инструментов. Они дают удачные примеры реализации для каждой рекомендации.

3. Christopher Kovel: Почему алгоритмы не заменят пользовательских исследователей. Они подают надежды во вторичных исследованиях, которые делаются на основе уже опубликованных отчётов. Но не смогут в первичные, где нужно общаться с пользователями и зачастую импровизировать в рамках изначального плана.

4. Jakob Nielsen и Sarah Gibbons: Можно ли считать эмпатию от алгоритмических инструментов настоящей. Сара скептична, Якоб воодушевлён.

5. NN/g: Феномен «подхалимства» при работе с генеративными чат-ботами. Они стараются быть вежливыми и угодить пользователю, поэтому готовы противоречить фактам.

6. Jakob Nielsen: Анализирует свежее исследование Microsoft, которое показывает рост продуктивности благодаря помощнику Copilot. Цифры местами завышены (они такие только для идеальной ситуации), но данные в целом интересные.

7. Moritz Gießmann: Проблемы результатов алгоритмического дизайна с точки зрения accessibility.

8. Luke Wroblewski: Совмещение очков дополненной реальности и возможностей алгоритмического дизайна на лету.

Создание таких инструментов:
1. Конспект панельной дискуссии Noah Levin (Figma), Nadim Hossain (Databricks), Greg Hochmuth (Midjourney) и Joe Burfitt (Modyfi).

2. Intercom: Обновлённый продуктовый процесс при работе над функциональностью на базе ИИ.

Кейсы и инструкции:
1. Antoine Vidal: Как генерировать предсказуемую сцену в разных стилях с помощью подключения алгоритмических инструментов к 3D-программам.

2. Яндекс Лавка: Упаковка на базе YandexArt.

3. Вкусвилл: Упаковка.

4. ASML: Фильм о бренде. Для этих 1 минуты и 50 секунд собрали 7852 изображений на основе 1963 текстовых запросов в Midjourney, потом обработали в Runway. Видео.
 
Инструменты для изображений:
1. iA: Алгоритмически сгенерированная графика всё больше похожа на клишированные стоковые изображения. Они сформулировали конкретные приёмы, которые вызывают такое ощущение. iA придерживаются этого мнения и про видео.

2. Austin Gil: Как самому реализовать генерацию изображений в браузере на базе OpenAI.

3. Ideogram: Иллюстрации с реальным текстом по текстовому запросу.

4. ImageFX: Фото и иллюстрации по текстовому описанию от Google.

5. EverArt: Многофункциональный инструмент, который может генерировать и редактировать изображения. Может подстроиться под заданный стиль.

6. iStock AI Generator: Фото и иллюстрации по текстовому описанию. Обещают гарантированную безопасность в плане авторских прав на картинки. Анонс.

7. Яндекс Маркет: YandexArt генерирует изображения товаров в разном окружении, если загрузить фото на однотонном или прозрачном фоне.

8. Apple: Редактирование и ретушь фото по текстовому запросу.

9. BRIA RMBG: Удаляет фон на фото с очень пристойным качеством.

10. DignifAI: Угарный эксперимент от 4chan — одевает откровенные фото.

Инструменты для видео:
1. OpenAI Sora: Генерация видео по текстовому запросу (выглядит фешенебельно). Как это работает.

2. Stable Video: Генератор видео по текстовому запросу от создателей Stable Diffusion.

Другие дизайнерские инструменты:
1. Moodboard Creator: Генерирует базовые основы для визуального стиля. Правда, к мудбордам это отношения не имеет и попадание в запрос по жанру сомнительное.

2. Miro Assist: Умеет группировать и суммировать идеи, генерировать диаграммы и изображения, убрать фон у картинки.

3. Mural AI: Умеет группировать и суммировать идеи, генерировать ментальные карты. Он интегрирован с Microsoft 365 Copilot.

4. NVIDIA ACE (Avatar Cloud Engine): Оживляет игровых персонажей в живое взаимодействие без заранее заданного сценария с их решением. Видео.
 
5. Valve: Разрешит включать больше генеративного контента в игры для Steam.

#ai #algorithms
Вторая часть запоздалого выпуска про алгоритмический дизайн. Чуть меньше про сам дизайн, чуть больше про платформы:
 
Инструменты:
1. Wix AI Website Builder: Второй заход Wix на поляну алгоритмического дизайна после ADI. В этот раз он генерируется по текстовому запросу.
 
Взаимодействие с такими инструментами:
1. Silvia Podesta: Ментальные модели обычного поиска и новых подходов на базе чат-ботов типа Perplexity. Как отличается поведение и ожидания пользователей.

Общий тренд:
1. Everypixel: Обзор главных запусков и законодательных инициатив в сфере генеративного ИИ в 2023 году.

2. Sequoia Capital: Начинается второй акт генеративного ИИ. Он больше про полезные сценарии использования, а не просто технологии.

3. Simon Willison: Что отрасль узнала про большие языковые модели в 2023 году.

4. Визуализация того, как устроены большие языковые модели.
 
Платформы:
1. Microsoft добавляет кнопку Copilot в свой стандарт клавиатур для Windows. Это сильное заявление — в последний раз они делали это 30 лет назад с кнопкой Windows.
 
2. ChatGPT: Всё-таки появился каталог плагинов.
 
Также они тестируют возможность запоминать диалоги и строить следующие с их учётом.

3. Google выпустили свою новую модель Gemini 1.5. Она умеет, например, анализировать видео. Они переименовали Bard в Gemini.
 
4. Mistral: Французский аналог ChatGPT с инвестициями от Microsoft.

5. Claude: Выходцы из OpenAI запустили своя большие языковые модели. Анонс.

6. NVIDIA Chat with RTX: Языковая модель для локальной работы.
 
Другие инструменты:
1. Яндекс добавил возможности YandexGPT в свой браузер. Он помогает писать тексты, пересказывать и переводить видео и генерировать изображения. Это также повысит безопасность.

2. MusicFX: Обновился генератор музыки и битов по текстовому запросу от Google.

3. Afforai: Профессиональный поисковик по исследовательским публикациям. Он может просуммировать найденное.

4. Adobe Acrobat: Сможет пересказывать содержание PDF-документов.

5. Экспериментальный помощник при покупках на Amazon. Он может дать общие рекомендации перед покупкой, подобрать товары или ответить на вопросы о конкретных вещах

6. Walmart прокачает поиск на мобильных с помощью OpenAI.
 
Этика:
1. В открытый доступ утекла обучающая выборка для Midjourney, в которой многие иллюстраторы и дизайнеры нашли себя. Они использовали это как одно из доказательств для судебного иска.

2. Google перекрутил ручку инклюзивности Gemini и он стал выдавать нелепые исторические сюжеты.

3. Duolingo: Сократили 10% фрилансеров за счёт ИИ-инструментов.
 
#ai #algorithms
Чтобы пакет с пакетами про алгоритмический дизайн не успел переполниться, закидываю его сюда:
 
Relume: Грамотная концепция конструктора сайтов на базе алгоритмического дизайна. Он помогает составить карту сайта, сделать wireframes и собрать стиль на основе мудбордов. Всё это можно экспортировать в Webflow или Figma (они сделали тонну компонентов для типовых ситуаций).
 
NN/g: Помощь пользователям-новичкам при работе с алгоритмическими чат-ботами. Они провели небольшое исследование китайских сервисов и описала типичные проблемы людей, которые сталкиваются с таким впервые.
 
OpenAI: Попросили семь художников и режиссёров попробовать их новую модель Sora для генерации видео. Получилась крутая демонстрация возможностей.
 
Google AI Studio: Общедоступная версия языковой модели Gemini 1.5 Pro через новый, частично визуальный интерфейс.
 
Midjourney Character Reference: Теперь можно сохранить черты лица или детали одежды персонажа в разных генерациях.
 
Vincent Koc: Фреймворк «компас генеративного ИИ». Он помогает проектировать интерфейсы таких продуктов.

MeasuringU: Можно ли использовать ChatGPT для тестирования дерева в информационной архитектуре? Успешность выполнения задач сильно завышена, а вот простоту решения задачи предполагает неплохо.
 
Jakob Nielsen написал спорную статью об автоматической поддержке accessibility с помощью ИИ. Это вызвало огромную волну критики в проф.сообществе и Adrian Roselli собрал ссылки на все такие статьи.
 
Maze: Сервис для проведения пользовательских исследований добавляет алгоритмические функции. Он подскажет как грамотно сформулировать вопрос для респондента, задать догоняющие вопросы, анализировать общие темы и в целом организовывать проекты.
 
Devin: Платформа для разработчиков, которая мощно развивает концепцию копилотов. Она не только пишет код и исправляет баги, но и помогает разобраться в незнакомых технологиях, выкатывать на прод и много чего ещё.
 
Adobe Acrobat: Дизайн интерфейса Generative summary. Их принципы алгоритмического дизайна.
 
Victoria Turk: Анализирует современные инструменты генерации изображений по текстовому запросу и показывает на конкретных примерах, насколько они полны клишированных стереотипов.
 
Leonardo AI: Генератор фото и иллюстраций по текстовому описанию.
 
Blaze: Алгоритмический генератор текстов для блогов, социальных сетей и рекламы.
 
Jakob Nielsen: Приводит несколько исторических аналогий на тему страха «использующие ИИ-инструменты отупеют». Это далеко не всегда так.
 
Everypixel: Глоссарий самых популярных терминов, использующихся на текущем этапе эволюции ИИ.
 
Adobe Project Music GenAI Control: Генератор музыки по текстовому описанию. Можно докрутить готовую композицию по скорости, экспрессивности и т.п.
 
Arcads: Генератор вертикальных рекламных видео с вымышленными актёрами. На входе – ваш сценарий.
 
HeyGen Avatar in Motion 1.0: Генератор вертикальных рекламных видео с вымышленными актёрами в движении.
 
Grok-1: xAI Илона Маска опубликовала исходный код своей ИИ-платформы Grok-1 на GitHub.
 
YandexGPT 3: Новая версия языковой модели Яндекса. Также в Yandex Cloud появился API YandexArt для генерации фото и иллюстраций.
 
Яндекс Почта: Научилась пересказывать важные письма за последнюю неделю с помощью YandexGPT.
 
Intuit Assist: Алгоритмический помощник подсказывает, как управлять финансами.
 
#ai #algorithms
«Я ещё не договорила», сказала недавняя мини-подборка об алгоритмическом дизайне. Лучше выгрузить сейчас, пока снова не стало слишком много:
 
1. Rosenfeld Media запускают новую конференцию «Designing with AI» с фокусом на дизайн с ИИ. Она пройдёт 4-5 июня в онлайне.
 
2. UX Pilot: Многофункциональный инструмент алгоритмического дизайна. Умеет генерировать макеты, wireframes, цветовые палитры, тексты, планы рабочих сессий. Также может сделать оценку дизайна.
 
3. Adobe Photoshop: Можно стилизовать часть изображения на основе другого стилистического изображения-примера, менять части изображения на похожие по духу объекты, вырезать и сгенерирвать фон.
 
4. Adobe Premiere Pro: Можно генерировать видео по текстовому запросу, добавлять или удалять объекты, расширять кадр. Будет возможность подключить сторонние модели вроде OpenAI Sora, Pika Labs или Runway.
 
5. Knowing Machines: Откуда берут данные для обучения алгоритмов популярные генераторы фото и иллюстраций. Они пользуются базой LAION-5B, для которой сделали несколько курированных людьми выборок. Исходя из особенностей этих выборок становится понятно, почему многие картинки от Midjourney или Stable Diffusion выглядят однообразно.
 
6. Oliver Reichenstein: Интервью с основателем iA на тему стоковости результатов работы инструментов алгоритмического дизайна. И то, как может измениться подход дизайнеров, которые хотят этого избежать.
 
7. Figma Wireframe Designer: Плагин генерирует wireframes по текстовому запросу.
 
8. Amelia Wattenberger: Интересный концепт алгоритмического инструмента для помощи писателям. Он помогает сбалансировать повествование по сложности, эмоции и другим параметрам.
 
9. Spline: Генератор 3D-объектов по текстовому запросу.
 
10. VIDIM: Экспериментальный инструмент Google дорисовывает промежуточные кадры видео по первому и последнему.
 
11. Google Vids: Генератор видео для Google Workspace на базе презентаций Google Slides. Можно выбрать стиль и записать себя.
 
12. Яндекс Поиск: Алгоритмический чат-бот на базе YandexGPT.
 
13. Алиса: Прокачалась с помощью YandexGPT. Она сможет отвечать сама на большее количество вопросов.
 
14. Meta AI: Алгоритмический чат-бот. Работает как отдельный инструмент и внутри продуктов типа Facebook.
 
15. Mail.ru: В productivity-сервисах появился генеративный ИИ. Короткий пересказ писем, генерация текстов в заметках.
 
16. SoundID VoiceAI: Плагин для DAW превращает запись вашего голоса в любой другой и делает его звучание более профессиональным.
 
#ai #algorithms
Свежая супертяж-подборка об алгоритмическом дизайне:

СБОРКА ИНТЕРФЕЙСА
1. Gov.uk: Как можно превращать обычную бумажную форму в веб-версию. Tim Paul использовал дизайн-систему Gov.uk и автоматически разбивал её на шаги. Демка работает даже на основе бумажного скетча. Исходный код и более ранний эксперимент его коллеги Kuba Bartwicki.

2. GPT-4o: OpenAI выпустили новую модель 4o (omni), которая может анализировать текст, звук, изображения и видео в реальном времени. И выдавать результат также в реальном времени. Получается фактически легендарный фильм «Она» (они даже имитировали голос Скарлетт Йохансон, пока она не подала в суд). На презентации показали мощные демки с синхронным переводом на другой язык, адаптацией интонации под собеседника и контекстными шутками, обсуждением помещения собеседника (захват картинки с камеры), диалогом двух ИИ.

Eric Vyacheslav сгенерировал с её помощью макеты в Figma на основе спецификации.

ГРАФИЧЕСКИЙ ДИЗАЙН И ИСКУССТВО
1. Flair: Сервис генерирует эффектную сцену подачи вашего продукта (например, упаковка или одежда).

2. Robert Hodgin: Несколько раз прогнал цикл «Midjourney генерирует картинку → ChatGPT описывает её → Midjourney делает новую картинку по этому описанию». Он показал, как менялось это изображение от запроса к запросу.

3. Exactly AI: Инструмент для создания иллюстраций в заданном стиле.

4. Сбер вместе с музейными специалистами попытался восстановить картины, утерянные во время войны. Они сделали уже два проекта для Волгограда и Воронежа.

ВЗАИМОДЕЙСТВИЕ С ТАКИМИ ИНСТРУМЕНТАМИ
1. Книга Josh Clark и Veronika Kindred «Sentient Design» готовится в Rosenfeld Media. Они запустили этот термин вместе с флагманским выступлением и обзорной статьёй, плюс продают услуги типа Sentient Design Sprint.

2. Connor Joyce: Ещё один набор паттернов.

3. Alex Klein: Концепция интерфейсов на базе ИИ-агентов. Они не просто выполняют отдельные куски задач, а помогают по всему user journey.

4. iA: Предлагает по-другому посмотреть на ChatGPT и похожие сервисы. Если не ждать от них готовый результат, а использовать как собеседника и корректора — результат становится намного качественнее.

5. NN/g: Роль дизайнера. Какие навыки становятся важны вместо технических.

6. Everypixel: Типы «галлюцинаций».

ВИДЕО И КИНО
1. ToonCrafter: Генератор анимационных роликов на основе их первого и последнего кадра.

2. Luma Dream Machine: Генератор видео по текстовому запросу. Может в том числе анимировать обычную картинку (поток оживших мемов в первые дни зашкаливал).

3. KLING: Новый добротный генератор видео по текстовому описанию.

4. Runway Gen:48: Конкурс Runway для режиссёров — они должны были создать за 48 часов фильм на основе этого инструмента алгоритмического дизайна с условиями по сценарию.

5. AI Film Festival 2024: Runway второй раз провели фестиваль кино, сделанного при помощи ИИ.

6. Showrunner: Экспериментальный онлайн-кинотеатр от студии Fable генерирует сериалы по вашему запросу. С нужным стилем и сюжетом.

ИГРЫ
1. Microsoft Copilot появится в играх. Они показали демо для Minecraft.

2. Эксперимент с генеративной сценой в виртуальной реальности.

ЭТИКА И ЗАКОННОСТЬ
1. Everypixel: Что происходит с авторскими правами на контент, который используют для обучения больших языковых моделей. Кто с кем судится, есть ли легальные варианты для компаний.

2. Фотограф Miles Astray выиграл конкурс ИИ-фотографии 1839 Color Photography Awards с реальным фото. Его дисквалифицировали в итоге, но пранк вышел отменный.

3. Google Gemini в поиске выдаёт бредовые и опасные рекомендации типа клея в пицце. Они обучали его в том числе на данных Reddit, где много такого стёба.

4. Экспериментальный проект даёт возможность пообщаться с собеседником в чате, а потом угадать — это был человек или бот.

ДРУГИЕ ИНСТРУМЕНТЫ
1. IKI AI: Сервис поможет анализировать набор документов в разных форматах.

2. ElevenLabs Sound Effects: Генератор звуков для видео и подкастов по текстовому описанию.

#ai #algorithms
Вдогонку к новостям алгоритмического дизайна от Adobe — интересное, запущенное другими участниками рынка:
 
Генерация интерфейсов
1. Salesforce: Алгоритмический генератор дашбордов и в целом выборок данных по текстовому запросу. Он собирает экраны на основе дизайн-системы Lightning.
 
2. Недавно глава дизайна Gov.uk Tim Paul показал, как можно превращать обычную бумажную форму в веб-версию. Теперь можно пощупать живые примеры в обработке OpenAI и Antropic.
 
Инструменты дизайна
1. Figma: Перезапустила встроенные возможности алгоритмического дизайна под названием «First Draft». Она фокусируется на создании первых набросков интерфейса разных уровней детализации — от wireframe до полноценного макета. Сейчас они прорабатывают интеграцию с дизайн-системами компаний.
 
Как они делали алгоритмический поиск по макетам и компонентам. Он вырос из экспериментов с «автозаполнением».

2. Midjourney: Редактор изображений. Можно заменить часть изображения через генератор — добавить элемент или поменять текстуру.
 
3. Stable Diffusion 3.5: Новое поколение модели для генерации изображений.

4. YandexArt 2.0: Модель научилась создавать надписи прямо на изображениях, придерживаться нескольких стилей на одной картинке, располагать объекты в пространстве и относительно друг друга более естественно и учитывать при генерации больше деталей из текстового запроса.
 
Создание видео
1. MovieGen: Генератор видео со звуком по текстовому запросу. Можно также редактировать существующие ролики.

2. Pika 1.5: Умеет добротно генерировать физические эффекты и взаимодействия на видео.
 
Дизайн таких инструментов
1. Josh Clark: Просит перестать уже использовать иконку «две искры» для любой заплатки «тут у нас ИИ». Зачастую это просто функции, которые полезны и без этой приставки.
 
Разработка
1. Cursor: Редактор кода, усиленный возможностями ИИ.
 
Другие обновления на рынке
1. ChatGPT Canvas: Отдельный режим интерфейса для написания текстов и кода в формате совместной работы с ассистентом.
 
2. Нейросеть Claude учится управлять компьютером. В одной из демок она запланировала встречу с друзьями, используя браузер, календарь и редактор кода.
 
3. Новая модель YandexGPT 4 Pro и Lite.
 
4. Ozon: Даст возможность генерировать фон для фото товаров и улучшать качество этих фото.
 
5. Shopsense AI делает "Shazam для одежды".

6. Яндекс: Добавил в результаты поиска ответы от своего ИИ-сервиса Нейро.
 
#ai #algorithms
Только пропустишь месяц в дайджестах об алгоритмическом дизайне — приходится делать сразу две части. Первая на этой неделе:
 
Взаимодействие с такими инструментами
1. Joana Cerejo: Отличный фреймворк для anticipatory-дизайна. Как и в какой степени ИИ может персонализировать интерфейс и адаптировать его под пользователя.

2. Josh LaMar: Фреймворк помогает выбрать степень прозрачности в том, как упоминать использование ИИ в продукте или контенте.

3. Jakob Nielsen: Пачка исследований на тему доверия к ИИ-продуктам и результатам их работы. Спойлер: с доверием проблемы.

4. NN/g: Как адаптировать навыки дизайнеров под эпоху ИИ-инструментов.

5. NN/g: Причины «галлюцинаций» в генеративных продуктах. Он предлагает несколько интерфейсных решений, которые подсветят риски пользователям.

6. Валерия Ильина: Памятка по определению сгенерированного текста, изображений или видео.
 
Дизайн таких инструментов
1. Подборка дизайн-систем, которые описывают принципы дизайна для ИИ. IBM, Emplifi, SAP, PatternFly, ServiceNow, Microsoft.

2. Luke Wroblewski: Развивает свой алгоритмический поиск по сайту. Оказывается, он постепенно отвечает на вопросы пользователей, на которые пока не было ответов. А ещё он провёл юзабилити-тестирование и поделился выводами.
 
3. IBM: Рассуждает на примерах о том, как правильно отмечать в интерфейсе контент и функции на базе ИИ.

4. Jorge Arango: Размышляет на тему смены технологического уклада и его влияния на пользовательское взаимодействие. В частности — что произойдёт с встраиванием ИИ в привычные интерфейсы.

5. Figma: Собрали мнения разных дизайнеров, экспертов и продуктовых команд о том, как создаются реальные продукты с использованием ИИ.

6. MG Siegler: Удивляется, почему ИИ-чат-боты ломают свой принцип максимального упрощения взаимодействия, добавляя непонятный для большинства пользователей выбор моделей с абракадабрными названиями.
 
Инструменты дизайна
1. Adobe Firefly Bulk Create: Можно редактировать сразу пачку изображений: менять размер с генерацией недостающей части, вырезать фон, перекрасить цвета.

2. GoDaddy Airo: Генератор логотипов и сайтов. Он также может помочь в запуске рекламной кампании почте и в соцсетях, а также анализировать её результаты.

3. AI Emojis Generator: Генератор эмоджи по текстовому описанию.
 
4. Midjourney Patchwork: Памятка по работе с инструментом от Валерии Ильиной.
 
Пользовательские исследования
1. Alexander Knoll (со-основатель базы знаний и инсайтов Condends): Толково разложил применимость ИИ для разных задач в анализе результатов пользовательских исследованияй. Где он помогает, работает с вопросиками и вообще бесполезен.

3D
1. Krea: Можно сгенерировать 3D-объект на основе изображения и управлять ими.
 
Видео
1. Adobe Firefly: Теперь может генерировать видео. Они планируют добавить работу со звуком.

2. Icon: Генератор рекламных роликов. На основе материалов съёмки он помогает собрать сценарий и подкрутить его, сгенерировав новые кадры при необходимости.

3. TransPixar: Экспериментальный генератор видео-объектов на прозрачном фоне по текстовому запросу или картинке от Adobe.

4. Luma Ray2: Новая модель для генерации видео от Luma — её можно использовать в Dream Machine. Быстрое последовательное движение и сверхреалистичные детали, длина – 20 секунд.

5. Pika: Научилась менять один объект на видео на другой с помощью функции Pikaswaps. И добавлять персонажа на видео на основе фото через Pikadditions.

6. Adobe Premiere: Может искать по содержимому видео и автоматически переводить субтитры.
 
7. LipDub AI: Генератор дубляжа видео на разных языках с синхронизацией мимики.
 
8. Step-Video-T2V: Генератор видео по текстовому описанию.
 
9. Hailuo AI: Генератор видео на основе фото.
 
10. YouTube: Генерация коротких видео через модель Google Veo 2 внутри инструмента Dream Screen.

11. OmniHuman-1: Генератор видео выступления персонажа на основе одного изображения и аудио-дорожки с примером голоса от ByteDance.

Продолжим в четверг.

#ai #algorithms
Продолжим царь-подборку об алгоритмическом дизайне:

Игры
1. Microsoft Muse: Экспериментальный инструмент генерирует игровой мир и игровые механики на основе примеров. Они хотят адаптировать старые игры с его помощью.

2. Модель Claude 3.7 прошла игру Pokemon Red.
 
Разработка
1. Tim O'Reilly: Программная статья о смене парадигмы в программировании. Как профессия много менялась в прошлом и как её переформатирует ИИ.

2. Книга Chip Huyen «AI Engineering». Как строится разработка с современными ИИ-инструментами.

3. GitHub Copilot: Может сгенерировать код на основе скриншота интерфейса.

4. Codename Goose: ИИ-агент для разработчиков, который решает много утилитарных повседневных задач и работает прямо на компьютере.

5. Модель Claude 3.7 Sonnet в режиме Code создаёт игры, мобильные приложения, сайты, SVG-графику и кучу других результатов разработчика (примеры).
 
ИИ-агенты
1. Sequoia Capital: Новый прорыв в генеративном ИИ — агенты. Что это значит для рынка и пользовательского взаимодействия. Перевод.

2. Jakob Nielsen: Как ИИ-агенты повлияют на дизайн интерфейсов. И делает обзор текущих решений с исторической справкой.

3. NN/g: Как изменится проектирование услуг при повсеместном распространении ИИ-агентов. От картирования пути до процессов.

4. UI-TARS: ИИ-агент для управления компьютером от ByteDance.

5. Perplexity: ИИ-агент для Android, который частично может управлять телефоном. Они также готовят к запуску агентский браузер Comet.

6. Google запустили ИИ-агента для автопроизводителей. Одна из первых интеграций — в информационную систему Mercedes MBUX.
 
Другие обновления на рынке
1. OpenAI: ChatGPT научился распознавать документы и изображения, создавать анимированную симуляцию воды в Blender

Там появился режим дотошных исследований Deep Research. Он долго собирает материалы, но на выходе выдаёт объёмный отчёт по теме. А также задачи и напоминания.
 
Они сделали сравнительный анализ SWE-Lancer — он помогает понять, насколько хорошо ИИ-сервисы справляются с реальными инженерными задачами.

Еженедельная аудитория продукта взлетела с 300 млн пользователей в декабре 2024 до 400 млн всего за пару месяцев.

2. Alibaba Qwen: Китайская ИИ-модель, которая общается в чате, генерирует изображения и управляет компьютером.

3. Журналисты New York Times начнут использовать нейросети для работы над новостями — пока не написание, но помощь в работе над заголовками, версиями для рассылок и т.п.

3. Grok 3: Новая модель от x.AI.

4. Anthropic: Серия исследований и публикаций Economic Index о влиянии ИИ на экономику и разные профессии/отрасли. Обзор первого выпуска.

5. Аукционный дом Christie's: Готовит выставку произведений искусства, которые созданы с помощью ИИ. Само собой, они отхватили кучу негатива.

6. Skyeng: Дают возможность сгенерировать урок и материалы для него.

7. Leonardo.AI: Обзор трендов ИИ в маркетинге и рекламе 2025 года.
 
#ai #algorithms
И снова масштабный привоз нового об алгоритмическом дизайне. Влезло бы в две части, а то скорость движа бодрится с каждым месяцем:

Дизайн таких инструментов
1. Microsoft: Принципы дизайна ИИ-агентов. Они разбиты по трём категориям: пространство, время и ядро.

Взаимодействие с такими инструментами
1. Netlify: Предолжили новый термин «Agent Experience» для оптимизации продуктов под ИИ-агентов. CEO компании Mathias Biilmann описывает своё понимание этого термина.

2. Беседа главы Figma Dylan Field и Garry Tan (глава Y Combinator) о влиянии ИИ на дизайн, а также прошлом и будущем инструмента.

3. Stephen P. Anderson: Отличная метафора, показывающая бессмыслицу обучения через простое суммирование информации, на которую часто упирают ИИ-сервисы. Это как с играми — цель сам процесс, нет смысла быстро выиграть.

Инструменты дизайна
1. Flora: Комбайн из инструментов алгоритмического дизайна собирает результаты их работы на бесконечном холсте. Умеет в изображения (Flux Pro, Luma Photon, Recraft, Stable Diffusion), видео (Hailuo, Kling, Pika, Runway, Luma Dream Machine), тексты (ChatGPT, Claude).

2. NEX: Набор инструментов для генерации и улучшения маркетинговых материалов – фото и видео продуктов, тексты о них, создание кампаний. Можно загрузить гайдлайны бренда и описание целевой аудиториии, чтобы результаты учитывали их.

3. Webflow AI Site Builder: Инструмент алгоритмического дизайна от Webflow помогает генерировать и настраивать сайты.

4. Экспериментальная связка Figma и Cursor через протокол MCP. Работает в две стороны — можно создавать дизайн по текстовому запросу и превращать готовый макет в код.

5. ChatGPT 4o: Добавили самую актуальную версию генератора изображений. Это породило лавину массового копирования жанров и форматов: студия анимации Ghibli, игрушки в упаковке, советские плакаты и т.п. Отчасти благодаря этому он продолжает набирать аудиторию дикими темпами — прибавили 1 млн пользователей за час. Примеры того, что он умеет. Кстати, теперь все сгенерированные изображения лежат в разделе Library, откуда их можно ещё и редактировать.

6. Midjourney v7: Новое поколение модели. Появился черновой режим для творческих поисков — изображения похуже качеством, зато генерируются намного быстрее.

7. Альфа-Банк: Как используют алгоритмический дизайн для создания 3D-иллюстраций.

8. Visual Electric: Плагин для Figma генерирует графику по текстовому запросу

9. Reve: Генератор изображений по текстовому запросу. Он умеет в советскую и пост-советскую эстетику.

10. ShaderGPT: Генератор браузерного кода для шейдеров анимации по текстовому запросу.

11. Hailou: Генератор видео теперь может и в изображения.

12. Ideogram 3.0: Вышла третья версия модели для генерации изображений. Улучшили работу с текстом и общее качество, научились повторять стиль изображения-примера.

13. Yandex Art 2.5: Новая версия генератора изображений. Она лучше работает с текстами и работает со стилем.

Пользовательские исследования
1. Chris Chapman: Думает вслух о пользе и вреде ИИ в работе пользователького исследователя (и не только). Он рассматривает всё через 4 критерия: польза, эстетика, общество и этика.

2. Outset: Сервис помогает пользовательским исследователям проводить и анализировать сессии с пользователями с помощью ИИ.

Accessibility
1. Eric Bailey: Польза и ограничения от сравнительного нового класса ИИ-продуктов, которые улучшают accessibility любого сайта. Большой справочный анализ в довесок.

3D
1. Spline: Генератор 3D-сцен на основе изображения.

2. Roblox: Генератор интерактивных 3D-объектов по текстовому описанию (позже смогу и на основе изображения).
 
3. Shapen: Генератор 3D-моделей на основе изображения и текстового описания.

Звук
1. NotaGen: Генератор нотных партитур.

Игры
1. Microsoft Copilot for Gaming. Он будет помогать в прохождении игр.

2. Pieter Levels: Написал простой авиасимулятор с помощью связки Cursor и Claude 3.7 без опыта игровой разработки. Он даже зарабатывает на нём.

#ai #algorithms
Продолжение свежего дропа об алгоритмическом дизайне:
 
Инструменты дизайна
1. Magic Animator: Создатели Lottie запускают генератор анимации на основе макетов Figma с описанием по текстовому запросу.

3D
1. Krea Stage: Возможность создавать 3D-сцены, генерируя и настраивая отдельные объекты.

Звук
1. NotaGen: Генератор нотных партитур.

Игры
1. Microsoft: Copilot for Gaming будет помогать в прохождении игр.

2. Pieter Levels: Написал простой авиасимулятор с помощью связки Cursor и Claude 3.7 без опыта игровой разработки. Он даже зарабатывает на нём.

Разработка
1. Lovable: Генератор сайтов по текстовому описанию, скриншоту или макету в Figma. Можно отдельно дорабатывать конкретный блок. Можно подключить GitHub и редактор кода.

2. Firebase Studio: Среда разработки от Google, где можно генерировать сайты, мобильные приложения и игры. Можно импортировать существующий проект и публиковать результаты на GitHub или другом репозитории.

3. Figma: Собрали мнения разработчиков и дизайнеров о вайб-кодинге — свежем баззворде вокруг разработки через общение с ИИ-чат-ботами.

4. Geoff Huntley: Толковый анализ того, как повлияет ИИ на будущее работы разработчиков разного уровня.

ИИ-агенты
1. Manus: Китайский ИИ-агент, который работает в фоновом режиме в разных программах и вкладках одновременно.

2. Opera: ИИ-агент в браузере Operator. Он поможет с покупкой товаров, билетов, гостиниц.

3. OpenAI: API для создания ИИ-агентов на базе ChatGPT.

Другие обновления на рынке
1. Прогноз развития ИИ к 2027 году от Daniel Kokotajlo, Scott Alexander, Thomas Larsen, Eli Lifland и Romeo Dean. Каждый период подробно расписан с рационализацией авторов.

2. OpenAI:
Поддержали протокол MCP для ИИ-агентов, который позволяет управлять приложениями для компьютера.

Модели для создания голосовых помощников, озвучивания и расшифровки текста. Демо-сайт позволяет попробовать в деле — https://www.openai.fm/.

3. Amazon:
— Alexa+: Прокачалась с помощью ИИ (они подключают разные модели для разных задач). Это делает умные колонки и другие устройства полезнее — меньше тупиковых веток диалога, больше возможностей ИИ-агента. Также можно генерировать музыку через Suno.

Пробуют ИИ-дубляж для отдельных фильмов.

— Kindle: Научился пересказывать некоторые книги.

4. Google Gemini:
Сможет распознавать предметы через камеру телефона.

Режим Canvas для работы с текстом и кодом.

Google AI Mode в поиске даёт развёрнутые ответы на вопросы со ссылками. И может искать по тому, что видит камера — https://blog.google/products/search/ai-mode-multimodal-search/.

5. Microsoft Copilot:
Большое обновление. Actions в духе ИИ-агентов, организация наработок в страницы, генерация подкастов и всякое другое.

Dragon Copilot: Помощник в принятии решений для врачей.

6. H&M: Экспериментируют с генеративными двойниками своих фотомоделей. Они снимают дополнительные сюжеты без привлечения человека (за них тоже платят).

7. Газета LA Times: Запустили эксперимент с написанием статей через ИИ. Он моментально стал расистом.

8. Il Foglio: Итальянская газета выпустила экспериментальный номер, полностью написанный ИИ.

9. Cloudflare: Защита от ИИ-ботов, обучающихся на вашем контенте — их загоняют в лабиринт из фейкового контента.
 
#ai #algorithms
В беготне давно не успевал собрать выпуск про алгоритмический дизайн, а тут ссылки как комары на болоте — плодятся армадой. Попробую упаковать эту сотню-другую в пару выпусков:
 
Взаимодействие с такими инструментами
1. Hardik Pandya: Шикарно разложил по полочкам, с какими сценариями использования MCP справляется хорошо, а где это бесполезный костыль. Он разделяет два режима работы — оркестровка разных инструментов и источников информации, а также инкрементальные доработки. Многие инструменты предполагают переключение между ними в рамках работы, что только усложняет жизнь.

Дизайн таких инструментов
1. Allen Pike: Анализирует интерфейсные паттерны ИИ-чат-ботов, которые делают общение с ними более гибким и интерактивным, чем простой обмен сообщениями.

2. Pete Koomen: Почему часть интерфейсов текущих ИИ-продуктов напоминает первые автомобили, имитирующие повозки с лошадьми. Он пробует предложить решение на примере генератора писем.

3. ServiceNow: Памятка по дизайну человеко-ориентированных ИИ-сервисов.

4. Kojo Osei: То, о чём давно нужно было сказать — во многих продуктах ИИ вызывается как отдельный режим, а не часть основных сценариев использования. Пользователям непонятно, что он делает и в целом режимы забывают включать.

Кейсы
1. Fabio Sasso: Навайбкодил свой простой инструмент дизайна — он накладывает эффект рифлёного стекла на фотографию. Как он это сделал.

2. Luke Wroblewski: Как устроен ИИ-чат/поиск на его сайте. На каких технологиях он написан.

3. Intercom: Хакатон, который помог прокачать навыки использования ИИ-инструментов. Это помогло запустить новый сайт дизайн-команды.

Инструменты дизайна
1. html.to.design: Плагин для импорта HTML-кода в Figma теперь умеет работать с Cursor и использовать протокол MCP.

2. Google Stitch: Инструмент алгоритмического дизайна создаёт дизайн и код для сайтов и мобильных приложений по макету или текстовому описанию. Они позиционируют его как способ сделать прототип или набросок продукта, а дальше дорабатывать его в профессиональном инструменте (кстати, можно экспортировать в Figma).

3. v0 Design Mode: ИИ-сервис для разработчиков Vercel v0 запустил режим дизайна. В нём можно корректировать макеты как в простом встроенном графическом редакторе без текстового запроса.

4. Точка AI: Генератор сайтов, логотипов и изображений от банка для предпринимателей.

5. Adobe Photoshop Harmonize: Быстрый способ вставить объект на фото, где инструмент сам сделает цветокоррекцию и докрутит освещение. Это сделано на базе эксперимента #Project PerfectBlend с Adobe MAX.

6. Control: Инструмент алгоритмического дизайна позволяет вайб-кодить эффектные сайты с анимацией.

7. Figma Make: Примеры прототипов, которые делают пользователи. Кстати, первую версию нового интерфейса работы с сетками они также набрасывали в нём. И советы по работе с инструментом: как описывать текстовые запросы, готовить макеты и компоненты, а также вообще планировать такие проекты.

8. Thiings: Инструмент алгоритмического дизайна позволяет сгенерировать коллекцию 3D-иконок/иллюстраций в своём стиле. Стиль настраивается из примеров. Можно создать новую иконку по текстовому запросу или взять уже доступный объект.

9. Weavy: Универсальный инструмент алгоритмического дизайна умеет соединять отдельные простые действия (сгенерировать, отредактировать фото или видео) в единую последовательность, чтобы получился нужный результат. Они подключают множество популярных моделей, которые можно использовать в любом порядке.

10. Manus: Генерирует изображения под конкретную задачу. Например, на основе фото комнаты подобрал мебель к ней из каталога IKEA и вставил её в помещение.

Шрифты
1. Monotype: Серия статей и экспериментов и шрифтовых дизайнеров из других словолитен вокруг генерации шрифтов и просто символов с помощью ИИ. Monotype развивают свой инструмент.

2. Несколько шрифтовых дизайнеров рассказывают о своих экспериментах по ИИ-генерации типографики. Пока они не очень практические, но возможны.

#ai #algorithms
Продолжение выпуска об алгоритмическом дизайне, который засиделся в черновиках:

Accessibility
1. Scott Vinkle: Как использует ИИ-сервисы для анализа и улучшения accessibility.

Роль дизайнера
1. Ashish Bhatia: Природа и роль креативности в эпоху ИИ-инструментов дизайна.

2. NN/g: Считают ИИ дополнительным инструментом и не боятся за свою работу по дизайну интерфейсов. Она видят её шире, чем просто один этап, метод или итоговый документ.

Дизайн-процесс
1. NN/g: Как используют ИИ для проведения рабочих сессий. И сами, и вместе с остальными участниками. Продолжение.

Дизайн таких инструментов
1. Stephen P. Anderson: Фреймворк P.E.E.C.E. для понимания того, как ИИ-продукты и решения влияют на рынок и людей.

Игры
1. PixelLab: Инструмент алгоритмического дизайна для пиксельной графики в играх. Помогает создавать персонажей, локации и карты.

2. Genie 3: Модель Google для генерации интерактивных игровых миров.

3D
1. Cartwheel: Инструмент алгоритмического дизайна позволяет анимировать поведение манекена по текстовому описанию, панели настроек, библиотеке готовых движений или видео-примеру. Можно менять его одежду и в целом детали образа, загружать свою модель или генерировать её на основе изображения. А также дотюнивать детали анимации.

2. Meta 3D AssetGen 2.0: Вторая версия генератора 3D-моделей.

Презентации и книги
1. Manus: Научился создавать презентации — писать тексты, генерировать изображения и искать доп.информацию в интернете.

2. PageOn: Генератор презентаций по текстовому описанию.

3. Google Gemini: Генерирует детские книги с иллюстрациями на основе семейных фото и рисунков.

Видео
1. Storyboarder AI: Генератор раскадровок для видео и кино. Помогает делать наброски на основе текстового запроса или изображения, позволяет редактировать итоговый сценарий и детали каждого кадра, помогает подбирать локации.

Промдизайн
1. Arcade: Сервис алгоритмического дизайна с необычной концепцией — можно сгенерировать ювелирные украшения или декор для дома, а дальше реальные мастера доведут концепт до ума и изготовят в реальности.

Управление продуктами
1. Christina Wodtke: Ситуации в управлении продуктами, где ИИ может помочь. И, наоборот, превратить всё в профанацию.

Разработка
1. Replit Import: Может импортировать проект из Figma, Lovable и Bolt, а потом превратить макет в код или доработать уже существующий код.

2. Onlook: Генератор кода на основе макета. Макет можно докрутить в самом инструменте.

3. Addy Osmani: Предостерегает, что вайб-кодинг в чистом виде — это самый быстрый способ накопления технического долга, под которым востребованный продукт рухнет. Когда уместно вайбить и что нужно держать в голове.

4. Сергей Целовальников: Главная проблема дискурса о вайб-кодинге — работа цифрового инженера шире просто кодинга и как именно.

5. Diwank Tomer: Где реально можно использовать ИИ в разработке продуктов, а где нужны люди.

6. John Rush: Настроил хитрую связку разных ИИ-моделей, которые пишут ТЗ и перепроверяют его, затем пишут код на его основе и снова проверяют его друг за другом.

Другие обновления на рынке
1. MIT: Исследование компаний, которые внедряли ИИ. 95% из опрошенных не получили отдачи, потому что стандартные решения сложно докручивать под свои конкретные задачи.

2. MIT: Исследование, как общение с ИИ-чат-ботами влияет на жизнь пользователей. Чем дольше и глубже вовлечённость человека — тем больше негативных побочек вроде одиночества и эмоциональной зависимости.

3. Anthropic: Исследование 700 000 диалогов с Claude. Какие ценности транслирует чат-бот и какие вообще должен?

4. Спекулятивный концепт фигурного длинного тире, которое должно подсветить, что автор текста — человек. К сожалению, длинное тире попало под подозрение — генеративные тексты слишком часто используют его.

5. Всё больше университетов возвращается к письменным экзаменам, чтобы студенты не срезали углы через ИИ-сервисы.

6. Vogue: Разместили рекламу, где модель сгенерирована ИИ. Это вызвало к обильным полыханиям в сообществе.

#ai #algorithms