contra labs всерьез изучает как измерять креативный потенциал и вкус llm-моделей, для этого они создали свою уникальную методологию, которая оценивает результат по нескольких шкалам.
они ввели параметр где эксперты (пишут что 1,5 млн, но исследования на тысчах, а не миллионах) согласны и где не согласны, чтобы разделить хорошее и плохое и показывать это на разных шкалах — ведь дизайнеры редко берут весь результат llm, они скорее делают несколько итераций, где оставляют хорошее и отбрасывают плохое, на основе собственного вкуса, конечно.
кроме этого, contra измеряли модели на нескольких стадиях кретивного процесса — ideation, mockup и refinement. и на каждой стадии очень разные результаты, например, на стадии ideation veo 3.1 в домене video generation занимает первое место, а grok imagine — последнее, а на стадии refinement ровно наоборот.
очень похожая ситуцация в генерации картинок, например китайская seedream оч хороша в редактировании мелких деталей, но на стадии первичной генерации сильно проигрывает.
это похоже на черновик того как в будущем мы будем оценивать креативный потенциал разных моделей, но эти рейтинги в рельных задачах не очень полезны. а вот для тех кто делает продукты это очень полезный материал для рефлексии и даже для продуктовых рещений. например, для оркестрации моделей — мы можем использовать разные модели на разных стадиях креативного процеса и добиваться оптимальных результатов.
ну и традиционно — поддержите в линке
они ввели параметр где эксперты (пишут что 1,5 млн, но исследования на тысчах, а не миллионах) согласны и где не согласны, чтобы разделить хорошее и плохое и показывать это на разных шкалах — ведь дизайнеры редко берут весь результат llm, они скорее делают несколько итераций, где оставляют хорошее и отбрасывают плохое, на основе собственного вкуса, конечно.
кроме этого, contra измеряли модели на нескольких стадиях кретивного процесса — ideation, mockup и refinement. и на каждой стадии очень разные результаты, например, на стадии ideation veo 3.1 в домене video generation занимает первое место, а grok imagine — последнее, а на стадии refinement ровно наоборот.
очень похожая ситуцация в генерации картинок, например китайская seedream оч хороша в редактировании мелких деталей, но на стадии первичной генерации сильно проигрывает.
это похоже на черновик того как в будущем мы будем оценивать креативный потенциал разных моделей, но эти рейтинги в рельных задачах не очень полезны. а вот для тех кто делает продукты это очень полезный материал для рефлексии и даже для продуктовых рещений. например, для оркестрации моделей — мы можем использовать разные модели на разных стадиях креативного процеса и добиваться оптимальных результатов.
ну и традиционно — поддержите в линке
❤12
развлечение выходного дня с gpt image-2, диджитал дубинский, промпт внутри
🔥18❤7
каждый раз с удовольствием смотрю новый выпуск дорогих дизайнеров, в этот раз он про айдентику ai-компаний
❤17🦄5
находка века — app store connect cli. терминальная версия доступа почти ко всем полям в metadata, подписках и прочим штукам в app store connect (на прокликивание и заполнение которых уходили часы, если не дни) — а он нужен чтобы ваше приложение apple пустил в app store
теперь у меня клод ходит сам все заполняет, проверяет по чеклисту где может быть реджект, а что недоступно через apc cli — я прошу его сделать через браузер, например адский опросник app privacy, неправильное заполнение которого частая причина реджектов
теперь у меня клод ходит сам все заполняет, проверяет по чеклисту где может быть реджект, а что недоступно через apc cli — я прошу его сделать через браузер, например адский опросник app privacy, неправильное заполнение которого частая причина реджектов
❤15🔥3
простите крик души: рекламные кабинеты основных соцсетей это адок. кто первый сделает агента, который избавит от взаимодействия с ними, тот победит
❤7💯1
в продолжение темы доступа агентов к интерфейсам — я решила, как мне казалось сложную задачку — теперь у aigma (node based web site creation) есть свой cli.
если вы работаете claude code или codex, просто скиньте им ссылку на эту страницу он поможет установить cli и сможет создавать вам сайты прямо aigma, публиковать их и на выходе отдавать ссылки (и на канвас где все варианты и просто public url)
есть всякие фишки типа variants — можете попросить сделать например 3 варианта дизайна и выбрать.
еще aigma есть базовый скилл который позволяет не генерить откровенный слоп, буду его развивать.
следующий шаг — это сделать страницы и сайты seo-friendly, минимальное programmatic seo, сделать удобный интерфейс создания сайта из нескольких страниц (сейчас это больше single page).
а еще хочу сделать телеграм/вотсап бота, который на claude managed agents сможет вам пилить сайтики просто надиктовав аудио и скинув несколько картинок.
это пока preview версия, скоро сделаю видео и опишу чуть подробнее юз кейсы. если что-то ломается — напишите, сил на тесты не хватило)
если вы работаете claude code или codex, просто скиньте им ссылку на эту страницу он поможет установить cli и сможет создавать вам сайты прямо aigma, публиковать их и на выходе отдавать ссылки (и на канвас где все варианты и просто public url)
есть всякие фишки типа variants — можете попросить сделать например 3 варианта дизайна и выбрать.
еще aigma есть базовый скилл который позволяет не генерить откровенный слоп, буду его развивать.
следующий шаг — это сделать страницы и сайты seo-friendly, минимальное programmatic seo, сделать удобный интерфейс создания сайта из нескольких страниц (сейчас это больше single page).
а еще хочу сделать телеграм/вотсап бота, который на claude managed agents сможет вам пилить сайтики просто надиктовав аудио и скинув несколько картинок.
это пока preview версия, скоро сделаю видео и опишу чуть подробнее юз кейсы. если что-то ломается — напишите, сил на тесты не хватило)
❤18
дайджест build in public
aya photo: готовлю большой апдейт, будет новая айдентика, новая главная, наняла пару человек на промпты, разбираюсь с sideshift, хочу нанять 5-10 креаторов, органический тик-ток стал показывать неплохие лайки и показы (а сегодня уже не очень), сделали ASO по нескольким локациям, готовим ASA
cellr: новое небольшое приложение, которое я сделала в режиме марафона, это довольно утилитарная штука про поиск мобильных вышек на карте, новый для меня формат, делаем с партером 50/50, партнер отвечает за маркетинг, я только за продукт и техническую часть (а там есть челлендж — 5,5 млн вышек в базе, расчет покрытия с учетом рельефа и проч)
genue: это драфт страницы агентства, которое делает дизайн и цифровые продукты для клиентов. продаю экспертизу за деньги. если у вас есть какие-то штуки поделать вместе обращайтесь (драфт сайта вот тут). агентство upwale нам сейчас помогает выйти на upwork, пока совсем не понимаю что это за мир и как он работает.
луч: сложно стало на российском рынке и ментально я уже далеко, но вышел новый коммерческий директор — позже анонсирую, это необычный и очень обнадеживающий найм
aigma: друг купил подписку (а до него нельзя было купить потому что было сломано), сделала cli, до сих пор от себя в ахуе. дальше хочу сделать talk to your web sites — агента в тг и вотсапе, который управляет aigma обновляет контент, делает новые сайты, публикует их и привязывает к домену. еще зочу прикрутить поиск рефов — в идеале что-то типа mcp refero, чтобы агент находил красивые картинки
dear journal кстати, жив, им пользуюсь я и еще несколько десятков человек, хочу в ближайшие месяцы сделать апдейт с учетом того опыта в мобильной разработке и маркетинге, который у меня есть сейчас
Oval AI это приложение сканер лица который помогает найти правильный уход — там был хороший буст от apple но почти не конвертит в покупку. возможно сделаю бесплатным для основной фичи, пусть просто подрастает по оценкам + возможно будет какой-то фидбек как улучшить (я и сама знаю первые шаги — сейчас слишком как mvp выглядит). но в общем не приоритете сейчас. потренировалась на нем как связать apps flyer и tik tok чтобы потестить рекламу, так и не получилось прокинуть events. видела что adapty там что-то классное сделали для трекинга, хочу попробовать.
я конечно иногда в панике от количества проектов и кажется что нет фокуса, но когда я выгребаю и смотрю на прогресс, хочется себя очень похвалить (хоть и по параметру деньги это пока все про будущее, а не про настоящее).
поддержите мой лонгрид на линке плиз
aya photo: готовлю большой апдейт, будет новая айдентика, новая главная, наняла пару человек на промпты, разбираюсь с sideshift, хочу нанять 5-10 креаторов, органический тик-ток стал показывать неплохие лайки и показы (а сегодня уже не очень), сделали ASO по нескольким локациям, готовим ASA
cellr: новое небольшое приложение, которое я сделала в режиме марафона, это довольно утилитарная штука про поиск мобильных вышек на карте, новый для меня формат, делаем с партером 50/50, партнер отвечает за маркетинг, я только за продукт и техническую часть (а там есть челлендж — 5,5 млн вышек в базе, расчет покрытия с учетом рельефа и проч)
genue: это драфт страницы агентства, которое делает дизайн и цифровые продукты для клиентов. продаю экспертизу за деньги. если у вас есть какие-то штуки поделать вместе обращайтесь (драфт сайта вот тут). агентство upwale нам сейчас помогает выйти на upwork, пока совсем не понимаю что это за мир и как он работает.
луч: сложно стало на российском рынке и ментально я уже далеко, но вышел новый коммерческий директор — позже анонсирую, это необычный и очень обнадеживающий найм
aigma: друг купил подписку (а до него нельзя было купить потому что было сломано), сделала cli, до сих пор от себя в ахуе. дальше хочу сделать talk to your web sites — агента в тг и вотсапе, который управляет aigma обновляет контент, делает новые сайты, публикует их и привязывает к домену. еще зочу прикрутить поиск рефов — в идеале что-то типа mcp refero, чтобы агент находил красивые картинки
dear journal кстати, жив, им пользуюсь я и еще несколько десятков человек, хочу в ближайшие месяцы сделать апдейт с учетом того опыта в мобильной разработке и маркетинге, который у меня есть сейчас
Oval AI это приложение сканер лица который помогает найти правильный уход — там был хороший буст от apple но почти не конвертит в покупку. возможно сделаю бесплатным для основной фичи, пусть просто подрастает по оценкам + возможно будет какой-то фидбек как улучшить (я и сама знаю первые шаги — сейчас слишком как mvp выглядит). но в общем не приоритете сейчас. потренировалась на нем как связать apps flyer и tik tok чтобы потестить рекламу, так и не получилось прокинуть events. видела что adapty там что-то классное сделали для трекинга, хочу попробовать.
я конечно иногда в панике от количества проектов и кажется что нет фокуса, но когда я выгребаю и смотрю на прогресс, хочется себя очень похвалить (хоть и по параметру деньги это пока все про будущее, а не про настоящее).
поддержите мой лонгрид на линке плиз
❤22👍11