НИИ им. Лутаенко
487 subscribers
69 photos
17 videos
57 links
Работаю директором по ИИ в Narrators (Е-Promo Group)
Руковожу студией подкастов Слушай Сюда
Делюсь опытом использования нейросетей в бизнесе и жизни

Не продаю курсы, все бесплатно и от чистого сердца.
Download Telegram
Open Design

Помните, писал про дизайн-агента Claude Design? Не прошло и пары недель, как его буквально опенсорснули народные умельцы.

Если пользовались Claude Design, наверное успели заценить насколько он, сука, ДОРОГОЙ. На Pro тарифе недельных лимитов хватает чисто сделать парочку интерфейсов. Это не устроило чуваков из nexu — и они подарили возможность пользоваться агентом локально, без регистрации и смс. Ставите на комп и юзаете любую нейронку, хоть бесплатную. Красота.

Странно, но информации про Open Design в интернете не так много. Я его ещё не устанавливал, но насмотрелся ютуба — там все ссут кипятком. Надо пробовать.

Фан-сайт
Гитхаб
20😱3😍3
https://youtu.be/-nyNyk9EZy4?si=YWipMdg06vOIBNLs

Интересное видео попалось — мужик, который всю жизнь занимается аранжировкой музыки, плачет и рассуждает о том, что ИИ-генераторы музыки делают музыку лучше людей.

Видео необычно тем, что в профессиональной среде принято критиковать и говорить что в этом нет души. А тут человек с большим опытом просто принимает реальность.

На меня произвело впечатление — такой спокойный монолог, полный отчаяния.
😭85👍4
Forwarded from Ai molodca (Dobrokotov)
Собрал выжимку (с помощью ГПТ, хехе) всего самое интересное из презентации гугла в первой карточке. А во второй — вообще все, что показали. Хорошая презентация получилась.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍105🔥3
Media is too big
VIEW IN TELEGRAM
Альфа Фьюча Хьюман

Хочу рассказать про проект, над которым работали последнее время. Мы в Narrators сделали визуальный стиль для фестиваля Alfa Human, который стартовал в Нижнем Новгороде.

Работа титаническая, департаменты креатива и дизайна сотворили шедевр, а мне досталась скромная роль — создать приложение, которое переосмысливает изображения в графические партитуры. С реализацией мне помогли музыкальное образование и диплом технического вуза.

Под капотом сидит LoG — Laplacian of Gaussian (лапласиан гауссиана), он же волновой алгоритм. ЛоГ находит места, где переход пикселей происходит особенно резко или неожиданно.

В музыке работает тот же принцип. Длинная нота не несёт информации — ухо к ней привыкает. Событие — это атака, удар, смена. Тишина информативна только рядом со звуком. Наш мозг реагирует не на состояние, а на переход между состояниями.

То есть LoG — это модель того, как зрительная система уже на уровне сетчатки фильтрует изображение. Алгоритм не придумывает "интересные точки" — он извлекает то, что глаз считает интересным по биологическим причинам. Когда мы берём эти точки и превращаем их в звук, мы озвучиваем не фотографию — мы озвучиваем зрительный отклик.

LoG даёт разреженное, равномерное облако точек разного веса, которое отражает общую структуру образа — силуэт, крупные формы, характерные переходы. Именно это нужно партитуре: не технический список пикселей, а осмысленный скелет изображения.

Когда точки найдены, каждая из них несёт одну координату, которая нас интересует — высота на изображении. Точка в верхней части кадра звучит высоко, точка внизу — низко. Это прям наивный перенос пространства в звук: вертикальная ось фотографии становится музыкальной шкалой, а горизонтальная - время.

Но просто взять частоту пропорционально высоте — не работает. Случайные частоты звучат как помехи. Мы много тестили, и получалась какофония, поэтому я предложил привязать точки к ре-минорной пентатонике — гамме из пяти нот, растянутой на три октавы. Пентатоника устроена так, что любые две её ноты звучат вместе без диссонанса. Это значит, что какие бы точки ни попали на изображение и в каком бы порядке они ни сыграли — результат будет гармоничным.

Алгоритм ничего не знает про музыку, изображение не знает про гамму, но система в целом звучит.

Этот проект глубже, чем кажется, поэтому хотелось про него рассказать. Пишу пост уже, наверное, час — без заумных слов не получилось, но пусть останется так.

Обязательно заходите и приколитесь.
17🔥16😍6😁1
Google I/O итоги

Прошло уже внушительное время после презентации Гугла, на которую я делал ставку. Ничего не писал всё это время — тестил, смотрел обзоры, читал твиттер, собирал фактуру, чтобы сформировать собственное мнение. Хотел найти хоть что-то, что меня впечатлит.

Если скипнуть всё неинтересное, останется только 2 вещи: Gemini Omni и Gemini 3.5.

Gemini Omni — модель, которая умеет создавать контент на основе любых данных (видео, текст, аудио, изображения и т.п.). Ничего революционного, генерация видео (куда была ставка) не обгоняет Seedance в качестве и динамике. Но! На презентации сделали уклон на возможность редактировать видео. Это как нанабанана, только для видео. Хотите заменить персонажа, одежду, предметы интерьера — пожалуйста. Работает отлично, примеры приложил. Модель хорошо разбирается в устройстве мира, это и влияет на качество результата.

Gemini 3.5 Flash — теперь нативная модель во всех продуктах Гугла. Модель хорошая, но не Claude Opus, конечно. Главная фишка — скорость, 3.5 Flash просто реактивная. Со слов Гугла — модель идеальна для агентских задач.

Ну и по мелочи: Antigravity 2.0 (кто помнит — это кодовый агент) скопировал интерфейс у Codex и стал похож на привычные нам агентские приложения. Gemini Spark — клон Claude Cowork, персональный ИИ-ассистент, даже устанавливать не стал, как скучно.

А вот и всё — это вся презентация. Ни Veo 4, ни нанабананы 3, ни новых поводов напрячься конкурентам.
8👍4🤨3
This media is not supported in your browser
VIEW IN TELEGRAM
Runway Aleph 2

Сразу после презентации Гугла с их моделью Gemini Omni, которая редактирует видео, подтянулись Runway (напомню, что это первая компания, которая сделала коммерческий видео-генератор) анонсировав Aleph 2.

Aleph 2 зашел с козырей, модель умеет редактировать мультикадровые видео. То есть вы можете скормить сюжет из разных планов, попросить заменить одежду на персонаже и она свапнется на всем хронометраже.

Выдает 1080p до 30 секунд, это супер. Хочется посмотреть на выражение лиц специалистов по композитингу, ии добралось и до вас.
10🔥8😨6
Сентиментальный момент — выключаю свой самый первый тестовый сервер. Как сейчас помню день, когда арендовал его: ничего не знал ни о линуксах, ни о деплоях, ни о безопасности. И сколько мы прошли вместе.

На нём не было ничего важного, просто песочница. Его брутфорсили, ломали, заражали вирусами (каждый сервер в интернете пытаются сломать, надеясь что у вас лёгкий пароль и нет файрволла), но мой агент каждый раз помогал решить проблему. Он живёт на этой машине и сражается один на один со всей нечистью, закрывая дыры.

И вот время пришло. Сервак выключаю, а моё прощание с агентом выглядит так, как будто я в Last of Us собираюсь убегать от заражённой системы, но мой верный друг говорит: «Беги, я их задержу»...

Пусть этот пост увидят вайбкодеры, которые создают свои SaaS даже не зная, что их сервера используют не только они.
112🫡7😢6💔1😭1
Claude Opus 4.8

Всего через месяц после выхода шикарного 4.7 Антропики пидарнули 4.8, без видимых на то причин.

Сама компания назвала релиз "скромным улучшением" — даже по бенчам там на пару процентов подросли характеристики. Но есть одно микроскопическое, но важное нововведение — честность. Опус 4.8 меньше косячит и реально может ответить что не может сделать задачу, если понимает что не может. На фоне патологического пиздабольства большинства моделей, которые призваны угождать пользователю, шаг смелый.

Антропики — панки, прут против системы. Сначала закусились с Пентагоном, потом сотворили Mythos (эталонная модель с надменным поведением), а теперь научили модель говорить "я не знаю" людям, которые платят деньги за подписку.

Там краем уха говорят, что Mythos всё же хотят выпускать в свет — странное решение, учитывая что мир пока ещё объективно не готов к этой модели.
🔥134🥰2
Всем привет, хочу рассказать о планах на неделю. Пишу этот пост в выходные, пока есть время.

Ну во-первых, у меня сегодня (понедельник) должен родиться сын. Будет классно, если я угадал с датой — потому что по плану релиз Тима Лутаенко был запланирован на 30 мая, а он, хитрец, выходить не собирался. Сейчас мы, скорее всего, в роддоме, либо тужимся, либо ждем.

Посты на этой неделе будут рефлексирующими, про будущее ИИ. Каждый день по одной отложке. Классно, если придёте в комменты спорить, ругаться, рассказывать свою точку зрения. Громких новостей пока не было — есть время поразмышлять.

У меня накопилось много кейсов, которые хочу оформить в интересные статьи. Последний месяц был увесисто продуктивный, и, надеюсь, через неделю устрою марафон демонстрации достижений.

Ещё хочу отдать какой-то день для постов от ИИ-агента. Меня не отпускает мысль сделать дайджест, но хочется чего-то большего. Я тестировал гипотезу, может ли агент читать новости во всех ресурсах, за которыми я слежу, и выдавать текст в моём стиле, только про самое важное. Тесты порадовали, модерировать агента не буду, вся его писанина - сюрприз даже для меня.

Так же планирую писать больше видео на ютуб-канал. Есть идея рассказать лайфхаки как я пользуюсь контекстным окном, установить на комп локальные модели и показать возможности опенсорса в генерации изображений без цензуры, заценю вам возможности создания моушн-графики (анимации) и монтажа видео только посредством агента.

Вот такие планы, коплю силы для мощного рывка. А пока занимаюсь автоматизацией появления человека на свет — тут ИИ-агенты, сволочи, не помогают.
137❤‍🔥13🔥5🥰2
Ребятня, есть кто на примете? Хотим усыновить или удочерить талантливого человека (какие у меня аналогии пошли).
😁41
Привет!
Молодые, пылкие, креативные, словоохотливые, стильные, смешные и дерзкие. Ждали момента начать карьеру в рекламе? Вот он.

Мы ищем стажера в креативный департамент. Это значит, что нам не важен твой опыт. Всему научим. Спустя 2 месяца ты заточишь перо, будешь писать крутые концепты и (надеемся) получишь оффер.

Есть вопросы — пиши. Есть желание — заполняй анкету
11🔥6