Max: AI, Engineering and Startups
1.9K subscribers
8 photos
1 video
1 file
35 links
Авторский канал про ИИ, разработку и стартапы от Head of AI & Product Engineering.
Стараюсь писать полезно и кратко. Делюсь возможностями, лайфхаками, личным опытом, ресёрчем и рефлексией.
Фидбек, советы, предложения: MaxAboutAI@gmail.com
Download Telegram
Google зарелизил Agent2Agent (A2A) протокол для взаимодействия агентов.

Кажется, что MCP уже стал де-факто стандартом для взаимодействия агентов, но на самом деле это не так. MCP - это протокол взаимодействия с инструментами (ресурсами), и он не предназначен для координации агентов между собой. A2A, напротив, является протоколом взаимодействия между агентами. Пример архитектуры решения, использующего оба этих протокола, можно посмотреть на диаграмме ниже.

Если объяснять совсем простыми словами:
MCP - это аналог того как люди взаимодействуют с компьютером и другими предметами.
A2A - это аналог того как люди общаются друг с другом.
И взаимодействие со средой и координация действий важны для успешной работы людей.

Если для решения простой задачи, вам нужно задействовать одного агента, то достаточно MCP. Но если вы строите сложную систему, аналог, любого реального рабочего процессу, то вам обязательно понадобиться A2A или другой аналог координации агентов.

До релиза Google, уже существовало несколько протоколов координации агентов: ANP(Agent Network Protocol), FIPA-ACL (Foundation for Intelligent Physical Agents – ACL), OPAN (Open Protocol for AI Networking). Тем не менее, ни один из них даже близко не приблизился по популярности к MCP. Сможет ли это сделать A2A нам еще предстоит узнать, но кажется, что A2A лишен тех фундаментальных проблем, которые были у его предшественников.

Ознакомиться с каждым из протоколов можно по ссылкам:
MCP: blogpost, documentation
A2A: blogpost, documentation

В будущих постах я расскажу подробнее про каждый из протоколов.

@max_about_ai
👍5🔥2
Как вайб кодить с Figma

О чем речь: Что такое вайб кодинг я рассказал здесь. Сервис Figma - де-факто стандарт для дизайна UI, UX, сайтов и даже презентаций. Многие дизайнеры и продукт-менеджеры используют именно его при работе над внешним видом продуктов. Если не пробовали - рекомендую.

Возможность: С появлением протокола MCP и vibe coding появилась возможность создавать дизайн по промпту (MCP Cursor to Figma plugin) и создать приложение по созданному дизайну и промпту (Builder.io Figma plugin c интеграцией в Lovable или MCP Server для AI IDE, например, Cursor). Cам полноценно потестить пока не успел, но отзывы очень позитивные.

@max_about_ai
🔥5👌3👍2
Channel name was changed to «Max: AI, Engineering and Startups»
В Windsurf и Cursor можно бесплатно попробовать GPT-4.1

Вчера вечером OpenAI анонсировал модели семейства GPT-4.1. Windsurf и Cursor сразу же анонсировали, что они предоставят доступ к GPT-4.1 бесплатно. У Windsurf бесплатный период на 7 дней, а у Cursor “на некоторое время”. Если еще не пробовали эти инструменты, то это отличная возможность сделать это бесплатно.
5🔥1👌1
OpenAI зарелизили o3 and o4-mini, но главная новость для меня - это появление Codex.

Codex - это AI coding CLI, прямой конкурент Claude Code.

Преимущества Codex:

- Никаких настроек - достаточно предоставить ваш OpenAI API-ключ, и всё заработает!
- Полный auto-approval ченжей, при этом безопасно и надежно благодаря запуску без доступа к сети из sandbox.
- Мультимодальный — можно передавать скриншоты или диаграммы для реализации фичей.

Для поддержки open source, OpenAI обещает выделить грант на $1M в кредитах на токены. Для подачи заявки на грант до 25 000$ можно оставить заявку здесь.

GitHub repo

@max_about_ai
👍10🍌3
Обзор AI и Vibe coding инструментов

Что такое AI coding и Vibe coding, я уже писал выше. Перейдем к более детальному обзору.

Уровни автономности

Существует 5 уровней автономности в зависимости от уровня самостоятельности выбранного инструмента:

1⃣ Детерминированные и статистические правила. Примеры: автодополнение кода (в любой IDE), статические анализаторы кода (SonarQube, Veracode, PyLint и т.д.)

2⃣ AI ассистенты: выполняют отдельные задачи, которые пользователь детально описывает, как правило, с высокой гранулярностью (ChatGPT, Claude, и т.д.). В последнее время у многих AI ассистентов есть тенденция к более высоким уровням автономности.

3⃣ AI CoPilot: программист работает над продуктом в паре с AI CoPilot, совместно внося изменения. Программист по-прежнему несет полную ответственность за разрабатываемый программный продукт. Примеры инструментов данного уровня: Cursor, Windsurf, Trae, Codex.

4⃣ AI Agent: генерация продуктов по описанию, пользователь выступает в качестве супервизора и тестировщика. Данный уровень все еще не достигнут, потому что в текущем поколении систем этого уровня, пользователь по-прежнему отвечает за разрабатываемый продукт и нередко вынужден помогать с разрешением проблем. Примеры: Lovable, v0, Replit , Bolt.New.

5⃣ Полная автономность разработки: здесь пользователь описывает цели, которые он хочет достичь, а AI система уже сама решает, как ее достичь (Devin, MetaGPT).

6 типов инструментов.

Помимо уровней автономности, есть еще типизация инструментов в зависимости от способа взаимодействия с пользователем.

1⃣ Framework - для программистов, которые хотят разрабатывать самостоятельных AI coding агентов или иметь максимальную гибкость.

2⃣ CLI (command line interface) - для программистов, предпочитающих гибкость и контролируемость CLI инструментов или планирующих встроить их в свой CI/CD пайплайн.

3⃣ IDE plugin - для разработчиков, которые не хотят переезжать со своей любимой IDE.

4⃣ IDE - отдельная среда разработки, как правило, на основе VS Code.

5⃣ SaaS - отдельный сервис или мобильное приложение, в котором можно вести автоматическую или полуавтоматическую разработку, как правило, с минимальными знаниями программирования.

6⃣ AI chat assistant - любой ИИ чатбот, который отвечает на вопросы по программированию, например ChatGPT, Gemini, Grok или Claude.

Что выбрать лично вам, если вы программист и:

- хотите попробовать повысить свою продуктивность - попробуйте AI Coding IDE и возьмите бесплатный двухнедельный триал от Cursor. Крупные альтернативы: Windsurf, Trae, GitHub CoPilot. Примерная цена - 20$ / месяц.

- не хотите менять IDE - попробуйте плагины для вашей любимой IDE: Continue, GitHub CoPilot, Junie. Примерная цена - 20$ / месяц.

- любите CLI и готовы платить за токены - попробуйте Codex или Claude Code. Цена зависит от использования, читал истории про 500$ / месяц, но для редкого использования может выйти и всего пару долларов.

- вам жизненно критична конфиденциальность вашей разработки - попробуйте локальную связку из MetaGPT + Ollama (с Gemini3-27B или QwQ2.5). Как запускать модели локально, я писал здесь. Условно бесплатно, но нужна мощная рабочая станция.

Что выбрать лично вам, если вы НЕ программист и:

- хотите сделать личный веб-сайт: не используйте vibe coding, есть много стабильно работающих дешевых конструкторов (Tilda, Wix, Wordpress, Webflow, …). Цена от 10$ в месяц.

- хотите сделать несложный SaaS: изучите, есть ли no-code решения для вашего проекта и попробуйте его сначала, если нет, то попробуйте Lovable, v0, Replit, Bolt.New. Попробовать бесплатно, дальше от 20$.

- хотите сделать mobile app: попробуйте Replit или Rork. Попробовать бесплатно, дальше от 20$.

- хотите сделать сложный SaaS: будьте готовы, что это может не получиться, изучите основы разработки ПО и посмотрите в сторону Lovable, v0, Replit, Bolt.New. Цена от 20$ и дороже.

Свои личные предпочтения я напишу в отдельном посте.

Все вышеперечисленное является моим субъективным мнением. Некоторые ссылки - реферальные и дают бонусы для меня и зарегистрировавшихся по ним.

@max_about_ai
1🔥274👍3
Программисты все еще нужны, или что не так с вайб кодингом (апрель 2025)

Заменит ли ИИ программистов в долгосрочной перспективе? Я не знаю - существует сразу несколько вероятных сценариев развития, и я проанализирую их и подготовку к ним в будущих постах. Прямо сейчас AI-инструменты все еще не автономны и в неумелых руках могут нанести больше вреда, чем пользы. Однако те, кто умеют эффективно ими пользоваться и знают о проблемах и рисках, могут получить кратный прирост продуктивности.

С какими проблемами столкнулся лично я:

1⃣ Не сразу понял важность детального описания требуемой функциональности и архитектуры.
2⃣ Многие тулы не универсальны и у меня возникло несоответствие ожиданий: например, V0 не смог создать backend проект без фронтенд части.
3⃣ Генерируемый код часто содержит ошибки, которые приходится исправлять вручную.
4⃣ В большинстве инструментов есть лимиты на использование, а в некоторых еще и долгое время ожидания (в Trae до нескольких минут в час-пик).
5⃣ Сервисы все еще не очень стабильны, например один из них просто завис после получения запроса и так и не открылся в течение часа.
6⃣ Код, генерируемый LLM был устаревшим и не соответствовал версиям библиотек в проекте. Особенно это болезненно при настройке аутентификации или авторизации.
7⃣ Часть фичей было проще сделать самому, чем добиваться правильного поведения от AI инструмента.

Потенциальные проблемы при неправильном использовании:

1⃣ Критические ошибки и невозможность откатить приложение назад при отсутствие правильного версионирования.
2⃣ Атака на вайб кодеров с подменой библиотек из-за галлюцинаций в их имени
3⃣ Вызов опасных команд, например удаление всех файлов на диске или нанести другой вред своему компьютеру
4⃣ Не работающий спагетти-код в продакшене.
5⃣ Уязвимости в безопасности разрабатываемого приложения.
6⃣ Риски утраты конфиденциальности кода и данных.
7⃣ Очень дорого (до 500$ / месяц) при использовании инструментов с оплатой за токены.

В следующем посте напишу best practices и решения проблем, про которые я писал выше.

Подписывайтесь: @max_about_ai
👍247🔥4🤡3👎1
Vibe coding - советы и best practices. Часть 1.

Я подготовил 25+ советов по эффективному использованию AI для разработки (обзор инструментов).

В первой части - максимально универсальные, базовые рекомендации для начинающих. Советы для опытных программистов будут в следующих частях.

1⃣ Правильно выстраивайте ожидания: воспринимайте AI как начинающего программиста, который пишет код очень быстро, но за которым нужно следить и тщательно проверять.

2⃣ Попробуйте разные инструменты и сервисы чтобы выбрать подходящие именно для ваших задач. IDE наиболее универсальны, но лендинг удобнее делать в SaaS решении, а в CI/CD проще встроить CLI инструменты.

3⃣ Декомпозируйте задачу на небольшие подзадачи. Это снизит вероятность засорения контекста и повысит качество генерируемого кода.

4⃣ Используйте систему контроля версий Git и регулярно коммитьте код, предварительно его протестировав.

5⃣ Сохраняйте промпты в репозитории с кодом. Это позволит воспроизвести решение заново, а еще на их основе можно генерировать спеку.

6⃣ Начинайте новый чат для каждой новой задачи чтобы избежать засорения контекста LLM.

7⃣ Используйте наиболее мощные модели (например GPT-o3) для планирования и дизайна архитектуры, а для кодинга можно использовать модели оптимальные по цене-качеству (например, Gemini-2.5-pro или Claude-3.7).

8⃣ Если вы делаете приложение для пользователей, а не прототип - всегда делайте код-ревью.

9⃣ Поймите ограничения AI coding инструментов и не полагайтесь на них в наиболее критичных и уязвимых местах, например приеме платежей или авторизации.

Подписаться
3👍2013🔥7
Vibe coding - советы и best practices. Часть 2.

В первой части, я описал базовые рекомендации, полезные как профессиональным разработчикам и тестировщикам, так и энтузиастам вайб-кодерам. В этой части, рассмотрим советы для более опытных инженеров, основанные на уже сформировавшихся лучших практиках разработки.

1⃣ Создайте Readme.md, где запишите основную информацию о проекте.

2⃣ Установите стандарты для кода и архитектуры и следуйте им. Запишите эти стандарты и принятые технические решения в architecture.md внутри самого проекта, чтобы они попадали в контекст и передавались LLM. Для Cursor используйте mdc формат и директорию .cursor/rules, для других сервисов убедитесь, что вы используете подходящее расположение для технической документации и она попадает в контекст.

3⃣ Держите требования и спецификацию в одном репозитории вместе с кодом. Используйте todo.md для отслеживания прогресса, prd.md для продуктовых требований, а goals.md для целей проекта.

4⃣ Разбивайте приложение на микросервисы в отдельных модулях и, возможно, даже репозиториях. Чем меньше кодовая база, тем выше качество контекста, а следовательно генерируемого кода. Используйте хорошо задокументированные интерфейсы между модулями.

5⃣ Используйте юнит-тесты и авторегрессионные тесты. Это нужно делать и при обычной разработке, но многие программисты почему-то забывают это.

6⃣ Используйте базовые принципы проектирования - SOLID, GRASP.

7⃣ Используйте линтеры и другие инструменты статического анализа программ. К сожалению, они часто генерят много шума и пропускают реальные ошибки, но это плата за скорость разработки. Я уверен, что с большим проникновением вайб-кодинга, они станут незаменимы для быстрой проверки гигантских объемов сгенерированного кода. Обзор статических анализаторов кода я напишу в отдельной серии постов.

В третьей части будут советы более специфичные для применения AI coding инструментов.

Подписаться
5👍3413🔥2🤡1
Бесплатный хостинг для пет-проектов

У меня есть несколько персональных пет-проектов для тестирования новых технологий и сервисов. Хочется хостить эти проекты за пределами личного ноутбука, а еще лучше иметь возможность прикрутить собственный домен, чтобы делиться с другими людьми. Так как все это не коммерческие истории, то платить деньги за хостинг не хочется.

Что я использую для бесплатного хостинга с своим доменным именем:

GitHub Pages - для статического сайта-визитки.

Vercel - для персонального блога на собственном домене с бэкендом и базой данных.
Причины: наличие v0 для вайб-кодинга, нет “засыпания” приложения, наличие бесплатного тира Supabase прямо в Vercel, очень удобная интеграция с GitHub.
Впечатления: крайне положительные очень нравится, проблем пока не было.

Google Colab - для Python скриптов (DS / ML) в Jupiter Notebook.
Причины: Google Colab для DS / ML - это де-факто стандарт, удобно делиться с знакомыми, можно редактировать и запускать ноутбуки с любого персонального девайса, изолированная среда без необходимости возиться с conda самостоятельно, можно запускать долго-выполняющиеся скрипты в фоне.
Впечатления: полет нормальный, но иногда бесплатных мощностей не хватает и приходится либо доплачивать, либо гонять модельки локально.

Google Cloud - для всего остального.
Причины: наличие бесплатных 300$ на GCP сервисы на 3 месяца, мощная Gemini-2.5-pro, хотелось попрактиковаться именно с Google Cloud.
Впечатления: соответствует ожиданиям.

Если нужно хранить данные граждан РФ, то единственным найденным условно-бесплатным вариантом является Yandex Cloud.

Другие альтернативы с бесплатным тарифом:
- Cloudflare Pages (static sites),
- Codeberg Pages (static sites),
- Azure Static Web Apps (static sites),
- Netlify (full-stack apps),
- Glitch (full-stack apps),
- Render (full-stack apps, static sites),

- Koyeb (containers, Postgres),
- AWS Free Tier (serverless functions),
- Azure (serverless functions).

Поделитесь с друзьями, уверен им тоже будет полезно.

Подписаться
5👍3010🔥10🦄3🤮2
Vibe coding - советы и best practices. Часть 3. (1, 2)

1⃣ Используйте инструменты управления контекстом, например, references в Cursor. Все инструменты стремятся уменьшить размер контекста, чтобы сэкономить на токенах, и зачастую лучше управлять контекстом самостоятельно.

2⃣ Переиспользуйте уже написанные за вас rules - набор правил для AI coding агента (примеры для Cursor, Windsurf).

3⃣ Используйте инструменты AI code review: GitHub Copilot, Graphite, GrepTile, CodeRabbit. Активно их тестирую, впечатления пока смешанные, напишу отдельно.

4⃣ Используйте MCP сервера для дополнительных возможностей (например для интеграции с Figma, Obsidian, Slack, Google Drive и т.п.). Список MCP серверов доступных в Cursor можно посмотреть здесь. Их также можно использовать в других инструментах. Будьте осторожны - большинство из них неофициальные и могут содержать дырки в безопасности.

5⃣ Попробуйте TDD (test driven development) или DDD (domain driven development).

6⃣ Подгрузите спеку для актуальных версий библиотек (Context7 MCP). Как правило, LLM обучались на не самых последних версиях библиотек и могут не знать о недавних изменениях. Это особенно актуально для динамично меняющихся фреймворков или API, например, для разработки AI агентов.

После предыдущего поста нас стало больше 1000, спасибо что читаете❤️ Репосты и рекомендации в Телеграмм - один из основных источников роста канала. Если вы считаете мой контент полезным - поделитесь, пожалуйста, с друзьями, коллегами или подписчиками.

Подписаться
29👍14🔥4
Подборка постов про AI / Vibe coding

Я не часто публикую посты, это фича, а не баг. Стараюсь писать о том, что попробовал сам или в чем действительно разобрался. На это нужно время.

Сейчас активно рефлексирую о будущем разработки - мне кажется, что разработка изменится, очень сильно изменится через 5 лет. Но вполне вероятно не так как многие ожидают. Лучшее из того что я слушал по этой теме это подкаст Андрея Бреслава (автор языка программирования Kotlin и мой бывший преподаватель в 2007-09 годах).

А еще мы собрали классную подборку постов про AI / Vibe coding с знакомыми ребятами, рекомендую:

- Vibe Cursor Coding

- AI / Vibe coding - советы и best practices

- Как получилось, что юристы используют среду для разработчиков?

- Stitch: от вайб-кодинга к вайб-дизайну и обратно

- Как я бросил курсорить и начал шотганить

- Вайб-кодим Google Apps Script для офисных задач: как LLM превращает часы рутины в минуты магии

- Context7 — один из лучших инструментов для AI-разработки

- Топовый AI Coding Workflow: Cursor & AI Studio

- Как Cursor AI превращает текст в готовые макеты Figma

- Простое веб-приложение за 30 минут с помощью Lovable


Подписаться
5🔥229👍6
КАК_СДЕЛАТЬ_ВИРАЛЬНЫЙ_AI_ПРОДУКТ_НА_МИРОВОМ_РЫНКЕ_ПРОДУКТ,_ПОНЯТЬ.pdf
2 MB
Многие мечтают сделать свой Gen AI стартап. Мой приятель, Ислам Мидов, экс-глава венчурного фонда в МТС, фаундер двух AI стартапов Copilot2Trip и 2pr.io, поделился своей историей в прикрепленной презентации. Если хотите начать свой стартап - рекомендую, мне было очень интересно. Презентацию взял из ТГ-канала Ислама с его согласия.

@max_about_ai
12👍6💩3🔥2
Продолжая тему стартапов, МФТИ стартует новый поток обучения технологическому предпринимательству под руководством Дениса Сметнего (сооснователь Skyeng). Я бы возможно прошел мимо этой новости, но есть любопытный факт, который мало кто знает: Физтех занимает первое место по количеству успешных стартаперов в России, значительно опережая другие крупные и известные университеты страны.

@max_about_ai
👍86💩3🤬2😭1🦄1
Небольшой ликбез по устройству AI продуктов

Почти для любого решения, можно выделить как минимум 5 слоев (layers):
Infrastructure: дата-центры, оборудование и вычислительные мощности (GPU, TPU и т.д.)
Foundation models (LLM): большие языковые модели: GPT, Claude, Gemini, LLaMA и другие.
AI Platforms: облачные сервисы, которые позволяют подключать и масштабировать ресурсы, оркестрировать модели, приложения и данные: AWS Bedrock, GCP Vertex AI и т.д.
AI Tech Stack: инструменты для интеграции, мониторинга, оркестрации, хранения данных, файн-тюнинга и пр.: Langchain, Chroma, Langfuse, CrewAI, и многие другие
Applications: конечные продукты для пользователей: MS Copilot, Cursor, Perplexity, Gamma App, и т.д.

Чем ближе к основанию пирамиды, тем более специфические знания и скиллы требуются для работы на этом уровне и тем больше затраты на разработку. Например, стоимость обучения топовых LLM в 2025 году исчисляется миллиардами долларов, а инвестиции в инфраструктуру - сотнями миллиардов.

Большинство компаний занимаются разработкой приложений для конечных пользователей или инструментов (баз данных, фреймворков, сервисов) для разработки конечных приложений.

Подписаться
1👍247🔥3
Please open Telegram to view this post
VIEW IN TELEGRAM
Про диаграммы и их AI генерацию

Я потратил неоправданно много времени на самостоятельное рисование в draw.io пирамидальной диаграммы из предыдущего поста. Решил поизучать какие есть актуальные AI возможности для оптимизации этого процесса. Вспомнив про пост Рефата про AI генерацию диаграмм, я решил попробовать связку Mermaid и Claude на практике.

Мне очень понравился мой непродолжительный опыт с Mermaid. Оказалось его можно генерировать и визуализировать как в специализированном Mermaid.live, так и в моем любимом Excalidraw. В отличие от PlantUML формата, Mermaid легко читаем и интуитивно понятен, но не дает той же гибкости в выборе визуальных эффектов (цвета, размеры и т.д.). На мой взгляд, отделение содержания диаграммы от её визуализации - это фича, а не баг. Благодаря минимализму, Mermaid диаграммы можно добавлять прямо текстом в md документацию и тем самым повышать качество работы AI coding инструментов без потери человеко-читаемости. Кажется, что с развитием AI инструментов для программирования, данный формат будет внедряться все больше.

Что же касается генерации пирамидальной диаграммы, то я потерпел фиаско и с Mermaid и с PlantUML, потому что это фактически не техническая диаграмма, а инфографика и для ее визуализации нужны другие инструменты. Например, ее можно эффективно сгенерировать в Gamma.app - инструменте для создания презентаций.

Подписаться
👍156🔥3
DevOps и AI

Удивительно как много людей в IT индустрии забывают, что цикл разработки не ограничивается программированием.

В одном из своих выступлений Андрей Карпатый (со-основатель Open AI и ex-Director of AI в Tesla) поделился как он завайбкодил мини-приложение за несколько часов и потом неделю настраивал и релизил его.

Можно ли зарелизиться быстро? Можно если у вас нет зависимостей от внешних сервисов, если вам не нужен провайдер авторизации, прием платежей, релиз в AppStore, тщательное тестирование или настройка. Всё это до сих пор занимает много времени и требует ручного труда. По крайней мере пока.

Из этого следуют два вывода:

- если вы не знаете в какую сторону растить свою карьеру, вероятно, DevOps и особенно MLOps в моменте могут быть интересной опцией,
- если вы не знаете какой запилить стартап в сфере AI и разработки, то, возможно, автоматизация DevOps - это один из следующих рубежей.

Подписаться
12👍4🔥4💯2🤔1
Годовая подписка на 10+ AI тулов для разработки, дизайна, коммуникации и эффективности за 200$

Ленни Ракитски, автор популярной англоязычной рассылки Lenny’s Newsletter, сделал новый AI Bundle из 10+ тулов (единая годовая подписка на все тулы):

1. Инструменты для быстрого прототипирования и разработки с AI: Replit, Lovable, Bolt, n8n, Warp, Magic Patterns, ChatPRD
2. Инструменты для коммуникации: Linear, Superhuman, Granola
3. Видео генерация, AI дизайн, презентации: Descript, Gamma, Mobbin
4. Повышение эффективности и AI ассистент: Wispr Flow, Raycast, Perplexity

Важно: прочтите правила на сайте, не забудьте сразу запросить и использовать коды со скидками, Ленни не гарантирует, что все подписчики смогут воспользоваться всеми сервисами из предложения. Прямо сейчас все коды еще доступны (сам только что проверил).

По моему мнению, это отличное предложение, хотя дешевым его не назвать. В прошлый раз, я долго размышлял и купоны на все самые интересные сервисы успели разобрать раньше, чем я решился на подписку. В этот раз я не стал тормозить и подписался в течение первого часа после анонса, а затем два дня ждал пока сайт восстановят после наплыва пользователей, сегодня ночью сайт наконец восстановили.

@max_about_ai
👍75🔥3
Про релиз Genie-3

Genie-3 - новая модель для симуляции физического мира. Модель по промпту генерирует видеопоток вплоть до нескольких минут в разрешении 720p и дает возможность управлять и взаимодействовать с ним. Это похоже на игровой движок, где пользователь не только описывает видео (как в Veo3), но также может взаимодействовать с созданным по описанию “миром”. Если в игровых движках объекты и физика “захардкожены”, то здесь они описываются нейросетью. Это означает что результаты работы имеют стохастическую природу и могут появляться различные “артефакты”. Больше примеров на сайте Гугла.

Помимо улучшения качества и детализации графики, у Genie-3 появилась способность запоминать результаты взаимодействия пользователя.

Релиз представляет интерес сразу по трем причинам:
1️⃣Семейство Genie моделей может быть следующим уровнем в индустрии игр и развлечений, дающем безграничные возможности для фантазии пользователей.
2️⃣Genie модели могут вдохнуть новую жизнь в медленно развивающиеся VR технологии.
3️⃣Самое интересное для меня: данный тип моделей, по моему личному мнению, может потенциально повлиять на исследования и развитие как существующих, так и новых теорий в космологии. Если экстраполировать прогресс на много поколений моделей вперед - космология может перейти из теоретической физики в экспериментальную.

Для обычных пользователей доступа к модели пока нет.

Подписаться
This media is not supported in your browser
VIEW IN TELEGRAM
6👍5🔥2