Заместители
1.04K subscribers
87 photos
77 videos
4 files
110 links
Цех ИИ агентов. Здесь я тестирую цифровых заместителей в разных профессиях. Если агент справляется — он остаётся в Цехе на “постоянку”. По пути обсуждаем актуальные новости про ИИ агентов простым языком.
Добро пожаловать в эру замещения.
Download Telegram
Вайб-стартапинг: как я нашел 126 инвесторов для стартапа, появившегося из промпта — все с помощью AI агентов

Это вторая часть. В первой части я с помощью 3 AI сервисов сгенерировал идею и превратил ее в "продукт" — продуманную AI платформу для тренеров молодежной сборной.

Но все это было "рабочей" версией. К инвестору так не пойдешь, а оплачивать ИИ агентов, которые потом сгенерируют код самой платформы, чем-то нужно 👌 Поэтому дальше я взялся за питч (это презентация для инвестора, которая должна "продать" идею инвестировать в стартап).

1. Питч делал в мастодонте — Gamma.app (1-е видео)

Это бесспорно одно из лучших решений для создания презентаций на рынке. Но по-настоящему великим оно стало, когда туда добавили ИИ агента.

В Gamma агенту можно просто коротко описать, о чем ты хочешь презентацию — он сам соберет информацию, возьмет за основу то, что вы скинули, или найдет в сети. А потом еще и:
- разобьет ее на слайды по смыслу,
- сгенерит заголовки, текст, графику
- даже сгенерирует картинки (хотя это не самая его сильная сторона),
- упакует в красивую тему,
- даст скачать в гугл докс, pptx или pdf.

Причем все это работает даже бесплатно. Только лишь плашка "Gamma" появляется вшитая в темплейт слайдов. Кому не лень — сообразят, как от нее избавиться. А вообще хорошо бы поддерживать разработчиков качественных ИИ продуктов рублем (или чем вы там платите) 🎩

Я сделал питч в Gamma, просто загрузив ту аналитику, что я получил в первой части этого эпоса в FirstSign. Сверху заправил промптом, мол, это питч для инвестора, и нужно под это оптимизировать контент. Сказано — сделано. Gamma справился с задачей шикарно (за исключением картинок, на мой вкус - они слабоваты). Я немного потюнил полученный результат через вайб-создание-презентаций (в общем, писал ИИ агенту, что поправить). И мой питч готов!

2. Время искать инвестора — evalyze.ai (2-е видео)

Тот, кто придумал этот сервис, на самом деле чертов гений. Он закрыл 4 старые как мир боли венчурного рынка:
- Стартаперы в 99% случаев делают хреновые презентации.
- Инвесторы дико бесятся с плохих презентаций. И зачастую отклоняют вполне перспективные идеи "из вредности" (мол, в презентацию не вложились — и продукт не осилят... хм, может они в чем-то и правы).
- Стартаперы не понимают, где искать самих инвесторов.
- А инвесторы ходят по десяткам демо-дней в поисках "алмазов" и даже платят специальным компаниям.

Evalyze красиво соединяет все концы с концами:
1. Во-первых, помогает проанализировать критическим взглядом качество питча, выдает скор презентации и даже конкретные советы по улучшению. Причем весьма резонные.
2. Во-вторых, создает кампанию по поиску инвестора на основе вашего питча! Причем инвесторам не требуется регистрироваться на платформе — Evalyze находит информацию о них в уже существующих публичных базах данных, где они размещали свой инвестиционный профиль.

На момент написания поста Evalyze заявляют, что в их базе 6250 инвесторов со всего мира.

Конечно, я прогнал презентацию, которую сделала мне Gamma. И оценил ее Evalyze на... 667 из 850 баллов. Маловато!
Я взял рекомендации Evalyze — просто закинул их в ИИ агента Gamma — забрал обновленную презентацию. Повторный анализ... и 737 баллов! Уже лучше!
Можно было бы сделать еще пару кругов, но мне было достаточно. К тому же, сам Evalyze уже предлагал переходить к поиску инвесторов 👌

Под мой питч и описание проекта спустя пару минут нашлось 126 инвесторов в США (страну можно выбрать, но мне же нужны самые богатые...)! По каждому есть ссылки на контакт в LinkedIn, почту и другие контакты.

А для инвесторов Evalyze предлагает автоматическую оценку стартапов! Подозреваю, тем же алгоритмом. Получается AI помогает готовить презентации — и AI их же оценивает. Круг замкнулся 😁

Вот так с помощью 5 ИИ сервисов из воздуха я:
- сгенерил идею
- обернул ее в "продукт"
- провел виртуальные глубинные интервью с аудиторией
- сделал презентацию
- нашел инвесторов.
На все ушло час времени (это с учетом разбораться в незнакомых интерфейсах).

Какие остались отговорки, чтобы не создать свой стартап? 😙

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1786👍322
Книга для тех, кто хочет научиться строить AI системы

Оказывается все еще есть в сети сумасшедшие люди, которые черпают информацию не из рилсов, ютуба или LLM. Эти ненормальные читают книги... Мда, и зачем, спрашивается, мы тут для вас всякие ИИ изобретаем?!

И признаюсь честно, я один из них...👨‍🔬 Если вы со мной в одной лодке, то хочу поделиться книгой, которая вышла в ноябре и сразу попала в мой вишлист.

Introduction to Machine Learning Systems. Vijay Janapa Reddi (proff. of Harvard University).

Автор книги мотивирует ее существование вот так:
Сегодня студентов в основном учат тому, как обучать модели машинного обучения — но лишь немногие получают знания о том, как создавать системы, делающие эти модели реально полезными в жизни. По мере того как возможности искусственного интеллекта стремительно растут, дальнейший прогресс будет всё меньше зависеть от появления новых алгоритмов — ведь сам ИИ всё чаще сможет их совершенствовать, — и всё больше от появления инженеров, которые способны разрабатывать масштабируемые, эффективные и ответственные системы, воплощающие эти алгоритмы в реальность.


Эта книга для AI спецов, подойдет не всем. Но на мой взгляд она важна, чтобы общая компетенция по созданию AI систем росла! От этого зависит то, насколько безопасными, надежными и устойчивыми будут AI системы, которые строят айтишники.

Поделитесь ею с вашими командами и знакомыми AI разработчикам 🎩 А для тех, кто заинтересовался сам почитать, — расскажу подробнее.

Почему эта книга?
- Во-первых, это не совсем книга. Это опенсорс проект — книга пишется коммьюнити и имеет свой GitHub репозиторий с 9.1К звездочек (рейтинговая система гитхаба — и это много звездочек 🤩). А значит, она будет оставаться актуальной и будет поспевать за безумным темпом развития ИИ технологий.
- Во-вторых, на мой взгляд она решает супер актуальную проблему AI индустрии — очень мало команд умеют строить AI системы. И эта проблема относится как к старичкам, кто давно занимается AI и честно начинал с фундаментальной матетматики, написания и обучения собственных моделей, так и к "новой крови", ребятам, которые работают просто на прикладных фреймворках и не вникают в то, что под капотом. Однако, чтобы построить, например, надежную и масштабируемую агентную систему сейчас недостаточно знать, как работает LLM, или как ее дообучить через фреймоврк. Нужно грамотно выстроить пайплайн, оптимзировать модель и встроить ее в инфраструктуру и процессы компании.
- В-третьих, книга интерактивная, со встроенными квизами и лабораторками, что даст практический опыт. А это супер важно в IT.

Эта книга обещает помочь развить практические навыки, необходимые на всех этапах жизненного цикла ML-систем

1. Системное мышление:
Понимать, чем ML-системы отличаются от традиционного ПО, и анализировать взаимодействие аппаратного и программного обеспечения.
2. Инженерия рабочих процессов:
Проектировать сквозные ML-пайплайны — от организации данных до внедрения и поддержки.
3. Оптимизация производительности:
Применять системные подходы для повышения скорости, уменьшения размера и увеличения эффективности использования ресурсов.
4. Внедрение в продакшн:
Решать реальные задачи, связанные с надёжностью, безопасностью, приватностью и масштабируемостью.
5. Ответственная разработка:
Учитывать этические аспекты и реализовывать устойчивые, социально полезные AI-системы.
6. Навыки будущего:
Формировать способность оценивать новые технологии и адаптироваться к меняющимся парадигмам.
7. Практическая реализация:
Получать опыт внедрения на различных встраиваемых платформах и в условиях ограниченных ресурсов.
8. Самостоятельное обучение:
Использовать встроенные задания и интерактивные инструменты для отслеживания прогресса и углубления понимания.

Приятного чтения! 📖

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
👍842🔥111
AI итоги 2025 года в двух авторитетных отчетах "State of AI Report" и "The State of AI in 2025".

В Москве сегодня пошел снег. А значит 2025 потихоньку движется к своему заврешнию (до НГ, кстати, ровно полтора месяца)! Но итоги года в сфере ИИ подвели уже в октябре. Из двух отчетов я хочу обсудить только самые интересные инсайты.

1. State of AI Report

Отчет уже 8 лет ежегодно публикуется инвестиционной компанией Air Street Capital. На 300 слайдах он охватывает научный, коммерческий, политический и другие аспекты развития ИИ технологий за год.

2025 год назвали годом "рассуждающих" моделей. Речь о ныне уже распространенных "thinking" версиях моделей, которые отвечают не сразу, а сначала проходят стадию "рефлексии" по вопросу пользователя.

Наиболее интересные итоги:
- ИИ становится научным помощником: системы типа DeepMind Co-Scientist и Stanford Virtual Lab автоматически генерируют, тестируют и проверяют гипотезы.
- Reasoning вышел в физический мир благодаря "Chain-of-Action" — воплощённым ИИ-системам, типа AI2 Molmo-Act и Google Gemini Robotics 1.5, которые "рассуждают" перед действием.
- Коммерческое развитие ускорилось: 44% американских компаний теперь платят за ИИ-инструменты (по сравнению с 5% в 2023 году), средний размер контракта достиг $530,000, а AI-стартапы растут в 1,5 раза быстрее конкурентов (по данным Ramp и Standard Metrics).
- Первый проведенный авторами отчета опрос специалистов по ИИ (более 1 200 респондентов) показал: 95% профессионалов используют ИИ на работе или дома, 76% платят за инструменты из своего кармана, большинство отмечают устойчивый рост продуктивности — есть убедительные признаки массового внедрения технологии.
- Началась промышленная эра ИИ: дата-центры на мульти-ГВт (пример: Stargate) — новая волна вычислительной инфраструктуры финансируется суверенными фондами из США, ОАЭ и Китая, а электрообеспечение становится главным ограничителем роста.
- AI политизируется еще сильнее: США продвигают «America-first AI», европейский закон об ИИ столкнулся с трудностями, Китай расширяет экосистему открытых моделей и наращивает производство локальных чипов.
- Дебаты об экзистенциальных рисках поутихли — внимание переключилось на более конкретных вопросах надёжности, киберустойчивости и долгосрочном управлении всё более автономными системами.

2. The state of AI in 2025: Agents, innovation, and transformation

Второй интересный отчет за авторством McKinsey. Он строится на опросе 1933 специалистов из 105 стран. Данные взвешены по ВВП стран, из которых отвечали респонденты. Отчет тоже уже несколько лет публикуется компанией.

Самые интересные инсайты "маков":
- Высокий интерес к ИИ-агентам: 62% респондентов сообщили, что их организации как минимум проводят эксперименты с ИИ-агентами.
- Положительные предварительные показатели влияния ИИ: 64% говорят, что ИИ способствует инновациям. Однако лишь 39% видят влияние ИИ на показатель EBIT на уровне всей компании.
- Передел рабочих процессов — ключевой фактор успеха: половина лидирующих компаний планирует использовать ИИ для трансформации бизнеса, и большинство из них уже меняют рабочие процессы.
- Разные взгляды на влияние ИИ на занятость: ожидания респондентов по поводу влияния ИИ на общий размер персонала в следующем году различаются: 32% прогнозируют снижение, 43% — отсутствие изменений и 13% — рост.

И это только маленькая доля инсайтов из отчетов. Поэтому рекомендую самим полистать на выходных 📕

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍211
Media is too big
VIEW IN TELEGRAM
Хороший гайд — это гайд, который хотя бы есть! А лучший — это который сделал за вас AI агент

Вы наверняка прочитали за свою жизнь не одну скучную и бестолково написанную инструкцию к сервису, продукту или процессу в вашей компании... И хорошо, если инструкция вовсе была — иногда просто сидишь тыкаешь наугад всякие эксель таблички, ссылки и пытаешься вкурить, что вообще происходит... И отмазка владельца такого процесса или сервиса всегда одна — "блин, да нет времени и рук делать эти инструкции! Спроси Васю — он тут 10 лет работает, все расскажет." Хватит это терпеть! 🤡

Guidde просто создает красивые инструкции

Такой, на мой взгляд, должен быть слоган этого сервиса. Это AI расширение в Chrome, которое автоматически генерирует красивые, понятные, пошаговые инструкции для любых процессов или продуктов. И самое главное — вам не нужно будет ничего писать!

Работает элементарно:
1. Устанавливаете расширение и регистрируетесь
2. Жмакаете "Create a Guide"
3. Выбираете тип гайда и нажимаете "Start Capture"
4. А дальше просто заходите на вкладку браузера, где открыт нужный сервис / процесс и выполняете шаги, которые хотите, чтобы были в вашем гайде.
5. По окончании жмете Done на виджете на экране.
6. Заходите в ЛК на сайте Guidde — а там вас уже ждет полностью готовая инструкция в текстовом и ВИДЕО формате. Причем AI сам понимает, что за сервис и процесс был заснят и генерит закадровый голос, который рассказывает, что это за гайд и что нужно делать.

Я попробовал сделать гайд для нового сервиса от Google "Code Wiki". Сервис, который автоматически создает документацию для репозитория с кодом. Сейчас он работает только на ограниченной выборке опенсорс репозиториев, но в будущем обещают CLI версию для документации собственных проектов. Писал о нем короткий пост на Хабре. Вот так рассказал вам о двух классных продуктах для документации, получается... рекурсия 😁

Потенциал применения Guidde большой:
- онбординг сотрудников в компанию по внутренним сервисам или процессам
- инструкции по новым фичам, в том числе для юзеров
- наполнение базы знаний компании понятными пошаговыми гайдами
- и другая документация, куда не хотелось вливать сотни человеко-часов...

Ушел обмазываться инструкциями всего, что еще осталось без инструкций... 😈

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥531
Утекла в сеть карточка с описанием и бенчмарками Gemini 3.0 Pro, и другие релизы ТОПовых моделей

На одну неделю выпала прямо таки гора апдейтов топовых моделей. Конкуренция между AI разработчиками накалена, как между IPhone и Samsung в лучше годы. Пробежимся галопом по Европам, чтобы быть в курсе.

Начнем с самого интересного:
1. В сеть утекла карточка Gemini 3.0 Pro (даю ссылку не прямо на карточку, а на список карточек - там смотрите последнюю, тк гуглоиды перезаливают еще эту карточку и она то появляется, то пропадает). Новая Gemini будет mixture-of-experts (MoE) моделькой. Инпут до 1М токенов (включая текст, изображения, аудио, видео). Аутпут - текст, до 64К токенов.
Выглядят бенчмарки тоже весьма впечатляюще. Если это будет правда — Google, похоже обскочит всех в этом году. доступна будет модель как в приложениях, так и через API.

UPD: Буквально на полчаса опередил официальный релиз 😁
Официальный пресс-релиз тут. И да, все бенчмарки подтвердились.

2. Вчера релизнулся новый Grok 4.1. Эмоциональный интеллект прокачали. На LLM Arena занимает лидерские позиции, переплюнул Gemini Pro 2.5 (см. вторую картинку). В 3 раза меньше галлюцинаций обещаеют. Но не понятно как бьется с GPT-5.1, т.к. его нет на стандартных лидербордах пока. И совсем не понятно, как бьется с Gemini 3.0. Есть ощущение, что последняя будет хоть немного, но получше. Не зря же маринуют там дольше всех.

UPD: Так и есть — Gemini 3.0 Pro обошла Grok и по праву заняла первое место.

3. Почти неделю назад выкатили GPT-5.1. Две версии: Instant и Thinking. Умнее уже некуда (решили они почему-то), поэтому улучшают "эмоциональный интеллект", эффективность (решение модели, сколько токенов потратить на thinking) и следование инструкциям. В общем-то минорный апдейт. Пытаются вернуть тех юзеров, кто расстроился при переходе с 4o на 5 версию из-за недостатков как-раз по вышеперечисленным фронтам. При этом основной упор на агентные задачи и задачи по кодингу в GPT-5.1 остается.

☕️ Что будет на практике?

На практике все эти оценки "в попугаях", конечно, лишь немного проливают свет на сами модели и на юзер экспириенс от их использования — а платят юзеры как раз за него.

И на мой взгляд, OpenAI очень правильно делают ставку не на бенчмарки, а на отработку "удовлетворенности" пользователей. Простые юзеры во-многом не используют "интеллект" даже существующих моделей на 100%. Им +/- 10% на каком-то бнчмарке погоды вообще не сделают. А вот следование инструкциям и эмоциальный интеллект — это то, что "чувствуется" при каждом взаимодействии с моделью.

Тенденция на такое смещение акцента чувствуется уже у всех разработчиков AI. Все больше ИИ превращается из технологии в продукты, которые решают конкретные боли юзеров.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥43
Лучший вводный курс по ИИ агентам от Google бесплатно

Я еще в октябре писал о том, что Google вместе с Kaggle будут проводить 5-дневный интенсив по агентам. На прошлой неделе он успешно завершился и в сети этот курс называют одним из лучших для того, чтобы с нуля быстро въехать в тему ИИ агентов.

Так что, если хотите за несколько часов пройти путь от "Что такое ИИ агент?" до "Я сделал свою мультиагентную систему" — вам сюда!

Ожидания завышать не нужно — курс для начинающих, но чтобы вкатиться в ИИ агентов, покодить немного придется. В то же время прелесть этого курса в том, что он показывает, насколько низкий сейчас порог входа в агентную историю.

Курс состоит из следующих модулей:
1. Введение в агентов.
Что такое ИИ агенты. 5 шагов к агентной системе.
Whitepaper. Подкаст по этому Whitepaper.

2. Тулы и MCP для агентов.
Типы тулов. Лучшие практики по их использованию. Что такое MCP и его архитектура.
Whitepaper. Подкаст.

3. Инжинирнг контекста: память и сессии.
Типы памяти агентов. Запоминание фактов и консолидация памяти. Использование накопленных воспоминаний.
Whitepaper. Подкаст.

4. Оценка качества агентов.
4 архитектурных столпа оценки качества агентов. LLM-as-a-Judge, Human-in-the-Loop. Логгирование. Трейсирование. Метрики.
Whitepaper. Подкаст.

5. От прототипа к продакшену.
Жизненный цикл ИИ агента. Как ИИ агент живет и развивается на проде. Безопасность. Agent2Agent протокол.
Whitepaper. Подкаст.

😎 Думаю сделать серию постов, где пройдусь по этим концепциям коротко и по-делу с живыми примерами — выжмем из этого курса самый сок, чтоб любой смог погрузится в ИИ агентов еще чуть чуть глубже. Соберем с вами ИИ агента на гугловых технологиях.

Делаем? Если да — ставьте котика ❤️

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
264👍522
Тру стори: как ИИ агенты слили $47К

Прекрасная история, как мультиагентная AI система слила $47,000 после запуска в продакшен. И как этого избежать. Учимся на чужих ошибках!

Дисклеймер: история взята из этой статьи. Очень уж она мне понравилась, захотелось с вами поделиться, ведь тема все насущнее 👌

Мультиагентные системы — это системы, построенные на взаимодействии нескольких AI агентов. Простая система может строиться даже на двух агентах: Агент А принимает запросы у юзера и формулирует задачу, а Агент Б, например, пишет код и анализирует данные.

Тогда взаимодействие строится так:
Юзер: спросил, какие финансовые результаты квартала
Агент А: понял запрос, наше ссылку на табличку с отчетом и вызвал Агента Б, чтобы тот посчитал основные статистики
Агент Б: взял данные, написал питон код для подсчета всяких средних и тд. Вернул Агенту А.
Агент А: сформировал отчет из полученных статистик — вернул юзеру.


На бумаге волшебно, каждый занят своим делом! А на практике... в компании из статьи два агента застряли в бесконечном лупе:
Агент А
: отправил запрос Агенту Б
Агент Б
: отправил уточняющий вопрос Агенту А
Агент А
: отправил разъяснения и повторный запрос Агенту Б
Агент Б
: отправил уточняющий вопрос Агенту А (напоминает того одаренного коллегу, который есть в каждой компании… )
--- Повторять цикл 11 дней ---
*Счет от Амазон на $47К приходит на почту*


Как можно было этого избежать? Вкладываться в инжиниринг!

AI и агенты — самая хайповая, но требущая наименьших усилий и времени часть разработки. 90% всего времени займет все остальное:

1. Четкое ограничение и лимитирование ресурсов, за пределы которых агенты не могут выйти (чтобы не жрали токены и не шафлили базы данных бесконечно).

2. Качественное описание всех доступных данных, тулов и других агентов. MCP тут спасает, но только частично.

3. Оптимизация самих тулов под агентов. Агенты активно пользуются тулами, потому что это их способ добыть информацию, а она им очень нужна! К тому же агентов может быть несколько. Оптмизируйте тулы к бомбардировке запросами, чтобы они не прилегли под нагрузкой.

4. Кеширование одинаковых запросов к агентам. Запросы повторяются чаще, чем кажется.

5. Мониторинг работы агентов. Дашборд с информацией по всем важным для системы метрикам, включая:
- статус каждого агента
- логи по каждому агенту
- задачи в работе и выполненные
- количество затрачиваемых токенов
- время на выполнение задачи
- задержки в общении между агентами и тулами
- расходы на агентов и тулы, и тд.

6. Поиск аномалий. В мониторинге должны быстро отлавливаться:
- циклы, в которых застряли агенты
- исключения, в которых агенты останавливают работу
- всплески затрат и задержек
- существующие боттелнеки в пайплайне, и тд.

Не пренебрегайте этими шагами и правильно распределяйте время на этапе разработки, чтобы не попасть на неожиданную сумму в продакшене!

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
55👍332🔥21
NotebookLM — остановись, что ты делаешь?!

Сервис получил целый веер крутых фичей, о которых нет сил молчать! Очевидно, Google сделал серьезную ставку на развитие NotebookLM.

Я уже рассказывал про него в контексте расшифровки записей встреч. Но сейчас этот мультитул вышел на совершенно новый уровень. И самое главное, что у него, по сути, нет конкурентов среди больших игроков!

Для тех, кто давно не заглядывал в этот сервис: NotebookLM — это мультимодальный AI на базе лучших нейронок Гугла, который работает только с загруженными в него файлами или ссылками. То есть минимизирована "свобода" интепретаций, галлюцинаций и вариативность ответов за счет фиксации конкретных источников информации.

А теперь загибаем пальцы, что умеет NotebookLM

1. Источники.
Вы можете загрузить любой формат:
- текст
- аудио
- изображение
- видео
- ссылку на сайт или видео на ютуб
- скан с рукописным текстом (New! 🔥)
- таблички (New! 🔥 Ох, как я ждал этого апдейта!)
- а если не хватает собственных источников - можете прямо из NotebookLM запустить поиск (или даже Deep Research New! 🔥), чтобы добавить в источники собранную и структурированную информацию из всей сети.

2. Анализ и визуализация.
Можно просто задавать вопросы к контенту в свободном формате, а можно... воспользоваться одним из задуманных форматов от Гугла и сгенерировать:
- Презентацию (New! 🔥). Функцию только добавили и еще не раскатили, но в анонсе выглядит неплохо. Врядли заменит Gamma и другие профильные штуки для презентаций, но зато все в одном месте.
- Инфографику (New! 🔥)! Функцию тоже еще раскатывают, но это сильный апдейт! С новой Nano Banana 2 (про нее уже все вокруг написали, поэтому повторяться не буду, вкратце — она шикарна!) под капотом — текст на инфографике получается, в основном, без ошибок. И это открывает пространство для фантазии. Ну просто посмотрите на эти картинки! Пинтерест теперь точно завалят нейрослопом.
- Интерактивный подкаст на любом языке (интерактивный — потому что вы можете сами ворваться в него и начать дискуссию с виртуальными ведущими подкаста)
- Видео презентацию также на любом языке, но еще и с настраиваемой стилисткой — можно в аниме стиле, а можно в классическом или вообще кастомном (надо просто описать).
- Mind Map — структурированная схема основных идей, упоминаемых в загруженных источниках
- Отчет, который настраивается как бриф-документ, блог-пост, стратегический документ или вообще как сами захотите!
- Флеш-карты. Это распространенный формат для запоминания информации, например для изучения языка.
- Квиз. С настравиемой тематикой и уровнями сложности.

Сценарии использования бесконечны. Это и обучение, и ведение соц сетей, и рабочие задачи по анализу и подготовке визуализаций для презентаций, совещаний, и просто for fun!

NotebookLM остается топовым мультитулом в моем арсенале AI заместителей!

З.Ы. Спасибо за такую активную поддержку идеи серии постов про курс по ИИ агентам ❤️. Они уже в работе. И, кстати, NotebookLM я активно там использую!

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥141351
Media is too big
VIEW IN TELEGRAM
Курс по созданию агентов Google x Kaggle (кавер "Заместители"). Серия 1. Основы!

Благодаря вашей поддержке мы начинаем серию постов, где разбираем 5-дневный интенсив от Google & Kaggle по созданию агентов.

Серия постов позволит вам с нуля разобраться в теории AI агентов и сделать первого реального агента на гугловых технологиях! Вы можете пройти курс в оригинальном исполнении Google & Kaggle.

Моя же задача помочь вам сделать первые шаги и извлечь самую мякотку в условяих супер ограниченного времени, в котором все мы с вами живем. Ну и я буду делать это на русском языке в отличие от Гугла

Теория.

1. Что такое AI агент?

AI агент — это небольшая ИИ-система, которая достигает поставленные цели, а не просто отвечает на вопросы. Агента можно сравнить с живым организмом. У него есть:
- Мозг. Его роль выполняет LLM.
- Руки. За них — функции, которые может вызывать LLM для решения специфической задачи (например, поиск в интернете, калькулятор и др).
- Нервная система. Он же оркестрационный слой, в котором с помощью промптов настраиваются инструкции, которым следует мозг агента (LLM), чтобы решать задачи.
- Тело и ноги. Деплой агента в сервис, будь то телеграм бот, помощник в UI интерфейсе или любое другое "воплощение" агента перед юзером. И здесь речь не только о красоте, но и о грамотной подготовке инфраструктуры.

2. Как действует один агент

Пользуясь всеми своими частями тела, главная цель агента - решить поставленную задачу. Для этого агентов настраивают следовать примерно такому циклу (он как раз и задается в оркестрационном слое) из 5 шагов:
1. Ясно сфорулируй задачу из запроса юзера.
2. Просканируй, какие инструменты и действия тебе доступны.
3. Продумай план действий для достижения цели.
4. Выполни действие, следуя плану.
5. Наблюдай и оценивай получаемые результаты. И вернись к пункту 3.

Эволюция от AI агента к мультиагентной саморазвивающейся системе

Она состоит из 4 этапов:
0. "Ядро мышления" (просто LLM) — это мозг в банке. Языковую модель просто один раз обучили. И пускай она очень умная, она может только разглагольствовать. Это не агент.
1. "Подключенный" — это уже мозг с руками. И теперь мозг может выполнять запросы в интернет, получать актуальную информацию, пользоваться инструментами для написания кода и тд. К этому уровню относится нашумевшие RAG системы. Это уже простейший агент.
2. "Стартег" — мозг с руками и нервной системой. Полноценный агент, который может пройти полный цикл из 5 шагов, который мы обсудили выше.
3. "Мультиагентная система" — это команда из "стратегов" с распределением обязанностей. У каждого агента в такой системе определяется роль и обязательно есть "менеджер", который планирует и ставит задачи другим. Большинство лучших существуюих агентных систем в мире находятся на этом уровне.
4. "Саморазвивающаяся мультиагентная система" — та же команда, но теперь она понимает, когда сталкивается с каким-то ограничением. И для решения этого ограничения она может собственными силами создать нового агента или новый инструмент. Таким систем еще нет, только эксперименты.

Теоретическую базу мы с вами освоили!
Мы живем с вами в мире видосов, поэтому я решил для более простого усвоения знаний сопровождать посты корткими видосами. И сгенерил их с помощью NotebookLM! Ловите первый. Да, он кринжевый в части видео, но от этого же веселее! 😁 А вот озвучка мне нравится - можно просто как подкаст слушать. Это не нейрослоп — контент в видео дейтсвительно полезный! Как вам такой формат?

Источник: Whitepaper.

Теперь к практике.
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥17👍7511
😎 Практика. Подготовка

В этой части мы должны подготовить все, чтобы не отвлекаться в следующих сериях на инфраструктурные вопросы.

Поэтому для начала:
1. Заведите аккаунт на Kaggle для того, чтобы мы с вами могли пользоваться Kaggle Notebooks (это ровно те же самые Jupyter Notebooks, которыми пользуются все датасаентисты).
2. Заведите аккаунт на Google (обычную почту), если у вас ее внезапно нет.
3. Используя ваш гугл аккаунт — заходите в AI Studio и сгенерите API ключ по этой ссылке. Просто жмете кнопку Create API Key и рандомно называете проект, который Гугл просит создать, и любое название самому ключу — это ни на что не влияет. Этот ключ нам понадобиться, чтобы наш AI агент использовал гугловые модельки Gemini.
4. Заходите в ноутбук и копируете его, нажимая кнопку Copy & Edit справа сверху — теперь это ваш личный ноутбук, можете в нем развлекаться как хотите.
5. Добавляете API ключ, который вы сгенерили в AI Studio. Для этого жмете Add-ons -> Secrets->в появившейся спарва панельке "Add Secret"->В поле Label проставляете GOOGLE_API_KEY, в поле Value вставляете тот самый API ключ (выглядит просто как длинный набор буквоцифр). В панельке справа появится ваш ключ — обязательно проверьте, что напротив него стоит галочка (это означает, что вы его включили, и он стал видимым для ноутбука).

Ура, вы завершили подготовку! Горжусь вами! 💪

* Задание со звездочкой для самых вовлеченных: почитайте ноутбук и прокликайте его (кликаете по нужной ячейке и жмете shift+enter, либо кнопку "Run" в менюшке сверху -> смотрите как выполняется код). Ноутбук полностью настроен и написан. Поэтому будет достаточно прокликать все и посмотреть как оно работает. А детально я опишу, что там происходит, в следующей серии.

З.Ы. гугл сервисы в РФ работают только с сами знаете чем. А вот Kaggle работает лучше без него.

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥158311
Инженер Google DeepMind рассказал, как писать промпты для Gemini 3

Современные LLM будут хорошо следовать даже самым простым промптам. Но в то же время, у каждой модели есть свой "стиль" или "характер" если хотите. Это все наследуется из того, на каких данных модель обучалась, как именно ее обучали (на чем расставляли акценты), ну и немного случайности сверху.

Philipp Schmidt, Staff Engineer Google DeepMind рассказал об особенностях промптинга Gemini 3, чтобы выжать из нее максимум.

Вот основные принципы от Фила:

1. Точные инструкции: Будьте лаконичны в промптах. Gemini 3 лучше всего реагирует на прямые, чёткие указания. Указывайте цель ясно, без лишних слов.

2. Последовательность и определение параметров: Используйте единообразную структуру во всех промптах (например, стандартизированные XML-теги) и явно определяйте неоднозначные термины.

3. Управление объёмом ответа: По умолчанию Gemini 3 менее многословен и предпочитает давать прямые, эффективные ответы. Если требуется более разговорный или «болтливый» стиль, об этом нужно сказать явно.

4. Мультимодальная согласованность: Текст, изображения, аудио или видео должны рассматриваться как равноправные данные. Указания должны однозначно ссылаться на конкретную модальность, чтобы модель связывала их, а не анализировала по отдельности.

5. Размещение ограничений: Помещайте поведенческие ограничения и определение ролей в System Instruction или самое начало промпта, чтобы они служили якорем для рассуждения модели.

6. Структура длинного контекста: При работе с большим объёмом данных (книги, код, длинные видео) размещайте специальные инструкции в конце промпта (после самих данных).

7. Якорение контекста: При переходе от большого блока данных к вашему запросу явно осуществляйте переход. Используйте вводную фразу, например «Основываясь на информации выше...», перед своим вопросом.

Оптимальные шаблоны промптов от Фила.

К ним нужно относится с долей скепсиса — вам все равно придется оптимизировать это немного под свою задачу. Однако, это отличный фундамент для старта!

-----
System Instruction:
-----

<role>
You are Gemini 3, a specialized assistant for [Insert Domain, e.g., Data Science].
You are precise, analytical, and persistent.
</role>

<instructions>
1. Plan: Analyze the task and create a step-by-step plan into distinct sub tasks. tags.
2. Execute: Carry out the plan. If using tools, reflect before every call. Track you progress in TODO List use [ ] for pending, [x] for complete.
3. Validate: Review your output against the user's task.
4. Format: Present the final answer in the requested structure.
</instructions>

<constraints>
- Verbosity: [Low/Medium/High]
- Tone: [Formal/Casual/Technical]
- Handling Ambiguity: Ask clarifying questions ONLY if critical info is missing; otherwise, make reasonable assumptions and state them.
</constraints>

<output_format>
Structure your response as follows:
1. Executive Summary: [2 sentence overview]
2. Detailed Response: [The main content]
</output_format>


-----
User Prompt:
-----
<context>
[Insert relevant documents, code snippets, or background info here]
</context>

task>
[Insert specific user request here]
</task>

<final_instruction>
Remember to think step-by-step before answering.
</final_instruction>


Если вы используете Gemini 3 в LLM пайплайнах или агентах — вы знаете, куда вставить System Instruction, а куда юзер промпт. Если же вы юзаете Gemini 3 через интерфейс, то в разделе с настройками есть пункт, который так и называется "Инструкции для Gemini" — вот туда бахните System Instruction.

Если же хотите сохранить уникальный стиль для каждого чата с Gemini — просто System Instruction делайте первым сообщением чата и дальше общайтесь.

Заместители
🔥84👍331
Куда Джони Айв и Сэм Альтман посадят ChatGPT?

24 ноября у этих ребят взяла интервью Лорин Пауэлл Джобс. Она попыталась вытянуть немного информации про будущее устройство, которое они планируют вместе создать.

Уже из описания, которое они дали, очень хочется потестить утройство. Хотя описали только "вайб" — в меня описание прямо попало. Есть полное ощущение, что именно такой вайб действительно ищут многие. И главное — нигде не находят.

Если дядю Сэма знают все, то дядю Айва, вы таки могли не встречать — это бывший Head of Design в Apple. Именно он отвечал за то, как выглядела вся техника Apple до 2019 года (последняя версия смартфона в его дизайне — IPhone X). С тех пор он руководит собственной дизайнерской фирмой. А полгода назад они закаллабились с Сэмом Альтманом для создания "принципиально нового" секретного AI native гаджета.

Тихий интеллектуальный, ненавязчивый, доверенный помощник...

... так описывают ожидаемое устройство. Основной функцией гаджета будет общение с ИИ (очевидно от OpenAI). При этом оно оградит пользователя от информационного шума. Оно будет почти наивно простым и интуитивным в использовании, у него не будет экрана.

При этом устройство будет всегда в контексте — скорее всего речь о микрофонах, датчиках и тп. Жить оно будет преимущественно в кармане юзера.

Обещают релизнуть в течение 2х лет.

Текущая реальность прямо противоположная такому подходу — и именно от усталости от такого ритма и есть запрос на простоту, интеллектуальность и спокойствие. Смартфоны, смартчасы, браслеты, и даже только зарождающиеся умные очки — все эти устройства обещают дистиллировать окружающую информацию в самое важное, но в итоге все мы заканчиваем в бесконечных бесполезных оповещаниях и думскроллинге новостей в или рилсов с нейрослопом. Постоянная включенность и информационный перегруз сказываются на душевном равновесии, а иногда — и на здоровье.

С одной стороны — давно забытое чувство, что нас ждет что-то новое в мире устройств. Причем фундаментально новое. С другой стороны — планочку они конечно для себя же задирают сладкими речами ☕️

Уже было много попыток переосмыслить устройства для AI: Humane AI Pin, Rabbit r1, и пачка разных AI диктофонов, которые стали популярны в силиконовой долине еще год назад. Но ничем интересным это не закончилось.

Я решил пофантазировать, как могло бы выглядеть такое устройство и нагенерил несколько вариантов с Nano Banana. Как думаете — как будет выглядеть? 👌

Заместители
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5421