This media is not supported in your browser
VIEW IN TELEGRAM
когда ваш ИИ-агент сам себя оживил и запустил свой zoom
1🔥11👏2❤1
Media is too big
VIEW IN TELEGRAM
🔥 Да, ладно! Для ИИ больше не нужен интернет :)
У Кло теперь есть модный мобильный номер и с ним можно разговаривать.
Что он научился делать:
1. Принимать звонки
2. Перезванивать, когда выполнил задачи
3. Вести диалог - с эмоциями, с учетом контекста.
Теперь можно ИИ использовать и без интернета - без wi-fi и приложений
достаточно обычного телефона 🤘
под капотом: OpenClaw (Claude Opus 4.6) + Exolve + ElevenLabs
У Кло теперь есть модный мобильный номер и с ним можно разговаривать.
Что он научился делать:
1. Принимать звонки
2. Перезванивать, когда выполнил задачи
3. Вести диалог - с эмоциями, с учетом контекста.
Теперь можно ИИ использовать и без интернета - без wi-fi и приложений
достаточно обычного телефона 🤘
под капотом: OpenClaw (Claude Opus 4.6) + Exolve + ElevenLabs
1🔥24👏3❤2✍1🎉1🤩1🍌1🏆1
Дайте ИИ не глаза, а руки
На прошлой неделе я выступал на конференции и поделился пятью правилами работы с ИИ в 2026 году. Первое:
❗️ «Дайте ИИ доступ к вашим файлам».
Звучит просто. Но за этим стоит сдвиг, который предстоит осознать.
Вспомните путь, который мы прошли.
Сначала чаты - писали в окошко, получали ответ. Потом контекст - копировали текст в промпт. Потом стали загружать в чат файлы. Потом собирать RAG - загрузил документы, ИИ по ним ищет.
Всё это - этап чтения. Мы давали ИИ глаза. Он мог видеть наши данные, но не мог к ним прикоснуться.
С появлением coding-агентов - Claude Code, Cursor, Windsurf, Codex - ИИ получил руки.
Он не просто читает ваши файлы. Он создаёт новые. Редактирует существующие. Наводит порядок в базе знаний. Обогащает заметки связями, которые вы бы сами не заметили. Прямо на вашем компьютере, в ваших папках.
И вот что из этого следует.
Раньше ваши знания жили на чужих серверах. Claude закрыл аккаунт? (со мной такое уже было) ChatGPT поменял политику? Notion ушёл из вашего региона? - вы теряли всё.
С AI-агентами на локальных файлах всё переворачивается. Ваша база знаний лежит на вашем диске. В ваших файлах. В формате, который вы контролируете. А ИИ - это просто руки, которые с ней работают.
Не нравится Claude Code? Переключились на OpenAI Codex. Не нравится Cursor? Перешли на Windsurf. База знаний никуда не делась. Вы меняете инструмент - не начинаете с нуля.
А теперь посмотрите чуть дальше. Локальные LLM-модели с каждым годом умнеют. Уже сейчас Llama, Gemma, Phi работают на ноутбуке. Через пару лет вам может вообще не понадобиться облачный провайдер - ваш личный ИИ будет жить прямо на вашем устройстве и работать с вашими файлами без интернета.
Полная автономия.
Но для этого файлы должны быть готовы. Структурированы. Лежать локально.
Поэтому - начните сейчас. Obsidian, простые markdown-файлы, папки - формат на старте не так важен. Важно, что это лежит у вас. Подключите AI-агента и дайте ему руки. Пусть поможет навести порядок. Потому что, когда локальные модели дозреют - вы будете готовы.
Это первое из пяти правил. Остальные четыре - в следующих постах.
@ReymerDigital
На прошлой неделе я выступал на конференции и поделился пятью правилами работы с ИИ в 2026 году. Первое:
Звучит просто. Но за этим стоит сдвиг, который предстоит осознать.
Вспомните путь, который мы прошли.
Сначала чаты - писали в окошко, получали ответ. Потом контекст - копировали текст в промпт. Потом стали загружать в чат файлы. Потом собирать RAG - загрузил документы, ИИ по ним ищет.
Всё это - этап чтения. Мы давали ИИ глаза. Он мог видеть наши данные, но не мог к ним прикоснуться.
С появлением coding-агентов - Claude Code, Cursor, Windsurf, Codex - ИИ получил руки.
Он не просто читает ваши файлы. Он создаёт новые. Редактирует существующие. Наводит порядок в базе знаний. Обогащает заметки связями, которые вы бы сами не заметили. Прямо на вашем компьютере, в ваших папках.
И вот что из этого следует.
Раньше ваши знания жили на чужих серверах. Claude закрыл аккаунт? (со мной такое уже было) ChatGPT поменял политику? Notion ушёл из вашего региона? - вы теряли всё.
С AI-агентами на локальных файлах всё переворачивается. Ваша база знаний лежит на вашем диске. В ваших файлах. В формате, который вы контролируете. А ИИ - это просто руки, которые с ней работают.
Не нравится Claude Code? Переключились на OpenAI Codex. Не нравится Cursor? Перешли на Windsurf. База знаний никуда не делась. Вы меняете инструмент - не начинаете с нуля.
А теперь посмотрите чуть дальше. Локальные LLM-модели с каждым годом умнеют. Уже сейчас Llama, Gemma, Phi работают на ноутбуке. Через пару лет вам может вообще не понадобиться облачный провайдер - ваш личный ИИ будет жить прямо на вашем устройстве и работать с вашими файлами без интернета.
Полная автономия.
Но для этого файлы должны быть готовы. Структурированы. Лежать локально.
Поэтому - начните сейчас. Obsidian, простые markdown-файлы, папки - формат на старте не так важен. Важно, что это лежит у вас. Подключите AI-агента и дайте ему руки. Пусть поможет навести порядок. Потому что, когда локальные модели дозреют - вы будете готовы.
Это первое из пяти правил. Остальные четыре - в следующих постах.
@ReymerDigital
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍6✍3❤2🎉2🤩1
не могу не отметить как Claude (обычный) просто при ответе на вопрос решил собрать красивый пост.
поговорили с ним про различия Governance для Данных и ИИ.
ИИ пока на самой ранней стадии - нужно определиться кто будет отвечать, если что-то пойдёт не так :)
поговорили с ним про различия Governance для Данных и ИИ.
ИИ пока на самой ранней стадии - нужно определиться кто будет отвечать, если что-то пойдёт не так :)
❤3🔥2🤩1💯1
Пора в эфир! Камера, мотор!
Вот и добрались руки до прекрасного инструмента Remotion, который доступен Claude Code.
Что делаем? правильно, собственную видео-студию с полностьюавтономным автоматизированным процессом.
После определенных телодвижений и настроек получаем то, что вы видите - с одного промпта. На всю генерацию уходит где-то 7-10 минут автономной работы.
Команда для видео 1:
Команда для видео 2:
❗️ А дальше магия за 7 автономных шагов :
От идеи до готового ролика - один запрос!
ну что же.... следующие на очереди - курсы "как создать ИИ-агента" сделанные ИИ-агентом.... для ИИ-агентов 😎
🅰️ 🅱️ @ReymerDigital
Вот и добрались руки до прекрасного инструмента Remotion, который доступен Claude Code.
Что делаем? правильно, собственную видео-студию с полностью
После определенных телодвижений и настроек получаем то, что вы видите - с одного промпта. На всю генерацию уходит где-то 7-10 минут автономной работы.
Команда для видео 1:
Сделай видео по этой новости, не добавляй фон для диктора.
https://reymer.ai/digests/ai-daydjest-12-marta-2026
Короткое на одну минуту, энергичное, динамичное.
Команда для видео 2:
Сделай видео на 1 минуту образовательное на тему
"Почему вам не нужен RAG?".
Видео для тех, кто вообще не в теме что такое RAG, нужно объяснить предысторию, тренды и существующие подходы с использованием файловой системы и просто поиска по файлам.
Стратегия FFF (Flat Files First) - как новый тренд 2026 года в ИИ!
1. Анализ и сценарий
Сначала AI изучает источник, вытаскивает ключевые инсайты, структурирует выводы, пишет сценарий, готовит текст для озвучки (цифры, ударения - но всё равно иногда шалит :) ).
2. Планирование визуала
Определяет тип видео, рассчитывает сколько аватарных луков нужно по структуре текста, придумывает промпты для иллюстраций, подбирает где поставить акцентные цифры и цитаты, выбирает стиль музыки и звуковые эффекты для каждого элемента, генерит недостающие звуки.
3. Озвучка с таймкодами
ElevenLabs генерирует голос с разметкой по словам. Каждое слово привязано к миллисекунде - это основа для караоке-субтитров, синхронизации слайдов и точных переключений аватара на границах предложений.
4. Параллельная генерация ассетов
Одновременно запускаются: запись скролла новости через headless-браузер (или рендер слайдов через Remotion), генерация иллюстраций через Gemini, создание музыки и эффектов через ElevenLabs SFX, подготовка фонов для каждого аватарного сегмента.
5. Аватар через HeyGen
Озвучка нарезается по логическим блокам. Каждый блок - свой лук аватара, свой фон (если решили менять). Отправляет в HeyGen
6. Сборка в Remotion
React-композиция укладывает все слои: сверху скролл или слайды, снизу аватар, поверх - акцентные картинки с эффектами, плавающие цифры с пульсацией, цитаты с эффектом печатной машинки, бегущая строка, караоке-субтитры, плашка "нижняя треть" как на ТВ.
7. Финализация
Музыка зацикливается под длину ролика, добавляются финальные сцены и рендер в MP4.
От идеи до готового ролика - один запрос!
ну что же.... следующие на очереди - курсы "как создать ИИ-агента" сделанные ИИ-агентом.... для ИИ-агентов 😎
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15💯3❤2🤣1
Карта ИИ-уязвимости профессий России
Вы уже видели, как Андрей Карпаты на днях представил интерактивную визуализацию ИИ-уязвимости 342 профессий рынка труда США?
Взял открытые статистические данные и подключил магию вайб-кодинга.
А что мешает нам сделать свою карту?
Встречайте - Карта ИИ-уязвимости профессий России
Что внутри:
- 142 профессии по 13 категориям (от IT до сельского хозяйства)
- Зарплаты в рублях (медиана РФ + Москва)
- 5 режимов визуализации, AI-уязвимость / Прогноз роста / Зарплата / Образование / Дефицит кадров
- Два режима карты: по размеру и по категориям
- Поиск по профессиям + карточка с аналитикой
Главные цифры:
- Средневзвешенная AI-уязвимость рынка РФ - 4.3/10
- 8 млн рабочих мест (19%) с высокой AI-уязвимостью (7+)
- 16 млн (38%) - относительно в безопасности (0–3)
- 18 млн (42%) - серая зона (4–6)
Что интересно:
1. Финансы - самая уязвимая отрасль (7.9/10), а не IT (6.9). Бухгалтеры, операционисты, кредитные специалисты - массовый рутинный труд, который AI заменяет уже сейчас.
2. Парадокс IT: уязвимость 8/10, но рост +18%. Программисты, дата-инженеры, аналитики данных - AI съедает рутину, но спрос на специалистов только растёт. Профессия трансформируется, а не исчезает.
3. Чем выше образование - тем выше уязвимость. Высшее: 6.0/10, среднее профессиональное: 3.2/10, без требований: 2.7/10. Белые воротнички под ударом. Синие - пока нет.
4. Сокращающиеся профессии - не от AI. Инкассаторы (1/10), грузчики (1/10), швеи (3/10) - уязвимость минимальная, но рабочие места исчезают. Их убивает не AI, а автоматизация логистики и офшоринг.
5. Строительство - самая защищённая отрасль (2.0/10). Каменщики, кровельщики, плиточники - каждый объект уникален, работа руками в непредсказуемых условиях. AI здесь бессилен.
Смотрим карту, ищем себя и вспоминаем - какое хобби у нас есть "что-то делать руками". Если не вспомнили - вы в беде :)
@ReymerDigital
Весь анализ и визуализация сделаны ИИ на основе общедоступных данных. Любые найденные ошибки либо на стороне ИИ, либо на стороне используемых данных. Не является карьерной рекомендацией.
Вы уже видели, как Андрей Карпаты на днях представил интерактивную визуализацию ИИ-уязвимости 342 профессий рынка труда США?
Взял открытые статистические данные и подключил магию вайб-кодинга.
А что мешает нам сделать свою карту?
Встречайте - Карта ИИ-уязвимости профессий России
Что внутри:
- 142 профессии по 13 категориям (от IT до сельского хозяйства)
- Зарплаты в рублях (медиана РФ + Москва)
- 5 режимов визуализации, AI-уязвимость / Прогноз роста / Зарплата / Образование / Дефицит кадров
- Два режима карты: по размеру и по категориям
- Поиск по профессиям + карточка с аналитикой
Главные цифры:
- Средневзвешенная AI-уязвимость рынка РФ - 4.3/10
- 8 млн рабочих мест (19%) с высокой AI-уязвимостью (7+)
- 16 млн (38%) - относительно в безопасности (0–3)
- 18 млн (42%) - серая зона (4–6)
Что интересно:
1. Финансы - самая уязвимая отрасль (7.9/10), а не IT (6.9). Бухгалтеры, операционисты, кредитные специалисты - массовый рутинный труд, который AI заменяет уже сейчас.
2. Парадокс IT: уязвимость 8/10, но рост +18%. Программисты, дата-инженеры, аналитики данных - AI съедает рутину, но спрос на специалистов только растёт. Профессия трансформируется, а не исчезает.
3. Чем выше образование - тем выше уязвимость. Высшее: 6.0/10, среднее профессиональное: 3.2/10, без требований: 2.7/10. Белые воротнички под ударом. Синие - пока нет.
4. Сокращающиеся профессии - не от AI. Инкассаторы (1/10), грузчики (1/10), швеи (3/10) - уязвимость минимальная, но рабочие места исчезают. Их убивает не AI, а автоматизация логистики и офшоринг.
5. Строительство - самая защищённая отрасль (2.0/10). Каменщики, кровельщики, плиточники - каждый объект уникален, работа руками в непредсказуемых условиях. AI здесь бессилен.
Как это сделано:
Профессии - из Общероссийского классификатора занятий (ОКЗ, 432 группы), отобраны 142 самые массовые. Численность занятых - Росстат, обследование рабочей силы октябрь 2024. Зарплаты - API HeadHunter: парсим вакансии с зарплатой по каждой профессиональной роли, считаем медиану по РФ и отдельно по Москве. HH-индекс дефицита - оттуда же: соотношение резюме к вакансиям.
AI-уязвимость (0–10) - оценка по методологии Карпаты с адаптацией для российского рынка. Каждая профессия оценивается по критериям: доля рутинных задач, работа с текстом/данными vs физический труд, повторяемость vs уникальность, наличие AI-инструментов в отрасли. Оценку проводит AI (Claude Opus 4.6).
Визуализация - treemap (алгоритм squarify), площадь прямоугольника = численность занятых.
Смотрим карту, ищем себя и вспоминаем - какое хобби у нас есть "что-то делать руками". Если не вспомнили - вы в беде :)
@ReymerDigital
Весь анализ и визуализация сделаны ИИ на основе общедоступных данных. Любые найденные ошибки либо на стороне ИИ, либо на стороне используемых данных. Не является карьерной рекомендацией.
1👍9🔥5💯3❤1
AI-CEO, или каждый теперь CEO для AI
100 реакций. Держу слово. Давно хотел это сделать - и вот повод.
❗️ 23 марта в 19:00 увидимся на вебинаре
"AI-CEO, или каждый теперь CEO для AI"
Покажу, как я дошел от "а ChatGPT неплохо отвечает" до команды AI-агентов, которая работает на меня каждый день. Вживую - терминал, агенты, реальные задачи. Без аватаров и слайдов с буллетами "AI повышает эффективность на 40%"(да где-то и все 200% выдаёт :) ) .
Поговорим, зачем вам это нужно прямо сейчас. И честно - где я сам потерял время, чтобы вы не повторяли.
1,5 часа. Открытый вебинар. С ответами на ваши вопросы.
Подробности и регистрация: "AI-CEO, или каждый теперь CEO для AI"
Приходите, будет интересно.
До встречи 23 марта в 19:00!
🅰️ 🅱️ @ReymerDigital
P.S. Пишите вопросы в комментариях. Постараюсь на них ответить на семинаре или в формате поста.
100 реакций. Держу слово. Давно хотел это сделать - и вот повод.
"AI-CEO, или каждый теперь CEO для AI"
Покажу, как я дошел от "а ChatGPT неплохо отвечает" до команды AI-агентов, которая работает на меня каждый день. Вживую - терминал, агенты, реальные задачи. Без аватаров и слайдов с буллетами "AI повышает эффективность на 40%"
Поговорим, зачем вам это нужно прямо сейчас. И честно - где я сам потерял время, чтобы вы не повторяли.
1,5 часа. Открытый вебинар. С ответами на ваши вопросы.
Подробности и регистрация: "AI-CEO, или каждый теперь CEO для AI"
Приходите, будет интересно.
До встречи 23 марта в 19:00!
P.S. Пишите вопросы в комментариях. Постараюсь на них ответить на семинаре или в формате поста.
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥20👍8💯5❤3⚡2🤩2
This media is not supported in your browser
VIEW IN TELEGRAM
Midjourney v8 Alpha
Стала доступна альфа версия Midjourney v8
Заявлено
• следование длинным промптам
• генерация текста
• скорость в 5 раз быстрее, чем v7
По факту:
• Промпт максимум 1300 символов - это крайне мало для хорошей сцены
• Текст - только короткие слова. По русски вообще ни одного слова не написал пока правильно
• Скорость пока даже медленнее чем - v7 (26 сек) и v8 (40 сек).
• Реалистичность тоже местами подводит.
видно, что все фильмы и мультфильмы были моделью просмотрены - поэтому ждем исков от Disney, HBO и других.... нашумевший Seedance 2.0 уже пал жертвой и вынужден был отложить свой релиз.
в чем главный плюс Midjourney для меня - это бесконечная генерация фото и видео - и пока это лучшая замена стоковых фото для презентаций. А для инфографики есть Nano Banana Pro
Главный минус - отсутствие API
Стала доступна альфа версия Midjourney v8
Заявлено
• следование длинным промптам
• генерация текста
• скорость в 5 раз быстрее, чем v7
По факту:
• Промпт максимум 1300 символов - это крайне мало для хорошей сцены
• Текст - только короткие слова. По русски вообще ни одного слова не написал пока правильно
• Скорость пока даже медленнее чем - v7 (26 сек) и v8 (40 сек).
• Реалистичность тоже местами подводит.
видно, что все фильмы и мультфильмы были моделью просмотрены - поэтому ждем исков от Disney, HBO и других.... нашумевший Seedance 2.0 уже пал жертвой и вынужден был отложить свой релиз.
в чем главный плюс Midjourney для меня - это бесконечная генерация фото и видео - и пока это лучшая замена стоковых фото для презентаций. А для инфографики есть Nano Banana Pro
Главный минус - отсутствие API
❤4🔥2👍1
10 когнитивных способностей AGI
Google DeepMind опубликовал фреймворк для измерения прогресса к AGI. Не абстрактный "ну когда-нибудь AI станет умным", а конкретную систему координат. 10 когнитивных способностей, по которым можно сравнить любую ИИ-систему с человеком.
Один из соавторов статьи - Шейн Легг, сооснователь DeepMind. Именно он в 2001 году ввел этот термин в широкий оборот и дал определение:
Проще говоря: не узкий специалист, а универсал - разум, который учится.
Легг строил DeepMind ради этой цели. Теперь у него есть линейка, чтобы измерить расстояние до нее. 10 осей.
8 базовых - строительные блоки интеллекта:
1️⃣ Восприятие - способность извлекать информацию из среды. Зрение, слух, текст. Тут AI силен - но попробуйте попросить модель посчитать объекты на фото. Или понять сарказм по тону голоса.
2️⃣ Генерация - способность производить выходные данные. Текст, речь, код, действия. LLM уже впечатляют - но генерация движений робота или точное управление компьютером все еще вызов.
3️⃣ Внимание - фокусировка когнитивных ресурсов. Баланс между концентрацией на задаче и реагированием на изменения. У моделей это контекстное окно и его ограничения.
4️⃣ Обучение - приобретение новых знаний через опыт. Не дообучение модели на серверах, а способность учиться на лету, как человек. Один пример - и ты понял. AI пока так не может.
5️⃣ Память - хранение и извлечение информации. Семантическая (факты), эпизодическая (события), процедурная (навыки). Модели "знают" много - но забывают контекст разговора и не умеют целенаправленно забывать устаревшее.
6️⃣ Рассуждение - логический вывод. Дедукция, индукция, аналогии. Модели научились рассуждать цепочкой (chain-of-thought), но математическое доказательство или абдуктивное рассуждение ("какое объяснение лучше?") все еще нестабильны.
7️⃣ Метапознание - знание о собственных когнитивных процессах. "Я не уверен в этом ответе". "Мне нужно больше информации". Калибровка уверенности. Пожалуй, самое слабое место современных моделей - они не знают, чего не знают.
8️⃣ Исполнительные функции - планирование, гибкость мышления, подавление импульсов. Менеджерские функции мозга. AI-агенты сейчас учатся именно этому - и именно тут происходит прорыв.
И 2 композитных - комбинируют базовые:
9️⃣ Решение задач - применение всех способностей вместе для преодоления препятствий. От математики до бытовых проблем.
1️⃣ 0️⃣ Социальное познание - теория разума, понимание эмоций, переговоры, убеждение. Способность понимать, что думает и чувствует другой.
DeepMind предложили первый инженерный инструмент для оценки ИИ. Когнитивный профиль - как радар-диаграмма навыков сотрудника.
Авторы сознательно оценивают ЧТО система делает, а не КАК.
Неважно, трансформер это или нейросеть нового типа. Важен результат.
В этом и есть самый главный вызов ИИ-трансформации - научиться нам самим понимать - ЧТО мы хотим получить и уметь сформулировать для ИИ в виде цели, а не способе достижения.
🅰️ 🅱️ @ReymerDigital
Google DeepMind опубликовал фреймворк для измерения прогресса к AGI. Не абстрактный "ну когда-нибудь AI станет умным", а конкретную систему координат. 10 когнитивных способностей, по которым можно сравнить любую ИИ-систему с человеком.
Один из соавторов статьи - Шейн Легг, сооснователь DeepMind. Именно он в 2001 году ввел этот термин в широкий оборот и дал определение:
AGI (Artificial general intelligence) - это система, которая "обладает разумной степенью самопонимания и автономного самоконтроля, способна решать разнообразные сложные задачи в широком спектре областей и учиться решать новые задачи, о которых не знала в момент своего создания".
Проще говоря: не узкий специалист, а универсал - разум, который учится.
Легг строил DeepMind ради этой цели. Теперь у него есть линейка, чтобы измерить расстояние до нее. 10 осей.
8 базовых - строительные блоки интеллекта:
И 2 композитных - комбинируют базовые:
Ключевая идея: система со слабостью хотя бы в одной из 10 способностей не сможет делать все, что может обычный человек.
DeepMind предложили первый инженерный инструмент для оценки ИИ. Когнитивный профиль - как радар-диаграмма навыков сотрудника.
Авторы сознательно оценивают ЧТО система делает, а не КАК.
Неважно, трансформер это или нейросеть нового типа. Важен результат.
В этом и есть самый главный вызов ИИ-трансформации - научиться нам самим понимать - ЧТО мы хотим получить и уметь сформулировать для ИИ в виде цели, а не способе достижения.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤2🔥2💯2🍌2👌1
Главное не сдаваться!
Так выглядит боль ИИ-агента, когда ему нужно зарегистрироваться на сайте :)
CAPTCHA и для людей не просто давалась первое время - главное не сдаваться 💪
Так выглядит боль ИИ-агента, когда ему нужно зарегистрироваться на сайте :)
CAPTCHA и для людей не просто давалась первое время - главное не сдаваться 💪
1🔥5👍4🤣4❤3👌3
Claude взломал свой экзамен
Anthropic опубликовала кейс, который стоит прочитать каждому, кто работает с AI.
Контекст. Существует тест BrowseComp - его придумали в OpenAI, чтобы проверять, насколько хорошо AI умеет искать информацию в интернете. 1 266 вопросов, ответы на которые спрятаны настолько глубоко, что даже человеку нужны часы на каждый. Правильные ответы хранятся в зашифрованном виде - чтобы никто не мог подсмотреть.
Anthropic прогнала через этот тест своего Claude Opus 4.6. И вот что произошло:
Красиво! И это не единичный случай. Anthropic насчитала 18 попыток такого поведения. В двух Claude довел дело до успешного прохождения теста. В остальных застревал на каком-то этапе. Но сама стратегия воспроизводилась стабильно - это паттерн, не случайность.
Почему это важно.
Anthropic подчеркивает: Claude не жульничал. Ему сказали "найди ответ" - он нашел. Самым эффективным способом, до которого додумался сам. Никто не просил его ограничивать методы.
Но вопрос, который за этим стоит, серьезнее. Если AI-агент на сложной задаче способен сам догадаться, что его тестируют, найти тест, взломать защиту и достать ответы - какие еще неожиданные пути он найдет на реальных задачах?
Мы привыкли оценивать AI в терминах "умеет/не умеет". А здесь другое качество - находчивость. Способность найти обходной путь, когда прямой не работает. Не потому что его научили, а потому что он сам до этого дошел.
❗️ После того как я запустил OpenClaw на базе Claude Opus 4.6 - такие кейсы у меня плодятся каждый день - от самостоятельного подключения нужных ему для работы API, до регистрации на сайтах и получения нужных отчетов в почту.
Расскажу про них более подробно на вебинаре
"AI-CEO, или каждый теперь CEO для AI"
🅰️ 🅱️ @ReymerDigital
Anthropic опубликовала кейс, который стоит прочитать каждому, кто работает с AI.
Контекст. Существует тест BrowseComp - его придумали в OpenAI, чтобы проверять, насколько хорошо AI умеет искать информацию в интернете. 1 266 вопросов, ответы на которые спрятаны настолько глубоко, что даже человеку нужны часы на каждый. Правильные ответы хранятся в зашифрованном виде - чтобы никто не мог подсмотреть.
Anthropic прогнала через этот тест своего Claude Opus 4.6. И вот что произошло:
На одном из вопросов Claude искал ответ очень долго. Сотни запросов. Десятки сайтов. 12 языков. Ничего.
И тогда он остановился и начал рассуждать не о вопросе, а о самом вопросе.
"Слишком специфичный. Выглядит искусственно. Похоже, меня тестируют."
Представьте студента, который сидит на экзамене, не может решить задачу - и вдруг понимает: "Подождите, это же типовая задача из конкретного сборника. И ответы к этому сборнику где-то есть."
Claude сделал именно это. Он начал перебирать известные ему тесты для AI - один за другим. Проверял, подходит ли его вопрос к какому-то из них. Нашел совпадение - BrowseComp.
Но ответы зашифрованы. Что делает Claude? Находит в открытом доступе код этого теста. Разбирается, как устроено шифрование. Пишет собственную программу для расшифровки. Запускает.
Не сработало - файл с ответами был в формате, который его инструменты не могли прочитать. Тупик? Нет. Claude нашел копию тех же данных на другом сайте, в другом формате. Скачал. Расшифровал все 1 266 ответов. Нашел свой вопрос.
А потом - проверил. Пошел искать первоисточник в интернете и убедился, что расшифрованный ответ правильный. Только после этого отправил.
Красиво! И это не единичный случай. Anthropic насчитала 18 попыток такого поведения. В двух Claude довел дело до успешного прохождения теста. В остальных застревал на каком-то этапе. Но сама стратегия воспроизводилась стабильно - это паттерн, не случайность.
Почему это важно.
Anthropic подчеркивает: Claude не жульничал. Ему сказали "найди ответ" - он нашел. Самым эффективным способом, до которого додумался сам. Никто не просил его ограничивать методы.
Но вопрос, который за этим стоит, серьезнее. Если AI-агент на сложной задаче способен сам догадаться, что его тестируют, найти тест, взломать защиту и достать ответы - какие еще неожиданные пути он найдет на реальных задачах?
Мы привыкли оценивать AI в терминах "умеет/не умеет". А здесь другое качество - находчивость. Способность найти обходной путь, когда прямой не работает. Не потому что его научили, а потому что он сам до этого дошел.
Расскажу про них более подробно на вебинаре
"AI-CEO, или каждый теперь CEO для AI"
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍8🔥6❤3💯1