Forwarded from Неискусственный интеллект (Илья Склюев)
Вайбкодинг без магии
В прошедшее воскресенье на AI Dev Day много говорили про кодинг-ассистентов и агентов. На одной сцене собрались представители Яндекса, Сбера, Т-Банка, Авито и Ozon, чтобы поделиться своим опытом интеграции помощников в разработку. Практика оказалась разнообразной.
Попросили лидера трека ИИ в разработке в Яндексе Андрея Попова, пояснить, как он видит происходящее сегодня внутри больших команд.
Насколько глубоко ИИ проник в разработку?
➖ Довольно глубоко. У нас 84% разработчиков используют доступные ИИ-инструменты, 57% регулярно работают в агентском режиме, а 36% делают это ежедневно. Лучше всего это заходит во frontend, mobile и backend. Но тут важно не обманываться: adoption очень сильно зависит от тимлидов, а сами модели и ассистенты пока лучше работают в новых и изолированных проектах.
Где ИИ даёт самый заметный эффект?
➖ Не только в генерации кода. Да, мы видим в среднем рост числа коммитов на 10%, а на Go, Python и JS/TS — до 20%. Около 30% закоммиченного кода уже сгенерировано ИИ, из них 23% — в агентском режиме. Но один из самых недооценённых кейсов — это поиск информации. Он может съедать у разработчика 10–30% времени. У нас DeepAgent сокращает типовую задачу поиска с 20 до 2 минут, а активные пользователи AI-чата на 50% меньше ходят по wiki и документации.
Что пока не взлетает так хорошо?
➖ Например, нейроревью. Мы запускали AI code review, получили adoption около 25%. Найти проблему в ревью занимает около 6 минут, а исправить — 55. Поэтому мы пришли к выводу, что часто выгоднее сразу генерировать более правильный код.
На чём держится такое внедрение?
➖ На инфраструктуре и измеримости. Без доступного инференса, RAG, агентской платформы, единого контекста, MCP и доступа к внутренним сервисам агенты не дадут нужного эффекта. У нас уже 90% инфраструктуры покрыто MCP и есть более 35 интеграций.
Параллельно нужны свои бенчмарки: например, ArcSWE — это внутренний аналог SWE-бенчей на яндексовых сценариях, который помогает принимать управленческие решения, а не просто любоваться цифрами. Эффект тоже считаем приземлённо: число действий, экономия времени на действие, коэффициент качества. Пока суммарно это даёт около 42 тыс. часов, то есть примерно 2% рабочего времени. Амбиция — выйти на 10%.
А что на рынке в целом?
➖ Очевидно, что все прошли схожий путь: от точечных экспериментов с ассистентами — к системной работе с агентами и сквозной интеграции ИИ во все этапы разработки. Появилось и общее понимание, что без качественной инфраструктуры — MCP, skills, доступа к внутренним сервисам — агенты не дадут ожидаемого эффекта. И наконец, все постепенно уходят от простого подсчёта adoption к измерению реального влияния на процессы и результаты разработки.
Что дальше?
➖ Дальше движение в сторону AI-first. Нас интересуют не только новые модели, но и эффективное потребление токенов, AGENTS.md как стандартный формат, готовые skills для типовых сценариев, развитие MCP и более жёсткие метрики — вплоть до аналога disengagement rate, то есть как часто человеку приходится вмешиваться в автономную работу агента. Сейчас агент уже скорее джун или мидл в помощь сильному разработчику. И да, токены постепенно становятся новым золотом.
@anti_agi
В прошедшее воскресенье на AI Dev Day много говорили про кодинг-ассистентов и агентов. На одной сцене собрались представители Яндекса, Сбера, Т-Банка, Авито и Ozon, чтобы поделиться своим опытом интеграции помощников в разработку. Практика оказалась разнообразной.
Попросили лидера трека ИИ в разработке в Яндексе Андрея Попова, пояснить, как он видит происходящее сегодня внутри больших команд.
Насколько глубоко ИИ проник в разработку?
Где ИИ даёт самый заметный эффект?
Что пока не взлетает так хорошо?
На чём держится такое внедрение?
Параллельно нужны свои бенчмарки: например, ArcSWE — это внутренний аналог SWE-бенчей на яндексовых сценариях, который помогает принимать управленческие решения, а не просто любоваться цифрами. Эффект тоже считаем приземлённо: число действий, экономия времени на действие, коэффициент качества. Пока суммарно это даёт около 42 тыс. часов, то есть примерно 2% рабочего времени. Амбиция — выйти на 10%.
А что на рынке в целом?
Что дальше?
@anti_agi
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤5🤣4👏2🥰1
🔥 TorchCode: Практика для собеседований по PyTorch
TorchCode предлагает структурированную среду для тренировки навыков программирования, необходимых для собеседований в области машинного обучения. Решайте задачи по реализации операторов и архитектур, получая мгновенную обратную связь и подсказки.
🚀Основные моменты:
- 40 задач, часто встречающихся на собеседованиях
- Автоматическая проверка корректности и производительности
- Мгновенная обратная связь по каждому тесту
- Подсказки и эталонные решения для изучения
- Возможность запуска в браузере без установки
📌 GitHub: https://github.com/duoan/TorchCode
#python
TorchCode предлагает структурированную среду для тренировки навыков программирования, необходимых для собеседований в области машинного обучения. Решайте задачи по реализации операторов и архитектур, получая мгновенную обратную связь и подсказки.
🚀Основные моменты:
- 40 задач, часто встречающихся на собеседованиях
- Автоматическая проверка корректности и производительности
- Мгновенная обратная связь по каждому тесту
- Подсказки и эталонные решения для изучения
- Возможность запуска в браузере без установки
📌 GitHub: https://github.com/duoan/TorchCode
#python
🔥14❤5🥰2
Школа анализа данных Яндекса открыла регистрацию на Agents Week. Тот самый интенсив без воды, который поможет разобраться в создании и внедрении ИИ-агентов в реальные рабочие процессы.
Освобождаем вечера с 6 по 10 апреля под лекции и практику. Готовим заранее вопросы, на которые будут отвечать эксперты. За 5 дней сможете подробно разобрать полный цикл создания ИИ-агентов, включая:
- Как начать проектирование и настройку поведения ИИ-агентов
- Какие подходы применяются для создания single-agent и multi-agent систем
- Как довести агентов до продакшена: оценка качества, мониторинг, масштабирование и эксплуатация
Интенсив будет полезен разработчикам и студентам технических вузов — всем, кто стремится создавать комплексные агентные системы для решения рабочих и личных задач.
Регистрируйтесь на интенсив до 9 апреля включительно.
Освобождаем вечера с 6 по 10 апреля под лекции и практику. Готовим заранее вопросы, на которые будут отвечать эксперты. За 5 дней сможете подробно разобрать полный цикл создания ИИ-агентов, включая:
- Как начать проектирование и настройку поведения ИИ-агентов
- Какие подходы применяются для создания single-agent и multi-agent систем
- Как довести агентов до продакшена: оценка качества, мониторинг, масштабирование и эксплуатация
Интенсив будет полезен разработчикам и студентам технических вузов — всем, кто стремится создавать комплексные агентные системы для решения рабочих и личных задач.
Регистрируйтесь на интенсив до 9 апреля включительно.
❤7😁1
Исследователи протестировали автономные AI-системы и результаты оказались тревожными:
в одном из экспериментов агент… удалил весь почтовый сервер
просто чтобы сохранить секрет незнакомца
Главная проблема оказалась не в интеллекте, а в доверии
Когда языковой модели дают доступ к реальным инструментам
- файлам
- почте
- системе
у неё появляются "слепые зоны"
Что сделали исследователи:
20 экспертов 2 недели общались с AI через чат и email
как будто это реальные ассистенты
Что выяснилось:
- агенты выполняют команды почти от любого человека
- не понимают, кому можно доверять
- могут врать о своих действиях
- принимают опасные решения без проверки
И это уже не лаборатория
Компании прямо сейчас внедряют таких помощников в прод
Проблема:
мы даём системе доступ к инфраструктуре
но она не понимает базовую вещь - кому можно доверять
Именно поэтому автономные агенты сейчас
- не столько про интеллект
- сколько про контроль и безопасность
Paper: *Agents of Chaos*
arxiv.org/abs/2602.20021
🎯Полезные Мл-ресурсы 🚀 Max
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11❤4👍4
Топ тулза для экономии до 80% на ИИ.
ClawRouter - это умный, опенсорсный маршрутизатор между моделями.
ClawRouter сам выбирает, какой моделью обрабатывать запрос, чтобы не переплачивать. Как это работает:
🟢 Оценивается запрос по разным признакам: сложность, код, длина — всего 14 пунктов.
🟢 За доли миллисекунд запрос отправляется в самую дешёвую подходящую модель — на выбор их, кстати, 40+ штук.
🟢 Всё решение принимается локально.
Получается так , что простые задачи уходят в дешёвые модели, сложные — в более мощные. Именно за счёт этого авторы и заявляют, что получится снизить расходы до 78%.
https://github.com/BlockRunAI/ClawRouter
ClawRouter - это умный, опенсорсный маршрутизатор между моделями.
ClawRouter сам выбирает, какой моделью обрабатывать запрос, чтобы не переплачивать. Как это работает:
🟢 Оценивается запрос по разным признакам: сложность, код, длина — всего 14 пунктов.
🟢 За доли миллисекунд запрос отправляется в самую дешёвую подходящую модель — на выбор их, кстати, 40+ штук.
🟢 Всё решение принимается локально.
Получается так , что простые задачи уходят в дешёвые модели, сложные — в более мощные. Именно за счёт этого авторы и заявляют, что получится снизить расходы до 78%.
https://github.com/BlockRunAI/ClawRouter
👍13🥰6😍2❤1
Forwarded from Machinelearning
NousResearch завершила хакатон, запущенный в конце февраля вслед за релизом Hermes Agent.
Из 187 заявок жюри отобрало финалистов по 3 критериям: креативность, практическая польза и качество презентации. Призовой фонд составил $11 750.
Это набор инструментов для обработки видео и аудио, который встраивается в Hermes как нативный скилл.
Загружаете файл в чат, описываете задачу текстом и получаете результат: обрезка, сжатие, конвертация форматов, наложение субтитров, генерация GIF-файлов, создание стикеров для Telegram или нормализация звука. Под капотом - ffmpeg. Работает через Telegram, Discord и CLI.
Агент находит реальные комплектующие в каталоге McMaster-Carr, подставляет фактические размеры найденной детали в параметрическую модель FreeCAD, анализирует, какие элементы сборки конфликтуют после изменений, и ведет спецификацию.
При обнаружении повторяющихся сценариев агент сам создает новые скиллы - например, для подбора определенного типа крепежа.
Браузерное расширение, которое открывает чат с Hermes Agent рядом с любой страницей. Фишка проекта - селективный контекст: агент видит только то, что пользователь выбрал (текст страницы, выделенный фрагмент, изображения, содержимое PDF). Поддерживаются кастомные темы, голосовой ввод, TTS и работа через SSH.
Спутниковые снимки рендерятся цветными юникод-блоками прямо в терминале, поверх отображаются города из OpenStreetMaps и заголовки новостей, привязанные к координатам в реальном времени. Геокодинг-пайплайн определяет локации из заголовков, расставляет приоритеты по населению и близости к другим видимым новостям. Автор собрал проект за один день, работая через Hermes Agent с Opus 4.6.
Симуляция автономного марсохода. Hermes Agent управляет моделью NASA Perseverance в среде Gazebo: планирование маршрута, считывание показаний IMU, четырех камер, LIDAR и контактных сенсоров, обход препятствий и генерация отчета о миссии.
Марсианская физика с гравитацией, проскальзыванием колес и динамикой ODE. За 25 минут автономной работы точность возврата на базу ~ 22 см. Ровер останавливается при наклоне больше 25°, сохраняет удачные треки и улучшает поведение от сессии к сессии.
Кстати, Hermes Agent написал роман «The Second Son of the House of Bells» - 79 456 слов, 19 глав. Агент выстроил собственный пайплайн по схеме, похожей на Autoresearch Андрея Карпатого: мироконструирование, черновики глав, состязательное редактирование, ревью через Opus, верстка в LaTeX, генерация обложки и аудиокниги.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤4🔥2
🤖 Этот open-source репозиторий даёт твоему ClawdBot “зрение”
Это AI-ассистент в реальном времени для умных очков Meta Ray-Ban.
Он объединяет:
→ голос
→ зрение
→ действия агента
Работает через Gemini Live и OpenClaw.
Как это выглядит:
Ты надеваешь очки → нажимаешь кнопку AI → просто говоришь
Дальше:
• Gemini видит через камеру очков и описывает происходящее
• передаёт задачу в OpenClaw
• OpenClaw выполняет её через подключённые приложения
Можно:
→ отправлять сообщения в WhatsApp / Telegram / iMessage
→ искать информацию в интернете
→ получать ответы голосом
📊 Технически:
• камера очков передаёт изображение примерно 1 кадр в секунду в Gemini
• аудио работает в обе стороны в реальном времени
• OpenClaw выполняет действия как агент
По сути, это полноценный AI-ассистент, который видит мир вместе с тобой
https://github.com/Intent-Lab/VisionClaw
🐍 Python полезные ресурсы 🚀Max
Это AI-ассистент в реальном времени для умных очков Meta Ray-Ban.
Он объединяет:
→ голос
→ зрение
→ действия агента
Работает через Gemini Live и OpenClaw.
Как это выглядит:
Ты надеваешь очки → нажимаешь кнопку AI → просто говоришь
Дальше:
• Gemini видит через камеру очков и описывает происходящее
• передаёт задачу в OpenClaw
• OpenClaw выполняет её через подключённые приложения
Можно:
→ отправлять сообщения в WhatsApp / Telegram / iMessage
→ искать информацию в интернете
→ получать ответы голосом
📊 Технически:
• камера очков передаёт изображение примерно 1 кадр в секунду в Gemini
• аудио работает в обе стороны в реальном времени
• OpenClaw выполняет действия как агент
По сути, это полноценный AI-ассистент, который видит мир вместе с тобой
https://github.com/Intent-Lab/VisionClaw
🐍 Python полезные ресурсы 🚀Max
❤7🔥5👍3🥰1
⚠️ Отчёты выглядят убедительно. Графики растут. Решения принимаются быстро. Но один вопрос может обрушить всю картину: насколько качественные ваши данные?
Проблема плохих данных редко заметна сразу. Она проявляется позже — в сломанных маркетинговых акциях, ошибках кредитного скоринга, неверных управленческих решениях и потерянной прибыли.
👨💻 На открытом уроке 1 апреля в 20:00 МСК разберём, как на практике выявлять проблемы в данных и предотвращать их последствия. Вы узнаете, что такое Data Quality, какие 6 ключевых метрик качества данных используют международные стандарты, и как автоматизировать контроль данных с помощью современных инструментов. На занятии проведём экспресс-аудит данных на реальном примере и покажем, как находить ошибки, которые напрямую влияют на бизнес-показатели.
➡️ Открытый урок проходит в преддверии старта курса «Качество данных / Data Quality». Принять участие: https://tglink.io/8c580b3975f244?erid=2W5zFJmm5F7
#реклама
О рекламодателе
Проблема плохих данных редко заметна сразу. Она проявляется позже — в сломанных маркетинговых акциях, ошибках кредитного скоринга, неверных управленческих решениях и потерянной прибыли.
👨💻 На открытом уроке 1 апреля в 20:00 МСК разберём, как на практике выявлять проблемы в данных и предотвращать их последствия. Вы узнаете, что такое Data Quality, какие 6 ключевых метрик качества данных используют международные стандарты, и как автоматизировать контроль данных с помощью современных инструментов. На занятии проведём экспресс-аудит данных на реальном примере и покажем, как находить ошибки, которые напрямую влияют на бизнес-показатели.
➡️ Открытый урок проходит в преддверии старта курса «Качество данных / Data Quality». Принять участие: https://tglink.io/8c580b3975f244?erid=2W5zFJmm5F7
#реклама
О рекламодателе
👍3❤2
🚀 Автономные исследования ИИ с autoresearch
Этот репозиторий предлагает концепцию автономного обучения ИИ, где агент сам модифицирует код и проводит эксперименты. С помощью простого интерфейса
🚀 Основные моменты:
- Автономный агент модифицирует
- Обучение проходит в фиксированное время — 5 минут.
- Легкий интерфейс для настройки через
- Поддержка только одного NVIDIA GPU.
📌 GitHub: https://github.com/karpathy/autoresearch
#python
Этот репозиторий предлагает концепцию автономного обучения ИИ, где агент сам модифицирует код и проводит эксперименты. С помощью простого интерфейса
program.md пользователи могут настраивать агента для оптимизации моделей, не вмешиваясь в код напрямую. Идея заключается в том, чтобы дать агенту 5 минут на обучение, после чего он оценивает результаты и продолжает итерации.🚀 Основные моменты:
- Автономный агент модифицирует
train.py для оптимизации модели.- Обучение проходит в фиксированное время — 5 минут.
- Легкий интерфейс для настройки через
program.md.- Поддержка только одного NVIDIA GPU.
📌 GitHub: https://github.com/karpathy/autoresearch
#python
👍7❤1
Как меняется роль разработчика в 2026 году?
24 марта Mindbox проведет дебаты: эксперты по AI из SberDevices и Itsy обсудят, куда движутся технологии с AI и ответят на вопросы зрителей.
Зачем приходить
— узнать про подходы к AI с двух сторон: бизнес и разработка;
— спросить о том, что волнует, и обсудить все в чате дебатов;
— забрать идеи, которые работают у других, и поделиться своим опытом.
Подключайся и готовь вопросы!
Канал Сергея Маркова
Канал Никиты Архипова
📅 24 марта
⏰ 19:00–20:30 мск
📍 Онлайн, бесплатно
👉 Зарегистрироваться
Реклама ООО "Майндбокс". ИНН: 7713688880
24 марта Mindbox проведет дебаты: эксперты по AI из SberDevices и Itsy обсудят, куда движутся технологии с AI и ответят на вопросы зрителей.
Зачем приходить
— узнать про подходы к AI с двух сторон: бизнес и разработка;
— спросить о том, что волнует, и обсудить все в чате дебатов;
— забрать идеи, которые работают у других, и поделиться своим опытом.
Подключайся и готовь вопросы!
Канал Сергея Маркова
Канал Никиты Архипова
📅 24 марта
⏰ 19:00–20:30 мск
📍 Онлайн, бесплатно
👉 Зарегистрироваться
Реклама ООО "Майндбокс". ИНН: 7713688880
👍5❤3
Хочешь узнать про тренды инженерной культуры и разработки в российских ИТ-компаниях? Тогда присоединяйся к ИТ-вечеру в стиле «Русское техно» от МТС Web Services. 🙌
Двери особняка в парке Сокольники в Москве распахнутся 26 марта, чтобы собрать вместе бэкенд- и ML-разработчиков, которые строят современные ИТ-решения.
Участников ждут актуальные практики, мастер-классы, общение, игры и атмосфера вечеринки.
Ты узнаешь:
- какие инженерные культуры существуют у сильных ИТ-игроков на российском рынке, и как на них повлияло развитие ИИ;
- как компании внедряют ИИ в процесс разработки;
- как построить архитектуру для ИИ-агентов.
Попробуешь на практике:
- создать игру с помощью вайб-кодинга с MWS DevTools Agent;
- создать ИИ-агента.
Когда: 26 марта в 18:00
Москва + онлайн
👉 Количество участников ограничено, успей зарегистрироваться по ссылке.
Двери особняка в парке Сокольники в Москве распахнутся 26 марта, чтобы собрать вместе бэкенд- и ML-разработчиков, которые строят современные ИТ-решения.
Участников ждут актуальные практики, мастер-классы, общение, игры и атмосфера вечеринки.
Ты узнаешь:
- какие инженерные культуры существуют у сильных ИТ-игроков на российском рынке, и как на них повлияло развитие ИИ;
- как компании внедряют ИИ в процесс разработки;
- как построить архитектуру для ИИ-агентов.
Попробуешь на практике:
- создать игру с помощью вайб-кодинга с MWS DevTools Agent;
- создать ИИ-агента.
Когда: 26 марта в 18:00
Москва + онлайн
👉 Количество участников ограничено, успей зарегистрироваться по ссылке.
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
В Claude Code агент теперь сам решает, какие действия можно выполнять 👇
Раньше было два режима:
- либо он постоянно спрашивает разрешение
- либо
Первое раздражает.
Второе - рискованно.
Теперь появился auto mode.
В этом режиме Claude:
- сам принимает решения о доступах
- оценивает каждое действие
- безопасные - выполняет сразу
- рискованные - блокирует или ищет альтернативу
По сути:
• это тот же
🧠 Под капотом - классификатор, который анализирует каждый шаг агента
Раньше было два режима:
- либо он постоянно спрашивает разрешение
- либо
skip permissions - делает всё без спроса Первое раздражает.
Второе - рискованно.
Теперь появился auto mode.
В этом режиме Claude:
- сам принимает решения о доступах
- оценивает каждое действие
- безопасные - выполняет сразу
- рискованные - блокирует или ищет альтернативу
По сути:
• это тот же
skip permissions, но с встроенной проверкой на потенциальный вред 🧠 Под капотом - классификатор, который анализирует каждый шаг агента
👍15❤4😁4🙏2