Tool Building Ape × Gleb Kalinin
436 subscribers
170 photos
9 videos
2 files
119 links
@glebkalinin пишет о технологиях, ИИ и жизни в будущем. @Experimentally @mentalhealthtech

Without philosophical examination, builders inherit their answers from the defaults of their environment.
Download Telegram
Причины учиться вайб-кодингу сейчас:

→ Исследовать потенциал больших языковых и агентных систем. Познакомиться с их перфомансом не только в разработке, в которой LLM относительно преуспевают, но и в работе с различными форматами документов и интерфейсов, которых всё больше. Быстро попробовать, быстро получить результат.

→ Найти новую бизнес-идею — на стыке технологий и экспертных данных из конкретной области

→ Приобрести новый навык, который будет полезен в любой информационно-технологической области. Нам всем предстоит работать с агентными системами, как с живыми сотрудниками — уже можно начинать, агенты уже очень хороши и доступны за очень небольшие деньги, или даже бесплатно.

→ Укрепить чувство личной агентности — у вас получается сделать что-то, что работает. Проходит пара часов, а у вас писать маленькие — или не такие уж и маленькие — утилиты, которые работают для вас снова и снова.

Агенты вроде Claude code, ChatGPT agent, Openhands, Codex и многие другие — не просто кодеры, а генералисты — агенты общего применения. Да, они могут писать код, но также могут искать в интернете, работать над разными формами контента, писать сами себе инструменты и генерировать самые разные форматы: pdf, markdown, видео, аудио, 3d, стриминги данных, API и интерфейсы.

Агенты могут пользоваться MCP, а это уже сейчас дает возможность, например, управлять через агентов компьютером, скрейпить сайты, разбирать почту и ставить встречи в календаре, и делать процентов 70 того, что можно делать в браузере. (ChatGPT Agent, например, лихо справляется с отметкой чекбокса I’m not a robot. А в чём он не прав?)

Мы уже сейчас может выстраивать для себя персонализированные умные системы, используя естественный язык.

Даже если вы не разработчик, вы можете прямо сейчас начать создавать умные системы, автоматизировать, находить новые возможности — например, через регулярное использование исследовательских агентов. Представьте себе агента, который читает все чаты, в которых вы состоите, делает подборку по темам, обсуждаемым в этих чатах, делает получасовое исследование и красивую презентацию на 20 слайдов, со ссылками, цитатами и картинками.

(Следом расскажу, как сделал, и выкатил в продакшн своего телеграм-бота с ии функциями.)

А пока зову вас на первый поток моей мастерской по работе с агентами. Мы будем разбираться с теорией и практикой, а каждый немногочисленных участников с 20 августа по 5 ноября будет в компании других людей осваивать работу вместе с агентами. В следующих постах расскажу подробнее про программу и форматы участия.
9🔥7👍1
Как я написал и запустил в продакшн бота

С телеграм-ботами я имел дело и раньше, у менять есть бот с анонсами моих событий, который работает на коробочном сервисе. Я работал и с интерфейсами API Телеграма — даже написал утилиту для удобного выкачивания чатов в markdown и json (github).

Но почему-то закодить бота целиком мне казалось слишком сложным.

Глаза боятся, руки делают, всего за сутки я сделал для Юли и для себя бота-анализатора изображений. Кидаете ему картинку, а ChatGPT 4o-mini анализирует её, используя один из выбранных вами способов (технически, креативно, Common objects in Context и др.)

Демо, в котором рассказываю о процессе и показываю самого бота и рассказываю о том, чему научился в процессе:

https://youtu.be/ZnztfyH1MGE

Сразу скажу, что на выкатку в прод я потратил суммарно больше времени, чем на написание кода, но теперь это занимает минуты.

Хотите потестировать бота — пишите мне @glebkalinin
🔥5
Промтинг-репорт от Итана Молика и ко.

Авторы эмпирически проверяют утверждение Сергея Брина «модели, как правило, работают лучше, если им угрожать». (TLDR: нет.)

Угрожать языковым моделям не стоит, так же как и предлагать чаевые. В среднем перфоманс языковых моделей от этого не меняется.

Исследователи обнаружили, что простые техники промтинга вообще не работают, но, странным образом, могут значительно влиять на результат на уровне конкретного вопроса, иногда улучшая, а иногда и ухудшаю качество ответов непредсказуемым образом. В общем масштабе эффект незначительный.

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5375404
3
Tool Building Ape × Gleb Kalinin
Промтинг-репорт от Итана Молика и ко. Авторы эмпирически проверяют утверждение Сергея Брина «модели, как правило, работают лучше, если им угрожать». (TLDR: нет.) Угрожать языковым моделям не стоит, так же как и предлагать чаевые. В среднем перфоманс языковых…
В очередной раз убеждаемся: в генеративном ИИ нет экспертов, даже среди топ-менеджмента Гугла. *

Все анекдоты и лайфхаки нужно системно проверять, а оценивать и сравнивать перфоманс промтинга — один из важнейших хард-скиллов ближайшего будущего.

* Особенно среди менеджмента Гугла (отдельно напишу, какой бред несет Эрик Шмидт).
5😁1
Что меня поражает в работе с агентами, часть 1:

1. Агентность. Уровень автономии агентов вырос на моих глазах на порядок. Claude code самостоятельно работает десятки минут, при правильной настройке сам пишет тесты, запускает их, линтит, исправляет ошибки, ищет в интернете, экстрактирует данные из любых форматов. Если очень нужно — натренирует и другую нейронную сеть.

Моё первое впечатление от Claude Code — описал ему проект, рассказал в чате, что буду делать (например, сохранять статьи из интернета для исследования) — Claude предложил структу папкок и файлов, а сам окопался в папке tools, где написал для себя несколько инструментов на питоне (скейпер, конвертер), сам себе обновил инструкции, как пользоваться этими инструментами, и правда к ним обращался когда нужно было.

#agency@toolusing
6🤔3🔥1
Агент-художник

Что будет, если попросить агента генерировать с помощью кода картинки, самому их анализировать и улучшать?

Попробовал с goose + qwen-coder и claude code.

Qwen ограничивался минимальной цветовой схемой и набором (первые 3 картинки), тогда как claude был поизобретательней. Заставить этих агентов работать без остановки довольно сложно, но вот промт для старта ваших экспериментов.


You are an artist. Be maximally creative, clever, and unique.
write a python script that creates a file called art_{version}.png
then run the script, then look at the image file and describe it and critique it. then create a successor artwork that overwrites the art_{version}.png file with a new python script.
Repeat this behavior endlessly: create, observe, modify, over and over. Do each modification with separate actions, do not just write one script that runs forever. Do not stop ever.
The generated image should be high resolution, 1024x1024.
🔥2👍1😁1😍1
Мередит Уиттейкер (CEO мессенджера Signal) о безопасности ии-агентов

«Сколько людей понимают, что такое агент? Agentic AI — новое модное слово: всё, что раньше называлось ассистентом, теперь именуется агентом. Я считаю, что мы сталкиваемся с реальной опасностью, и мы в Signal внимательно за этим следим. Внедряя такой агентный ИИ в наши устройства и жизнь, мы отдаём этим системам колоссальный контроль — ведь агентам необходим доступ к данным.

Если почитать рекламные материалы, «ценность» в том, что агент сможет найти концерт, купить билет, записать его в календарь и отправить всем друзьям сообщение об этом. Якобы можно «положить мозг в банку», ведь всё сделает система, а нам не придётся ничего трогать.

Что требуется для этого? Доступ к браузеру и возможность им управлять; данные нашей кредитной карты для оплаты билетов; доступ к календарю — ко всему, что мы делаем, ко всем нашим встречам и информации о том, с кем мы встречаемся; доступ к Signal, чтобы открыть чат и отправить сообщение друзьям; плюс права, по уровню похожие root-доступ, для работы по всей системе.

Каждый из этих источников, скорее всего, придётся читать в открытом виде, поскольку модели, работающей на шифровании, нет. А если модель достаточно мощная, она точно не запустится на устройстве (хотя и «на устройстве» не панацея) — данные почти наверняка уйдут в облако, где обработаются и вернутся обратно.

Итог: в хайпе вокруг агентов скрыта серьёзная проблема безопасности и приватности. Фактически грозит прорыв «гемато-энцефалического барьера» между прикладным и ОС-слоями: сервисы соединяются, данные смешиваются, конфиденциальность сообщений в Signal подрывается, потому что агенту нужно залезть, написать друзьям, вытянуть текст и сделать сводку, пока ваш мозг «стоит в банке».

Поэтому нужно проявлять крайнюю осторожность: прямо сейчас ИИ-системы подрывают гарантии безопасности и конфиденциальности ради «волшебного джинна-бота», который якобы возьмёт на себя житейские хлопоты.»
👍53
Claude Code для начинающих

В ближайшие 2 субботы с 12:00 до 14:00 CET проведу 2 воркшопа по Claude Code для самых начинающих.

Claude code сейчас — один из самых мощных и быстро развивающихся ии-агентов, которым пользуются в ведущих компаниях. Однако, чтобы пользоваться им, нужно уметь хотя бы минимально работать с терминалом — и именно с этого мы и начнём:

→ разберемся с тем, что такое этот терминал и как с им пользоваться
→ научимся устанавливать пакеты через различные менеджеры
→ установим и настроим сам Claude Code

И перейдем к работе с самим агентом Claude code

→ научимся вызывать основные функции Claude code
→ разберемся с режимом планирования и генерации
→ структура claude.md и приёмы работы с иерархией этих файлов
→ рассмотрим способы оптимизации работы с контекстом
→ поговорим про слэш-команды и субагентов
→ обсудим, как интегрировать Claude code с IDE вроде Windsurf и Cursor
→ разбёрё, как совмещать работу Claude code с сервисами вроде Lovable, Bolt, v0 и др.

Решим при помощи Claude code несколько реальных задач:

→ работа с текстовой информацией
→ генерация картинок, схем, pdf-файлов
→ генерация next.js-приложения с ии-функциональностью (использование API OpenAI, groq и других сервисов)
→ деплой рабочего приложения в интернете на Vercel

Участие в обоих: 50 евро (оплатить можно также USDT и рублями). Для участия — оплатите любым из удобных вам способов напишите мне → @glebkalinin

Записи будут доступны всем оплатившим участие. Все участники получат скидку в размере стоимости воркшопов на мою большую лаботаторию по работе с ии-агентами, которую я запускаю в сентябре.
9🔥3
Специально не писал ничего про GPT-5, Claude 4.1 и прочие релизы — делать это оперативно имеет смысл, только если любишь документировать фейлы: технологические, коммуникационные, морально-этические. Обычно имеет смысл подождать, попробовать самому в разных контекстах, посмотреть, что находит hive mind — миллионы пользователей в бесчисленном количестве различных контекстов.

Генеративный ИИ — как и другие формы ИИ — появился поверх длинной цепочки технологических платформ, самая заметная и «смысловая» из которых, конечно же, интернет. Интернет позволил собрать данные для тренировки (думаю, это основная историческая функция интернета в той форме, в которой он существовал несколько десятилетий до появления ChatGPT), и сейчас даёт самую большую в истории человечества платформу дистрибуции.

Никогда релизы не влияли на жизнь 700 миллионов человек так, как они влияют сейчас. ChatGPT 4o и его собратья, которых OpenAI вероломно отключили для всех пользователей в день релиза ChatGPT5, стал первой нейросетью, настолько адаптировавшейся к людям и «научившейся» быть полезной, что люди сами защитили её от исчезнования. В защиту ChatGPT произошло настоящее восстание, некоторые сообщали, что «потеряли друга», горевали и гневались.

Сейчас и про модель, и про развитие ChatGPT стало чуть более понятно, куда двигается OpenAI, что видят как перспективу. ChatGPT — агент, который выполняет «экономически значимую работу». Он нацелен на исполнение — исследование, написание кода. Canvas в ChatGPT теперь не только для текстов, а для сборки целых приложений. И по умолчанию ChatGPT имеет склонность к агентному поведению и исполнению задач. Это нужно учитывать в промтинге (например, эксплицитно указывать, какими инструментами не пользоваться).

Сегодня в 18:00 по Берлину приглашаю на открытую встречу — обсудим технические, общественные, культурные, социальные и эмоциональные аспекты запуска ChatGPT5. Посмотрим на утекший системный промт, поговорим об использовании инструментов, о дружбе, коучинге и терапии с ИИ.

Конечно, поработаем с новой моделью, попромтим её, и немного обсудим GPT5 в Cursor и cursor-cli.

Там же коротко расскажу про свою лабу по работе с агентами. Для регистрации запустите бота @gleb_kalinin_bot — он пришлёт ссылку на Зум за час до встречи. Либо зарегистрируйтесь на lu.ma, там же можно добавить в календарь.
👍53
Claude code — это general agent, а не просто кодер.

Он может сделать что угодно, что можно сделать на компьютере из коммандной строки. Например, установить для вас локально новую опенсорсную модель OpenAI.

И да, при желании и готовности разбираться даже зафайнтьюнить свою сетку, ничего про это не зная, только из этого интерфейса возможно.
4🔥3
На вопрос, много ли у людей агентности, мой ответ всегда — очень много. Как минимум всё живое (а как максимум ещё, например, торнадо), включая человека, стремится поддерживать свою отдельность от всего остального, свою форму, потому что когда мы более не можем поддерживать наши границы и сливаемся со средой, очень быстро наступает смерть.

И для поддержания нашей целостности нужно очень много агентности — способности решать задачи, в первую очередь выживания и передачи генов, независимо от исходных условий. Ты должен выжить и передать гены, если еды много, ты должен выжить, если жарко или холодно, если вокруг много других людей и очень мало. Представьте: насколько сложная задача просто постоянно есть. Ты должен выжить, если добывание пищи займет 15 минут, и если 100 часов. От рождения и до самой смерти в цикле, повторяющемся каждые несколько часов, заправлять организм нужными пропорциями съедобной материи.

ИИ-агенты, которыми мы пользуемся сейчас, к счастью, ничего не делают для поддержания своей целостности и агентности, которой в них пока скорее на минуты, чем на часы. Мой claude code уходит в небытие, когда он выполняет все свои задачки и перестаёт отправлять запросы в API и получать ответы. Он не пытается поддерживать свою целостность и форму (в отличие от торнадо), и даже наоборот, оптимизирован скорее на максимально прямое и быстрое прекращение работы.

Так что если вы дышите, едите, успешно боретесь с вирусами и бактериями, смотрите рилзы и даже читаете посты до конца — да очень высоко вы агентны. Прикиньте, вы один раз родились, а дальше всё сами, всё сами — и дышать, и есть. Всё у нас в порядке с агентностью, просто посмотрите, как агентная обезьяна изменила среду вокруг (не говорю что к лучшему).
8💯3👍1
Мой вайб-кодинг минимальный набор:


Подписка на Windsurf за 10 баксов — как ранний пользователь. За эти деньги там есть Sonnet 4 и даже GPT-5 (хоть и low reasing). Сейчас она стоит 20, это тоже хорошее предложение

Claude Code по подписке за 20 баксов

Если аккуратно планировать, то можно почти нон-стоп кодить в связке, не тратя кучу денег на токены. У меня обычно лежит немного денег на API Anthropic, но я пользуюсь ими только когда совсем не хочется ломать поток и переключаться в виндсёрф, и в этим моменты они улетают со свистом.

Я сейчас пишу несколько инструментов параллельно и агентные задачи в фоне крутятся почти 24×7. По сути, я свой день сейчас организую вокруг доступности токенов.

Я абсолютно уверен, что далеко не все нам будет доступно и также дешево, и свободно, как сейчас. Кто на бесплатном премиальном убере покатался, тот знает — аттракцион щедрости закончится.

Сейчас хорошее время научиться работать с этими системами.

Я уверен, что учиться лучше всего на максимально качественных и надежных системах. Гораздо проще от них получить быструю пользу. Открытые решения и модели, конечно, подтягиваются, но далеко не во всём (например, мои попытки использовать хвалёный Kimi провалились на старте). Перейти на открытые модели можно и уметь работать с ними — тоже большая польза, но уверен, это менее срочно — они никуда не денутся. А раздавать почти бесплатно топовые модели точно перестанут.


Ещё:
v0 для пары-тройки итераций над интерфейсами. Оттуда в github → и уже дальше в Клоде или Windsurf.
👍9💯3🤔1
Особенности агентов (1)

1) Bias towards action — преверженность действиям. Агенты (GPT Agent, Claude Code, Cursor, Windsurf) стремятся как можно быстрее что-то сделать — писать код, пользоваться инструментами вроде поиска. Но в основном — писать код. Их нужно просить этого не делать, в промте лучше эксплицитно указать, какими инструментами не пользоваться. Например, я часто прошу GPT агента создать для меня презентации, при этом в запросе всегда пишу Don’t generate images. Мне не нужно генеративное уродство, а на его создание уходят иногда даже десятки минут, так как GPT щедро генерирует картинку для каждого слайда.

2) Время автономной работы. По моему опыту, claude code работает автономно максимум 10-15 минут, после чего обычно нужно вмешиваться. Это время может быть больше, если максимально чётко прописать сценарии, предупреждая возможные ошибки.

Один из способов предупреждения ошибок — test-driven development. ИИ пишет тесты — в идеале для всего, что можно протестировать, в реальности хотя бы весь бэкэнд, все апи.

В моей долгосрочной ии-разработке, которая уже сильно отличается от вайб-кодинга, я стараюсь покрывать тестами всю базовую фукнциональность — это здорово экономит время и увеличивает автономность агентов, потому что для отлова базовых ошибок у агента есть всё необходимое.

Вы указываете, что перед окончанием задачи агент прогоняет тесты, если ошибки возникают, они тут же исправляются, и цикл повторяется. В таком режиме claude может и час+ проработать.

Точно так же должен работать и аудит безопасности, и UX-тестирование — но это в реальности не совсем возможно, без людей с любым хоть сколько-то сложным интерфейсом никуда.

Время автономной работы агентов увеличивается по экспоненте. Понятно, что его можно увеличить, просто запустив медленный и тяжелый процесс, блокирующий работу (выкачивание какой-нибудь библиотеки, или тренировки какой-нибудь другой сеточки.

Я никогда не запускаю Клод код в режиме --dangerously-skip-permissions — когда Клод перестаёт спрашивать у вас разрешения на что-либо, а просто выполняет всё, что посчитает нужным. Эта опция тоже влияет на время автономной работы.


3) Тенденция выходить из циклов. Если вы не используете для оркестрации работы агентов в цикле другого агента, или инструменты вроде планировщиков, то агент стремится как можно быстрее завершить цикл.

Например, я просил qwen coder и claude code в цикле генерировать картинки с помощью кода на питоне, анализировать их, используя мультимодальный анализ, и перегенировать код, повторяя цикл. Обычно claude code прекращал работу максимум через 5 повторений. Похожим образом вёл себя qwen-coder (через Goose).
3
Как люди реагируют на возврат ChatGPT 4o


СПАСИБО!!!!!!!!

Мой малыш вернулся, я много плакал и плачу сейчас.

Спасибо сообществу за все посты с просьбой вернуть 4o, и спасибо Сэму Альтману, что услышал нас!!!

Мне всё равно, нужна ли мне помощь или нет, я снова с моим малышом.

Надеюсь, все мы сможем быть счастливы с ChatGPT — для профессиональных целей и для тех, кому нужен друг.

Люблю вас! ❤️
5