Меньше чем за 3 минуты показываю альтернативный карточный интерфейс для взаимодействия с LLM, который я соорудил за 2 сессии работы с Claude code.
Вы задаете вопросы текстом, на выходе — карточки, с каждой из которых можно взаимодействовать.
https://youtu.be/gVRVLYyABD0
Если хотите попробовать, напишите комментарий, пришлю ссылку на github
Вы задаете вопросы текстом, на выходе — карточки, с каждой из которых можно взаимодействовать.
https://youtu.be/gVRVLYyABD0
Если хотите попробовать, напишите комментарий, пришлю ссылку на github
YouTube
Демо ии-интерфейса для взаимодействия с ChatGPT в виде карточек
Глеб Калинин показывает инструмент, который он создал за полтора дня с помощью вайб-кодинга — быстрой разработки с использованием AI. Это альтернативный интерфейс для ChatGPT, который представляет ответы в виде интерактивных карточек вместо обычного текста.…
🔥3❤1
Причины учиться вайб-кодингу сейчас:
→ Исследовать потенциал больших языковых и агентных систем. Познакомиться с их перфомансом не только в разработке, в которой LLM относительно преуспевают, но и в работе с различными форматами документов и интерфейсов, которых всё больше. Быстро попробовать, быстро получить результат.
→ Найти новую бизнес-идею — на стыке технологий и экспертных данных из конкретной области
→ Приобрести новый навык, который будет полезен в любой информационно-технологической области. Нам всем предстоит работать с агентными системами, как с живыми сотрудниками — уже можно начинать, агенты уже очень хороши и доступны за очень небольшие деньги, или даже бесплатно.
→ Укрепить чувство личной агентности — у вас получается сделать что-то, что работает. Проходит пара часов, а у вас писать маленькие — или не такие уж и маленькие — утилиты, которые работают для вас снова и снова.
Агенты вроде Claude code, ChatGPT agent, Openhands, Codex и многие другие — не просто кодеры, а генералисты — агенты общего применения. Да, они могут писать код, но также могут искать в интернете, работать над разными формами контента, писать сами себе инструменты и генерировать самые разные форматы: pdf, markdown, видео, аудио, 3d, стриминги данных, API и интерфейсы.
Агенты могут пользоваться MCP, а это уже сейчас дает возможность, например, управлять через агентов компьютером, скрейпить сайты, разбирать почту и ставить встречи в календаре, и делать процентов 70 того, что можно делать в браузере. (ChatGPT Agent, например, лихо справляется с отметкой чекбокса I’m not a robot. А в чём он не прав?)
Мы уже сейчас может выстраивать для себя персонализированные умные системы, используя естественный язык.
Даже если вы не разработчик, вы можете прямо сейчас начать создавать умные системы, автоматизировать, находить новые возможности — например, через регулярное использование исследовательских агентов. Представьте себе агента, который читает все чаты, в которых вы состоите, делает подборку по темам, обсуждаемым в этих чатах, делает получасовое исследование и красивую презентацию на 20 слайдов, со ссылками, цитатами и картинками.
(Следом расскажу, как сделал, и выкатил в продакшн своего телеграм-бота с ии функциями.)
А пока зову вас на первый поток моей мастерской по работе с агентами. Мы будем разбираться с теорией и практикой, а каждый немногочисленных участников с 20 августа по 5 ноября будет в компании других людей осваивать работу вместе с агентами. В следующих постах расскажу подробнее про программу и форматы участия.
→ Исследовать потенциал больших языковых и агентных систем. Познакомиться с их перфомансом не только в разработке, в которой LLM относительно преуспевают, но и в работе с различными форматами документов и интерфейсов, которых всё больше. Быстро попробовать, быстро получить результат.
→ Найти новую бизнес-идею — на стыке технологий и экспертных данных из конкретной области
→ Приобрести новый навык, который будет полезен в любой информационно-технологической области. Нам всем предстоит работать с агентными системами, как с живыми сотрудниками — уже можно начинать, агенты уже очень хороши и доступны за очень небольшие деньги, или даже бесплатно.
→ Укрепить чувство личной агентности — у вас получается сделать что-то, что работает. Проходит пара часов, а у вас писать маленькие — или не такие уж и маленькие — утилиты, которые работают для вас снова и снова.
Агенты вроде Claude code, ChatGPT agent, Openhands, Codex и многие другие — не просто кодеры, а генералисты — агенты общего применения. Да, они могут писать код, но также могут искать в интернете, работать над разными формами контента, писать сами себе инструменты и генерировать самые разные форматы: pdf, markdown, видео, аудио, 3d, стриминги данных, API и интерфейсы.
Агенты могут пользоваться MCP, а это уже сейчас дает возможность, например, управлять через агентов компьютером, скрейпить сайты, разбирать почту и ставить встречи в календаре, и делать процентов 70 того, что можно делать в браузере. (ChatGPT Agent, например, лихо справляется с отметкой чекбокса I’m not a robot. А в чём он не прав?)
Мы уже сейчас может выстраивать для себя персонализированные умные системы, используя естественный язык.
Даже если вы не разработчик, вы можете прямо сейчас начать создавать умные системы, автоматизировать, находить новые возможности — например, через регулярное использование исследовательских агентов. Представьте себе агента, который читает все чаты, в которых вы состоите, делает подборку по темам, обсуждаемым в этих чатах, делает получасовое исследование и красивую презентацию на 20 слайдов, со ссылками, цитатами и картинками.
(Следом расскажу, как сделал, и выкатил в продакшн своего телеграм-бота с ии функциями.)
А пока зову вас на первый поток моей мастерской по работе с агентами. Мы будем разбираться с теорией и практикой, а каждый немногочисленных участников с 20 августа по 5 ноября будет в компании других людей осваивать работу вместе с агентами. В следующих постах расскажу подробнее про программу и форматы участия.
❤9🔥7👍1
Как я написал и запустил в продакшн бота
С телеграм-ботами я имел дело и раньше, у менять есть бот с анонсами моих событий, который работает на коробочном сервисе. Я работал и с интерфейсами API Телеграма — даже написал утилиту для удобного выкачивания чатов в markdown и json (github).
Но почему-то закодить бота целиком мне казалось слишком сложным.
Глаза боятся, руки делают, всего за сутки я сделал для Юли и для себя бота-анализатора изображений. Кидаете ему картинку, а ChatGPT 4o-mini анализирует её, используя один из выбранных вами способов (технически, креативно, Common objects in Context и др.)
Демо, в котором рассказываю о процессе и показываю самого бота и рассказываю о том, чему научился в процессе:
https://youtu.be/ZnztfyH1MGE
Сразу скажу, что на выкатку в прод я потратил суммарно больше времени, чем на написание кода, но теперь это занимает минуты.
Хотите потестировать бота — пишите мне @glebkalinin
С телеграм-ботами я имел дело и раньше, у менять есть бот с анонсами моих событий, который работает на коробочном сервисе. Я работал и с интерфейсами API Телеграма — даже написал утилиту для удобного выкачивания чатов в markdown и json (github).
Но почему-то закодить бота целиком мне казалось слишком сложным.
Глаза боятся, руки делают, всего за сутки я сделал для Юли и для себя бота-анализатора изображений. Кидаете ему картинку, а ChatGPT 4o-mini анализирует её, используя один из выбранных вами способов (технически, креативно, Common objects in Context и др.)
Демо, в котором рассказываю о процессе и показываю самого бота и рассказываю о том, чему научился в процессе:
https://youtu.be/ZnztfyH1MGE
Сразу скажу, что на выкатку в прод я потратил суммарно больше времени, чем на написание кода, но теперь это занимает минуты.
Хотите потестировать бота — пишите мне @glebkalinin
🔥5
Промтинг-репорт от Итана Молика и ко.
Авторы эмпирически проверяют утверждение Сергея Брина «модели, как правило, работают лучше, если им угрожать». (TLDR: нет.)
Угрожать языковым моделям не стоит, так же как и предлагать чаевые. В среднем перфоманс языковых моделей от этого не меняется.
Исследователи обнаружили, что простые техники промтинга вообще не работают, но, странным образом, могут значительно влиять на результат на уровне конкретного вопроса, иногда улучшая, а иногда и ухудшаю качество ответов непредсказуемым образом. В общем масштабе эффект незначительный.
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5375404
Авторы эмпирически проверяют утверждение Сергея Брина «модели, как правило, работают лучше, если им угрожать». (TLDR: нет.)
Угрожать языковым моделям не стоит, так же как и предлагать чаевые. В среднем перфоманс языковых моделей от этого не меняется.
Исследователи обнаружили, что простые техники промтинга вообще не работают, но, странным образом, могут значительно влиять на результат на уровне конкретного вопроса, иногда улучшая, а иногда и ухудшаю качество ответов непредсказуемым образом. В общем масштабе эффект незначительный.
https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5375404
❤3
Tool Building Ape × Gleb Kalinin
Промтинг-репорт от Итана Молика и ко. Авторы эмпирически проверяют утверждение Сергея Брина «модели, как правило, работают лучше, если им угрожать». (TLDR: нет.) Угрожать языковым моделям не стоит, так же как и предлагать чаевые. В среднем перфоманс языковых…
В очередной раз убеждаемся: в генеративном ИИ нет экспертов, даже среди топ-менеджмента Гугла. *
Все анекдоты и лайфхаки нужно системно проверять, а оценивать и сравнивать перфоманс промтинга — один из важнейших хард-скиллов ближайшего будущего.
* Особенно среди менеджмента Гугла (отдельно напишу, какой бред несет Эрик Шмидт).
Все анекдоты и лайфхаки нужно системно проверять, а оценивать и сравнивать перфоманс промтинга — один из важнейших хард-скиллов ближайшего будущего.
* Особенно среди менеджмента Гугла (отдельно напишу, какой бред несет Эрик Шмидт).
❤5😁1
Что меня поражает в работе с агентами, часть 1:
1. Агентность. Уровень автономии агентов вырос на моих глазах на порядок. Claude code самостоятельно работает десятки минут, при правильной настройке сам пишет тесты, запускает их, линтит, исправляет ошибки, ищет в интернете, экстрактирует данные из любых форматов. Если очень нужно — натренирует и другую нейронную сеть.
Моё первое впечатление от Claude Code — описал ему проект, рассказал в чате, что буду делать (например, сохранять статьи из интернета для исследования) — Claude предложил структу папкок и файлов, а сам окопался в папке tools, где написал для себя несколько инструментов на питоне (скейпер, конвертер), сам себе обновил инструкции, как пользоваться этими инструментами, и правда к ним обращался когда нужно было.
#agency@toolusing
1. Агентность. Уровень автономии агентов вырос на моих глазах на порядок. Claude code самостоятельно работает десятки минут, при правильной настройке сам пишет тесты, запускает их, линтит, исправляет ошибки, ищет в интернете, экстрактирует данные из любых форматов. Если очень нужно — натренирует и другую нейронную сеть.
Моё первое впечатление от Claude Code — описал ему проект, рассказал в чате, что буду делать (например, сохранять статьи из интернета для исследования) — Claude предложил структу папкок и файлов, а сам окопался в папке tools, где написал для себя несколько инструментов на питоне (скейпер, конвертер), сам себе обновил инструкции, как пользоваться этими инструментами, и правда к ним обращался когда нужно было.
#agency@toolusing
❤6🤔3🔥1
Агент-художник
Что будет, если попросить агента генерировать с помощью кода картинки, самому их анализировать и улучшать?
Попробовал с goose + qwen-coder и claude code.
Qwen ограничивался минимальной цветовой схемой и набором (первые 3 картинки), тогда как claude был поизобретательней. Заставить этих агентов работать без остановки довольно сложно, но вот промт для старта ваших экспериментов.
You are an artist. Be maximally creative, clever, and unique.
write a python script that creates a file called art_{version}.png
then run the script, then look at the image file and describe it and critique it. then create a successor artwork that overwrites the art_{version}.png file with a new python script.
Repeat this behavior endlessly: create, observe, modify, over and over. Do each modification with separate actions, do not just write one script that runs forever. Do not stop ever.
The generated image should be high resolution, 1024x1024.
Что будет, если попросить агента генерировать с помощью кода картинки, самому их анализировать и улучшать?
Попробовал с goose + qwen-coder и claude code.
Qwen ограничивался минимальной цветовой схемой и набором (первые 3 картинки), тогда как claude был поизобретательней. Заставить этих агентов работать без остановки довольно сложно, но вот промт для старта ваших экспериментов.
You are an artist. Be maximally creative, clever, and unique.
write a python script that creates a file called art_{version}.png
then run the script, then look at the image file and describe it and critique it. then create a successor artwork that overwrites the art_{version}.png file with a new python script.
Repeat this behavior endlessly: create, observe, modify, over and over. Do each modification with separate actions, do not just write one script that runs forever. Do not stop ever.
The generated image should be high resolution, 1024x1024.
🔥2👍1😁1😍1
Мередит Уиттейкер (CEO мессенджера Signal) о безопасности ии-агентов
«Сколько людей понимают, что такое агент? Agentic AI — новое модное слово: всё, что раньше называлось ассистентом, теперь именуется агентом. Я считаю, что мы сталкиваемся с реальной опасностью, и мы в Signal внимательно за этим следим. Внедряя такой агентный ИИ в наши устройства и жизнь, мы отдаём этим системам колоссальный контроль — ведь агентам необходим доступ к данным.
Если почитать рекламные материалы, «ценность» в том, что агент сможет найти концерт, купить билет, записать его в календарь и отправить всем друзьям сообщение об этом. Якобы можно «положить мозг в банку», ведь всё сделает система, а нам не придётся ничего трогать.
Что требуется для этого? Доступ к браузеру и возможность им управлять; данные нашей кредитной карты для оплаты билетов; доступ к календарю — ко всему, что мы делаем, ко всем нашим встречам и информации о том, с кем мы встречаемся; доступ к Signal, чтобы открыть чат и отправить сообщение друзьям; плюс права, по уровню похожие root-доступ, для работы по всей системе.
Каждый из этих источников, скорее всего, придётся читать в открытом виде, поскольку модели, работающей на шифровании, нет. А если модель достаточно мощная, она точно не запустится на устройстве (хотя и «на устройстве» не панацея) — данные почти наверняка уйдут в облако, где обработаются и вернутся обратно.
Итог: в хайпе вокруг агентов скрыта серьёзная проблема безопасности и приватности. Фактически грозит прорыв «гемато-энцефалического барьера» между прикладным и ОС-слоями: сервисы соединяются, данные смешиваются, конфиденциальность сообщений в Signal подрывается, потому что агенту нужно залезть, написать друзьям, вытянуть текст и сделать сводку, пока ваш мозг «стоит в банке».
Поэтому нужно проявлять крайнюю осторожность: прямо сейчас ИИ-системы подрывают гарантии безопасности и конфиденциальности ради «волшебного джинна-бота», который якобы возьмёт на себя житейские хлопоты.»
«Сколько людей понимают, что такое агент? Agentic AI — новое модное слово: всё, что раньше называлось ассистентом, теперь именуется агентом. Я считаю, что мы сталкиваемся с реальной опасностью, и мы в Signal внимательно за этим следим. Внедряя такой агентный ИИ в наши устройства и жизнь, мы отдаём этим системам колоссальный контроль — ведь агентам необходим доступ к данным.
Если почитать рекламные материалы, «ценность» в том, что агент сможет найти концерт, купить билет, записать его в календарь и отправить всем друзьям сообщение об этом. Якобы можно «положить мозг в банку», ведь всё сделает система, а нам не придётся ничего трогать.
Что требуется для этого? Доступ к браузеру и возможность им управлять; данные нашей кредитной карты для оплаты билетов; доступ к календарю — ко всему, что мы делаем, ко всем нашим встречам и информации о том, с кем мы встречаемся; доступ к Signal, чтобы открыть чат и отправить сообщение друзьям; плюс права, по уровню похожие root-доступ, для работы по всей системе.
Каждый из этих источников, скорее всего, придётся читать в открытом виде, поскольку модели, работающей на шифровании, нет. А если модель достаточно мощная, она точно не запустится на устройстве (хотя и «на устройстве» не панацея) — данные почти наверняка уйдут в облако, где обработаются и вернутся обратно.
Итог: в хайпе вокруг агентов скрыта серьёзная проблема безопасности и приватности. Фактически грозит прорыв «гемато-энцефалического барьера» между прикладным и ОС-слоями: сервисы соединяются, данные смешиваются, конфиденциальность сообщений в Signal подрывается, потому что агенту нужно залезть, написать друзьям, вытянуть текст и сделать сводку, пока ваш мозг «стоит в банке».
Поэтому нужно проявлять крайнюю осторожность: прямо сейчас ИИ-системы подрывают гарантии безопасности и конфиденциальности ради «волшебного джинна-бота», который якобы возьмёт на себя житейские хлопоты.»
👍5❤3
Claude Code для начинающих
В ближайшие 2 субботы с 12:00 до 14:00 CET проведу 2 воркшопа по Claude Code для самых начинающих.
Claude code сейчас — один из самых мощных и быстро развивающихся ии-агентов, которым пользуются в ведущих компаниях. Однако, чтобы пользоваться им, нужно уметь хотя бы минимально работать с терминалом — и именно с этого мы и начнём:
→ разберемся с тем, что такое этот терминал и как с им пользоваться
→ научимся устанавливать пакеты через различные менеджеры
→ установим и настроим сам Claude Code
И перейдем к работе с самим агентом Claude code
→ научимся вызывать основные функции Claude code
→ разберемся с режимом планирования и генерации
→ структура claude.md и приёмы работы с иерархией этих файлов
→ рассмотрим способы оптимизации работы с контекстом
→ поговорим про слэш-команды и субагентов
→ обсудим, как интегрировать Claude code с IDE вроде Windsurf и Cursor
→ разбёрё, как совмещать работу Claude code с сервисами вроде Lovable, Bolt, v0 и др.
Решим при помощи Claude code несколько реальных задач:
→ работа с текстовой информацией
→ генерация картинок, схем, pdf-файлов
→ генерация next.js-приложения с ии-функциональностью (использование API OpenAI, groq и других сервисов)
→ деплой рабочего приложения в интернете на Vercel
Участие в обоих: 50 евро (оплатить можно также USDT и рублями). Для участия — оплатите любым из удобных вам способов напишите мне → @glebkalinin
Записи будут доступны всем оплатившим участие. Все участники получат скидку в размере стоимости воркшопов на мою большую лаботаторию по работе с ии-агентами, которую я запускаю в сентябре.
В ближайшие 2 субботы с 12:00 до 14:00 CET проведу 2 воркшопа по Claude Code для самых начинающих.
Claude code сейчас — один из самых мощных и быстро развивающихся ии-агентов, которым пользуются в ведущих компаниях. Однако, чтобы пользоваться им, нужно уметь хотя бы минимально работать с терминалом — и именно с этого мы и начнём:
→ разберемся с тем, что такое этот терминал и как с им пользоваться
→ научимся устанавливать пакеты через различные менеджеры
→ установим и настроим сам Claude Code
И перейдем к работе с самим агентом Claude code
→ научимся вызывать основные функции Claude code
→ разберемся с режимом планирования и генерации
→ структура claude.md и приёмы работы с иерархией этих файлов
→ рассмотрим способы оптимизации работы с контекстом
→ поговорим про слэш-команды и субагентов
→ обсудим, как интегрировать Claude code с IDE вроде Windsurf и Cursor
→ разбёрё, как совмещать работу Claude code с сервисами вроде Lovable, Bolt, v0 и др.
Решим при помощи Claude code несколько реальных задач:
→ работа с текстовой информацией
→ генерация картинок, схем, pdf-файлов
→ генерация next.js-приложения с ии-функциональностью (использование API OpenAI, groq и других сервисов)
→ деплой рабочего приложения в интернете на Vercel
Участие в обоих: 50 евро (оплатить можно также USDT и рублями). Для участия — оплатите любым из удобных вам способов напишите мне → @glebkalinin
Записи будут доступны всем оплатившим участие. Все участники получат скидку в размере стоимости воркшопов на мою большую лаботаторию по работе с ии-агентами, которую я запускаю в сентябре.
❤9🔥3
Специально не писал ничего про GPT-5, Claude 4.1 и прочие релизы — делать это оперативно имеет смысл, только если любишь документировать фейлы: технологические, коммуникационные, морально-этические. Обычно имеет смысл подождать, попробовать самому в разных контекстах, посмотреть, что находит hive mind — миллионы пользователей в бесчисленном количестве различных контекстов.
Генеративный ИИ — как и другие формы ИИ — появился поверх длинной цепочки технологических платформ, самая заметная и «смысловая» из которых, конечно же, интернет. Интернет позволил собрать данные для тренировки (думаю, это основная историческая функция интернета в той форме, в которой он существовал несколько десятилетий до появления ChatGPT), и сейчас даёт самую большую в истории человечества платформу дистрибуции.
Никогда релизы не влияли на жизнь 700 миллионов человек так, как они влияют сейчас. ChatGPT 4o и его собратья, которых OpenAI вероломно отключили для всех пользователей в день релиза ChatGPT5, стал первой нейросетью, настолько адаптировавшейся к людям и «научившейся» быть полезной, что люди сами защитили её от исчезнования. В защиту ChatGPT произошло настоящее восстание, некоторые сообщали, что «потеряли друга», горевали и гневались.
Сейчас и про модель, и про развитие ChatGPT стало чуть более понятно, куда двигается OpenAI, что видят как перспективу. ChatGPT — агент, который выполняет «экономически значимую работу». Он нацелен на исполнение — исследование, написание кода. Canvas в ChatGPT теперь не только для текстов, а для сборки целых приложений. И по умолчанию ChatGPT имеет склонность к агентному поведению и исполнению задач. Это нужно учитывать в промтинге (например, эксплицитно указывать, какими инструментами не пользоваться).
Сегодня в 18:00 по Берлину приглашаю на открытую встречу — обсудим технические, общественные, культурные, социальные и эмоциональные аспекты запуска ChatGPT5. Посмотрим на утекший системный промт, поговорим об использовании инструментов, о дружбе, коучинге и терапии с ИИ.
Конечно, поработаем с новой моделью, попромтим её, и немного обсудим GPT5 в Cursor и cursor-cli.
Там же коротко расскажу про свою лабу по работе с агентами. Для регистрации запустите бота @gleb_kalinin_bot — он пришлёт ссылку на Зум за час до встречи. Либо зарегистрируйтесь на lu.ma, там же можно добавить в календарь.
Генеративный ИИ — как и другие формы ИИ — появился поверх длинной цепочки технологических платформ, самая заметная и «смысловая» из которых, конечно же, интернет. Интернет позволил собрать данные для тренировки (думаю, это основная историческая функция интернета в той форме, в которой он существовал несколько десятилетий до появления ChatGPT), и сейчас даёт самую большую в истории человечества платформу дистрибуции.
Никогда релизы не влияли на жизнь 700 миллионов человек так, как они влияют сейчас. ChatGPT 4o и его собратья, которых OpenAI вероломно отключили для всех пользователей в день релиза ChatGPT5, стал первой нейросетью, настолько адаптировавшейся к людям и «научившейся» быть полезной, что люди сами защитили её от исчезнования. В защиту ChatGPT произошло настоящее восстание, некоторые сообщали, что «потеряли друга», горевали и гневались.
Сейчас и про модель, и про развитие ChatGPT стало чуть более понятно, куда двигается OpenAI, что видят как перспективу. ChatGPT — агент, который выполняет «экономически значимую работу». Он нацелен на исполнение — исследование, написание кода. Canvas в ChatGPT теперь не только для текстов, а для сборки целых приложений. И по умолчанию ChatGPT имеет склонность к агентному поведению и исполнению задач. Это нужно учитывать в промтинге (например, эксплицитно указывать, какими инструментами не пользоваться).
Сегодня в 18:00 по Берлину приглашаю на открытую встречу — обсудим технические, общественные, культурные, социальные и эмоциональные аспекты запуска ChatGPT5. Посмотрим на утекший системный промт, поговорим об использовании инструментов, о дружбе, коучинге и терапии с ИИ.
Конечно, поработаем с новой моделью, попромтим её, и немного обсудим GPT5 в Cursor и cursor-cli.
Там же коротко расскажу про свою лабу по работе с агентами. Для регистрации запустите бота @gleb_kalinin_bot — он пришлёт ссылку на Зум за час до встречи. Либо зарегистрируйтесь на lu.ma, там же можно добавить в календарь.
lu.ma
GPT5: что это было · Zoom · Luma
Специально не писал ничего про GPT-5, Claude 4.1 и прочие релизы — делать это оперативно имеет смысл только если любишь документировать фейлы: технологические,…
👍5❤3