Чернецкий | AI, apps & vibe
517 subscribers
57 photos
4 videos
2 files
79 links
Илья Чернецкий, основатель @coinkeeper, о мобильных приложениях, SaaS, AI, вайб-кодинге и прочем ближайшем будущем
Download Telegram
В общем, Claude Design конечно крут и надо его обязательно щупать, но если вы думали, что сейчас перенесете из Фигмы свои дизайн-системы и ух, тогда заживем — у меня для вас плохие новости
😢1😭1
Чем больше погружаешься в Claude Code, тем больше узнаешь всяких терминов: skills, agents, plugins, hooks, slash-commands, MCP, CLAUDE.md, MEMORY.md, subagents, tools, CLI, IDE. Хорошо еще, что все это обрушивается на тебя не сразу, а постепенно. Но в какой-то момент я понял, что не могу сфорулировать, чем skills отличается от plugin, и решил разложить все по полочкам. Вместе с клодом мы придумали такую метафору:

Основной Claude — это ты, шеф-повар

Ты стоишь у плиты. У тебя есть руки (инструменты), память, опыт, правила заведения и список специалистов, которым можно делегировать. Все, что происходит в Claude Code, крутится вокруг этого шефа.

CLI и IDE — где именно стоит твоя кухня

Одного и того же шефа можно поставить работать в разных условиях, и от этого меняется только обстановка вокруг — не сам повар и не его навыки.

CLI (терминал) — это походная кухня или открытый огонь. Минимум оборудования вокруг, максимум прямого контакта. Ты в терминале, шеф в фартуке, между вами ничего лишнего. Быстро, честно, без украшательств. Хорошо, когда надо что-то сделать прямо сейчас, не отрываясь от текущего контекста, или когда ты работаешь по SSH с сервером, где никакого IDE и нет.

IDE (расширение для VS Code, JetBrains и прочих) — это полноценный стационарный ресторан. Рядом с плитой открытая книга (редактор с кодом), висят экраны с камерами на каждую конфорку (превью, diff, терминал), под рукой мойка (git-панель), на столе разложены все ингредиенты (файловое дерево). Шеф тот же самый, но вокруг него теперь целая рабочая станция. Удобнее видеть контекст, удобнее принимать правки, удобнее жить в одном окне.

Плюс есть мобильное приложение и веб-версия — это как кухня в трейлере или в чужом заведении: не так удобно, как дома, но готовить можно откуда угодно.

Важная деталь: это просто разные двери в одну и ту же кухню. Скиллы, агенты, CLAUDE.md, MEMORY.md, MCP — все работает одинаково, независимо от того, через CLI ты зашел или через IDE. Меняется только эргономика, а не набор возможностей.

Более того, на самом деле все сессии, которые запускает Claude Code на твоей машине, одинаковые и видны в разных IDE или в CLI.

Tools — базовый набор кухонных приборов

Нож, сковорода, духовка, миксер. В Claude это:

- Read — прочитать файл
- Write — создать новый файл
- Edit — точечно поправить существующий файл
- Bash — выполнить команду в терминале
- Grep — найти по содержимому файлов
- Glob — найти файлы по имени или маске

И так далее. Встроенные, всегда под рукой. Без них ты даже яичницу не пожаришь.

CLAUDE.md — правила этого конкретного заведения

В каждом ресторане свои порядки: здесь мы не жарим на подсолнечном, здесь пасту только al dente, вот наш tone of voice с гостями. CLAUDE.md лежит в корне проекта и Claude читает его автоматически при входе на кухню. Это не рецепты и не приемы — это конституция проекта.

MEMORY.md — личная записная книжка повара

У любого хорошего шефа есть потрепанный блокнот, который он таскает с собой между заведениями: где брать хорошее мясо, как мама учила резать лук, какие у него любимые пропорции. MEMORY.md работает так же — она загружается в каждой сессии, независимо от проекта.

Разница с CLAUDE.md: CLAUDE.md — это про место, MEMORY.md — это про тебя.

Skill — рецепт в поваренной книге

Пошаговая инструкция "как приготовить X". Просто файл с инструкцией, иногда с приложенными скриптами-заготовками. Сам по себе рецепт ничего не готовит — его читает и исполняет шеф. Но у шефа на полке может лежать сорок рецептов, и когда гость просит карбонару, он берет нужный и делает по нему.

Скиллы переиспользуются между проектами. Один раз написал рецепт — используешь на любой кухне.

Slash-команда — кнопка быстрого вызова на панели

/commit, /review-pr, /screenshot-beautify. Это как кнопки на профессиональной кофемашине: нажал "эспрессо" — получил эспрессо. Под кнопкой лежит заранее прописанная последовательность действий. Отличие от скилла: скилл Claude может подхватить сам, когда видит подходящий контекст. Команду ты вызываешь явно, нажатием.
Agent (субагент) — специалист, которого ты нанимаешь на задачу

Шеф не делает все сам. У него есть кондитер, сомелье, су-шеф, мойщик посуды. Субагент — это отдельный Claude со своим системным промптом, своим набором разрешенных инструментов и (главное) своим изолированным контекстом.

Ты говоришь: "эй, кондитер, сделай мне тирамису". Он уходит в свой угол кухни, делает там что-то сорок минут, приносит готовое блюдо и уходит. Ты не видишь, как он взбивал маскарпоне и сколько яиц разбил — тебе важен только результат.

Две ключевые суперсилы субагентов:
- Изолированный контекст. Его возня не засоряет твою голову. Ты помнишь только: "заказал тирамису, получил тирамису".
- Параллельность. Можно одновременно отправить кондитера делать десерт, су-шефа резать овощи и мойщика мыть посуду. Шеф при этом жарит стейк.

Hook — автоматический триггер на кухне

Открылась дверь холодильника — включился свет. Закончилась готовка — автоматически запустилась посудомойка. Заходишь на смену — шеф автоматически проверяет, что все ножи наточены.

В Claude это PreToolUse, PostToolUse, SessionStart и другие события. Повесил хук "перед каждым git push запусти линтер" — теперь линтер запускается сам, без твоих напоминаний. Важная деталь: хук исполняет не Claude, а сама кухня (харнесс). То есть это не "Claude постарается не забыть", а жесткое правило, которое сработает всегда.

MCP-сервер — подключение новой кухонной техники

Купил соковыжималку, подключил к розетке — появилась возможность делать свежевыжатый сок. В Claude Code это работает так же: подключил MCP-сервер для GitHub — появились тулы для работы с PR, issues, коммитами. Подключил MCP для Figma — появились тулы для чтения макетов.

MCP — это стандарт, по которому внешние инструменты приносят Claude новые возможности. Как USB для кухни: один разъем, много устройств.

Plugin — упакованный набор "кухня под ключ"

Коробка с надписью "Итальянская кухня". Внутри: рецепты (скиллы), специалист-пастаро (агент), пастомашина (MCP), автотриггер "посыпать пармезаном" (хук), кнопка "сделай мне пасту" (slash-команда).

Плагин сам по себе не готовит. Это способ упаковать и распространить набор всего вышеперечисленного одним куском. Поставил плагин — получил сразу все ингредиенты для конкретного сценария.

Как это все работает вместе

Приходит заказ: "сделай лендинг с подключенной аналитикой".

1. Шеф (основной Claude) читает CLAUDE.md — "ага, в этом заведении мы пишем на Next.js, CSS через Tailwind, никаких эмодзи".
2. Заглядывает в MEMORY.md — "у меня уже был похожий проект, вот мои любимые паттерны".
3. Достает с полки скилл "шаблон лендинга" — пошаговый рецепт.
4. Делегирует субагенту-дизайнеру подобрать цветовую схему, параллельно — субагенту-копирайтеру написать тексты.
5. Вызывает MCP Figma-сервера, чтобы подтянуть макеты.
6. Использует инструменты Write и Edit, чтобы собрать код.
7. На коммите срабатывает хук — прогоняется линтер и тесты.
8. Ты вызываешь slash-команду /deploy — улетает на Vercel.

Весь этот набор (скилл + агенты + MCP + хук + команда) может быть упакован в один плагин "SaaS-лендинг под ключ" и поставлен другому человеку одной строкой.

Резюме одной таблицей

- CLI / IDE — разные двери в одну и ту же кухню
- Tools — руки и приборы шефа
- CLAUDE.md — правила заведения
- MEMORY.md — записная книжка повара
- Skill — рецепт
- Slash-команда — кнопка быстрого вызова
- Agent — специалист, которому делегируешь
- Hook — автоматический триггер на кухне
- MCP — подключенная кухонная техника
- Plugin — коробка со всем вышеперечисленным для одного сценария

❤️ если узнал что-то новое
2🔥96🙏3👍1
Сейчас такое время, что постоянно слышишь аббривиатуры, в середине которых две буквы аа. SaaS'ы (software as a service) умирают, на смену приходит Services as a software и Outcome as a service.

Про это все мы обязательно поговорим, но я тут вспомнил довольно старую концепцию — Everything as a product, которая лично для меня, с наступлением эры AI, и в связке с процессом самокопания, стала очень актуальной.

Я очень люблю стадию 0 to 1. Даже больше — стадию 0 to 0.1. Когда в голове и в каких-то артефактах уже сформулирована идея продукта, но до встречи с реальностью ещё далеко. И тем более далеко от операционки, рутины и прочего скучного.

И это, знаете ли, проблема. Десятки не доведенных до продакшена идей тому подтверждение. Сейчас я стараюсь автоматизировать все процессы, которые ведут от 1 до бесконечности. А для этого нужно подойти к ним как к продукту.

Мне хотелось делать визуальный контент — я начал с каруселек и сделал из этого продукт (20 звезд на гитхабе уже, кстати).

Мне нужен качественный дизайн для новых продуктов — делаю скилл, который можно переиспользовать (хотя с Claude Design и GPT Image 2 может уже и не надо).

Мне нужно постоянно заниматься продвижением своих продуктов через контент — делаю дашборд, где одновременно собираются ключевые контентные метрики (подписки и охваты) и календарь публикаций.

То что контент — это сам по себе продукт — я уже и не говорю.

Создание продуктов стало дешевым, почти бесплатным, и на первый план выходит операционка. Но и к ней можно и нужно подходить как к продукту. Пользуясь случаем хочу поблагодарить академию, антропиков и openAI за новый генератор картинок для этого канала.
👍7
"AI создаст новые рабочие места", говорили они.

Январь 2023. Андрей Карпатый постит в твиттере: *"The hottest new programming language is English"*. Твит набирает ~4 млн просмотров

Март 2023. Anthropic вывешивает вакансию Prompt Engineer с зарплатой до $335,000 в год. Требования: "a creative hacker spirit" и любовь к головоломкам. Ни PhD, ни десяти лет кода — просто "умей разговаривать с ИИ".

Апрель 2023. Time публикует гайд "How to Get a Six-Figure Job as an Prompt Engineer". Fortune пишет: человек с "хакерским духом" может получить $300K+ за новую AI-профессию.

Всё лето 2023. LinkedIn заполоняют люди с этой профессией в описании. Курсы "Стань prompt engineer за 6 недель" по $2000. Гайды "1000 best ChatGPT prompts" продаются за $49. Консультанты пишут в биографиях "AI Whisperer". Родители объясняют детям, что Гарвард больше не нужен.

Осень 2024. Те же издания, которые годом раньше восхищались, разворачиваются: "Prompt engineering was never the future". Модели стали лучше — и теперь сами понимают корявые запросы. Вакансии "prompt engineer" начинают исчезать с LinkedIn.

2025. Роль растворяется в ML/AI-инженерии. "Prompt engineering" — это уже не профессия, а навык, чуть сложнее чем "просто напиши в чат, что ты хочешь".

От "программируй на английском за $335K" до "это даже не профессия" за полтора года - это наверное самый быстро устаревший карьерный совет в истории IT.

Поэтому когда говорят "AI заберет рабочие места, зато создаст новые"... у меня есть некоторые сомнения.
😱6
До сих пор не понимаю определение «AI-агента». Почему "агенты" это обязательно какой-то OpenClaw с именем и характером?

1. Claude Code, который для большой задачи запускает (по его словам) субагентов и работает по триггеру-рутине.
2. Обычный веб-сервис, который обрабатывает какие-то входящие в него тексты вызовом LLM по API.
3. Тот же Claude Code, поднятый на VPS с доступом через Happy или самописный интерфейс.

Это уже агенты — или ещё нет?

Ниже мнение Клода по этому вопросу:
Если выкинуть хайп, рабочее определение сводится к трём свойствам.

Цикл — LLM сама решает «что дальше», а не делает один проход input → output.

Инструменты — может что-то делать в мире, не только генерить текст.

Цель — действует ради задачи через несколько шагов без человека в каждом.

По моим примерам выходит так:

Claude Code с субагентами по триггеру — агент. Есть цикл, инструменты, многошаговое выполнение.

Веб-сервис, который дёргает LLM на входящий текст, — не агент. Это LLM-обёртка. Один проход, нет автономии. Даже если внутри RAG — всё равно пайплайн.

Claude Code на VPS через Happy — агент. Интерфейс доступа не меняет сущности; внутри тот же цикл с инструментами.

Граница на практике: есть ли у системы решение «продолжать или остановиться» на каждом шаге. Если да — агент. Если ты заранее знаешь, сколько раз вызовется LLM, — пайплайн.

И ещё: много LLM-вызовов ≠ агент. Цепочка из 5 промптов — это пайплайн. Агент — это когда сам не знаешь, сколько вызовов будет, потому что решает модель.


Так какого черта вы пишите "Поигрался и забросил"?! Невозможно забросить Claude Code, в котором ты начал серьезно работать. Зачем вы зашквариваете определение "агентов", сводя их к пошлому нарративу "купил Mac mini чтобы запустить на нем ИИ-агента по имени Вася"?
🔥3🤬2👍1💯1🦄1
Мое главное guilty pleasure, помимо всего прочего — это собирать потенциально полезную информацию.

Поэтому у меня уже под 200 реп сохранено на гитхабе, а вы бы знали что творится в моей галлерее скриншотов в телефоне и Избранном в телеграме...

Давно уже пытаюсь навести в этом всем порядок (даже в Систему добавил раздел Inbox, но в итоге так и не придумал, как систематизировать, извините за каламбур, хаос, который начал копиться там).

Но, поразмыслив в концепции Everything as a product, я подумал, а не завести ли мне рассылку или телеграм-канал, куда я просто буду автоматически выгружать все свои "сохраненки" с кратким AI-generated описанием.. Что думаете? Читали бы такое?
🔥31
Только я похаял AI-агентов, как мне вселенная начала про этих AI-агентов из всех щелей рассказывать. И у меня наконец-то сложилась картинка.

Короче, начнем с того, что у AI к нашему общечеловеческому счастью еще нет свой воли. Он не может сам обратиться к пользователю. Мы его что-то спросили — он ответил: просто текстом, открыл и отредактировал файл с кодом, вызвал скрипт и так далее. Не спрашиваем ничего — он молчит, его не существует.

Даже когда мы ведем с ним долгую беседу — он помнит ее начало только потому, что каждый раз загружает все ее содержанием целиком в контексте последней нашей реплики.

И вот AI агент, он там типа живет своей жизнью, что-то делает без вас... как это работает? Что это за магия такая?

Никакой магии тут нет. Он работает только потому что что-то его будит и дает ему пинок (с контекстом впридачу). Этим пинком может быть крон (будильник для скриптов, которые и запускают агентов), какой-то внешний триггер (вебхук, например пришло новое письмо в почту) или внутренний (какой-то другой "агент" что-то передал, или тот же самый агент закончил задание и запустил хук типа "а теперь оцени то что сделал и придумай как сделать это лучше").

Если крон запускается часто или триггеры постоянно срабатывают, то возникает ощущение что агент "живой, постоянно работающий". Но на самом деле это просто куча постоянно запускающихся индивидуальных сессий. Таких же, какие мы запускаем в Claude Code. Ну, плюс запись в память чего-то важного (но и это мы с вами делаем в СС).

Поэтому если вы сидите за своим компьютером и стартуете сессии — поздравляю, вы вручную оркестрируете агентов. Можно поставить эту оркестрацию на автомат, но зачем?

Я пока придумал только одну причину — если вы хотите, чтобы что-то происходило полностью автономно без вашего участия (но с участием LLM). Для этого вам нужно поднять Claude Code на выделенном сервере (что я и сделал примерно за 15 минут) и придумать для него какую-то задачу (я пока придумал только мониторить определенный набор телеграм каналов и фильтровать в них интересный мне контент по определенным правилам). Пока на этом моя мысль остановилась, но вдруг вы подкините каких-то идей?

А, вот эти все имена AI агентов, характеры, "душа" — это все какая-то абсолютно бесполезная ерунда, по типу того как некоторые автолюбители дают имена своим машинам.
👍53
Ну вот наконец и настал момент, когда я выжег лимит своей подписки до конца недели. А подписка у меня не хрен собачий, а максимальный Claude Max 20x.

Чтобы понять, где я накосячил, я попросил Клода проанализировать все мои сессии за эту неделю (оказалось у меня десяток сессией с сотнями сообщений, хотя я думал что максимум 20-30 стараюсь отправлять).

А потом -- дать мне несколько советов, чтобы сжигать поменьше токенов (помимо очевидных -- не тянуть длинные чаты и использовать Sonnet). Ну а самая мякотка будет в конце!

1. Не давай Claude перечитывать один и тот же файл

Каждый раз, когда Claude открывает файл, он целиком попадает в контекст. Если в одной сессии один файл прочитан 20 раз — это 20 копий в памяти.

Как надо: проси сразу запоминать структуру файла и редактировать через точечные правки. Если файл огромный — попроси сначала составить «карту» (где что лежит), а потом работать по ней.

2. Делегируй массовый поиск в подагента

Когда нужно «найди все места, где упоминается X», Claude может сам пройтись по проекту. Но каждый результат поиска оседает в твоей сессии.

Как надо: проси «делегируй поиск в Explore-агент, верни мне только итоговый отчёт». Подагент работает в своей памяти, а тебе возвращает три строчки выжимки.

3. Делегируй ресерч в интернете

То же правило для веба. Один поход в URL = вся страница в контексте. Десять походов = десять страниц.

Как надо: «сходи в эти 20 сайтов через general-purpose агента, верни таблицу с нужными полями». Особенно круто работает, если запустить несколько агентов параллельно — задача решается в 3-5 раз быстрее, а контекст почти не растёт.

4. Не возвращайся в старую сессию через несколько дней

Возобновление сессии через сутки — это перезагрузка всей старой переписки в кэш. Часто дешевле начать заново.

Как надо: новые задачи — новые сессии. Старая сессия пригодится, только если ты вернулся через час и продолжаешь то же самое.

5. Группируй команды на сервере

Если нужно зайти на сервер и посмотреть пять разных вещей — не делай пять отдельных подключений. Каждый ответ сервера летит в контекст.

Как надо: проси Claude собрать всё в один скрипт, который выполнится одним заходом и вернёт всё разом.

Ну и самое прикольное: можно настроить автоматические предупреждения о нарушении правил через хуки

Все эти правила хорошо бы не только знать, но и применять, но в азарте работы про них забываешь. Можно поручить самому Claude Code следить за нарушениями и тыкать тебя в нос, когда ты их допускаешь.

В Claude Code есть штука под названием хуки (я уже писал использую их, например для оповещениях в телеграм) — это маленькие скрипты, которые харнес запускает на определённые события: перед вызовом инструмента, после, при старте сессии и так далее. Они могут не вмешиваться в работу, а просто кидать предупреждение в виде системного сообщения.

Я повесил себе три хука, которые ловят самые дорогие антипаттерны:

1. Перечитывание одного файла. Хук считает, сколько раз в текущей сессии Claude открыл Read для каждого файла. На третьем чтении одного и того же файла — выскакивает предупреждение: «уже три раза открыл, может, держать структуру в голове».

2. Рекурсивный поиск через Bash. Ловит команды вроде grep -rn, find . -name, rg. Когда таких команд за сессию становится больше двух — хук подсказывает: «делегируй в Explore-агент, не таскай результаты в основной контекст».

3. Серия WebFetch. Считает походы в URL. На третьем — напоминание: «пора отдать общий ресерч в general-purpose агента, он соберёт всё в своём контексте и вернёт только саммари».

Эти хуки не блокируют работу и не лезут в код — они только вешают подсказку, которая попадает прямо в диалог как системное сообщение. Claude её видит и обычно сам исправляется: переключается на агента или перестаёт перечитывать.

Хуки конфигурируются в ~/.claude/settings.json. Скрипты можно положить в ~/.claude/hooks/. Полезный приём, который окупается за пару сессий.

Главный принцип
🔥53👍1
Всё, что попадает в сессию (файлы, результаты поиска, веб-страницы, история диалога), оплачивается каждым следующим сообщением. Чем меньше мусора в контексте — тем дольше живёт твой лимит.

Подагенты, короткие сессии, правильный выбор модели и автоматические предупреждалки через хуки — четыре рычага, которыми ты управляешь сам. Claude об этом не напомнит — пока сам не настроишь.

Выложить этот хук в github? Поставьте огонечек если да.
🔥21🦄21
Больше 20 реакций еще ни один мой пост не получал, так что ловите хук: https://github.com/itchernetski/claude-code-token-watch

Кстати, еще один совет Клод забыл: русской язык в текстах сжирает в 1.5-2 раза больше токенов. Переходите на английский и экономьте 🧐 Делать я этого конечно же не буду.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍3🙏1
В процессе моего разбирательства с расходом токенов выяснилось, что Claude Code на каждую сессию пишет JSONL-лог в ~/.claude/projects/*.jsonl. Там по сообщениям разложены input, output, cache_read, cache_create — и модель, и проект, и время.

И мы с клодом довольно быстро собрали для этого UI - получился дашборд, который парсит эти файлы и показывает:

— сколько токенов в день (по «взвешенной» формуле: input × 1 + output × 5 + cache_create × 1.25 + cache_read × 0.1, та же пропорция, что в прайсинге Anthropic — даёт честный относительный ранг)
— какой проект сколько отъел
— какая модель использовалась
— 30 самых жирных сессий, остальное схлопнуто в одну строку
— все это можно посмотреть в разрезе 24h / 3d / 7d / 14d / 30d, без перезагрузки

Ноль API-вызовов, ноль токенов на просмотр — всё локально. Парсит за 5–15 секунд, кэширует в памяти.

Выложил на гитхаб https://github.com/itchernetski/claude-code-token-meter -- просто попросите клода забрать и научить вас пользоваться.

Можно (и нужно на самом деле!) проверить на безопасность, что код ничего не делает с вашими данными и тп. - это железное правило для любого репозитория из гитхаба, я сам всегда так делаю.

Премию за эту разработку мне конечно же не дадут, но хотя бы реакций и звезд на гитхабе я от вас ожидаю ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍32
Простите, помучаю вас еще проблемой токенов и лимитов Claude Code. Ну или наоборот, будет для вас полезным.

Попросил Клода разложить историю моего с ним взаимодействия по неделям, и вот какие выводы у меня есть по этой картинке:

1. Я начал пользоваться СС всего 3,5 месяца назад... я почему-то думал что раньше)
2. Моя активность в нем выросла на порядок по сравнению с первыми неделями использования.
3. Уже пару-тройку недель моя средняя сессия уменьшается, но.. надо еще.
4. Ну и самое интересное -- Опус реально выжирает токены раз в 5 сильнее Сонета и хайку, а учитывая что я Опус 4.7 еще и на 30% более вдумчивый, чем Опус 4.6 -- удивительно как я не уперся в лимиты раньше.
5. В какой-то момент выбор модели стал очень далеко запрятан в СС extention для курсора, и видимо в тот момент еще и сменились настройки дефолтной модели -- я перешел на Опус, хотя и не планировал, Хайку меня вполне устраивала.
6. А еще, субъективно так, кажется что последние пару недель количество токенов в лимитах уменьшилось. Потому что еще пару недель даже 70% недельного лимита было тяжело выжать, а на этот период пришелся максимум моей активности.
7. На самом деле примерно тогда же все массово стали жаловаться на то что лимиты утекают, но вот до меня эта волна дошла чуть позже

Поэтому:
а) срочно меняйте дефолтную модель, если вы за ней не следите (ее можно прописать в settings.json)
б) на Опус переключайтесь только при планировании (PlanMode)
в) не пускайте план сразу в работу! это тоже можно прописать в CLAUDE.md, что на выходе из PlanMode вам нужен файл, а сам план можно исполнять поэтапно

Токены -- новая нефть)
🔥5👍21
Когда я разбирался куда утекла моя подписка, одной из самых "тяжелых" по токенам сессий была та, в которой я делал презентацию.

Знакомый позвал рассказать про то, как я использую AI-инструменты в продукте, маркетинге и операционки, для директоров его компании.

Презентацию я делал естественно с Клодом, просил его копаться в моих проектах, искать кейсы, формулировать слайды и дизайнить их. А потом итеративно дорабатывал. Иногда правил напрямую в html, но это неудобно, так что чаще всего просил Клода переписать. И все это в одной сессии. Которая тянула весь контекст моих проектов и огромную 40-слайдовую html'ку. Короче, был не прав, увлекся.

И когда я увидел у Глеба пост, про то как он сделал html'ку редатируемой изнутри, я понял -- мне это надо! Ну и собственно сделал, и конечно же выложил на гитхаб:
💻https://github.com/itchernetski/html-presentation-editor

Это по сути маленький Keynote/Powerpoint внутри странички. Своего дизайна у нее почти что нет, надо просить модельку сверху нарисовать. Зато презентацию можно править как силами нейронки, так и просто ткнуть в текст и отредактировать - собственно это основная идея этого проекта. В общем это лучше один раз пощупать, чем читать об этом:
🖥https://itchernetski.github.io/html-presentation-editor/editor.html

Единственный минус - надо не забывать сохраняться. Автоматом, как мы привыкли, сохранять изменения нельзя.

PS: кстати, если вам в компании или персонально нужен воркшоп по AI (как "для начинающих", так и "для продолжающих") - то у меня уже есть готовая программа, могу исполнить) а могу адаптировать под вас) пишите @tchernetski
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51🔥1
Снятся ли AI агентам электрические овцы?

Как вы могли заметить, у меня две «больные» темы: лимиты и агенты 😐

Про лимиты я уже написал достаточно, сейчас снова копнем агентов.

На днях вышел отличный пост от Артема, в котором я со всем согласен, кроме определения агентов.

В комментариях он пишет "Агент - это то, что функционирует агентно, т.е «принимает» решения"

У меня есть небольшой сервис, который мониторит тг-группы по ключевым словам и избранные посты скармливает AI-модельке для принятия финального решения (подходит/не подходит по заданным критериям).

Принимает ли «агент» решения — да. Можно ли его назвать агентом? Лично я не могу. Уверен, что и Артем бы не стал.

И я крепко задумался, когда и по каким критериям, можно разделить автоматизацию, которая местами вызывает модель, чтобы привнести толику магии в обработку информации и выполнение задачи, и настоящего AI-агента...

Очевидно, настоящий AI-агент, если мы рассматриваем его как замену человека (а не дополнение) должен быть в постоянном процессе решения задач, поиске проблем и да, принятии решений, какая проблема важнее, как ее решить, решена ли она полностью.

Это постоянно работающая система, грамотно управляющая сессиями моделей, собственной памятью и контекстным окном, имеющая «недостижимую цель» и непрерывно решающая задачи.

Именно поэтому в мире AI сейчас базз вокруг Ralph loop, Антропики выкатывают goal и вот это все.

Но.. если модель не работает постоянно, но выполняет свои задачи (и тоже заменяет живого сотрудника, а то и нескольких)?

А если это вообще автоматизация, созданная с помощью ИИ, но не использующая его в процессе работы, но тоже заменяющая живых работников?

И чем больше я думал на эту тему, тем больше приходил к выводу, что все это не особенно важно...

Да, важно называть автоматизации — автоматизациями, а сессии — сессиями (а не все подряд агентами), но если кому то приспичило назвать своего парсера на питоне, периодически мимолетно вызывающего модельку, чтобы чего-то там порешать — ну пусть называет.

Лучше попросим его рассказать как это реально работает 🤏

Так, за три поста я эволюционировал от "хватит во все дыры пихать AI-агентов" до "чем бы дитя не тешилось, лишь бы секреты в гитхаб не сливало".

✍️ ну а если вам вдруг не хватает в жизни и бизнесе каких-то автоматизаций и AI-агентов — пишите, обсудим @tchernetski
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍4🦄21
Изобилие, неравенство и роботы

Уже сейчас очевидно, что следующей технологией, которая изменит мир, будет роботизация. И хотя мы всё ещё до конца не изучили, как генеративный AI повлиял на рынок труда и экономику, очевидно, что эффект от роботизации будет гораздо больше — просто потому что рынок физического труда всё ещё гораздо больше рынка умственного.

Конечно, экономисты на эту тему давно уже размышляют. Дарон Аджемоглу (который недавно получил Нобеля) описывает любую автоматизацию через две силы. Displacement — машина вытесняет человека из задачи. Reinstatement — появляются новые задачи, где у человека преимущество. Весь вопрос — что быстрее.

Исторически нас всегда спасал «запасной выход»: ферму автоматизировали — ушли на завод, завод — в офис. Это и есть ответ на классический lump-of-labor: работа не кончается, она перетекает.

Но вот что озадачивает в роботизации: AI закрывает когнитивные задачи, роботы — физические. Оба выхода закрываются одновременно. Перетекать становится особо некуда.

Сценариев по сути три (кстати проголосуйте эмодзями в какой больше верите вы):

🍾 Переход в новые профессии. Маловероятный, потому что опирается на тот самый старый эффект перетекания рабочей силы (lump-of-labor). Но если допустить, что производительность растёт, а роботы не полностью автономны, то появляются профессии «наладить-обучить-надзирать робота», средний класс восстанавливается. Этакий "Дивный новый мир", только с роботами вместо гамм, дельт и эпсилонов. Гипотеза в основном опирается на предпринимательские способности людей, амплифицированные возможностями искусственного интеллекта.

🗿 Ловушка посредственности. Роботы дешёвые, но посредственные, недостаточно умные, недостаточно автономные, этакий мир "Звездных войн": людей вытесняют, а пирог почти не растёт. Технологически, опять же, сценарий маловероятный, но может быть форсирован политикой, если например роботы не будут признаны независимыми акторами, имеющими право на самостоятельную работу. Рабочих мест стало меньше, богаче не стало — но в целом все как-то "по-старому", только с роботами.

🌭 Рост экономики и рост неравенства. (базовый по мнению МВФ ). ВВП растёт, но выигрыш у владельцев капитала и технологий. Мир балансирует между ростом социального напряжения и попытками компенсировать потерю доходов населения налогами на автоматизацию и универсальным базовым доходом (УБД). Хотелось бы думать, что это может быть мир счастливых людей, не обремененных работой, но потеря самоидентификации и ощущение несправедливости, вряд ли этому способствуют. Плюс, очевидно, владельцы технологий не будут рады дополнительному налогообложению ради УБД, так что все время будут стараться урезать их.

Честно говоря, ни один из этих путей в чистом виде не привлекателен и нереалистичен. Скорее всего, нас ждет более сложное сочетание нескольких путей, где многое зависит от а) государственной политики, б) предпринимательской активности, в) скорости изменений и адаптации.

Одно очевидно (помимо того, что надо копить деньги) -- двадцатые годы могут показаться очень неплохим временем по сравнению с тридцатыми.
🌭4🗿21🍾1
Странно, что уже почти 3 недели все игнорируют новость о том, что OpenAI планирует в следующем году выпустить свой телефон (и нет, это не то, ради чего Сэм Альтман купил компанию Джонни нашего яблочного Айва).

И поразительно, что никто еще не написал в Threads, что настал конец мобильным приложениям, хотя даже в статье Т3 прямо говорится о том, что это будет post-app device. "Идея в том" -- пишут они, "чтобы все делал агентский AI, вместо того, чтобы пользователь переключался между приложениями, чтобы выполнять свои задачи".

Я думаю, что идея в другом. С одной стороны, OpenAI нужно избежать ошибки Фейсбукфона, который был просто Андроидом с натянутым поверх забагованным Фейсбуком. Нужно предложить совершенно новый опыт. И это не должно быть что-то типа "чатжипити, посчитай мои финансы" или "чатжипити, расскажи про погоду". Иными словами, одним чатом не обойдешься, нужен визуально богатый интерфейс.

Но и этого мало, нужны привычные людям сервисы: банкинг, тик-ток и инстаграм, мессенджеры. Строить еще одну экосистему разработчиков тяжело (OpenAI уже пытался, помните GPTs и вот это все), однако вот вопрос -- зачем нужны разработчики в 2026-ом году, если есть Codex.

Мне кажется, идея, которую преследует OpenAI такова - они соберут все открытые API (и договорятся с достаточным количеством закрытых), а потом предложат пользователю самому "собрать" нужный набор приложений, причем дадут возможность людям подстраивать их под себя. Это некий следующий шаг после AI-билдеров типа Rork и Replit, но с опорой на API/MCP.

Начнем с простого, 4 самых главных и часто используемых приложений на телефоне: почта, мессенджер, браузер и звонилка. "Собери мне клиент GMail, который будет мне показывать только личные письма, а все рассылки будет собирать в ежедневный дайджест". "Сделай клиент, в котором чаты Whatsapp, Telegram и iMessage с смсками будут вместе". "Сделай мне мобильный хром, только чтобы там была удобная автоматическая группировка вкладок". "Сделай звонилку с кнопками, которые не бесят, make no mistake".

Сложнее всего будет со всякой секьюрной инфраструктурой, типа банкинга, но скорее всего договорятся. Может быть даже сделают какой-то внутренний аппстор для этого, но чтоб все через Codex, чтоб все можно было кастомизировать под пользователя. Скорее всего сделают какую-то upgrade tool, чтобы подцепить старый телефон, вытянуть из него все приложения и воссоздать на новом устройстве. В общем, много чего нужно будет сделать, чтобы эта штука взлетела. И скорее всего, с первого раза может не получиться (но может с 3.5-ного раза получится?).

Но кажется нужно признать, что когда стоимость написания кода стремительно катится к нулю, интерфейсный и даже частично бэкенд-слои будут отданы на откуп пользователям. А ценность останется в моделях и токенах, в закрытых данных и платформах. Но мобильные приложения, как и SaaS-cервисы, as we know them, перестанут существовать.

На обложке: как GPT Image 2 видит телефон от OpenAI
🦄4🔥31