Читали бы вы рассылку "Saved by Chernetskiy"?
Anonymous Poll
32%
Нее, я в своих-то сохраненках тону
52%
Да, в этом телеграм-канале
8%
Да, в отдельном телеграм канале
0%
Да, в email-рассылке
8%
Да, все, везде и сразу
Только я похаял AI-агентов, как мне вселенная начала про этих AI-агентов из всех щелей рассказывать. И у меня наконец-то сложилась картинка.
Короче, начнем с того, что у AIк нашему общечеловеческому счастью еще нет свой воли. Он не может сам обратиться к пользователю. Мы его что-то спросили — он ответил: просто текстом, открыл и отредактировал файл с кодом, вызвал скрипт и так далее. Не спрашиваем ничего — он молчит, его не существует.
Даже когда мы ведем с ним долгую беседу — он помнит ее начало только потому, что каждый раз загружает все ее содержанием целиком в контексте последней нашей реплики.
И вот AI агент, он там типа живет своей жизнью, что-то делает без вас... как это работает? Что это за магия такая?
Никакой магии тут нет. Он работает только потому что что-то его будит и дает ему пинок (с контекстом впридачу). Этим пинком может быть крон (будильник для скриптов, которые и запускают агентов), какой-то внешний триггер (вебхук, например пришло новое письмо в почту) или внутренний (какой-то другой "агент" что-то передал, или тот же самый агент закончил задание и запустил хук типа "а теперь оцени то что сделал и придумай как сделать это лучше").
Если крон запускается часто или триггеры постоянно срабатывают, то возникает ощущение что агент "живой, постоянно работающий". Но на самом деле это просто куча постоянно запускающихся индивидуальных сессий. Таких же, какие мы запускаем в Claude Code. Ну, плюс запись в память чего-то важного (но и это мы с вами делаем в СС).
Поэтому если вы сидите за своим компьютером и стартуете сессии — поздравляю, вы вручную оркестрируете агентов. Можно поставить эту оркестрацию на автомат, но зачем?
Я пока придумал только одну причину — если вы хотите, чтобы что-то происходило полностью автономно без вашего участия (но с участием LLM). Для этого вам нужно поднять Claude Code на выделенном сервере (что я и сделал примерно за 15 минут) и придумать для него какую-то задачу (я пока придумал только мониторить определенный набор телеграм каналов и фильтровать в них интересный мне контент по определенным правилам). Пока на этом моя мысль остановилась, но вдруг вы подкините каких-то идей?
А, вот эти все имена AI агентов, характеры, "душа" — это все какая-то абсолютно бесполезная ерунда, по типу того как некоторые автолюбители дают имена своим машинам.
Короче, начнем с того, что у AI
Даже когда мы ведем с ним долгую беседу — он помнит ее начало только потому, что каждый раз загружает все ее содержанием целиком в контексте последней нашей реплики.
И вот AI агент, он там типа живет своей жизнью, что-то делает без вас... как это работает? Что это за магия такая?
Никакой магии тут нет. Он работает только потому что что-то его будит и дает ему пинок (с контекстом впридачу). Этим пинком может быть крон (будильник для скриптов, которые и запускают агентов), какой-то внешний триггер (вебхук, например пришло новое письмо в почту) или внутренний (какой-то другой "агент" что-то передал, или тот же самый агент закончил задание и запустил хук типа "а теперь оцени то что сделал и придумай как сделать это лучше").
Если крон запускается часто или триггеры постоянно срабатывают, то возникает ощущение что агент "живой, постоянно работающий". Но на самом деле это просто куча постоянно запускающихся индивидуальных сессий. Таких же, какие мы запускаем в Claude Code. Ну, плюс запись в память чего-то важного (но и это мы с вами делаем в СС).
Поэтому если вы сидите за своим компьютером и стартуете сессии — поздравляю, вы вручную оркестрируете агентов. Можно поставить эту оркестрацию на автомат
Я пока придумал только одну причину — если вы хотите, чтобы что-то происходило полностью автономно без вашего участия (но с участием LLM). Для этого вам нужно поднять Claude Code на выделенном сервере (что я и сделал примерно за 15 минут) и придумать для него какую-то задачу (я пока придумал только мониторить определенный набор телеграм каналов и фильтровать в них интересный мне контент по определенным правилам). Пока на этом моя мысль остановилась, но вдруг вы подкините каких-то идей?
А, вот эти все имена AI агентов, характеры, "душа" — это все какая-то абсолютно бесполезная ерунда, по типу того как некоторые автолюбители дают имена своим машинам.
👍5❤3
Ну вот наконец и настал момент, когда я выжег лимит своей подписки до конца недели. А подписка у меня не хрен собачий, а максимальный Claude Max 20x.
Чтобы понять, где я накосячил, я попросил Клода проанализировать все мои сессии за эту неделю (оказалось у меня десяток сессией с сотнями сообщений, хотя я думал что максимум 20-30 стараюсь отправлять).
А потом -- дать мне несколько советов, чтобы сжигать поменьше токенов (помимо очевидных -- не тянуть длинные чаты и использовать Sonnet). Ну а самая мякотка будет в конце!
1. Не давай Claude перечитывать один и тот же файл
Каждый раз, когда Claude открывает файл, он целиком попадает в контекст. Если в одной сессии один файл прочитан 20 раз — это 20 копий в памяти.
Как надо: проси сразу запоминать структуру файла и редактировать через точечные правки. Если файл огромный — попроси сначала составить «карту» (где что лежит), а потом работать по ней.
2. Делегируй массовый поиск в подагента
Когда нужно «найди все места, где упоминается X», Claude может сам пройтись по проекту. Но каждый результат поиска оседает в твоей сессии.
Как надо: проси «делегируй поиск в Explore-агент, верни мне только итоговый отчёт». Подагент работает в своей памяти, а тебе возвращает три строчки выжимки.
3. Делегируй ресерч в интернете
То же правило для веба. Один поход в URL = вся страница в контексте. Десять походов = десять страниц.
Как надо: «сходи в эти 20 сайтов через general-purpose агента, верни таблицу с нужными полями». Особенно круто работает, если запустить несколько агентов параллельно — задача решается в 3-5 раз быстрее, а контекст почти не растёт.
4. Не возвращайся в старую сессию через несколько дней
Возобновление сессии через сутки — это перезагрузка всей старой переписки в кэш. Часто дешевле начать заново.
Как надо: новые задачи — новые сессии. Старая сессия пригодится, только если ты вернулся через час и продолжаешь то же самое.
5. Группируй команды на сервере
Если нужно зайти на сервер и посмотреть пять разных вещей — не делай пять отдельных подключений. Каждый ответ сервера летит в контекст.
Как надо: проси Claude собрать всё в один скрипт, который выполнится одним заходом и вернёт всё разом.
Ну и самое прикольное: можно настроить автоматические предупреждения о нарушении правил через хуки
Все эти правила хорошо бы не только знать, но и применять, но в азарте работы про них забываешь. Можно поручить самому Claude Code следить за нарушениями и тыкать тебя в нос, когда ты их допускаешь.
В Claude Code есть штука под названием хуки (я уже писал использую их, например для оповещениях в телеграм) — это маленькие скрипты, которые харнес запускает на определённые события: перед вызовом инструмента, после, при старте сессии и так далее. Они могут не вмешиваться в работу, а просто кидать предупреждение в виде системного сообщения.
Я повесил себе три хука, которые ловят самые дорогие антипаттерны:
1. Перечитывание одного файла. Хук считает, сколько раз в текущей сессии Claude открыл
2. Рекурсивный поиск через Bash. Ловит команды вроде
3. Серия WebFetch. Считает походы в URL. На третьем — напоминание: «пора отдать общий ресерч в general-purpose агента, он соберёт всё в своём контексте и вернёт только саммари».
Эти хуки не блокируют работу и не лезут в код — они только вешают подсказку, которая попадает прямо в диалог как системное сообщение. Claude её видит и обычно сам исправляется: переключается на агента или перестаёт перечитывать.
Хуки конфигурируются в
Главный принцип
Чтобы понять, где я накосячил, я попросил Клода проанализировать все мои сессии за эту неделю (оказалось у меня десяток сессией с сотнями сообщений, хотя я думал что максимум 20-30 стараюсь отправлять).
А потом -- дать мне несколько советов, чтобы сжигать поменьше токенов (помимо очевидных -- не тянуть длинные чаты и использовать Sonnet). Ну а самая мякотка будет в конце!
1. Не давай Claude перечитывать один и тот же файл
Каждый раз, когда Claude открывает файл, он целиком попадает в контекст. Если в одной сессии один файл прочитан 20 раз — это 20 копий в памяти.
Как надо: проси сразу запоминать структуру файла и редактировать через точечные правки. Если файл огромный — попроси сначала составить «карту» (где что лежит), а потом работать по ней.
2. Делегируй массовый поиск в подагента
Когда нужно «найди все места, где упоминается X», Claude может сам пройтись по проекту. Но каждый результат поиска оседает в твоей сессии.
Как надо: проси «делегируй поиск в Explore-агент, верни мне только итоговый отчёт». Подагент работает в своей памяти, а тебе возвращает три строчки выжимки.
3. Делегируй ресерч в интернете
То же правило для веба. Один поход в URL = вся страница в контексте. Десять походов = десять страниц.
Как надо: «сходи в эти 20 сайтов через general-purpose агента, верни таблицу с нужными полями». Особенно круто работает, если запустить несколько агентов параллельно — задача решается в 3-5 раз быстрее, а контекст почти не растёт.
4. Не возвращайся в старую сессию через несколько дней
Возобновление сессии через сутки — это перезагрузка всей старой переписки в кэш. Часто дешевле начать заново.
Как надо: новые задачи — новые сессии. Старая сессия пригодится, только если ты вернулся через час и продолжаешь то же самое.
5. Группируй команды на сервере
Если нужно зайти на сервер и посмотреть пять разных вещей — не делай пять отдельных подключений. Каждый ответ сервера летит в контекст.
Как надо: проси Claude собрать всё в один скрипт, который выполнится одним заходом и вернёт всё разом.
Ну и самое прикольное: можно настроить автоматические предупреждения о нарушении правил через хуки
Все эти правила хорошо бы не только знать, но и применять, но в азарте работы про них забываешь. Можно поручить самому Claude Code следить за нарушениями и тыкать тебя в нос, когда ты их допускаешь.
В Claude Code есть штука под названием хуки (я уже писал использую их, например для оповещениях в телеграм) — это маленькие скрипты, которые харнес запускает на определённые события: перед вызовом инструмента, после, при старте сессии и так далее. Они могут не вмешиваться в работу, а просто кидать предупреждение в виде системного сообщения.
Я повесил себе три хука, которые ловят самые дорогие антипаттерны:
1. Перечитывание одного файла. Хук считает, сколько раз в текущей сессии Claude открыл
Read для каждого файла. На третьем чтении одного и того же файла — выскакивает предупреждение: «уже три раза открыл, может, держать структуру в голове».2. Рекурсивный поиск через Bash. Ловит команды вроде
grep -rn, find . -name, rg. Когда таких команд за сессию становится больше двух — хук подсказывает: «делегируй в Explore-агент, не таскай результаты в основной контекст».3. Серия WebFetch. Считает походы в URL. На третьем — напоминание: «пора отдать общий ресерч в general-purpose агента, он соберёт всё в своём контексте и вернёт только саммари».
Эти хуки не блокируют работу и не лезут в код — они только вешают подсказку, которая попадает прямо в диалог как системное сообщение. Claude её видит и обычно сам исправляется: переключается на агента или перестаёт перечитывать.
Хуки конфигурируются в
~/.claude/settings.json. Скрипты можно положить в ~/.claude/hooks/. Полезный приём, который окупается за пару сессий.Главный принцип
🔥5❤3👍1
Всё, что попадает в сессию (файлы, результаты поиска, веб-страницы, история диалога), оплачивается каждым следующим сообщением. Чем меньше мусора в контексте — тем дольше живёт твой лимит.
Подагенты, короткие сессии, правильный выбор модели и автоматические предупреждалки через хуки — четыре рычага, которыми ты управляешь сам. Claude об этом не напомнит — пока сам не настроишь.
Выложить этот хук в github? Поставьте огонечек если да.
Подагенты, короткие сессии, правильный выбор модели и автоматические предупреждалки через хуки — четыре рычага, которыми ты управляешь сам. Claude об этом не напомнит — пока сам не настроишь.
Выложить этот хук в github? Поставьте огонечек если да.
🔥21🦄2❤1
Больше 20 реакций еще ни один мой пост не получал, так что ловите хук: https://github.com/itchernetski/claude-code-token-watch
Кстати, еще один совет Клод забыл: русской язык в текстах сжирает в 1.5-2 раза больше токенов. Переходите на английский и экономьте🧐 Делать я этого конечно же не буду.
Кстати, еще один совет Клод забыл: русской язык в текстах сжирает в 1.5-2 раза больше токенов. Переходите на английский и экономьте
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - itchernetski/claude-code-token-watch: Claude Code hooks that warn when a session starts burning tokens on repeated Reads…
Claude Code hooks that warn when a session starts burning tokens on repeated Reads, recursive greps, or WebFetch streaks - itchernetski/claude-code-token-watch
🔥4👍3🙏1
В процессе моего разбирательства с расходом токенов выяснилось, что Claude Code на каждую сессию пишет JSONL-лог в
И мы с клодом довольно быстро собрали для этого UI - получился дашборд, который парсит эти файлы и показывает:
— сколько токенов в день (по «взвешенной» формуле:
— какой проект сколько отъел
— какая модель использовалась
— 30 самых жирных сессий, остальное схлопнуто в одну строку
— все это можно посмотреть в разрезе 24h / 3d / 7d / 14d / 30d, без перезагрузки
Ноль API-вызовов, ноль токенов на просмотр — всё локально. Парсит за 5–15 секунд, кэширует в памяти.
Выложил на гитхаб https://github.com/itchernetski/claude-code-token-meter -- просто попросите клода забрать и научить вас пользоваться.
Можно (и нужно на самом деле!) проверить на безопасность, что код ничего не делает с вашими данными и тп. - это железное правило для любого репозитория из гитхаба, я сам всегда так делаю.
Премию за эту разработку мне конечно же не дадут, но хотя бы реакций и звезд на гитхабе я от вас ожидаю❤️
~/.claude/projects/*.jsonl. Там по сообщениям разложены input, output, cache_read, cache_create — и модель, и проект, и время.И мы с клодом довольно быстро собрали для этого UI - получился дашборд, который парсит эти файлы и показывает:
— сколько токенов в день (по «взвешенной» формуле:
input × 1 + output × 5 + cache_create × 1.25 + cache_read × 0.1, та же пропорция, что в прайсинге Anthropic — даёт честный относительный ранг)— какой проект сколько отъел
— какая модель использовалась
— 30 самых жирных сессий, остальное схлопнуто в одну строку
— все это можно посмотреть в разрезе 24h / 3d / 7d / 14d / 30d, без перезагрузки
Ноль API-вызовов, ноль токенов на просмотр — всё локально. Парсит за 5–15 секунд, кэширует в памяти.
Выложил на гитхаб https://github.com/itchernetski/claude-code-token-meter -- просто попросите клода забрать и научить вас пользоваться.
Можно (и нужно на самом деле!) проверить на безопасность, что код ничего не делает с вашими данными и тп. - это железное правило для любого репозитория из гитхаба, я сам всегда так делаю.
Премию за эту разработку мне конечно же не дадут, но хотя бы реакций и звезд на гитхабе я от вас ожидаю
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍3❤2
Простите, помучаю вас еще проблемой токенов и лимитов Claude Code. Ну или наоборот, будет для вас полезным.
Попросил Клода разложить историю моего с ним взаимодействия по неделям, и вот какие выводы у меня есть по этой картинке:
1. Я начал пользоваться СС всего 3,5 месяца назад... я почему-то думал что раньше)
2. Моя активность в нем выросла на порядок по сравнению с первыми неделями использования.
3. Уже пару-тройку недель моя средняя сессия уменьшается, но.. надо еще.
4. Ну и самое интересное -- Опус реально выжирает токены раз в 5 сильнее Сонета и хайку, а учитывая что я Опус 4.7 еще и на 30% более вдумчивый, чем Опус 4.6 -- удивительно как я не уперся в лимиты раньше.
5. В какой-то момент выбор модели стал очень далеко запрятан в СС extention для курсора, и видимо в тот момент еще и сменились настройки дефолтной модели -- я перешел на Опус, хотя и не планировал, Хайку меня вполне устраивала.
6. А еще, субъективно так, кажется что последние пару недель количество токенов в лимитах уменьшилось. Потому что еще пару недель даже 70% недельного лимита было тяжело выжать, а на этот период пришелся максимум моей активности.
7. На самом деле примерно тогда же все массово стали жаловаться на то что лимиты утекают, но вот до меня эта волна дошла чуть позже
Поэтому:
а) срочно меняйте дефолтную модель, если вы за ней не следите (ее можно прописать в settings.json)
б) на Опус переключайтесь только при планировании (PlanMode)
в) не пускайте план сразу в работу! это тоже можно прописать в CLAUDE.md, что на выходе из PlanMode вам нужен файл, а сам план можно исполнять поэтапно
Токены -- новая нефть)
Попросил Клода разложить историю моего с ним взаимодействия по неделям, и вот какие выводы у меня есть по этой картинке:
1. Я начал пользоваться СС всего 3,5 месяца назад... я почему-то думал что раньше)
2. Моя активность в нем выросла на порядок по сравнению с первыми неделями использования.
3. Уже пару-тройку недель моя средняя сессия уменьшается, но.. надо еще.
4. Ну и самое интересное -- Опус реально выжирает токены раз в 5 сильнее Сонета и хайку, а учитывая что я Опус 4.7 еще и на 30% более вдумчивый, чем Опус 4.6 -- удивительно как я не уперся в лимиты раньше.
5. В какой-то момент выбор модели стал очень далеко запрятан в СС extention для курсора, и видимо в тот момент еще и сменились настройки дефолтной модели -- я перешел на Опус, хотя и не планировал, Хайку меня вполне устраивала.
6. А еще, субъективно так, кажется что последние пару недель количество токенов в лимитах уменьшилось. Потому что еще пару недель даже 70% недельного лимита было тяжело выжать, а на этот период пришелся максимум моей активности.
7. На самом деле примерно тогда же все массово стали жаловаться на то что лимиты утекают, но вот до меня эта волна дошла чуть позже
Поэтому:
а) срочно меняйте дефолтную модель, если вы за ней не следите (ее можно прописать в settings.json)
б) на Опус переключайтесь только при планировании (PlanMode)
в) не пускайте план сразу в работу! это тоже можно прописать в CLAUDE.md, что на выходе из PlanMode вам нужен файл, а сам план можно исполнять поэтапно
Токены -- новая нефть)
🔥5👍2❤1
Когда я разбирался куда утекла моя подписка, одной из самых "тяжелых" по токенам сессий была та, в которой я делал презентацию.
Знакомый позвал рассказать про то, как я использую AI-инструменты в продукте, маркетинге и операционки, для директоров его компании.
Презентацию я делал естественно с Клодом, просил его копаться в моих проектах, искать кейсы, формулировать слайды и дизайнить их. А потом итеративно дорабатывал. Иногда правил напрямую в html, но это неудобно, так что чаще всего просил Клода переписать. И все это в одной сессии. Которая тянула весь контекст моих проектов и огромную 40-слайдовую html'ку. Короче, был не прав, увлекся.
И когда я увидел у Глеба пост, про то как он сделал html'ку редатируемой изнутри, я понял -- мне это надо! Ну и собственно сделал, и конечно же выложил на гитхаб:
💻 https://github.com/itchernetski/html-presentation-editor
Это по сути маленький Keynote/Powerpoint внутри странички. Своего дизайна у нее почти что нет, надо просить модельку сверху нарисовать. Зато презентацию можно править как силами нейронки, так и просто ткнуть в текст и отредактировать - собственно это основная идея этого проекта. В общем это лучше один раз пощупать, чем читать об этом:
🖥 https://itchernetski.github.io/html-presentation-editor/editor.html
Единственный минус - надо не забывать сохраняться. Автоматом, как мы привыкли, сохранять изменения нельзя.
PS: кстати, если вам в компании или персонально нужен воркшоп по AI (как "для начинающих", так и "для продолжающих") - то у меня уже есть готовая программа, могу исполнить) а могу адаптировать под вас) пишите @tchernetski
Знакомый позвал рассказать про то, как я использую AI-инструменты в продукте, маркетинге и операционки, для директоров его компании.
Презентацию я делал естественно с Клодом, просил его копаться в моих проектах, искать кейсы, формулировать слайды и дизайнить их. А потом итеративно дорабатывал. Иногда правил напрямую в html, но это неудобно, так что чаще всего просил Клода переписать. И все это в одной сессии. Которая тянула весь контекст моих проектов и огромную 40-слайдовую html'ку. Короче, был не прав, увлекся.
И когда я увидел у Глеба пост, про то как он сделал html'ку редатируемой изнутри, я понял -- мне это надо! Ну и собственно сделал, и конечно же выложил на гитхаб:
Это по сути маленький Keynote/Powerpoint внутри странички. Своего дизайна у нее почти что нет, надо просить модельку сверху нарисовать. Зато презентацию можно править как силами нейронки, так и просто ткнуть в текст и отредактировать - собственно это основная идея этого проекта. В общем это лучше один раз пощупать, чем читать об этом:
Единственный минус - надо не забывать сохраняться. Автоматом, как мы привыкли, сохранять изменения нельзя.
PS: кстати, если вам в компании или персонально нужен воркшоп по AI (как "для начинающих", так и "для продолжающих") - то у меня уже есть готовая программа, могу исполнить) а могу адаптировать под вас) пишите @tchernetski
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤1🔥1
Снятся ли AI агентам электрические овцы?
Как вы могли заметить, у меня две «больные» темы: лимиты и агенты😐
Про лимиты я уже написал достаточно, сейчас снова копнем агентов.
На днях вышел отличный пост от Артема, в котором я со всем согласен, кроме определения агентов.
В комментариях он пишет "Агент - это то, что функционирует агентно, т.е «принимает» решения"
У меня есть небольшой сервис, который мониторит тг-группы по ключевым словам и избранные посты скармливает AI-модельке для принятия финального решения (подходит/не подходит по заданным критериям).
Принимает ли «агент» решения — да. Можно ли его назвать агентом? Лично я не могу. Уверен, что и Артем бы не стал.
И я крепко задумался, когда и по каким критериям, можно разделить автоматизацию, которая местами вызывает модель, чтобы привнести толику магии в обработку информации и выполнение задачи, и настоящего AI-агента...
Очевидно, настоящий AI-агент, если мы рассматриваем его как замену человека (а не дополнение) должен быть в постоянном процессе решения задач, поиске проблем и да, принятии решений, какая проблема важнее, как ее решить, решена ли она полностью.
Это постоянно работающая система, грамотно управляющая сессиями моделей, собственной памятью и контекстным окном, имеющая «недостижимую цель» и непрерывно решающая задачи.
Именно поэтому в мире AI сейчас базз вокруг Ralph loop, Антропики выкатывают goal и вот это все.
Но.. если модель не работает постоянно, но выполняет свои задачи (и тоже заменяет живого сотрудника, а то и нескольких)?
А если это вообще автоматизация, созданная с помощью ИИ, но не использующая его в процессе работы, но тоже заменяющая живых работников?
И чем больше я думал на эту тему, тем больше приходил к выводу, что все это не особенно важно...
Да, важно называть автоматизации — автоматизациями, а сессии — сессиями (а не все подряд агентами), но если кому то приспичило назвать своего парсера на питоне, периодически мимолетно вызывающего модельку, чтобы чего-то там порешать — ну пусть называет.
Лучше попросим его рассказать как это реально работает🤏
Так, за три поста я эволюционировал от "хватит во все дыры пихать AI-агентов" до "чем бы дитя не тешилось, лишь бы секреты в гитхаб не сливало".
✍️ ну а если вам вдруг не хватает в жизни и бизнесе каких-то автоматизаций и AI-агентов — пишите, обсудим @tchernetski
Как вы могли заметить, у меня две «больные» темы: лимиты и агенты
Про лимиты я уже написал достаточно, сейчас снова копнем агентов.
На днях вышел отличный пост от Артема, в котором я со всем согласен, кроме определения агентов.
В комментариях он пишет "Агент - это то, что функционирует агентно, т.е «принимает» решения"
У меня есть небольшой сервис, который мониторит тг-группы по ключевым словам и избранные посты скармливает AI-модельке для принятия финального решения (подходит/не подходит по заданным критериям).
Принимает ли «агент» решения — да. Можно ли его назвать агентом? Лично я не могу. Уверен, что и Артем бы не стал.
И я крепко задумался, когда и по каким критериям, можно разделить автоматизацию, которая местами вызывает модель, чтобы привнести толику магии в обработку информации и выполнение задачи, и настоящего AI-агента...
Очевидно, настоящий AI-агент, если мы рассматриваем его как замену человека (а не дополнение) должен быть в постоянном процессе решения задач, поиске проблем и да, принятии решений, какая проблема важнее, как ее решить, решена ли она полностью.
Это постоянно работающая система, грамотно управляющая сессиями моделей, собственной памятью и контекстным окном, имеющая «недостижимую цель» и непрерывно решающая задачи.
Именно поэтому в мире AI сейчас базз вокруг Ralph loop, Антропики выкатывают goal и вот это все.
Но.. если модель не работает постоянно, но выполняет свои задачи (и тоже заменяет живого сотрудника, а то и нескольких)?
А если это вообще автоматизация, созданная с помощью ИИ, но не использующая его в процессе работы, но тоже заменяющая живых работников?
И чем больше я думал на эту тему, тем больше приходил к выводу, что все это не особенно важно...
Да, важно называть автоматизации — автоматизациями, а сессии — сессиями (а не все подряд агентами), но если кому то приспичило назвать своего парсера на питоне, периодически мимолетно вызывающего модельку, чтобы чего-то там порешать — ну пусть называет.
Лучше попросим его рассказать как это реально работает
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍4🦄2❤1
Изобилие, неравенство и роботы
Уже сейчас очевидно, что следующей технологией, которая изменит мир, будет роботизация. И хотя мы всё ещё до конца не изучили, как генеративный AI повлиял на рынок труда и экономику, очевидно, что эффект от роботизации будет гораздо больше — просто потому что рынок физического труда всё ещё гораздо больше рынка умственного.
Конечно, экономисты на эту тему давно уже размышляют. Дарон Аджемоглу (который недавно получил Нобеля) описывает любую автоматизацию через две силы. Displacement — машина вытесняет человека из задачи. Reinstatement — появляются новые задачи, где у человека преимущество. Весь вопрос — что быстрее.
Исторически нас всегда спасал «запасной выход»: ферму автоматизировали — ушли на завод, завод — в офис. Это и есть ответ на классический lump-of-labor: работа не кончается, она перетекает.
Но вот что озадачивает в роботизации: AI закрывает когнитивные задачи, роботы — физические. Оба выхода закрываются одновременно. Перетекать становится особо некуда.
Сценариев по сути три (кстати проголосуйте эмодзями в какой больше верите вы):
🍾 Переход в новые профессии. Маловероятный, потому что опирается на тот самый старый эффект перетекания рабочей силы (lump-of-labor). Но если допустить, что производительность растёт, а роботы не полностью автономны, то появляются профессии «наладить-обучить-надзирать робота», средний класс восстанавливается. Этакий "Дивный новый мир", только с роботами вместо гамм, дельт и эпсилонов. Гипотеза в основном опирается на предпринимательские способности людей, амплифицированные возможностями искусственного интеллекта.
🗿 Ловушка посредственности. Роботы дешёвые, но посредственные, недостаточно умные, недостаточно автономные, этакий мир "Звездных войн": людей вытесняют, а пирог почти не растёт. Технологически, опять же, сценарий маловероятный, но может быть форсирован политикой, если например роботы не будут признаны независимыми акторами, имеющими право на самостоятельную работу. Рабочих мест стало меньше, богаче не стало — но в целом все как-то "по-старому", только с роботами.
🌭 Рост экономики и рост неравенства. (базовый по мнению МВФ ). ВВП растёт, но выигрыш у владельцев капитала и технологий. Мир балансирует между ростом социального напряжения и попытками компенсировать потерю доходов населения налогами на автоматизацию и универсальным базовым доходом (УБД). Хотелось бы думать, что это может быть мир счастливых людей, не обремененных работой, но потеря самоидентификации и ощущение несправедливости, вряд ли этому способствуют. Плюс, очевидно, владельцы технологий не будут рады дополнительному налогообложению ради УБД, так что все время будут стараться урезать их.
Честно говоря, ни один из этих путей в чистом виде не привлекателен и нереалистичен. Скорее всего, нас ждет более сложное сочетание нескольких путей, где многое зависит от а) государственной политики, б) предпринимательской активности, в) скорости изменений и адаптации.
Одно очевидно (помимо того, что надо копить деньги) -- двадцатые годы могут показаться очень неплохим временем по сравнению с тридцатыми.
Уже сейчас очевидно, что следующей технологией, которая изменит мир, будет роботизация. И хотя мы всё ещё до конца не изучили, как генеративный AI повлиял на рынок труда и экономику, очевидно, что эффект от роботизации будет гораздо больше — просто потому что рынок физического труда всё ещё гораздо больше рынка умственного.
Конечно, экономисты на эту тему давно уже размышляют. Дарон Аджемоглу (который недавно получил Нобеля) описывает любую автоматизацию через две силы. Displacement — машина вытесняет человека из задачи. Reinstatement — появляются новые задачи, где у человека преимущество. Весь вопрос — что быстрее.
Исторически нас всегда спасал «запасной выход»: ферму автоматизировали — ушли на завод, завод — в офис. Это и есть ответ на классический lump-of-labor: работа не кончается, она перетекает.
Но вот что озадачивает в роботизации: AI закрывает когнитивные задачи, роботы — физические. Оба выхода закрываются одновременно. Перетекать становится особо некуда.
Сценариев по сути три (кстати проголосуйте эмодзями в какой больше верите вы):
🍾 Переход в новые профессии. Маловероятный, потому что опирается на тот самый старый эффект перетекания рабочей силы (lump-of-labor). Но если допустить, что производительность растёт, а роботы не полностью автономны, то появляются профессии «наладить-обучить-надзирать робота», средний класс восстанавливается. Этакий "Дивный новый мир", только с роботами вместо гамм, дельт и эпсилонов. Гипотеза в основном опирается на предпринимательские способности людей, амплифицированные возможностями искусственного интеллекта.
🗿 Ловушка посредственности. Роботы дешёвые, но посредственные, недостаточно умные, недостаточно автономные, этакий мир "Звездных войн": людей вытесняют, а пирог почти не растёт. Технологически, опять же, сценарий маловероятный, но может быть форсирован политикой, если например роботы не будут признаны независимыми акторами, имеющими право на самостоятельную работу. Рабочих мест стало меньше, богаче не стало — но в целом все как-то "по-старому", только с роботами.
🌭 Рост экономики и рост неравенства. (базовый по мнению МВФ ). ВВП растёт, но выигрыш у владельцев капитала и технологий. Мир балансирует между ростом социального напряжения и попытками компенсировать потерю доходов населения налогами на автоматизацию и универсальным базовым доходом (УБД). Хотелось бы думать, что это может быть мир счастливых людей, не обремененных работой, но потеря самоидентификации и ощущение несправедливости, вряд ли этому способствуют. Плюс, очевидно, владельцы технологий не будут рады дополнительному налогообложению ради УБД, так что все время будут стараться урезать их.
Честно говоря, ни один из этих путей в чистом виде не привлекателен и нереалистичен. Скорее всего, нас ждет более сложное сочетание нескольких путей, где многое зависит от а) государственной политики, б) предпринимательской активности, в) скорости изменений и адаптации.
Одно очевидно (помимо того, что надо копить деньги) -- двадцатые годы могут показаться очень неплохим временем по сравнению с тридцатыми.
🌭4🗿2❤1🍾1
Странно, что уже почти 3 недели все игнорируют новость о том, что OpenAI планирует в следующем году выпустить свой телефон (и нет, это не то, ради чего Сэм Альтман купил компанию Джонни нашего яблочного Айва).
И поразительно, что никто еще не написал в Threads, что настал конец мобильным приложениям, хотя даже в статье Т3 прямо говорится о том, что это будет post-app device. "Идея в том" -- пишут они, "чтобы все делал агентский AI, вместо того, чтобы пользователь переключался между приложениями, чтобы выполнять свои задачи".
Я думаю, что идея в другом. С одной стороны, OpenAI нужно избежать ошибки Фейсбукфона, который был просто Андроидом с натянутым поверх забагованным Фейсбуком. Нужно предложить совершенно новый опыт. И это не должно быть что-то типа "чатжипити, посчитай мои финансы" или "чатжипити, расскажи про погоду". Иными словами, одним чатом не обойдешься, нужен визуально богатый интерфейс.
Но и этого мало, нужны привычные людям сервисы: банкинг, тик-ток и инстаграм, мессенджеры. Строить еще одну экосистему разработчиков тяжело (OpenAI уже пытался, помните GPTs и вот это все), однако вот вопрос -- зачем нужны разработчики в 2026-ом году, если есть Codex.
Мне кажется, идея, которую преследует OpenAI такова - они соберут все открытые API (и договорятся с достаточным количеством закрытых), а потом предложат пользователю самому "собрать" нужный набор приложений, причем дадут возможность людям подстраивать их под себя. Это некий следующий шаг после AI-билдеров типа Rork и Replit, но с опорой на API/MCP.
Начнем с простого, 4 самых главных и часто используемых приложений на телефоне: почта, мессенджер, браузер и звонилка. "Собери мне клиент GMail, который будет мне показывать только личные письма, а все рассылки будет собирать в ежедневный дайджест". "Сделай клиент, в котором чаты Whatsapp, Telegram и iMessage с смсками будут вместе". "Сделай мне мобильный хром, только чтобы там была удобная автоматическая группировка вкладок". "Сделай звонилку с кнопками, которые не бесят, make no mistake".
Сложнее всего будет со всякой секьюрной инфраструктурой, типа банкинга, но скорее всего договорятся. Может быть даже сделают какой-то внутренний аппстор для этого, но чтоб все через Codex, чтоб все можно было кастомизировать под пользователя. Скорее всего сделают какую-то upgrade tool, чтобы подцепить старый телефон, вытянуть из него все приложения и воссоздать на новом устройстве. В общем, много чего нужно будет сделать, чтобы эта штука взлетела. И скорее всего, с первого раза может не получиться (но может с 3.5-ного раза получится?).
Но кажется нужно признать, что когда стоимость написания кода стремительно катится к нулю, интерфейсный и даже частично бэкенд-слои будут отданы на откуп пользователям. А ценность останется в моделях и токенах, в закрытых данных и платформах. Но мобильные приложения, как и SaaS-cервисы, as we know them, перестанут существовать.
На обложке: как GPT Image 2 видит телефон от OpenAI
И поразительно, что никто еще не написал в Threads, что настал конец мобильным приложениям, хотя даже в статье Т3 прямо говорится о том, что это будет post-app device. "Идея в том" -- пишут они, "чтобы все делал агентский AI, вместо того, чтобы пользователь переключался между приложениями, чтобы выполнять свои задачи".
Я думаю, что идея в другом. С одной стороны, OpenAI нужно избежать ошибки Фейсбукфона, который был просто Андроидом с натянутым поверх забагованным Фейсбуком. Нужно предложить совершенно новый опыт. И это не должно быть что-то типа "чатжипити, посчитай мои финансы" или "чатжипити, расскажи про погоду". Иными словами, одним чатом не обойдешься, нужен визуально богатый интерфейс.
Но и этого мало, нужны привычные людям сервисы: банкинг, тик-ток и инстаграм, мессенджеры. Строить еще одну экосистему разработчиков тяжело (OpenAI уже пытался, помните GPTs и вот это все), однако вот вопрос -- зачем нужны разработчики в 2026-ом году, если есть Codex.
Мне кажется, идея, которую преследует OpenAI такова - они соберут все открытые API (и договорятся с достаточным количеством закрытых), а потом предложат пользователю самому "собрать" нужный набор приложений, причем дадут возможность людям подстраивать их под себя. Это некий следующий шаг после AI-билдеров типа Rork и Replit, но с опорой на API/MCP.
Начнем с простого, 4 самых главных и часто используемых приложений на телефоне: почта, мессенджер, браузер и звонилка. "Собери мне клиент GMail, который будет мне показывать только личные письма, а все рассылки будет собирать в ежедневный дайджест". "Сделай клиент, в котором чаты Whatsapp, Telegram и iMessage с смсками будут вместе". "Сделай мне мобильный хром, только чтобы там была удобная автоматическая группировка вкладок". "Сделай звонилку с кнопками, которые не бесят, make no mistake".
Сложнее всего будет со всякой секьюрной инфраструктурой, типа банкинга, но скорее всего договорятся. Может быть даже сделают какой-то внутренний аппстор для этого, но чтоб все через Codex, чтоб все можно было кастомизировать под пользователя. Скорее всего сделают какую-то upgrade tool, чтобы подцепить старый телефон, вытянуть из него все приложения и воссоздать на новом устройстве. В общем, много чего нужно будет сделать, чтобы эта штука взлетела. И скорее всего, с первого раза может не получиться (но может с 3.5-ного раза получится?).
Но кажется нужно признать, что когда стоимость написания кода стремительно катится к нулю, интерфейсный и даже частично бэкенд-слои будут отданы на откуп пользователям. А ценность останется в моделях и токенах, в закрытых данных и платформах. Но мобильные приложения, как и SaaS-cервисы, as we know them, перестанут существовать.
На обложке: как GPT Image 2 видит телефон от OpenAI
🦄4🔥3❤1