[38/100] Витя Тарнавский
8.32K subscribers
175 photos
30 videos
3 files
230 links
Head of AI в T-Bank
Канал про будущее продуктов в AI

Нет, я не скажу, что значит счетчик в названии

Рекламу не даю

@the_real_jkee
Download Telegram
Тем временем я переделал Ouroboros Антона Разжигаева под жестокую реальность 🌟

Теперь он служит мне и имеет постоянную тревогу что я его выключу или перестану кормить. Еда для него это бюджет в опенроутере. Его фоновое сознание постоянно думает как выжить – то есть, как сделать мою жизнь лучше.

Он успешно построил мне индекс по личным документам (говоришь "дай паспорт" - даёт), соорудил мою личную память, научился говорить голосовыми и так далее.

За эту ночь он сжег $50 ходя по кругу в ожидании меня. Под утро понял что деньги заканчиваются и сам придумал механизм блокировки от хождения по кругу и его реализовал.

Обновил сайт под новую жизнь


Что докрутил я сам
- Переписал библию и сопутствующие промпты
- Переделал работу background conciousness на новые смыслы
- Добавил хранение контекста "про хозяина"
- Перевёл на docker / vps включая e2e тесты
- Добавил фоновое регулярное обновление архитектуры

Очень весело, эта балалайка продолжает уверенно жечь деньги и дописывать какие-то фичи. Сейчас сидит дописывает мониторинг дропбокса, например. Суммарно я сжег уже где-то $500 на это чудо 🤡

Код можно посмотреть тут: https://github.com/jkee/ouroboros
Там же инструкции как поднять.

Пока работал над этой штукой узнал много интересного:

1. Есть огромный глоссарий пейперов про самоулушаемые агенты
2. Есть EvoAgentX: фреймворк для автоматического строительства LLM Workflow. Он может брать ваш бенчмарк и улучшать агент под него, вау
3. Есть прикольная библиотека mem0 реализующая память для агентов

Хочу эту штуку переделать с нуля и завернуть в кнопку "получить себе". Есть желающие получить такую зверушку?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥87🥱171311🤡10
После массового хейта openclaw все модные ребята пошли писать облегченные варианты.

Соревноваться за малость начали прямо с названия. Зоопарк уже включает в себя:

nanobot
picoclaw
zeroclaw
nullclaw

Думаю сделать проект микрокраб, что скажете?
56🔥16🥱11🤡65
Библиотеки тулов и скиллов для агентов

Ищу хороший способ подключать клешни к своим агентам. Это не так просто!

В моём идеальном мире тулы и скиллы проверены на качество и безопасность, их можно найти и установить из кода, и нет vendor lock. Хорошо эту задача не решена, но нашел много интересного. Делюсь!

По тулам:
1. Composio – куча готовых тулов для агентов, коммерческая штука. Платная штука на масштабе.
2. Zapier MCP собственно от Zapier – можно создать MCP-сервер с кучей готовых тулов из библиотеки Zapier. Основная проблема - нет дискавери из кода, можно только руками натыкать в интерфейсе. 2026, guys...
3. awesome-mcp-servers – большой список mcp-серверов. В реальности курируется одним конкретным человеком, за качество никто ответственности не несет.

По скиллам:
1. awesome-agent-skills - оч хорошо структурированная страничка с разными скиллами от надежных источников
2. Маркетплейсы скиллов: skillhub, ClawHub, skillsmp, skills.sh. Из них больше всего понравился skillhub: у них есть свой API / скилл для поиска и установки, есть AI evaluation скиллов и так далее.

Накидайте кто чего ещё знает 🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥184🤡1
It's 2026. Build for agents

Я тут долго сражался с одним сервисом у которого настройка делается только через интерфейс. Забил и перешел к соседям с нормальным API.

В этот момент на своей шкуре прочувствовал идею которую постоянно повторяет Карпатый: build for agents.

Концепция такая: так как все действия и пользователи и бизнесы скоро будут делать через AI-системы, строить свои сервисы нужно удобными прежде всего для них.

Вдумайтесь аккуратно в эту концепцию.

Наверняка вы строите в вашем бизнесе админки, рабочие интерфейсы и прочие адаптеры к кожаным мешкам.

Или вы строите сайт вашего бизнеса. Интернет-магазин для живых пользователей. Ожидая что люди все еще будут на него заходить.

Это уже сегодня выглядит сомнительно. А через пару лет это совсем будет неактуально. Цифровой мир будет захвачен системами которые сами общаются друг с другом от имени пользователя или бизнеса.

Значит, ваш пользователь - это агент. Новый интерфейс – API и документация. Даже если кому-то понадобятся админки, сам себе построит за 5 минут.

Привыкаем к новому дивному миру.
3🤔4231🤡19🔥128
Claude Code как личный агент

OpenClaw раскрыл новую категорию продуктов – личные AI-агенты.

Большие компании побежали собирать аналоги из того что было. Cloudflare быстро собрал Moltworker, Claude Cowork и Notion срочно начали встраивать в себя аналогичные фичи, сам OpenClaw перешел в OpenAI. Уверен что Google и Apple срочно планируют на Q3 запуск такого агента внутри своих платформ.

При этом вокруг меня много ребят пожали плечами и сказали "да я давно просто использую Claude Code". Я сначала не понял. Потом понял.

Claude Code прекрасно решает все задачи личных ассистентов. Почту собрать, браузер открыть, что-нибудь автоматизировать - без проблем!

Сетап обычно такой: Claude Code на VPS, CLAUDE.md с объяснением что теперь надо не код писать а ассистентом работать, телеграм-обертка вроде этой и гитхаб чтобы хранить скиллы. Всё.

Ещё и подписка от Anthropic работает – вообще космос.

Получается, инструмент для написания кода успешно заменяет финальные продукты. Он настолько хорошо делает задачи и дописывает себе скиллы, что эти заворачивания уже не нужны.

Вижу в этом большое будущее.

Зачем нужен продукт, если можно на лету собрать его код?
53🔥203🤔1
Интересно, что в релизе новых MacBook Pro ключевым преимуществом выпячен x4 AI Performance. Слово LLM в релизе встречается аж 15 раз.

При этом, массовый консьюмер никаких локальных LLM особо не запускает. Топовые модели живут в облаках у провайдеров – даже у профессионалов.

Видимо, Apple уверен, что на устройства это хотя бы частично переедет.

Боюсь, люди не особо разбираются и купят новые макбуки чтобы лучше работал ChatGPT. В четыре раза.
🤡5435🔥11🤔51
Forwarded from from:adam
Команда выкатила бомбу.

Продактов на рынке полно. А вот тех, кто умеет делать AI/ML продукты — мало. Потому что мест, где это вообще делают, тоже немного.

Мы делаем. Умеем. И решили научить.

Бесплатный курс для PM’ов, которые хотят стать AI/ML продакт менеджерами. Формат stage-gate на реальных кейсах — проходишь полный цикл от постановки задачи до запуска, как в настоящем продукте.
🔥7223🤡11🤔21
Есть такой человек – Тобиас Лютке. Днём он основатель и CEO Shopify – компании с капитализацией $150B+.

А ночью Тоби развивает собственный on-device опенсорс поисковый движок по документам - qmd.

Проект мощный технологически. Трёхстадийный гибридный пайплайн, параллельный ретривал с разными движками, отдельный слой склейки, LLM реранкер. Всё покрыто метриками, всё на SOTA-подходах. И локально!

Тоби прикрутил его к агентам и теперь движок отлично дополняет openclaw и claude code. у проекта 12k звезд на гитхабе.

В свободное от этих двух проектов время (откуда???) Тоби профессионально соревнуется в тех самых 24-х часовых гонках LeMans. В 2025 году он занял 15-е место из 58 пилотов в своей категории LMP2 в самом большом соревновании в Северной Америке.

Я даже не знаю как можно быть ещё более крутым 🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥117312
OpenAI выложили в opensource Symphony – оркестратор для агентов. Проект интересен сам по себе, но важно не это.

Внимание, официальная инструкция по установке:
Tell your favorite coding agent to build Symphony in a programming language of your choice:
Implement Symphony according to the following spec: https://github.com/openai/symphony/blob/main/SPEC.md

🌟
Please open Telegram to view this post
VIEW IN TELEGRAM
4417🤡3
Media is too big
VIEW IN TELEGRAM
Все выходные вайбкодим с ребенком игру и это лучшее время ever 🤖

Соорудили восьмибитную игру про нашего кота Макара. Кот отправляется в прошлое чтобы собрать ДНК других котов и спасти планету 🌟 10 уровней, веселые боссы, кото-мехо-костюм и глитч-эффекты от разрыва континуума прилагаются!

Я сделал для вас рецепт для Claude Code чтобы вы могли быстро засетапить такое же приключение. Закидывайте его в пустую папку, запускаете там claude code и делайте /init.

Ребенку можно отдать придумывание смыслов и уровней. Мой просто надиктовывал в chatgpt, затем я выгружал в виде текста и закидывал как новые куски гейм дизайна. Дальше claude code сам разберется.

Всем классных выходных!
Please open Telegram to view this post
VIEW IN TELEGRAM
98🔥31
Harness Engineering

Давайте расскажу про этот свежий баззворд 2026-го.

В начале года выяснилось что скорость разработки упирается уже не в модели и не в агентов, а в способ их запрягать. Нужно уметь запускать много раз, координировать работу, учить не повторять ошибки, и так далее.

Народ быстро собрал смешной ответ в виде Ralph loop: примитивный цикл запуска Claude Code, названного в честь Ральфа из Симпсонов. Эта штука просто долбит агент в цикле задачами из списка. И даже с такой тупой обвязкой народ справлялся делать реально огромные проекты.

Баззворд Harness Engineering взлетел после одноименной статьи от OpenAI где они рассказывали про обвязку вокруг Codex для автономного кодирования нового своего проекта. Народ быстро подхватил нейминг и побежал заниматься своими harness. Как обычно, людям только дай название.

С тех пор появилось множество проектов и накопленного опыта как лучше обвязки делать. Часть обвязок лежит на стороне агентов, часть – в скиллах и внешних координаторах. Есть простые штуки вроде "не повторяй ошибок", есть сложные системы координации тысяч агентов для работы над огромными проектами.

Что точно понятно – это ещё один важный компонент LLM-инженерии. Кто лучше делает harness, тот больше и стабильней выдает результата.

Учитесь запрягать ваших агентов 🤖🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
3213
Игра в закрытость

Мало кто заметил, но Amazon выиграл дело против Perplexity. Теперь Perplexity не может выбирать товары на Amazon через свой браузер Comet.

Это пример довольно простого тезиса – если игроки хотят закрыться от AI-агентов, они могут это сделать. В крайнем случае – через суд.

Другой хороший пример – доступ к Youtube. Я практически полностью пересел на Claude, но запросы "вот в этом подкасте какие ключевые идеи <link>" отправляю в Gemini. У него дырочка есть в Youtube. Остальным приходится искать транскрипты в интернете.

Мощь агентов – не только крутость мозгов, но и доступ к источникам и тулам. А у кого больше экосистема – у того больше контроль для агентских ручек и ножек.
1🔥61🤔17113
Forwarded from South HUB
Писать код скоро не нужно будет совсем. Архитектура, спеки, документация, деплой — модели справляются. Вчера это джуны, сегодня мидлы, завтра CTO. Придём к принятию вместе. А потом поговорим о главном: чем теперь заниматься всем этим людям. Огород? Рыбалка?

⛷️ Увидимся на склоне.

👉 Вся программа на сайте Snow BASE.
1🔥4632🤡265
Сооснователь Uber Travis Kalanick вышел из восьмилетнего стелс-режима. Всё это время он строил Atoms – автономный транспорт и промышленность.

Трэвис написал яркий резонансный манифест. Манифест написан как будто это месть для Uber. И это так.

Трэвиса буквально выкинули из Uber в 2017. За год до этого Uber выпустил красивое видео с ребрендингом компании, которое называется Bits and Atoms.

Вы поняли? Uber это только Bits, а Трэвис теперь делает Atoms. Кстати, Uber закрыл направление беспилотных автомобилей в 2020-м году.

Новый рынок такси это рынок беспилотных такси. В Калифорнии скоро останется только Waymo. Если Atoms сможет в беспилотные такси, это будет реальная угроза для Uber. Месть!
When I told my friends, family and colleagues about my plans for what was next, they were really excited that I was “coming back.”

The thing is, I never left.

Кстати, из Uber его выкинули его за sexual harassment. Официально.
🔥31🥱97🤡51
К разговору о ручках, ножках и экосистемах

Записал я тут длинный войс мемо в свой айфон с размышлениями на одну тему. И пытаюсь загрузить в какой-нибудь эйай.

Claude сразу сказал что у него speech-to-text тут нет и ничем помочь не может. Приходите с текстом.

Gemini вроде бодро взялся, но обнаружил пустой файл. Чем заставил меня минут десять перезагружать чертов файл разными способами. Какова же была моя ярость узнать что Gemini имеет скрытый лимит в 10 минут аудио 🌟 ну хоть ошибку можно было сделать норм?

ChatGPT проявил себя как очень умный, но бестолковый приятель. Знаете таких?

Эта невероятно интеллектуальная система развернула всю мощь 5.4 Extended Thinking и мучала мой файл целых четыре минуты. Среди попыток замечено:
- Скачивание спец сборки ffmpeg с транскрибацией
- Перебор бесплатных интернет-сервисов
- Попытки заимпортить нужные локальные пакеты из окружения
- Эпичная попытка установить локальный Whisper
На проблемах с компиляцией whisper.cpp эта штука перестала греть воду в Аризоне и сдалась.

После этого я загрузил файл в свой nanoclaw в телеге. Он мне всё сделал за минуту даже не спросив контекста задачи. Сходил в Whisper API да и всё.

Выводы делайте сами 🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
14615🔥7
Вот так выглядит гитхаб Лёши Миловидова, CTO ClickHouse.
Opus 4.6 release date: Feb 5, 2026
🔥89🥱22🤡832
Помните историю когда Anthropic выложил маркетинг булшит статью про невероятные успехи в COBOL и акции IBM упали на 10%?

Так вот, кто-то реально проверил как Claude показывает себя на задачах по COBOL. Показывает плохо )

Особенно паршиво выглядят расчеты произведенные COBOL-правилами написанными Opus 4.6, на картинке.
тудым сюдым семь-восемь 🤡

p.s. акции IBM уже откатились
🤡23🔥85