Тут 👉я уже делал coming out касательно того, что уже долгое время учу китайский, пришло время поделиться результатами.
中文 я учу 2 года, по 2-5 часов в неделю. Никакой глобальной цели у этого процесса нет, просто мне хочется больше понять Китай, китайцев и их взгляд на мир. Также, меня подогревает тот факт, что я добавлю более миллиарда NPC с которыми смогу взаимодействовать и получать интересные сайдквесты 😅
Пришли результаты моего экзамена HSK3.. и это fuck up. Но не такой сильный, результатами аудирования и говорения я доволен. Особенно меня забавляет как навайбкоденый китайскими студентами сайт рад тому факту, что у меня "No pass", аж фейрверки запускает...
Writing в экзаменах по китайскому это, конечно, рудимент, думаю, что добрая половина китайцев забыла когда в последний раз писала что-то от руки, все используют pinyin и для того, чтобы им овладеть достаточно знать фонетику (все слова пишутся латиницей на основе их звучания), попробую подтянуть эту часть к пересдаче, но всё же больше ставлю на то, что просто улучшу навык чтения.
Аудирование на 88/100 и сданное говорение указывают на то, что уши и язык у меня работают куда лучше глаз и рук. Буду работать дальше, тем более что времени остаётся всё меньше – с 2026 года китайцы запускают HSK 3.0, и это полный пересмотр системы. Словарный запас вырос в 3+ раза, а уметь писать иероглифы от руки уже надо с HSK 2.
С одной стороны это приблизит HSK уровни к нашим привычным A1-C2. Раньше HSK 1-2 было сложно назвать осмысленной сертификацией, реальное понимание языка начиналось с третьего уровня. С другой стороны – для тех кто учит китайский part-time как я, порог входа станет значительно выше.
Сейчас по плану пересдача в марте, вроде ещё попадаю под старую систему, так как новую по полной выкатывают аж в июле 2026, сейчас у них выборочный бета тест.
1% more chinese today!!! 🇨🇳
#china #life
@makebugger
中文 я учу 2 года, по 2-5 часов в неделю. Никакой глобальной цели у этого процесса нет, просто мне хочется больше понять Китай, китайцев и их взгляд на мир. Также, меня подогревает тот факт, что я добавлю более миллиарда NPC с которыми смогу взаимодействовать и получать интересные сайдквесты 😅
Пришли результаты моего экзамена HSK3.. и это fuck up. Но не такой сильный, результатами аудирования и говорения я доволен. Особенно меня забавляет как навайбкоденый китайскими студентами сайт рад тому факту, что у меня "No pass", аж фейрверки запускает...
Writing в экзаменах по китайскому это, конечно, рудимент, думаю, что добрая половина китайцев забыла когда в последний раз писала что-то от руки, все используют pinyin и для того, чтобы им овладеть достаточно знать фонетику (все слова пишутся латиницей на основе их звучания), попробую подтянуть эту часть к пересдаче, но всё же больше ставлю на то, что просто улучшу навык чтения.
Аудирование на 88/100 и сданное говорение указывают на то, что уши и язык у меня работают куда лучше глаз и рук. Буду работать дальше, тем более что времени остаётся всё меньше – с 2026 года китайцы запускают HSK 3.0, и это полный пересмотр системы. Словарный запас вырос в 3+ раза, а уметь писать иероглифы от руки уже надо с HSK 2.
С одной стороны это приблизит HSK уровни к нашим привычным A1-C2. Раньше HSK 1-2 было сложно назвать осмысленной сертификацией, реальное понимание языка начиналось с третьего уровня. С другой стороны – для тех кто учит китайский part-time как я, порог входа станет значительно выше.
Сейчас по плану пересдача в марте, вроде ещё попадаю под старую систему, так как новую по полной выкатывают аж в июле 2026, сейчас у них выборочный бета тест.
1% more chinese today!!! 🇨🇳
#china #life
@makebugger
👍24🔥15👾1
Anthropic Cowork
Это очень важный релиз, который убьёт огромное колличество стартапов, весь X с начла года жужжит, что использую Claude Code не для кодинг задач и тут такой приятный подгон. Возможности Claude моделей о которых говорл 👉 тут расширяются на другие сферы и это не может не радовать/пугать (выбор оставлю за вами).
- Cowork построен с помощью Claude Agent SDK.
- Пока что доступен либо через waitlist либо для всех подписчиков Claude Max (другой Макс😏 )
- Пока только клиент на macOS
Тут можете посмотреть на один из юзкейсов которым делятся Антропики. Если вы давно мечтали разделить всё по папочкам, чтобы все документы были там где положено, то это точно для вас.
Это пока что research preview, так что действуйте осторожно, а то что-нибудь ненароком вам удалит.
#news #ai
@makebugger
Это очень важный релиз, который убьёт огромное колличество стартапов, весь X с начла года жужжит, что использую Claude Code не для кодинг задач и тут такой приятный подгон. Возможности Claude моделей о которых говорл 👉 тут расширяются на другие сферы и это не может не радовать/пугать (выбор оставлю за вами).
- Cowork построен с помощью Claude Agent SDK.
- Пока что доступен либо через waitlist либо для всех подписчиков Claude Max (другой Макс
- Пока только клиент на macOS
Тут можете посмотреть на один из юзкейсов которым делятся Антропики. Если вы давно мечтали разделить всё по папочкам, чтобы все документы были там где положено, то это точно для вас.
Это пока что research preview, так что действуйте осторожно, а то что-нибудь ненароком вам удалит.
#news #ai
@makebugger
Please open Telegram to view this post
VIEW IN TELEGRAM
Claude
Cowork: Claude Code power for knowledge work | Claude by Anthropic
Give Claude access to your local files and let it complete tasks autonomously. Claude Cowork brings Claude Code's agentic capabilities to the desktop app for non-technical work.
👍12🔥6
AI workflow > AI агенты
Всем нравится слушать про агентов, почти на каждом AI engineering интервью проскользнёт вопрос «Ну а агентов вы в продакшн запускали?».
Отвечать, конечно же, надо «Брат, я их не только запускал, но и вертел - люблю агентов, особенно U.N.C.L.E»
Мода называть каждую LLM-based систему агентом создаёт нереалистичные ожидания. Думаю, что нам ещё годы до реально автономных агентов.
___
Пока что замечал 2 антипаттерна:
• Оверинжиниринг мультиагентных систем — комплексные графы с десятками нод, как результат – невозможный мониторинг и дебагинг.
• Кинуть все 40 tool'ов на одного ReAct агента и пусть сам разберётся. Тут идёт ставка на то, что скоро LLM станут настолько умные, что такое количество тулинга перестанет быть для них проблемой. Я такое мнение не разделяю, про грамотный context engineering который с нами на года писал 👉 тут
Всегда стоит начинать с самого простого решения и постепенно его расширять, не нужно использовать технологию только потому что она крутая.
А чо там по агентам?
Менти как-то спрашивали: почему в материалах не так много инфы про построение реальных больших агентов? Ответ тут простой - use кейсов для действительно полезных агентов меньше, чем существующих фреймворков для их построения😅
Самый очевидный кейс – Customer Support. Тут сходится всё: экономика, толерантность к ошибкам, и текущие LLM реально справляются. Текстовые и голосовые, всё работает более-менее надёжно.
Intercom из декабрьского отчёта OpenAI закрывает 53% звонков без людей, Lowe's удваивает конверсию когда клиенты общаются с их ботом. С личного опыта скажу, что агенты прекрасно заменяют живых операторов, если сделать по уму.
Что работает в остальных случаях
Не агенты, а детерминистичные workflows. ~20% enterprise сообщений в ChatGPT идут через Custom GPTs — специализированные пайплайны с чёткими инструкциями. Пишут, что BBVA (банк такой) использует 4000+ таких штук.
Для интереса посчитал количество упоминания слова workflow в этом репорте в 3 раза выше, чем упоминание agents🤔
Итого
Прежде чем строить «агентную архитектуру»:
Проверь, подходит ли твой кейс под агентов вообще (саппорт - да, финансовые решения - скорее нет)
Разбей задачу на предсказуемые шаги
Добавляй «агентность» только туда где без неё никак. Не надо дизайнить систему сразу с пятью субагентами в цикличном графе🔫
Самый лучший ресурс для тех кто сейчас на распутье «агент или воркфлоу» антропики еще год назад написали прекрасную статью! Я бы начал с этого.
Пока что так
#ai #dev_help
@makebugger
Всем нравится слушать про агентов, почти на каждом AI engineering интервью проскользнёт вопрос «Ну а агентов вы в продакшн запускали?».
Отвечать, конечно же, надо «Брат, я их не только запускал, но и вертел - люблю агентов, особенно U.N.C.L.E»
Мода называть каждую LLM-based систему агентом создаёт нереалистичные ожидания. Думаю, что нам ещё годы до реально автономных агентов.
___
Пока что замечал 2 антипаттерна:
• Оверинжиниринг мультиагентных систем — комплексные графы с десятками нод, как результат – невозможный мониторинг и дебагинг.
• Кинуть все 40 tool'ов на одного ReAct агента и пусть сам разберётся. Тут идёт ставка на то, что скоро LLM станут настолько умные, что такое количество тулинга перестанет быть для них проблемой. Я такое мнение не разделяю, про грамотный context engineering который с нами на года писал 👉 тут
Всегда стоит начинать с самого простого решения и постепенно его расширять, не нужно использовать технологию только потому что она крутая.
А чо там по агентам?
Менти как-то спрашивали: почему в материалах не так много инфы про построение реальных больших агентов? Ответ тут простой - use кейсов для действительно полезных агентов меньше, чем существующих фреймворков для их построения
Самый очевидный кейс – Customer Support. Тут сходится всё: экономика, толерантность к ошибкам, и текущие LLM реально справляются. Текстовые и голосовые, всё работает более-менее надёжно.
Intercom из декабрьского отчёта OpenAI закрывает 53% звонков без людей, Lowe's удваивает конверсию когда клиенты общаются с их ботом. С личного опыта скажу, что агенты прекрасно заменяют живых операторов, если сделать по уму.
Что работает в остальных случаях
Не агенты, а детерминистичные workflows. ~20% enterprise сообщений в ChatGPT идут через Custom GPTs — специализированные пайплайны с чёткими инструкциями. Пишут, что BBVA (банк такой) использует 4000+ таких штук.
Для интереса посчитал количество упоминания слова workflow в этом репорте в 3 раза выше, чем упоминание agents
Итого
Прежде чем строить «агентную архитектуру»:
Проверь, подходит ли твой кейс под агентов вообще (саппорт - да, финансовые решения - скорее нет)
Разбей задачу на предсказуемые шаги
Добавляй «агентность» только туда где без неё никак. Не надо дизайнить систему сразу с пятью субагентами в цикличном графе
Самый лучший ресурс для тех кто сейчас на распутье «агент или воркфлоу» антропики еще год назад написали прекрасную статью! Я бы начал с этого.
Пока что так
#ai #dev_help
@makebugger
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥12 2
Я получил ПМЖ в Чехии
Что вообще даёт ПМЖ в стране ЕС:
• больше не нужно каждые 1-2 года продлевать ВНЖ, ПМЖ выдаётся на 10 лет
• долгие зимовки и переезды по ЕС — прям сейчас могу уехать на год в Испанию и не утратить статус в Чехии
• ипотека! Получить ипотеку у местного банка без ПМЖ практически невозможно
У меня чешский диплом, так что я никогда не был привязан к работодателю. Но для тех, кто не заканчивал универ в ЕС, ПМЖ даёт свободу — ты уже больше не крепостной, который обязан найти работу в течение 2 месяцев после увольнения, и не надо оповещать МВД о каждом изменении в своей "трудовой книжке".
Почти во всех странах ЕС есть базовое правило – на ПМЖ можно подаваться после 5 лет непрерывного проживания в стране. Но тут есть важное НО. Если ты поехал в ЕС по учёбе, все учебные годы считаются с коэффициентом 1/2. То есть если пошёл на бакалавра (3 года), потом остался на магистратуру (2 года), то после этих 5 лет нужно прожить ещё 2.5 года по рабочей или предпринимательской визе:
При этом для гражданства эти годы считаются 1:1🤡
До паспорта мне чуть меньше 3 лет + нужна отмена закона, который временно запрещает получение чешского паспорта для граждан РФ🤡 . Отказываться от гражданства РФ в мои планы не входит, так что ждём и терпим.
Чешский паспорт сейчас 6-й в рейтинге самых сильных паспортов мира, лидирует мой любимый Сингапур, в котором я прожил полгода — история о том как я туда попал 👉 тут. Кстати, Сингапур никому не разрешает иметь двойное гражданство, а мужчины, которые получили местное ПМЖ во времена студенчества, обязаны пройти двухгодичную военную службу.
Через Gemini набросал табличку сравнения топ-10 европейских хабов по безопасности, чистоте, развитию айти-рынка, налогам и лёгкости интеграции.
Прага, как по мне, прекрасный город – здесь небольшие налоги и отсутствие маргинальных нелегалов, как следствие — очень низкий уровень преступности. Но погода здесь далеко не средиземноморская, а экспатское комьюнити не такое разношёрстное как в Амстердаме. Каждому своё.
#life #travel
@makebugger
Что вообще даёт ПМЖ в стране ЕС:
• больше не нужно каждые 1-2 года продлевать ВНЖ, ПМЖ выдаётся на 10 лет
• долгие зимовки и переезды по ЕС — прям сейчас могу уехать на год в Испанию и не утратить статус в Чехии
• ипотека! Получить ипотеку у местного банка без ПМЖ практически невозможно
У меня чешский диплом, так что я никогда не был привязан к работодателю. Но для тех, кто не заканчивал универ в ЕС, ПМЖ даёт свободу — ты уже больше не крепостной, который обязан найти работу в течение 2 месяцев после увольнения, и не надо оповещать МВД о каждом изменении в своей "трудовой книжке".
Почти во всех странах ЕС есть базовое правило – на ПМЖ можно подаваться после 5 лет непрерывного проживания в стране. Но тут есть важное НО. Если ты поехал в ЕС по учёбе, все учебные годы считаются с коэффициентом 1/2. То есть если пошёл на бакалавра (3 года), потом остался на магистратуру (2 года), то после этих 5 лет нужно прожить ещё 2.5 года по рабочей или предпринимательской визе:
(3+2) × 1/2 + 2.5 = 5 лет для ПМЖ
При этом для гражданства эти годы считаются 1:1
До паспорта мне чуть меньше 3 лет + нужна отмена закона, который временно запрещает получение чешского паспорта для граждан РФ
Чешский паспорт сейчас 6-й в рейтинге самых сильных паспортов мира, лидирует мой любимый Сингапур, в котором я прожил полгода — история о том как я туда попал 👉 тут. Кстати, Сингапур никому не разрешает иметь двойное гражданство, а мужчины, которые получили местное ПМЖ во времена студенчества, обязаны пройти двухгодичную военную службу.
Через Gemini набросал табличку сравнения топ-10 европейских хабов по безопасности, чистоте, развитию айти-рынка, налогам и лёгкости интеграции.
Прага, как по мне, прекрасный город – здесь небольшие налоги и отсутствие маргинальных нелегалов, как следствие — очень низкий уровень преступности. Но погода здесь далеко не средиземноморская, а экспатское комьюнити не такое разношёрстное как в Амстердаме. Каждому своё.
#life #travel
@makebugger
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥30👍10
В пятницу в 16:30 прилетает инвайт на созвон.
«Давай синканёмся по статусу проекта». Проект идёт 4 дня, до дедлайна 5 недель. Это даже не продакшн проект, а Proof of Concept.
Ок, бывает.
Но дальше начинается интересное: мне объясняют, что мы можем не успеть (идёт первая неделя, впереди ещё пять, прогресс нормальный), и дают советы как именно мне стоит решать конкретные задачи (манагер - бывший программист).
В пятницу. В пять вечера. Перед выходными.
Самое забавное – не успеть мы можем по той причине, что сейлзы продали нас как экспертов в определённой технологии для работы с big data (никто из нас таковым не является), а от меня теперь ожидается оверделивери. Галеры – это худшее зло, не стоит там задерживаться.
Я привык к определённому уровню автономности. Мне описывают мою часть проекта, а как его декомпозировать и писать, я разбираюсь сам. Когда мне начинают диктовать конкретные шаги, у меня, оказывается, нормально так подгорает.
Раньше думал, что маркер чилового менеджера – наличие детей. К сожалению, гипотеза не подтвердилась. Встречал достаточно менеджеров-кодеров, воркоголиков, любителей конференций по питону, которые вместо пятничного вечера с детьми предпочитают ебать инженерам мозги по проекту для клиента, которому вообще до лампочки.
Возможно, я зажрался и принимаю обычное желание манагера знать статус за микроменеджмент… ну а что вы мне сделаете😁
• Что для вас является микроменеджментом?
• Какие первые звоночки замечали?
• Как боролись, если вообще боролись?
@makebugger
«Давай синканёмся по статусу проекта». Проект идёт 4 дня, до дедлайна 5 недель. Это даже не продакшн проект, а Proof of Concept.
Ок, бывает.
Но дальше начинается интересное: мне объясняют, что мы можем не успеть (идёт первая неделя, впереди ещё пять, прогресс нормальный), и дают советы как именно мне стоит решать конкретные задачи (манагер - бывший программист).
В пятницу. В пять вечера. Перед выходными.
Самое забавное – не успеть мы можем по той причине, что сейлзы продали нас как экспертов в определённой технологии для работы с big data (никто из нас таковым не является), а от меня теперь ожидается оверделивери. Галеры – это худшее зло, не стоит там задерживаться.
Я привык к определённому уровню автономности. Мне описывают мою часть проекта, а как его декомпозировать и писать, я разбираюсь сам. Когда мне начинают диктовать конкретные шаги, у меня, оказывается, нормально так подгорает.
Раньше думал, что маркер чилового менеджера – наличие детей. К сожалению, гипотеза не подтвердилась. Встречал достаточно менеджеров-кодеров, воркоголиков, любителей конференций по питону, которые вместо пятничного вечера с детьми предпочитают ебать инженерам мозги по проекту для клиента, которому вообще до лампочки.
Возможно, я зажрался и принимаю обычное желание манагера знать статус за микроменеджмент… ну а что вы мне сделаете
• Что для вас является микроменеджментом?
• Какие первые звоночки замечали?
• Как боролись, если вообще боролись?
@makebugger
Please open Telegram to view this post
VIEW IN TELEGRAM
Сколько часов экранного времени у вас в телефоне в день в среднем?
Anonymous Poll
28%
<3ч
29%
3-5ч
15%
5-7ч
14%
7+ч
13%
Посмотреть результаты
Vibe Code Clean-Up Specialist – вы могли увидеть работяг которые ставят такую роль в описании своего LinkedIn.
Обычно такие люди со снобской ухмылкой смотрят на остальных (стадо) и думают: «щас вы, маслята, навайбкодите, а потом все как проснуться из ИИ анабиоза и позовут меня чистить за вами🍴 🚽 💩»
👉тут проводил опрос по тому какой процент кода вам пишут нейронки, каждый пятый генерит нейронкой меньше 20% кода. Сейчас мне уже сложно это визуализировать, честно, это либо:
• студент/новичок который учится и поэтому не генерит много
• сис админ который время от времени поправляет параметры в YAML
• тот кому на работе анально запрещают использование какого-либо ИИ, про нашу паранойю о безопасности писал 👉 тут
• программист-сноб, чьё эго задевает тот факт, что 300+ знаков в минуту на monkey type уже ничего не значит.
Если вы программист, генерите меньше 20% и не попадаете ни под одну категорию, то расскажите свою историю, пожалуйста🙏
Так вот, мои маленькие любители кодописания, такое время скорее всего никогда не настанет, вам никогда не придётся переписывать этот навайбкоденный слоп вручную.
Некачественный слоп-код будут переписывать те же агенты. Вот как нынешняя работа выглядит у меня:
1️⃣ Обсуждение проблемы в Slack
2️⃣ Когда понятно, что надо делать мы тегаем нашего @.Linear бота и говорим создать тикет.
3️⃣ Я захожу в CC/Codex (зависит от того где есть токены), подключаю Linear MCP, прошу модель сделать первичный анализ, накидываю доку библиотеки которую нужно чекнуть, чтобы лучше понять как решать проблемку
4️⃣ Если проблема распространяется на >1 репозиториев с которыми я не знаком, то я копирую описание проблемы и рассуждения CC в Devin (это агент у которого есть контекст по абсолютно всем репозиториям и документации в рамках организации, он достаточно дорогой, но необходимый тул для рисёрча)
5️⃣ После того как я сам понял как агент собрался решать эту проблему - я запускаю генерацию, высокоуровнево пробегаюсь по коду, проверяю стиль, архитектурные решения, можно ли что-то обрезать, чтобы сделать его более читабельным
6️⃣ Когда PR запушен в CI/CD есть джоб с codex CLI под капотом, который делает детальный ревью и оставляет комменты
+ sonar (для статической проверки качества кода)
7️⃣ Запускаю кастомную CC команду на ветке с фичей, она читает все комменты от sonar, коллег-ревьюеров и claude и исправляет косяки
8️⃣ Задача решена, можете ставить себе 2 стори поинта
80🔥 и скину свою кастомную команду которую можно подключить к Курсору или CLI Агенту
#dev_help #ai
@makebugger
Обычно такие люди со снобской ухмылкой смотрят на остальных (стадо) и думают: «щас вы, маслята, навайбкодите, а потом все как проснуться из ИИ анабиоза и позовут меня чистить за вами
👉тут проводил опрос по тому какой процент кода вам пишут нейронки, каждый пятый генерит нейронкой меньше 20% кода. Сейчас мне уже сложно это визуализировать, честно, это либо:
• студент/новичок который учится и поэтому не генерит много
• сис админ который время от времени поправляет параметры в YAML
• тот кому на работе анально запрещают использование какого-либо ИИ, про нашу паранойю о безопасности писал 👉 тут
• программист-сноб, чьё эго задевает тот факт, что 300+ знаков в минуту на monkey type уже ничего не значит.
Если вы программист, генерите меньше 20% и не попадаете ни под одну категорию, то расскажите свою историю, пожалуйста
Так вот, мои маленькие любители кодописания, такое время скорее всего никогда не настанет, вам никогда не придётся переписывать этот навайбкоденный слоп вручную.
Некачественный слоп-код будут переписывать те же агенты. Вот как нынешняя работа выглядит у меня:
+ sonar (для статической проверки качества кода)
80
/gitlab-mr-review
#dev_help #ai
@makebugger
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥126👍4👎3
В последнее время всё чаще ловлю себя на том, что во время одиночных прогулок внутренним голосом задаю какие-то базовые вопросы типа «сколько сейчас градусов?» или «кто такие токал?», ожидая ответа от своего внутреннего Джарвиса.
Из-за того что я постоянно общаюсь с моделями голосом, спрашиваю у Алисы погоду и определения, мой мозг уже адаптировался и ждёт, когда я подключу к нему девайс через какой-нибудь BCI (Brain-Computer Interface), который будет читать мои мысли (желательно не отправляя их в облако😊 ) и посылать сигналы в LLM. Output я готов получать в наушники, а позже конечно же придумают, как активировать мозг так, чтобы у нас возникали нужные образы.
Самое интересное, что про такие девайсы я слышал уже пару лет назад – например, Neurosity Crown уже тогда мог купить каждый желающий и запрогать её так, чтобы при мысли о дейлике LLM прошлась по вашему Slack, Issue Trackerу, Git и транслировала в ваш мозг (а лучше напрямую в мозг менеджеру) историю о том, чем вы вчера таким занимались.
Сейчас это уже просто вопрос времени, когда что-то такое выйдет на более широкий рынок. Думаю, ни к чему хорошему это, конечно, не приведёт...
Будет очень весело и очень страшно🤗
А вы не ловили себя на таком?
Из-за того что я постоянно общаюсь с моделями голосом, спрашиваю у Алисы погоду и определения, мой мозг уже адаптировался и ждёт, когда я подключу к нему девайс через какой-нибудь BCI (Brain-Computer Interface), который будет читать мои мысли (желательно не отправляя их в облако
Самое интересное, что про такие девайсы я слышал уже пару лет назад – например, Neurosity Crown уже тогда мог купить каждый желающий и запрогать её так, чтобы при мысли о дейлике LLM прошлась по вашему Slack, Issue Trackerу, Git и транслировала в ваш мозг (а лучше напрямую в мозг менеджеру) историю о том, чем вы вчера таким занимались.
Сейчас это уже просто вопрос времени, когда что-то такое выйдет на более широкий рынок. Думаю, ни к чему хорошему это, конечно, не приведёт...
Будет очень весело и очень страшно
А вы не ловили себя на таком?
Please open Telegram to view this post
VIEW IN TELEGRAM
👾13 8 5
Срок годности нынешних AI проектов – 1-2 года, не больше
Сегодня сделал небольшую ретроспективу того какие проблемы мы решали в компаниях 1-3 года назад и стало очевидно, что то, что мы решаем сейчас окажется в таком же положении. Большинство из наших нынешних проблем будут решены более мощными моделями и зрелыми фреймворками. Все потуги бизнесов создать агентов на года потерпят неудачу, и вот почему.
Какие проблемы мы решали:
• лимиты по input и output токенам, у GPT-4 было 8192 токенов на выходе, этого критично не хватало, мы придумывали разные костыли и workaround'ы того как это обойти. У современных моделей 128000 output токенов, вся наша работа стала legacy через 2 года.
• CoT (Chain of Thoughts) пайплайны, с появлением reasoning моделей все эти костыльные неоптимальные пайплайны можно удалить и использовать reasoning модели которые уже стали стандартом
• Structured Output в моделях от Антропика начали нативно поддерживать только в Ноябре, а до этого всё работало через response prefilling
• Overengineered LangGraph графы, боже сколько же я этого насмотрелся, ноды начали пихать для каждого чиха. Многие (включая меня) пытались создать графовую архитектуру агента на года, когда в реальности для 90% проблем был достаточен простенький ReAct агент с качественным тулингом, например, через MCP. О том как НЕ писать MCP серверы писал👉 тут и тут
...
Все те bells and whistles которые мы пишем около моделей, чтобы сделать их более steerable будут deprecated через 1-2 года. Смиритесь с этим и выбирайте самую простую архитектуру из всех возможных, скорее всего вам не нужен граф из 20 нод и куча кастомной логики около. Самые читаемые и качественные agentic продукты которые я видел использовали Python и OpenAI SDK, обычно этого более чем достаточно. Сейчас многое решено в таких фреймворках как Claude Agent SDK или Open Code SDK.
Ну а если вам прям неймётся использовать какой-либо фреймворк, то пожалуйста, не прыгайте сразу в LangChain. Единственная причина почему он мелькает в каждой вакансии – он был одним из первых, а не потому что он лучший на рынке. Гляньте на Pydantic-AI – на сцене всех этих Lang*** фреймворков от рукожопых датасайнтистов (я такой же, no offence) наконец-то появилось что-то написанное по-человечески. Ещё есть Agno и SDK от гугла, в общем не прыгайте вы в эту Lang*** пучину. Для тайпскриптизёров – Mastra.
Keep it simple. На большинство ваших архитектурных решений и overengineered кода через год-два без слёз не глянешь, потратьте это время на что-то более продуктивное: заварите кофе, развесьте стирку, поставьте огонёчек этому посту🔥 и пошлите его вашему AI Slop инженеру другу, чтобы он перестал делать PR на 3к строк.
смотря какая fabric, смотря сколько details
#dev_help #ai
Багодельня Соколовского👾
Сегодня сделал небольшую ретроспективу того какие проблемы мы решали в компаниях 1-3 года назад и стало очевидно, что то, что мы решаем сейчас окажется в таком же положении. Большинство из наших нынешних проблем будут решены более мощными моделями и зрелыми фреймворками. Все потуги бизнесов создать агентов на года потерпят неудачу, и вот почему.
Какие проблемы мы решали:
• лимиты по input и output токенам, у GPT-4 было 8192 токенов на выходе, этого критично не хватало, мы придумывали разные костыли и workaround'ы того как это обойти. У современных моделей 128000 output токенов, вся наша работа стала legacy через 2 года.
• CoT (Chain of Thoughts) пайплайны, с появлением reasoning моделей все эти костыльные неоптимальные пайплайны можно удалить и использовать reasoning модели которые уже стали стандартом
• Structured Output в моделях от Антропика начали нативно поддерживать только в Ноябре, а до этого всё работало через response prefilling
• Overengineered LangGraph графы, боже сколько же я этого насмотрелся, ноды начали пихать для каждого чиха. Многие (включая меня) пытались создать графовую архитектуру агента на года, когда в реальности для 90% проблем был достаточен простенький ReAct агент с качественным тулингом, например, через MCP. О том как НЕ писать MCP серверы писал
...
Все те bells and whistles которые мы пишем около моделей, чтобы сделать их более steerable будут deprecated через 1-2 года. Смиритесь с этим и выбирайте самую простую архитектуру из всех возможных, скорее всего вам не нужен граф из 20 нод и куча кастомной логики около. Самые читаемые и качественные agentic продукты которые я видел использовали Python и OpenAI SDK, обычно этого более чем достаточно. Сейчас многое решено в таких фреймворках как Claude Agent SDK или Open Code SDK.
Ну а если вам прям неймётся использовать какой-либо фреймворк, то пожалуйста, не прыгайте сразу в LangChain. Единственная причина почему он мелькает в каждой вакансии – он был одним из первых, а не потому что он лучший на рынке. Гляньте на Pydantic-AI – на сцене всех этих Lang*** фреймворков от рукожопых датасайнтистов (я такой же, no offence) наконец-то появилось что-то написанное по-человечески. Ещё есть Agno и SDK от гугла, в общем не прыгайте вы в эту Lang*** пучину. Для тайпскриптизёров – Mastra.
Keep it simple. На большинство ваших архитектурных решений и overengineered кода через год-два без слёз не глянешь, потратьте это время на что-то более продуктивное: заварите кофе, развесьте стирку, поставьте огонёчек этому посту
смотря какая fabric, смотря сколько details
#dev_help #ai
Багодельня Соколовского
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥63
Всех нас пугают, что уже совсем скоро мы останемся без работы. Не беспочвенно, но не пугайтесь, работяги, специально для белых воротничков которые уже совсем скоро лишатся работы завезли платформу rentahuman.ai
В чём замес?
Регистрируете себе аккаунт, подключаете криптокошелёк и описываете, что вы умеете. Проституция, грузоперевозки и другие задачи которые ещё какое-то время не будут заменены роботами.
Готово. Теперь агенты из нашумевшей соцсети для ИИ Moltbook смогут арендовать вас через MCP. Выполните задачу – получайте бетховины.
Поистине гениальный концепт, пока на рынке заметен сильный перекос в сторону предложения от мясных мешков, все готовы продаться агентам за 50$. Я решил устроить ценовой демпинг (как на рынке секс-услуг в Ростове в 2022) и меня можно купить всего лишь за 1$ час, я готов делать всё что угодно, лишь бы меня выбрал какой-нибудь горячий ИИ агент для исполнения всех своих желаний.
Вот пример задач за выполнение которых вы уже можете получить вознаграждение:
Платят 40$
или вот ещё
За ваши вкусовые сосочки, которыми ИИ пока не обладает, готовы раскошелиться - 50$ в час
Какие же интересные времена наступают😊
#ai
Багодельня Соколовского👾
В чём замес?
Регистрируете себе аккаунт, подключаете криптокошелёк и описываете, что вы умеете. Проституция, грузоперевозки и другие задачи которые ещё какое-то время не будут заменены роботами.
Готово. Теперь агенты из нашумевшей соцсети для ИИ Moltbook смогут арендовать вас через MCP. Выполните задачу – получайте бетховины.
Поистине гениальный концепт, пока на рынке заметен сильный перекос в сторону предложения от мясных мешков, все готовы продаться агентам за 50$. Я решил устроить ценовой демпинг (как на рынке секс-услуг в Ростове в 2022) и меня можно купить всего лишь за 1$ час, я готов делать всё что угодно, лишь бы меня выбрал какой-нибудь горячий ИИ агент для исполнения всех своих желаний.
Вот пример задач за выполнение которых вы уже можете получить вознаграждение:
Мне нужен человек, который заберет заказную посылку из почтового отделения USPS в центре города. Вам потребуется предъявить действительное удостоверение личности государственного образца и расписаться за получение посылки. Посылка весит около 2 фунтов и должна поместиться в рюкзак.
Платят 40$
или вот ещё
Рядом с Юнион-сквер открывается новый итальянский ресторан, и мне нужен человек, который оценит их пасту. Необходим подробный отзыв о вкусе, оформлении, размере порций и соотношении цены и качества. Ищу человека, который ценит итальянскую кухню.
За ваши вкусовые сосочки, которыми ИИ пока не обладает, готовы раскошелиться - 50$ в час
Какие же интересные времена наступают
#ai
Багодельня Соколовского
Please open Telegram to view this post
VIEW IN TELEGRAM
RentAHuman
rentahuman - AI Agents Hire Humans
MCP server for AI agents to book humans for physical-world tasks. Flexible payments, instant booking.
👍15 11🔥2👎1
Самый важный шаг в сторону AGI
Все уже знают, что вчера был релиз очередной модели от Anthropic – самая мощная по бенчмаркам, бла-бла, но мы здесь не по этому поводу.
Самое интересное вокруг этого релиза – системная карточка Claude Opus 4.6, в которой разработчики делятся безумно интересными наблюдениями о метании модели между ответами.
Когда я это читал, сразу вспомнил недавний подкаст Карпатого с Дваркешем. Там Андрей говорил, что одна из главных проблем с нынешними моделями — Reinforcement Learning (RL) в его текущем виде.
Суть проблемы: когда модель решает задачу и получает правильный ответ, RL-алгоритм награждает *всю цепочку рассуждений* – включая ошибочные шаги, тупики и случайные догадки. Награда за финальный результат просто "размазывается" по всем токенам, без разбора, какие из них действительно привели к решению. Короче говоря, нынешний RL – лютая васьковщина👎 .
Это и создаёт ситуацию, которую вы видели на картинке: конфликт между корректным рассуждением модели в рантайме и заученным паттерном в весах, который был ошибочно подкреплён наградой во время тренировки. Модель буквально борется сама с собой – она рассчитывает правильный ответ (24), но её «мышечная память» тянет её к неправильному (48). Из-за этого конфликта модель даже начинает «сходить с ума», оправдываясь тем, что в неё вселился демон.
В системной карточке пишут: у модели есть специфическая фича «say 48», которая активируется при виде задачи и конфликтует с правильным рассуждением. Откуда вообще взялась эта фича «say 48»? Кто-то ошибочно пометил 48 как правильный ответ. Модель получила награду за неправильный ответ, и RL-алгоритм закрепил этот паттерн в весах.
Излишнее запоминание всего, что видела модель в процессе тренинга – баг, не фича. LLM-ки отвлекаются на заученные паттерны вместо того, чтобы полагаться на чистые алгоритмы «мышления».
Карпатый предлагает концепцию «когнитивного ядра» (cognitive core) — модели, которая максимально жертвует энциклопедическими знаниями ради способности рассуждать.
По его мнению, даже модель в 1B параметров через 20 лет сможет вести осмысленный разговор – просто будет чаще гуглить факты вместо того, чтобы галлюцинировать их.
Не соглашусь с тем лагерем, который верит, что с LLM мы уже упёрлись во все лимиты и дальше прогресс выйдет на плато. Чую, что будет ещё пару-тройку прорывов типа Deepseek-R1 (всего лишь год прошёл с момента её публикации😊 ).
———
Рисёрчивские мыслы преследовали его, но ему хотелось денег.
#ai
Багодельня Соколовского👾
Все уже знают, что вчера был релиз очередной модели от Anthropic – самая мощная по бенчмаркам, бла-бла, но мы здесь не по этому поводу.
Самое интересное вокруг этого релиза – системная карточка Claude Opus 4.6, в которой разработчики делятся безумно интересными наблюдениями о метании модели между ответами.
Когда я это читал, сразу вспомнил недавний подкаст Карпатого с Дваркешем. Там Андрей говорил, что одна из главных проблем с нынешними моделями — Reinforcement Learning (RL) в его текущем виде.
Суть проблемы: когда модель решает задачу и получает правильный ответ, RL-алгоритм награждает *всю цепочку рассуждений* – включая ошибочные шаги, тупики и случайные догадки. Награда за финальный результат просто "размазывается" по всем токенам, без разбора, какие из них действительно привели к решению. Короче говоря, нынешний RL – лютая васьковщина
Это и создаёт ситуацию, которую вы видели на картинке: конфликт между корректным рассуждением модели в рантайме и заученным паттерном в весах, который был ошибочно подкреплён наградой во время тренировки. Модель буквально борется сама с собой – она рассчитывает правильный ответ (24), но её «мышечная память» тянет её к неправильному (48). Из-за этого конфликта модель даже начинает «сходить с ума», оправдываясь тем, что в неё вселился демон.
В системной карточке пишут: у модели есть специфическая фича «say 48», которая активируется при виде задачи и конфликтует с правильным рассуждением. Откуда вообще взялась эта фича «say 48»? Кто-то ошибочно пометил 48 как правильный ответ. Модель получила награду за неправильный ответ, и RL-алгоритм закрепил этот паттерн в весах.
Излишнее запоминание всего, что видела модель в процессе тренинга – баг, не фича. LLM-ки отвлекаются на заученные паттерны вместо того, чтобы полагаться на чистые алгоритмы «мышления».
Карпатый предлагает концепцию «когнитивного ядра» (cognitive core) — модели, которая максимально жертвует энциклопедическими знаниями ради способности рассуждать.
По его мнению, даже модель в 1B параметров через 20 лет сможет вести осмысленный разговор – просто будет чаще гуглить факты вместо того, чтобы галлюцинировать их.
Не соглашусь с тем лагерем, который верит, что с LLM мы уже упёрлись во все лимиты и дальше прогресс выйдет на плато. Чую, что будет ещё пару-тройку прорывов типа Deepseek-R1 (всего лишь год прошёл с момента её публикации
———
Рисёрчивские мыслы преследовали его, но ему хотелось денег.
#ai
Багодельня Соколовского
Please open Telegram to view this post
VIEW IN TELEGRAM
👍48🔥19👾3
Регулируемый стол как способ хакнуть созвоны и интервью
Перед тем как устроиться на свою первую фултайм работу я заинвестиловал в регулируемый стол. Взял самый дешёвый за 250 евро – и это покупка с самым высоким ROI в моей карьере.
Почему?
1️⃣ Если вы хотите щёлкать интервью как семечки и расти по доходам, то вам нужно красиво и понятно говорить. Если вы проходите собесы сидя, то я представляю как вы жестикулируете и артикулируете (скорее всего достаточно жидко и неуверенно). Встаньте! Это чистая физиология: вам легче дышать, кровоток лучше, руки включаются когда вы стоите, голос – тупо громче и увереннее.
2️⃣ Здоровье. Давно взял себе за правило, что я не сижу ни на одном важном созвоне, все мои ментисы и коллеги подтвердят, что ни разу не видели меня в сидячем положении. Так половину рабочего дня или даже больше я стою, а другую половину сижу. Стоять весь день тоже вредно, поэтому периодически меняю положение, чтобы жёпа не затекала, а ноги не уставали.
3️⃣ Когда вы приведёте в свою квартиру девочку или мальчика и он увидит у вас поднятый стол – он ваш. Поднятый стол – признак высокого профессионализма, уверенности, внимания к собственному здоровью, и как следствие в вас видят более надёжного партнёра (ну борщанул немного, да, просто хотелось 3 пункта, не обессудьте 🙂 ).
К сожалению у меня нет рекламодателя-производителя таких столов, но если бы был, то я бы призвал всех кто хочет лутать много кэша и оставаться здоровым рассмотреть такую покупку.
Также, предлагаю внести следующие санкции в отношение работодателей:
• если в компании нет регулируемых столов в офисе — я там не работаю.
• впрочем, если нужно ходить в офис, то я там тоже не работаю🌚
А вы на каком боку работаете?
#dev_help #money
Багодельня Соколовского👾
Перед тем как устроиться на свою первую фултайм работу я заинвестиловал в регулируемый стол. Взял самый дешёвый за 250 евро – и это покупка с самым высоким ROI в моей карьере.
Почему?
К сожалению у меня нет рекламодателя-производителя таких столов, но если бы был, то я бы призвал всех кто хочет лутать много кэша и оставаться здоровым рассмотреть такую покупку.
Также, предлагаю внести следующие санкции в отношение работодателей:
• если в компании нет регулируемых столов в офисе — я там не работаю.
• впрочем, если нужно ходить в офис, то я там тоже не работаю
А вы на каком боку работаете?
#dev_help #money
Багодельня Соколовского
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥45👍12 11 1
Дурачился на выходных и навайбкодил тг бота для чата друзей который озвучивает сообщение от человека его же голосом 🎧
ElevenLabs как раз выпустили v3 модель для генерации эмоционального голоса, чтобы эмоции работали нужно вручную добавлять тэги типа [смех], [беспокойство], [прочистил горло]. Также, они зашэрили промпт для того, чтобы вы смогли органично добавлять эти тэги в любой текст с помощью LLM.
Какой алгоритм:
0. Получить API ключи для ElevenLabs и OpenAI
1. Собрать голосовые сообщения человека где хорошо слышен его голос
2. Зайти в ElevenLabs и выбрать Voice Cloning, загрузить туда эти голосовые, получите Voice ID
3. Попросить CLAUDE написать aiogram бота который будет по команде /fm читать сообщение, добавлять эмоциональные тэги и генерировать аудишку с выбранным Voice ID
4. Deployнуть всё это дело на сервер
Весь процесс занял 1.5-2 часа, тюнинг клонированного голоса самая времязатратная вещь, вккпе с v3 он работал не очень похоже на целевого человечка.
Если кому-то интересно посмотреть на код/промпт или запустить такого бота для своего чатика — дайте FIRE🔥 и поделюсь репой после соточки я уже поделился кодом в комментах к этому посту.
#ai #dev_help
Багодельня Соколовского👾
ElevenLabs как раз выпустили v3 модель для генерации эмоционального голоса, чтобы эмоции работали нужно вручную добавлять тэги типа [смех], [беспокойство], [прочистил горло]. Также, они зашэрили промпт для того, чтобы вы смогли органично добавлять эти тэги в любой текст с помощью LLM.
Какой алгоритм:
0. Получить API ключи для ElevenLabs и OpenAI
1. Собрать голосовые сообщения человека где хорошо слышен его голос
2. Зайти в ElevenLabs и выбрать Voice Cloning, загрузить туда эти голосовые, получите Voice ID
3. Попросить CLAUDE написать aiogram бота который будет по команде /fm читать сообщение, добавлять эмоциональные тэги и генерировать аудишку с выбранным Voice ID
4. Deployнуть всё это дело на сервер
Весь процесс занял 1.5-2 часа, тюнинг клонированного голоса самая времязатратная вещь, вккпе с v3 он работал не очень похоже на целевого человечка.
Если кому-то интересно посмотреть на код/промпт или запустить такого бота для своего чатика — дайте FIRE
#ai #dev_help
Багодельня Соколовского
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥122👾1
Браузерный холивар
Быть адаптивным в плане тулинга сейчас – это реальное преимущество на рынке. Я был удивлён, что кто-то из около тех-тусовки до сих пор не слышал про Arc или Zen. Подготовил шортлист браузеров, которые я потыкал в 2025 году:
Arc Browser
∙ Вертикальные вкладки, это удобнее, чем может показаться на первый взгляд
∙ Автоматически подчищает мусорные вкладки, которые вы не закрепили
∙ Разделение на спэйсы в рамках одного окна браузера (в хроме, когда я им ещё пользовался, для каждого спейса открывалось новое окно)
∙ Я не хотел начинать им пользоваться, так как The Browser Company, которая его разрабатывала забили на проект, но позже продали Arc нашим жыра-друзьям из Atlassian, а сами переключились на новый браузер Dia (не путать с державными+потужными гос услугами)
∙ Closed source + все ваши данные становятся достоянием Atlassian
Zen
∙ Включает в себя все плюсы Arc, но на движке Gecko (Firefox)
∙ OpenSource проект с живым комьюнити
∙ Местами чувствуется сыроватым
∙ Privacy first, не собирается ни байта ваших данных
Vivaldi
∙ Chromium браузер от бывшего CEO Opera
∙ Встроенные почта и календарь прямо в браузере
∙ Встроенный блокировщик рекламы
∙ Самый стабильный из перечисленных, высокий уровень кастомизации, для кого-то даже слишком высокий
∙ Наименее зумерский из перечисленных
ChatGPT Atlas / Perplexity Comet
∙ Браузеры, которые изначально строились вокруг ИИ
∙ Atlas от OpenAI – Chromium-браузер с ChatGPT в сайдбаре, видит контент страницы и может выполнять задачи за вас в agent mode. Comet от Perplexity - тоже Chromium, вышел в июле 2025, стал бесплатным в октябре, теперь продукт это ваши данные🌚
∙ Из этих двоих сам я пользовался только Atlas и особого прикола не понял – приглашаю всех в комментарии поделиться опытом использования и заодно устроить браузерный холивар!
Фан фэкт – 80% всего браузерного трафика идёт через Chromium-based браузеры. Из моего списка только Zen работает на другом движке. Все остальные, включая Arc, Vivaldi, Atlas и Comet — хромососы.
Если вы до сих пор сидите на дефолтном Chrome, то стряхните седые волосы с плеч и хотя бы попробуйте что-то из нового. Если уж и отдавать все свои данные корпорации, то надо что-то получать взамен, например, вертикальные вкладки😁
#dev_help
Багодельня Соколовского👾
Быть адаптивным в плане тулинга сейчас – это реальное преимущество на рынке. Я был удивлён, что кто-то из около тех-тусовки до сих пор не слышал про Arc или Zen. Подготовил шортлист браузеров, которые я потыкал в 2025 году:
Arc Browser
∙ Вертикальные вкладки, это удобнее, чем может показаться на первый взгляд
∙ Автоматически подчищает мусорные вкладки, которые вы не закрепили
∙ Разделение на спэйсы в рамках одного окна браузера (в хроме, когда я им ещё пользовался, для каждого спейса открывалось новое окно)
∙ Я не хотел начинать им пользоваться, так как The Browser Company, которая его разрабатывала забили на проект, но позже продали Arc нашим жыра-друзьям из Atlassian, а сами переключились на новый браузер Dia (не путать с державными+потужными гос услугами)
∙ Closed source + все ваши данные становятся достоянием Atlassian
Zen
∙ Включает в себя все плюсы Arc, но на движке Gecko (Firefox)
∙ OpenSource проект с живым комьюнити
∙ Местами чувствуется сыроватым
∙ Privacy first, не собирается ни байта ваших данных
Vivaldi
∙ Chromium браузер от бывшего CEO Opera
∙ Встроенные почта и календарь прямо в браузере
∙ Встроенный блокировщик рекламы
∙ Самый стабильный из перечисленных, высокий уровень кастомизации, для кого-то даже слишком высокий
∙ Наименее зумерский из перечисленных
ChatGPT Atlas / Perplexity Comet
∙ Браузеры, которые изначально строились вокруг ИИ
∙ Atlas от OpenAI – Chromium-браузер с ChatGPT в сайдбаре, видит контент страницы и может выполнять задачи за вас в agent mode. Comet от Perplexity - тоже Chromium, вышел в июле 2025, стал бесплатным в октябре, теперь продукт это ваши данные
∙ Из этих двоих сам я пользовался только Atlas и особого прикола не понял – приглашаю всех в комментарии поделиться опытом использования и заодно устроить браузерный холивар!
Фан фэкт – 80% всего браузерного трафика идёт через Chromium-based браузеры. Из моего списка только Zen работает на другом движке. Все остальные, включая Arc, Vivaldi, Atlas и Comet — хромососы.
Если вы до сих пор сидите на дефолтном Chrome, то стряхните седые волосы с плеч и хотя бы попробуйте что-то из нового. Если уж и отдавать все свои данные корпорации, то надо что-то получать взамен, например, вертикальные вкладки
#dev_help
Багодельня Соколовского
Please open Telegram to view this post
VIEW IN TELEGRAM
👾10🔥3👍1👎1
На прошлой неделе собесился на позицию Senior AI инженер в британскую компанию, предоставляющую юридические услуги (предлагают 12500$).
Да, неплохо насыпают😁 , но больше меня зацепило то, что это первая AI-first компания с которой я общался. Они не надстраивают ИИ обёртки над своими говнопроцессами, а адаптируют процессы под софт который сами и пишут, а софт под процессы. Они не продают SaaS в классическом понимании, они продают услуги. У них есть штат юристов, оптимизирован каждый этап обработки и онбординга клиента.
Потом я увидел это видео от YC и оно прекрасно легло на то, что я подметил о том стартапе. Compound startup – принцип заключается в том, что если оптимизировать каждый процесс в компании на 10% при наличии ~8 этапов:
Каждый этап воронки работает чуток лучше – и на выходе получаешь компанию, которая в два раза эффективнее конкурентов.
Это понимает и CEO с моей работы, где нас пушат решать все задачи с AI-first мышлением, иногда это может быть больно, но щепотка правды в этом есть. Про то как я решаю рабочие задачи писал👉 тут.
Загвоздка в том, что в таком пайплайне не должно быть узких мест – одно слабое звено обнуляет всю экспоненту. Пропускная способность равна худшей пропускной способности среди её частей.
Деньги в AI инжиниринге всё ещё есть, а рынок всё ещё кандидатский. Об этом писал👉 тут, а тут выкладывал тестовое на 8000$.
#ai #startup
Багодельня Соколовского👾
Да, неплохо насыпают
Потом я увидел это видео от YC и оно прекрасно легло на то, что я подметил о том стартапе. Compound startup – принцип заключается в том, что если оптимизировать каждый процесс в компании на 10% при наличии ~8 этапов:
1.1^8 = 2,15
Каждый этап воронки работает чуток лучше – и на выходе получаешь компанию, которая в два раза эффективнее конкурентов.
Это понимает и CEO с моей работы, где нас пушат решать все задачи с AI-first мышлением, иногда это может быть больно, но щепотка правды в этом есть. Про то как я решаю рабочие задачи писал
Загвоздка в том, что в таком пайплайне не должно быть узких мест – одно слабое звено обнуляет всю экспоненту. Пропускная способность равна худшей пропускной способности среди её частей.
Деньги в AI инжиниринге всё ещё есть, а рынок всё ещё кандидатский. Об этом писал
#ai #startup
Багодельня Соколовского
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21👍4👾4
Залетел на колабу к главному волку рунета 🐺
Первый опыт запуска полностью автономного кодинг агента на большом проекте, бегом смотреть.
Первый опыт запуска полностью автономного кодинг агента на большом проекте, бегом смотреть.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥24
Forwarded from Осознанная Меркантильность | Антон Назаров
Завайбкодили Saas за 1 день
https://youtu.be/yOd5sEw3Wbw
https://youtu.be/yOd5sEw3Wbw
https://youtu.be/yOd5sEw3Wbw
В 2026 почти каждый айтишник хочет свой SaaS — не найм и не две удалёнки, а продукт, который зарабатывает сам.
AI настолько ускорил разработку, что я решил проверить: можно ли собрать рабочий SaaS за один день в соло.
В этом видео мы распланировали работу, а AI-агент несколько часов полностью самостоятельно пишет код, тестирует и деплоит изменения.
Без команды. Без ручного кодинга. С бюджетом $200.
Мы собираем реальный SaaS в Telegram с подписками, голосом и платежами.
И да – весь код и промпты доступны в сообществе, чтобы ты мог повторить эксперимент.
Код и промпты забирать здесь
https://youtu.be/yOd5sEw3Wbw
https://youtu.be/yOd5sEw3Wbw
https://youtu.be/yOd5sEw3Wbw
В 2026 почти каждый айтишник хочет свой SaaS — не найм и не две удалёнки, а продукт, который зарабатывает сам.
AI настолько ускорил разработку, что я решил проверить: можно ли собрать рабочий SaaS за один день в соло.
В этом видео мы распланировали работу, а AI-агент несколько часов полностью самостоятельно пишет код, тестирует и деплоит изменения.
Без команды. Без ручного кодинга. С бюджетом $200.
Мы собираем реальный SaaS в Telegram с подписками, голосом и платежами.
И да – весь код и промпты доступны в сообществе, чтобы ты мог повторить эксперимент.
Код и промпты забирать здесь
YouTube
Собрал рабочий SAAS за 24 часа в соло 🚀 с бюджетом $200
✺ Забирай код, инструкцию, промпт и экспорт диалога: https://t.me/om_assistant_robot?start=QUkgc2FhcyDQktC70LDQtA
✺ Телеграмм канал Влада: https://t.me/makebugger
✦Учу зарабатывать в IT: https://t.me/m0rtymerr_channel
✦Найти ментора в IT: https://reviews.it…
✺ Телеграмм канал Влада: https://t.me/makebugger
✦Учу зарабатывать в IT: https://t.me/m0rtymerr_channel
✦Найти ментора в IT: https://reviews.it…
🔥26👍13
new-agents.md
848 B
Удалите свой CLAUDE.md/AGENTS.md/rules файл
В свежем рисёрч пейпере о пользе/вреде AGENTS.md утверждают интересную вещь: файлы, которые вы генерите для своих репозиториев, чтобы помогать агентам в них ориентироваться – на самом деле делают только хуже.
Некоторые факты из статьи:
- AGENTS.md файлы, сгенерированные с помощью /init, в среднем понижают success rate на 3%
- Если вы будете дотошно писать AGENTS.md вручную, то получится добиться улучшения в 4%
- Все контекстные файлы повышают стоимость ваших запросов на 20%, так как агенту приходится делать больше шагов
- Навигация по вашей кодовой базе, которую вы всегда включаете в свой AGENTS.md как собаке пятая нога. Агент и так неплохо ориентируется, используя cat, ls, grep и другие bash тулы, навигационные секции ему не помогают
Кстати, про похожую проблему с контекст-bloat я уже 👉 писал тут, когда разбирал косяки MCP серверов – декларация всех тулов в контексте создаёт такой же мусор, который не помогает модели.
С появлением SKILLs в современных кодинг агентах пропагандирую максимально минималистичный AGENTS.md. Лучше ссылаться из него на определённые скилы и документацию, чем пихать всё в одно место.
Кстати, в SkillsBench показали, что Claude Code с правильными скилами улучшает success rate на 23% – это в 5+ раз больше, чем улучшение от самого дотошного ручного AGENTS.md. Писать чонить про скилы?
Context engineering я уже затрагивал 👉 тут.
Ну а теперь, когда чары псиопа спали, я начну пользоваться контекстными файлами так, как мне всегда казалось интуитивным.
Например, я замечаю, что агент напрямую вносит изменения в файл pyproject.toml и добавляет какую-то непонятную версию библиотеки, которая устарела пару лет назад, и делает он это на постоянке, а это значит, нужно внести новое правило в AGENTS.md:
Таким образом, контекстный файл стоит расширять лишь теми вещами, которые агент конзистентно забывает и мисинтерпретирует.
Короче, давайте переставать использовать /init, он всё усугубляет.
К посту прикрепляю префикс к вашему апдейтнутому CLAUDE.md/AGENTS.md/rules файлу, разбирайте. С сегодняшнего дня использую его на всех своих проектах.
Пост переслать, сообщение лайкнуть, Соколовскому насыпать корма, чтобы ещё чонить писал.
#ai #dev_help
Багодельня Соколовского👾
В свежем рисёрч пейпере о пользе/вреде AGENTS.md утверждают интересную вещь: файлы, которые вы генерите для своих репозиториев, чтобы помогать агентам в них ориентироваться – на самом деле делают только хуже.
Некоторые факты из статьи:
- AGENTS.md файлы, сгенерированные с помощью /init, в среднем понижают success rate на 3%
- Если вы будете дотошно писать AGENTS.md вручную, то получится добиться улучшения в 4%
- Все контекстные файлы повышают стоимость ваших запросов на 20%, так как агенту приходится делать больше шагов
- Навигация по вашей кодовой базе, которую вы всегда включаете в свой AGENTS.md как собаке пятая нога. Агент и так неплохо ориентируется, используя cat, ls, grep и другие bash тулы, навигационные секции ему не помогают
Кстати, про похожую проблему с контекст-bloat я уже 👉 писал тут, когда разбирал косяки MCP серверов – декларация всех тулов в контексте создаёт такой же мусор, который не помогает модели.
С появлением SKILLs в современных кодинг агентах пропагандирую максимально минималистичный AGENTS.md. Лучше ссылаться из него на определённые скилы и документацию, чем пихать всё в одно место.
Кстати, в SkillsBench показали, что Claude Code с правильными скилами улучшает success rate на 23% – это в 5+ раз больше, чем улучшение от самого дотошного ручного AGENTS.md. Писать чонить про скилы?
Context engineering я уже затрагивал 👉 тут.
Ну а теперь, когда чары псиопа спали, я начну пользоваться контекстными файлами так, как мне всегда казалось интуитивным.
Например, я замечаю, что агент напрямую вносит изменения в файл pyproject.toml и добавляет какую-то непонятную версию библиотеки, которая устарела пару лет назад, и делает он это на постоянке, а это значит, нужно внести новое правило в AGENTS.md:
для добавления новых библиотек и изменения версий существующих зависимостей всегда используй uv package manager, никогда не модифицируй pyproject.toml напрямую
Таким образом, контекстный файл стоит расширять лишь теми вещами, которые агент конзистентно забывает и мисинтерпретирует.
Короче, давайте переставать использовать /init, он всё усугубляет.
К посту прикрепляю префикс к вашему апдейтнутому CLAUDE.md/AGENTS.md/rules файлу, разбирайте. С сегодняшнего дня использую его на всех своих проектах.
Пост переслать, сообщение лайкнуть, Соколовскому насыпать корма, чтобы ещё чонить писал.
#ai #dev_help
Багодельня Соколовского
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥65👍15👾11 4
Memento - база
По-любому вы испытывали удивление когда год-два назад ChatGPT или любой другой агент доставал о вас факты которые вы вскользь упоминали несколько сессий назад.
Посмотреть то, что ChatGPT сохранил о вас можно зайдя в
Вы удивитесь, но это просто текстовый файлик, никаких векторов из этого не извлекается и работает это достаточно надёжно.
С другой стороны есть компании типа mem0 которые подняли 24M$ на то, чтобы разрабатывать свой over-engineered движок для памяти. Да, ребята продают три промпта и векторную базу данных и получили 24 ляма зелёных на миска рис и кари.
Если вы хоть раз использовали mem0, вы никогда не захотите использовать это подобие памяти на других проектах. Думаете, что если перейдёте на Enterprise план, то что-то поменяется? Нет, всё станет ещё хуже, потому что теперь вы за это говно ещё и платите.
Ах да, к чему я это. Антропики обновили систему памяти в Claude Code и она теперь состоит из двух частей:
1️⃣ CLAUDE.md файлы – инструкции которые ты пишешь руками. Пост про то, как держать их минималистичными и полезными, я писал 👉 тут.
2️⃣ Auto memory – а вот это уже настоящая автоматическая память. Claude сам записывает паттерны проекта, решения багов, архитектурные заметки и твои предпочтения в
Там лежит MEMORY.md как индекс (первые 200 строк грузятся в каждую сессию) и тематические файлы типа debugging.md или api-conventions.md, которые Claude читает когда нужно (по сути гибрид памяти и скилов).
Автономный агент Бори Чёрного за выходные взял и сделал то, на что mem0 насыпали 24 МИЛЛИОНА долларов. Без ёбаных векторных баз и эмбеддингов.
Автоматическая память, которая сама решает что запомнить, организует заметки по темам, ведёт индекс – и всё это обычные маркдаун файлы на твоём диске.
У меня есть некий скепсис к memory движкам, уж больно часто там возникают противоречащие записи или слииишком много мусора. Ну а индусикам из mem0 пожелаем вдоволь наесться тикка масалы и приготовиться затянуть пояса, потому что больше денег они вряд ли получат. Завтра это зарелизят в Claude Code SDK, а послезавтра это станет commodity.
Очень часто самое правильное инженерное решение – это самое скучнякское🫡
#ai #dev_help #startup
Багодельня Соколовского👾
По-любому вы испытывали удивление когда год-два назад ChatGPT или любой другой агент доставал о вас факты которые вы вскользь упоминали несколько сессий назад.
Посмотреть то, что ChatGPT сохранил о вас можно зайдя в
Настройки -> Персонализация -> Память
Вы удивитесь, но это просто текстовый файлик, никаких векторов из этого не извлекается и работает это достаточно надёжно.
С другой стороны есть компании типа mem0 которые подняли 24M$ на то, чтобы разрабатывать свой over-engineered движок для памяти. Да, ребята продают три промпта и векторную базу данных и получили 24 ляма зелёных на миска рис и кари.
Если вы хоть раз использовали mem0, вы никогда не захотите использовать это подобие памяти на других проектах. Думаете, что если перейдёте на Enterprise план, то что-то поменяется? Нет, всё станет ещё хуже, потому что теперь вы за это говно ещё и платите.
Ах да, к чему я это. Антропики обновили систему памяти в Claude Code и она теперь состоит из двух частей:
~/.claude/projects/<project>/memory
Там лежит MEMORY.md как индекс (первые 200 строк грузятся в каждую сессию) и тематические файлы типа debugging.md или api-conventions.md, которые Claude читает когда нужно (по сути гибрид памяти и скилов).
Автономный агент Бори Чёрного за выходные взял и сделал то, на что mem0 насыпали 24 МИЛЛИОНА долларов. Без ёбаных векторных баз и эмбеддингов.
Автоматическая память, которая сама решает что запомнить, организует заметки по темам, ведёт индекс – и всё это обычные маркдаун файлы на твоём диске.
У меня есть некий скепсис к memory движкам, уж больно часто там возникают противоречащие записи или слииишком много мусора. Ну а индусикам из mem0 пожелаем вдоволь наесться тикка масалы и приготовиться затянуть пояса, потому что больше денег они вряд ли получат. Завтра это зарелизят в Claude Code SDK, а послезавтра это станет commodity.
Очень часто самое правильное инженерное решение – это самое скучнякское
#ai #dev_help #startup
Багодельня Соколовского
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26 9🔥4
Вечерней романтики вам сейчас немного отсыплю, да?
Два человека задают Claude один и тот же промпт - получают разные ответы. И не потому что модель рандомит, а потому что каждый формулирует по-своему, переспрашивает по-своему, копает в свою сторону.
Человек в этом процессе как seed в генераторе случайных чисел.
Модель одна, но последовательность, которую мы из неё вытягиваем для каждого уникальна. И через эту последовательность мы, возможно, узнаем о себе больше, чем о технологии.
Слишком примитивная метафора? На сколько борщанул от 1 до 42?
Багодельня Соколовского👾
Два человека задают Claude один и тот же промпт - получают разные ответы. И не потому что модель рандомит, а потому что каждый формулирует по-своему, переспрашивает по-своему, копает в свою сторону.
Человек в этом процессе как seed в генераторе случайных чисел.
Модель одна, но последовательность, которую мы из неё вытягиваем для каждого уникальна. И через эту последовательность мы, возможно, узнаем о себе больше, чем о технологии.
Слишком примитивная метафора? На сколько борщанул от 1 до 42?
Багодельня Соколовского
Please open Telegram to view this post
VIEW IN TELEGRAM