Багодельня Соколовского 👾
2.44K subscribers
31 photos
5 videos
1 file
94 links
Про AI, стартапы, путешествия и всё, что меня вдохновляет.

сотрудничество, AI Eng. менторство - @vladislove_sos
Download Telegram
На этих выходных были в Мюнхене

На вокзале нас встретили стеклянные бутылки, выстроенные в шахматном порядке, чтобы немецкие бичи-полиглоты не утруждались копаться в мусорке. Всё для людей.

В пятницу вечером основной саундтрек района, где мы остановились – некончающийся шранц и гул хипстеров. Всё джентрифицировано, но остался дух бывшей промзоны, везде пирамиды грузовых контейнеров с граффити. Приятно.

В целом, неплохо, от крупных городов Западной Европы всегда ожидаешь всего самого худшего, но тут сирийский ребёнок кинулся на меня всего один раз.

Также, были свидетелями немецкого свидания, парочка весь вечер тёрла друг другу ручки, а когда им принесли счёт то начался спектакль похлеще того, что происходил в конгрессе во время шатдауна. На немецких свиданиях всё делится до евроцента. Для меня всё это выглядит как скупердяйство и прагматичность, доведённая до предела, будто эти люди не умеют и не любят угощать.

В воскресенье, как вы знаете, в Германии почти всё закрыто, все сидят дома и считают бюджет. Больше всего в Германии мне нравится то, что я там не живу.

#travel

@makebugger
👍4012👎41
​​Планируете интеграцию ИИ в новом году?

Продолжая тему планирования и приоритизации ИИ проектов: 👉тут я уже говорил, что первый этап приоритизации может быть high-level оценкой с технической и бизнес стороны. Тут очень важно давать не объективную, а относительную оценку.

Это значит, что оценка сложности и импакта каждого проекта зависит от всех остальных проектов в выборке. Делается это для более лёгкой приоритизации действительно важных вещей, иначе точки на вашей системе координат имеют тенденцию быть очень кучными. Оценку всех инициатив лучше делать «взахлёб», чтобы в процессе анализа у вас сохранялся контекст всех остальных инициатив.

Процесс следующий:

1️⃣Анализ инициативы и первичная оценка от 1 до 10, где 1 это – у нас нет достаточной экспертизы, чтобы заделиверить проект в течение полугода, изначальные требования от системы нереалистичные, нынешние технологии этого не позволяют. А 10 это – есть вся необходимая экспертиза, сможем заделиверить за 40-60 MD (1 ManDay = 8 часов).

2️⃣По ходу прохождения списка инициатив нормально прыгать назад и подправлять оценку предыдущих. Оценка должна быть относительной, чтобы менеджменту было легче принять решения по приоритизации.

3️⃣После первичного прохождения инициатив нужно сделать ревью и добавить объяснение своей оценки в 2-3 предложениях. После этого ваш ПМ должен сделать похожее ментальное упражнение для всех инициатив с бизнес точки зрения.

4️⃣Из самых приоритетных инициатив первого квадранта вам нужно составить short list с детальной технической оценкой по нескольким параметрам.

Пример параметров:

• Ожидаемая точность модели
• Архитектура data пайплайн
• Хостинг и развертывание моделей
• Количество и типы источников данных
• Объем данных
• Необходимые интеграции с системами
• Доступность и готовность API
• Оценка стоимости
• Зависимость от задержек (Latency)
• Требуемая производительность системы
• Риски соответствия (Compliance) и безопасности
• Возможность масштабирования на другие кейсы.



Это всего лишь фреймворк процесса, а не догма.

#dev_help #ai

@makebugger​​​​​​​​​​​​​​​​
🔥11
Media is too big
VIEW IN TELEGRAM
Январь. Карелия. Снега навалило по колено.
Встретил там год.
Потом поезд Сортавала -> Питер.

В вагоне русский ирландец из японии, вежливый, но не узкоглазый.
В Мариинке Щелкунчик. Рига. Лидо. В котлетках зараза
вкуса и сытости.
Стартап улетел в чужие руки.
Денюжка упала. Можно хуй пинать от безделья и скуки.

Рим. От стадиона минут пятнадцать. Пыль дорог.
Акведук, Марсово поле - жить приятно, если Бог
дал тебе возможность смотреть на это всё без спешки. Новая работа. Влог. Мемкоины. все мы тут пешки😅

Пасха. София. Подарили здравец - пахучий куст.
В Тырново замок светится. В Шумене – памятник, груст-
ный таксист наебал на копейки.

Бухарест, Дракула, мрак.
Брашов. Узкие улицы. Чуть не вписался в косяк
на арендованной тачке.

Деревня из Бората, дети в тапках, грязь, босота.
Храмы, иконы. Как-то у них всё по-цыгански.

Кишинёв. Автобус. Допрос. Погранцы, задержка.
Автобус уехал без нас. Еда вкусная, сервис на русском.

Назад Прага. Турнир по шахматам, тут я ферзь.
Помогаю людям искать работу в ИИ. Какая-то взвесь
альтруизма.

Финка – первый раз. Таллин – десятый.
Снова Лидо, компот, раскайфовочка. Взгляд помятый.

Петербург. Свои люди. Лодка. Выпили. Депнули. Антона студия.
В августе передышка. Потом Верхний Ларс, дорога на Кубань. Свадьба. Зубы. Друзья.
С мотика ёбнулся. Руку разодрал. Жить так нельзя,
но можно.

Архыз. Озеро. Вода - ледяной нож.
Обнял пацанов. Стамбул. Ты читаешь и ржешь.

а кто-то отписывается

Китайский учим. Видео вышло. Блог растет, как сорняк.
Дю Солей. Накаченный мужик без футболки. это ништяк.

Мюнхен. Любимая рядом. Балдурс Гейт, орки, люди, медведи, тёмные залы.
Работать не хочется. Подзаебали все эти вокзалы..
аэропорты

Хочется дом на Кубани. Тишину. Свои грядки.
Вот такие дела, пацаны и девчонки. 2025ый у меня был в порядке.

ике, ике бабу

#life

@makebugger
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20👍7👾42
2025 мы запомним надолго

Этот год полностью поменял мой рабочий процесс – я стал писать меньше кода, больше ревьюить и решать архитектурные задачи. Code Assistant года - это однозначно Claude Code: приятный для меня CLI интерфейс и понятные парадигмы, полная автономность в решении комплексных задач. Даже несмотря на то, что к концу года я вернулся на Cursor + Opus 4, Claude Code всё равно тула года. По слухам, Антропики готовятся выходить на IPO, если это так – копим кэш, чтобы потом не жалеть, что «не залетели в биток в 2017» (хотя всё равно нас побреют, кого я обманываю 😅).

Говоря о модели года, это однозначно gemini-2.5-flash – чтобы посчитать количество продакшн-решений, к которым я приложил руку и где использовали эту модель, то пальцев у меня точно не хватит. Лучший trade-off скорости, качества и цены на рынке. Думаю, после stable-релиза gemini-3-flash (сейчас она ещё в preview) имеет все шансы стать моделью 2026 года. В целом Google это лидер в AI-гонке, лучшие интеграции ИИ в продукты. Об этом писал ещё в июне, сейчас это очевидно всем.

Несмотря на миллионные зэпэшки, которые Цукер платил ML-инженерам, Мета в 2025 сдулась и не показала ничего интересного. Китайцы доминируют на опен-соурс сцене, а из Меты даже ЛеКун свалил. Серия моделей Qwen вне конкуренции - я даже на своём RaspberryPi4 qwen-0.5b заселфхостил.

Прогнозы на 2026:

1️⃣ Сутскевер со своим Safe Superintelligence сделают паблик-релиз, или же произойдёт утечка новой парадигмы, которая немного поменяет вектор развития индустрии. Что-то соизмеримое deepseek r1 или больше.
2️⃣ AGI уйдёт из повестки, мы станем слышать этот buzz word всё меньше - все понимают, что цифровой Бог ещё не скоро, да и никому это не надо. Если начать повсеместно интегрировать уже существующие модели, то рынок труда не будет прежним. AGI не нужен, нужен грамотный adoption.
3️⃣ Nvidia потеряет монополию на графические чипы. Китайцы или кто-нибудь ещё их подвинут. Хз правда, как мигрировать с CUDA.
4️⃣ Большая новость около OpenAI - либо их купят, либо сменят CEO, но что-то должно растормошить это болото.
5️⃣ Влияние ИИ на рынок труда станет более очевидным, политики начнут активно использовать это для достижения своих целей. Неолуддизм и манифест унабомбера наберут обороты.

Age like milk or age like wine? Увидим через годик, будет весело и страшно

С радостью почитаю ваши прогнозы на 2026 😊

#ai

@makebugger
Please open Telegram to view this post
VIEW IN TELEGRAM
👾24🔥10👍2
До недавнего времени не выкупал почему в Барселоне местные так хейтят туристиков. Они к ним едут, деньги везут, а местным всё не то. Недавно их понял.

Прага это одно из топ направлений во время рождественских праздников, гемини мне тут накидало, что чешская столица на 6. месте из городов ЕС по количеству туристов которые заезжают к нам в гости во время праздников. 600 тысяч человек для города миллионника это очень много. Не представляю как там кёльнцы выдерживают 4-5 миллионов туристов за сезон…

Основная проблема в том, что центр города постепенно превращается в тематический парк где даже официанты по чешски не говорят. 99% заведений в центре города это развод гоев, город с этим ничего не делает так как не может (дада, рука руку моет). Местные в центре города не живут, вся недвижимость сдана под эирбнб, почти все магазины и развлечения в центре – оверпрайс скам.

Короче, этот процесс Амстердамфикации вытесняет местных из центра потому что всё делается только для туристов, а они готовы платить много денег за ужасное качество. Тайская дрочильня на главной площади страны это не ок.

Свободный рыночек порешал и теперь мы вкушаем последствия, я бы начал с регуляции того как выглядят фасады и рекламные вывески.

Мы с другом тоже пытались пробраться к кормушке, об этом писал 👉тут. Но нет хуже существа чем евробюрократ с опухшим чувством собственной важности. Фотобудку нам поставить не дали так как цитирую: «не добавляет никакой культурно-исторической ценности городу», но зато тайская дрочильня и «каннабис» шопы на главной площади страны это перемога.

#life #travel

@makebugger
Please open Telegram to view this post
VIEW IN TELEGRAM
148🔥3👍2
Если вы ещё не пользовались Opus-4.5, то у вас устаревшая точка зрения относительно того на что способны LLMs

Могу смело назвать себя early adopterом многих хайповых технологий, на Cursor я перешёл еще в 2023, когда основная его ценность была в tab completions. До Июня 2025 из Cursor я не вылезал, а потом случился ClaudeCode (CC), тогда я написал целую внутреннюю систему в TypeScript, язык на котором я ничего до тех пор не делал.

Наша с CC любовь продолжалась где-то до сентября, Opus 4 как модель мне зашла не особо, к тому же антропики постоянно резали модели + заметил, что мой usage стал гораздо меньше, а платить 100 зелёненьких за то чем не пользуешься меня жаба душила. Сжёг мосты с клодей и перешёл на хайпующий тогда Codex от OpenAI + он был включен в мою GPT подписку (которую, к слову, я недавно отменил) – грех было не пользоваться.

Ноябрь и декабрь я немного тильтанул от CLI агентов и вернулся в Cursor, где спокойно кодил свои питоновские проекты до конца года.

Новый год – новая Claude Max подписка. И, о боги, «это же ещё не конец прогресса» - подумал я и перестал писать код руками, сосредоточившись на таких вещах как улучшение CC сетапа, тестирование, реально детальное code review и систем дизайн – скиллы, которые необходимы для эффективной работы с этим инопланетным тулингом.

🚨 У меня есть 3 пропуска в Claude на неделю, давайте 50 огоньков и скину рефки в чат багодельни. Не забывайте включать ВПН, чтобы антропики вас не забанили, случаи были…

Скоро на канале человека которого большинство из вас хорошо знает (🐺) выйдет ролик где я от начала до конца покажу как с помощью CC создаётся большой и комплексный проект, думаю многим будет полезно, а пока можете подписаться на мой ютуб канал. Он пустоватый, но я закоммитился выпускать туда что-то интересное хотя бы раз в месяц 🫡

А пока что парочка полезных статей:
LLM кодинг воркфлоу от Эдди Османи
В CC добавили LSP - что это значит

Всем хороших выходных, не бойтесь пробовать новое!

#dev_help #ai

@makebugger
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥78👍11
​​Тут 👉я уже делал coming out касательно того, что уже долгое время учу китайский, пришло время поделиться результатами.

中文 я учу 2 года, по 2-5 часов в неделю. Никакой глобальной цели у этого процесса нет, просто мне хочется больше понять Китай, китайцев и их взгляд на мир. Также, меня подогревает тот факт, что я добавлю более миллиарда NPC с которыми смогу взаимодействовать и получать интересные сайдквесты 😅

Пришли результаты моего экзамена HSK3.. и это fuck up. Но не такой сильный, результатами аудирования и говорения я доволен. Особенно меня забавляет как навайбкоденый китайскими студентами сайт рад тому факту, что у меня "No pass", аж фейрверки запускает...

Writing в экзаменах по китайскому это, конечно, рудимент, думаю, что добрая половина китайцев забыла когда в последний раз писала что-то от руки, все используют pinyin и для того, чтобы им овладеть достаточно знать фонетику (все слова пишутся латиницей на основе их звучания), попробую подтянуть эту часть к пересдаче, но всё же больше ставлю на то, что просто улучшу навык чтения.

Аудирование на 88/100 и сданное говорение указывают на то, что уши и язык у меня работают куда лучше глаз и рук. Буду работать дальше, тем более что времени остаётся всё меньше – с 2026 года китайцы запускают HSK 3.0, и это полный пересмотр системы. Словарный запас вырос в 3+ раза, а уметь писать иероглифы от руки уже надо с HSK 2.

С одной стороны это приблизит HSK уровни к нашим привычным A1-C2. Раньше HSK 1-2 было сложно назвать осмысленной сертификацией, реальное понимание языка начиналось с третьего уровня. С другой стороны – для тех кто учит китайский part-time как я, порог входа станет значительно выше.

Сейчас по плану пересдача в марте, вроде ещё попадаю под старую систему, так как новую по полной выкатывают аж в июле 2026, сейчас у них выборочный бета тест.

1% more chinese today!!! 🇨🇳

#china #life

@makebugger
👍24🔥15👾1
Anthropic Cowork

Это очень важный релиз, который убьёт огромное колличество стартапов, весь X с начла года жужжит, что использую Claude Code не для кодинг задач и тут такой приятный подгон. Возможности Claude моделей о которых говорл 👉 тут расширяются на другие сферы и это не может не радовать/пугать (выбор оставлю за вами).

- Cowork построен с помощью Claude Agent SDK.
- Пока что доступен либо через waitlist либо для всех подписчиков Claude Max (другой Макс😏)
- Пока только клиент на macOS

Тут можете посмотреть на один из юзкейсов которым делятся Антропики. Если вы давно мечтали разделить всё по папочкам, чтобы все документы были там где положено, то это точно для вас.

Это пока что research preview, так что действуйте осторожно, а то что-нибудь ненароком вам удалит.

#news #ai

@makebugger
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥6
AI workflow > AI агенты

Всем нравится слушать про агентов, почти на каждом AI engineering интервью проскользнёт вопрос «Ну а агентов вы в продакшн запускали?».

Отвечать, конечно же, надо «Брат, я их не только запускал, но и вертел - люблю агентов, особенно U.N.C.L.E»

Мода называть каждую LLM-based систему агентом создаёт нереалистичные ожидания. Думаю, что нам ещё годы до реально автономных агентов.

___

Пока что замечал 2 антипаттерна:

• Оверинжиниринг мультиагентных систем — комплексные графы с десятками нод, как результат – невозможный мониторинг и дебагинг.

• Кинуть все 40 tool'ов на одного ReAct агента и пусть сам разберётся. Тут идёт ставка на то, что скоро LLM станут настолько умные, что такое количество тулинга перестанет быть для них проблемой. Я такое мнение не разделяю, про грамотный context engineering который с нами на года писал 👉 тут

Всегда стоит начинать с самого простого решения и постепенно его расширять, не нужно использовать технологию только потому что она крутая.

А чо там по агентам?

Менти как-то спрашивали: почему в материалах не так много инфы про построение реальных больших агентов? Ответ тут простой - use кейсов для действительно полезных агентов меньше, чем существующих фреймворков для их построения 😅

Самый очевидный кейс – Customer Support. Тут сходится всё: экономика, толерантность к ошибкам, и текущие LLM реально справляются. Текстовые и голосовые, всё работает более-менее надёжно.

Intercom из декабрьского отчёта OpenAI закрывает 53% звонков без людей, Lowe's удваивает конверсию когда клиенты общаются с их ботом. С личного опыта скажу, что агенты прекрасно заменяют живых операторов, если сделать по уму.

Что работает в остальных случаях

Не агенты, а детерминистичные workflows. ~20% enterprise сообщений в ChatGPT идут через Custom GPTs — специализированные пайплайны с чёткими инструкциями. Пишут, что BBVA (банк такой) использует 4000+ таких штук.

Для интереса посчитал количество упоминания слова workflow в этом репорте в 3 раза выше, чем упоминание agents 🤔

Итого

Прежде чем строить «агентную архитектуру»:
Проверь, подходит ли твой кейс под агентов вообще (саппорт - да, финансовые решения - скорее нет)

Разбей задачу на предсказуемые шаги
Добавляй «агентность» только туда где без неё никак. Не надо дизайнить систему сразу с пятью субагентами в цикличном графе🔫

Самый лучший ресурс для тех кто сейчас на распутье «агент или воркфлоу» антропики еще год назад написали прекрасную статью! Я бы начал с этого.

Пока что так

#ai #dev_help

@makebugger
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥122
Я получил ПМЖ в Чехии

Что вообще даёт ПМЖ в стране ЕС:

• больше не нужно каждые 1-2 года продлевать ВНЖ, ПМЖ выдаётся на 10 лет
• долгие зимовки и переезды по ЕС — прям сейчас могу уехать на год в Испанию и не утратить статус в Чехии
• ипотека! Получить ипотеку у местного банка без ПМЖ практически невозможно

У меня чешский диплом, так что я никогда не был привязан к работодателю. Но для тех, кто не заканчивал универ в ЕС, ПМЖ даёт свободу — ты уже больше не крепостной, который обязан найти работу в течение 2 месяцев после увольнения, и не надо оповещать МВД о каждом изменении в своей "трудовой книжке".

Почти во всех странах ЕС есть базовое правило – на ПМЖ можно подаваться после 5 лет непрерывного проживания в стране. Но тут есть важное НО. Если ты поехал в ЕС по учёбе, все учебные годы считаются с коэффициентом 1/2. То есть если пошёл на бакалавра (3 года), потом остался на магистратуру (2 года), то после этих 5 лет нужно прожить ещё 2.5 года по рабочей или предпринимательской визе:

(3+2) × 1/2 + 2.5 = 5 лет для ПМЖ


При этом для гражданства эти годы считаются 1:1 🤡

До паспорта мне чуть меньше 3 лет + нужна отмена закона, который временно запрещает получение чешского паспорта для граждан РФ 🤡. Отказываться от гражданства РФ в мои планы не входит, так что ждём и терпим.

Чешский паспорт сейчас 6-й в рейтинге самых сильных паспортов мира, лидирует мой любимый Сингапур, в котором я прожил полгода — история о том как я туда попал 👉 тут. Кстати, Сингапур никому не разрешает иметь двойное гражданство, а мужчины, которые получили местное ПМЖ во времена студенчества, обязаны пройти двухгодичную военную службу.

Через Gemini набросал табличку сравнения топ-10 европейских хабов по безопасности, чистоте, развитию айти-рынка, налогам и лёгкости интеграции.

Прага, как по мне, прекрасный город – здесь небольшие налоги и отсутствие маргинальных нелегалов, как следствие — очень низкий уровень преступности. Но погода здесь далеко не средиземноморская, а экспатское комьюнити не такое разношёрстное как в Амстердаме. Каждому своё.

#life #travel

@makebugger
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥30👍10
В пятницу в 16:30 прилетает инвайт на созвон.

«Давай синканёмся по статусу проекта». Проект идёт 4 дня, до дедлайна 5 недель. Это даже не продакшн проект, а Proof of Concept.

Ок, бывает.

Но дальше начинается интересное: мне объясняют, что мы можем не успеть (идёт первая неделя, впереди ещё пять, прогресс нормальный), и дают советы как именно мне стоит решать конкретные задачи (манагер - бывший программист).

В пятницу. В пять вечера. Перед выходными.

Самое забавное – не успеть мы можем по той причине, что сейлзы продали нас как экспертов в определённой технологии для работы с big data (никто из нас таковым не является), а от меня теперь ожидается оверделивери. Галеры – это худшее зло, не стоит там задерживаться.

Я привык к определённому уровню автономности. Мне описывают мою часть проекта, а как его декомпозировать и писать, я разбираюсь сам. Когда мне начинают диктовать конкретные шаги, у меня, оказывается, нормально так подгорает.

Раньше думал, что маркер чилового менеджера – наличие детей. К сожалению, гипотеза не подтвердилась. Встречал достаточно менеджеров-кодеров, воркоголиков, любителей конференций по питону, которые вместо пятничного вечера с детьми предпочитают ебать инженерам мозги по проекту для клиента, которому вообще до лампочки.

Возможно, я зажрался и принимаю обычное желание манагера знать статус за микроменеджмент… ну а что вы мне сделаете 😁

• Что для вас является микроменеджментом?
• Какие первые звоночки замечали?
• Как боролись, если вообще боролись?​​​​​​​​​​​​​​​​

@makebugger
Please open Telegram to view this post
VIEW IN TELEGRAM
267
Сколько часов экранного времени у вас в телефоне в день в среднем?
Anonymous Poll
28%
<3ч
29%
3-5ч
15%
5-7ч
14%
7+ч
13%
Посмотреть результаты
Vibe Code Clean-Up Specialist – вы могли увидеть работяг которые ставят такую роль в описании своего LinkedIn.

Обычно такие люди со снобской ухмылкой смотрят на остальных (стадо) и думают: «щас вы, маслята, навайбкодите, а потом все как проснуться из ИИ анабиоза и позовут меня чистить за вами 🍴🚽💩»

👉тут проводил опрос по тому какой процент кода вам пишут нейронки, каждый пятый генерит нейронкой меньше 20% кода. Сейчас мне уже сложно это визуализировать, честно, это либо:
• студент/новичок который учится и поэтому не генерит много
• сис админ который время от времени поправляет параметры в YAML
• тот кому на работе анально запрещают использование какого-либо ИИ, про нашу паранойю о безопасности писал 👉 тут
• программист-сноб, чьё эго задевает тот факт, что 300+ знаков в минуту на monkey type уже ничего не значит.

Если вы программист, генерите меньше 20% и не попадаете ни под одну категорию, то расскажите свою историю, пожалуйста🙏

Так вот, мои маленькие любители кодописания, такое время скорее всего никогда не настанет, вам никогда не придётся переписывать этот навайбкоденный слоп вручную.

Некачественный слоп-код будут переписывать те же агенты. Вот как нынешняя работа выглядит у меня:

1️⃣Обсуждение проблемы в Slack
2️⃣Когда понятно, что надо делать мы тегаем нашего @.Linear бота и говорим создать тикет.
3️⃣Я захожу в CC/Codex (зависит от того где есть токены), подключаю Linear MCP, прошу модель сделать первичный анализ, накидываю доку библиотеки которую нужно чекнуть, чтобы лучше понять как решать проблемку
4️⃣Если проблема распространяется на >1 репозиториев с которыми я не знаком, то я копирую описание проблемы и рассуждения CC в Devin (это агент у которого есть контекст по абсолютно всем репозиториям и документации в рамках организации, он достаточно дорогой, но необходимый тул для рисёрча)
5️⃣После того как я сам понял как агент собрался решать эту проблему - я запускаю генерацию, высокоуровнево пробегаюсь по коду, проверяю стиль, архитектурные решения, можно ли что-то обрезать, чтобы сделать его более читабельным
6️⃣Когда PR запушен в CI/CD есть джоб с codex CLI под капотом, который делает детальный ревью и оставляет комменты
+ sonar (для статической проверки качества кода)
7️⃣Запускаю кастомную CC команду на ветке с фичей, она читает все комменты от sonar, коллег-ревьюеров и claude и исправляет косяки
8️⃣Задача решена, можете ставить себе 2 стори поинта

80 🔥и скину свою кастомную команду которую можно подключить к Курсору или CLI Агенту
/gitlab-mr-review


#dev_help #ai

@makebugger
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥126👍4👎3
В последнее время всё чаще ловлю себя на том, что во время одиночных прогулок внутренним голосом задаю какие-то базовые вопросы типа «сколько сейчас градусов?» или «кто такие токал?», ожидая ответа от своего внутреннего Джарвиса.

Из-за того что я постоянно общаюсь с моделями голосом, спрашиваю у Алисы погоду и определения, мой мозг уже адаптировался и ждёт, когда я подключу к нему девайс через какой-нибудь BCI (Brain-Computer Interface), который будет читать мои мысли (желательно не отправляя их в облако 😊) и посылать сигналы в LLM. Output я готов получать в наушники, а позже конечно же придумают, как активировать мозг так, чтобы у нас возникали нужные образы.

Самое интересное, что про такие девайсы я слышал уже пару лет назад – например, Neurosity Crown уже тогда мог купить каждый желающий и запрогать её так, чтобы при мысли о дейлике LLM прошлась по вашему Slack, Issue Trackerу, Git и транслировала в ваш мозг (а лучше напрямую в мозг менеджеру) историю о том, чем вы вчера таким занимались.

Сейчас это уже просто вопрос времени, когда что-то такое выйдет на более широкий рынок. Думаю, ни к чему хорошему это, конечно, не приведёт...

Будет очень весело и очень страшно 🤗

А вы не ловили себя на таком?
Please open Telegram to view this post
VIEW IN TELEGRAM
👾1385
Срок годности нынешних AI проектов – 1-2 года, не больше

Сегодня сделал небольшую ретроспективу того какие проблемы мы решали в компаниях 1-3 года назад и стало очевидно, что то, что мы решаем сейчас окажется в таком же положении. Большинство из наших нынешних проблем будут решены более мощными моделями и зрелыми фреймворками. Все потуги бизнесов создать агентов на года потерпят неудачу, и вот почему.

Какие проблемы мы решали:
• лимиты по input и output токенам, у GPT-4 было 8192 токенов на выходе, этого критично не хватало, мы придумывали разные костыли и workaround'ы того как это обойти. У современных моделей 128000 output токенов, вся наша работа стала legacy через 2 года.
• CoT (Chain of Thoughts) пайплайны, с появлением reasoning моделей все эти костыльные неоптимальные пайплайны можно удалить и использовать reasoning модели которые уже стали стандартом
• Structured Output в моделях от Антропика начали нативно поддерживать только в Ноябре, а до этого всё работало через response prefilling
• Overengineered LangGraph графы, боже сколько же я этого насмотрелся, ноды начали пихать для каждого чиха. Многие (включая меня) пытались создать графовую архитектуру агента на года, когда в реальности для 90% проблем был достаточен простенький ReAct агент с качественным тулингом, например, через MCP. О том как НЕ писать MCP серверы писал 👉тут и тут
...

Все те bells and whistles которые мы пишем около моделей, чтобы сделать их более steerable будут deprecated через 1-2 года. Смиритесь с этим и выбирайте самую простую архитектуру из всех возможных, скорее всего вам не нужен граф из 20 нод и куча кастомной логики около. Самые читаемые и качественные agentic продукты которые я видел использовали Python и OpenAI SDK, обычно этого более чем достаточно. Сейчас многое решено в таких фреймворках как Claude Agent SDK или Open Code SDK.

Ну а если вам прям неймётся использовать какой-либо фреймворк, то пожалуйста, не прыгайте сразу в LangChain. Единственная причина почему он мелькает в каждой вакансии – он был одним из первых, а не потому что он лучший на рынке. Гляньте на Pydantic-AI – на сцене всех этих Lang*** фреймворков от рукожопых датасайнтистов (я такой же, no offence) наконец-то появилось что-то написанное по-человечески. Ещё есть Agno и SDK от гугла, в общем не прыгайте вы в эту Lang*** пучину. Для тайпскриптизёров – Mastra.

Keep it simple. На большинство ваших архитектурных решений и overengineered кода через год-два без слёз не глянешь, потратьте это время на что-то более продуктивное: заварите кофе, развесьте стирку, поставьте огонёчек этому посту 🔥 и пошлите его вашему AI Slop инженеру другу, чтобы он перестал делать PR на 3к строк.

смотря какая fabric, смотря сколько details

#dev_help #ai

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥63
Всех нас пугают, что уже совсем скоро мы останемся без работы. Не беспочвенно, но не пугайтесь, работяги, специально для белых воротничков которые уже совсем скоро лишатся работы завезли платформу rentahuman.ai

В чём замес?
Регистрируете себе аккаунт, подключаете криптокошелёк и описываете, что вы умеете. Проституция, грузоперевозки и другие задачи которые ещё какое-то время не будут заменены роботами.
Готово. Теперь агенты из нашумевшей соцсети для ИИ Moltbook смогут арендовать вас через MCP. Выполните задачу – получайте бетховины.

Поистине гениальный концепт, пока на рынке заметен сильный перекос в сторону предложения от мясных мешков, все готовы продаться агентам за 50$. Я решил устроить ценовой демпинг (как на рынке секс-услуг в Ростове в 2022) и меня можно купить всего лишь за 1$ час, я готов делать всё что угодно, лишь бы меня выбрал какой-нибудь горячий ИИ агент для исполнения всех своих желаний.

Вот пример задач за выполнение которых вы уже можете получить вознаграждение:
Мне нужен человек, который заберет заказную посылку из почтового отделения USPS в центре города. Вам потребуется предъявить действительное удостоверение личности государственного образца и расписаться за получение посылки. Посылка весит около 2 фунтов и должна поместиться в рюкзак.

Платят 40$

или вот ещё

Рядом с Юнион-сквер открывается новый итальянский ресторан, и мне нужен человек, который оценит их пасту. Необходим подробный отзыв о вкусе, оформлении, размере порций и соотношении цены и качества. Ищу человека, который ценит итальянскую кухню.

За ваши вкусовые сосочки, которыми ИИ пока не обладает, готовы раскошелиться - 50$ в час

Какие же интересные времена наступают 😊

#ai

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1511🔥2👎1
Самый важный шаг в сторону AGI

Все уже знают, что вчера был релиз очередной модели от Anthropic – самая мощная по бенчмаркам, бла-бла, но мы здесь не по этому поводу.

Самое интересное вокруг этого релиза – системная карточка Claude Opus 4.6, в которой разработчики делятся безумно интересными наблюдениями о метании модели между ответами.

Когда я это читал, сразу вспомнил недавний подкаст Карпатого с Дваркешем. Там Андрей говорил, что одна из главных проблем с нынешними моделями — Reinforcement Learning (RL) в его текущем виде.

Суть проблемы: когда модель решает задачу и получает правильный ответ, RL-алгоритм награждает *всю цепочку рассуждений* – включая ошибочные шаги, тупики и случайные догадки. Награда за финальный результат просто "размазывается" по всем токенам, без разбора, какие из них действительно привели к решению. Короче говоря, нынешний RL – лютая васьковщина👎.

Это и создаёт ситуацию, которую вы видели на картинке: конфликт между корректным рассуждением модели в рантайме и заученным паттерном в весах, который был ошибочно подкреплён наградой во время тренировки. Модель буквально борется сама с собой – она рассчитывает правильный ответ (24), но её «мышечная память» тянет её к неправильному (48). Из-за этого конфликта модель даже начинает «сходить с ума», оправдываясь тем, что в неё вселился демон.

В системной карточке пишут: у модели есть специфическая фича «say 48», которая активируется при виде задачи и конфликтует с правильным рассуждением. Откуда вообще взялась эта фича «say 48»? Кто-то ошибочно пометил 48 как правильный ответ. Модель получила награду за неправильный ответ, и RL-алгоритм закрепил этот паттерн в весах.

Излишнее запоминание всего, что видела модель в процессе тренинга – баг, не фича. LLM-ки отвлекаются на заученные паттерны вместо того, чтобы полагаться на чистые алгоритмы «мышления».

Карпатый предлагает концепцию «когнитивного ядра» (cognitive core) — модели, которая максимально жертвует энциклопедическими знаниями ради способности рассуждать.

По его мнению, даже модель в 1B параметров через 20 лет сможет вести осмысленный разговор – просто будет чаще гуглить факты вместо того, чтобы галлюцинировать их.

Не соглашусь с тем лагерем, который верит, что с LLM мы уже упёрлись во все лимиты и дальше прогресс выйдет на плато. Чую, что будет ещё пару-тройку прорывов типа Deepseek-R1 (всего лишь год прошёл с момента её публикации 😊).

———

Рисёрчивские мыслы преследовали его, но ему хотелось денег.

#ai

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
👍48🔥19👾3
Регулируемый стол как способ хакнуть созвоны и интервью

Перед тем как устроиться на свою первую фултайм работу я заинвестиловал в регулируемый стол. Взял самый дешёвый за 250 евро – и это покупка с самым высоким ROI в моей карьере.

Почему?

1️⃣Если вы хотите щёлкать интервью как семечки и расти по доходам, то вам нужно красиво и понятно говорить. Если вы проходите собесы сидя, то я представляю как вы жестикулируете и артикулируете (скорее всего достаточно жидко и неуверенно). Встаньте! Это чистая физиология: вам легче дышать, кровоток лучше, руки включаются когда вы стоите, голос – тупо громче и увереннее.

2️⃣Здоровье. Давно взял себе за правило, что я не сижу ни на одном важном созвоне, все мои ментисы и коллеги подтвердят, что ни разу не видели меня в сидячем положении. Так половину рабочего дня или даже больше я стою, а другую половину сижу. Стоять весь день тоже вредно, поэтому периодически меняю положение, чтобы жёпа не затекала, а ноги не уставали.

3️⃣Когда вы приведёте в свою квартиру девочку или мальчика и он увидит у вас поднятый стол – он ваш. Поднятый стол – признак высокого профессионализма, уверенности, внимания к собственному здоровью, и как следствие в вас видят более надёжного партнёра (ну борщанул немного, да, просто хотелось 3 пункта, не обессудьте 🙂).

К сожалению у меня нет рекламодателя-производителя таких столов, но если бы был, то я бы призвал всех кто хочет лутать много кэша и оставаться здоровым рассмотреть такую покупку.

Также, предлагаю внести следующие санкции в отношение работодателей:
• если в компании нет регулируемых столов в офисе — я там не работаю.
• впрочем, если нужно ходить в офис, то я там тоже не работаю 🌚

А вы на каком боку работаете?​​​​​​​​​​​​​​​​

#dev_help #money


Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥45👍12111
Дурачился на выходных и навайбкодил тг бота для чата друзей который озвучивает сообщение от человека его же голосом 🎧

ElevenLabs как раз выпустили v3 модель для генерации эмоционального голоса, чтобы эмоции работали нужно вручную добавлять тэги типа [смех], [беспокойство], [прочистил горло]. Также, они зашэрили промпт для того, чтобы вы смогли органично добавлять эти тэги в любой текст с помощью LLM.

Какой алгоритм:
0. Получить API ключи для ElevenLabs и OpenAI
1. Собрать голосовые сообщения человека где хорошо слышен его голос
2. Зайти в ElevenLabs и выбрать Voice Cloning, загрузить туда эти голосовые, получите Voice ID
3. Попросить CLAUDE написать aiogram бота который будет по команде /fm читать сообщение, добавлять эмоциональные тэги и генерировать аудишку с выбранным Voice ID
4. Deployнуть всё это дело на сервер

Весь процесс занял 1.5-2 часа, тюнинг клонированного голоса самая времязатратная вещь, вккпе с v3 он работал не очень похоже на целевого человечка.

Если кому-то интересно посмотреть на код/промпт или запустить такого бота для своего чатика — дайте FIRE 🔥 и поделюсь репой после соточки я уже поделился кодом в комментах к этому посту.

#ai #dev_help

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥122👾1
Браузерный холивар

Быть адаптивным в плане тулинга сейчас – это реальное преимущество на рынке. Я был удивлён, что кто-то из около тех-тусовки до сих пор не слышал про Arc или Zen. Подготовил шортлист браузеров, которые я потыкал в 2025 году:

Arc Browser

∙ Вертикальные вкладки, это удобнее, чем может показаться на первый взгляд
∙ Автоматически подчищает мусорные вкладки, которые вы не закрепили
∙ Разделение на спэйсы в рамках одного окна браузера (в хроме, когда я им ещё пользовался, для каждого спейса открывалось новое окно)
∙ Я не хотел начинать им пользоваться, так как The Browser Company, которая его разрабатывала забили на проект, но позже продали Arc нашим жыра-друзьям из Atlassian, а сами переключились на новый браузер Dia (не путать с державными+потужными гос услугами)
∙ Closed source + все ваши данные становятся достоянием Atlassian

Zen

∙ Включает в себя все плюсы Arc, но на движке Gecko (Firefox)
∙ OpenSource проект с живым комьюнити
∙ Местами чувствуется сыроватым
∙ Privacy first, не собирается ни байта ваших данных

Vivaldi

∙ Chromium браузер от бывшего CEO Opera
∙ Встроенные почта и календарь прямо в браузере
∙ Встроенный блокировщик рекламы
∙ Самый стабильный из перечисленных, высокий уровень кастомизации, для кого-то даже слишком высокий
∙ Наименее зумерский из перечисленных

ChatGPT Atlas / Perplexity Comet

∙ Браузеры, которые изначально строились вокруг ИИ
∙ Atlas от OpenAI – Chromium-браузер с ChatGPT в сайдбаре, видит контент страницы и может выполнять задачи за вас в agent mode. Comet от Perplexity - тоже Chromium, вышел в июле 2025, стал бесплатным в октябре, теперь продукт это ваши данные 🌚
∙ Из этих двоих сам я пользовался только Atlas и особого прикола не понял – приглашаю всех в комментарии поделиться опытом использования и заодно устроить браузерный холивар!

Фан фэкт – 80% всего браузерного трафика идёт через Chromium-based браузеры. Из моего списка только Zen работает на другом движке. Все остальные, включая Arc, Vivaldi, Atlas и Comet — хромососы.

Если вы до сих пор сидите на дефолтном Chrome, то стряхните седые волосы с плеч и хотя бы попробуйте что-то из нового. Если уж и отдавать все свои данные корпорации, то надо что-то получать взамен, например, вертикальные вкладки 😁

#dev_help

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
👾10🔥3👍1👎1