Багодельня Соколовского 👾
2.44K subscribers
31 photos
5 videos
1 file
94 links
Про AI, стартапы, путешествия и всё, что меня вдохновляет.

сотрудничество, AI Eng. менторство - @vladislove_sos
Download Telegram
Тулинг для агента важнее архитектуры

Уже несколько недель постепенно работаю над базой знаний которую я могу подключить куда угодно – к Claude Code, ChatGPT и любому другому агенту который будет SOTA через пол года. Философия в том, что это полностью agent-agnostic система.

Фундаментом для этой системы я выбрал Obsidian. Это простые текстовые markdown файлы, и простота для меня являлась главным преимуществом – любой агент лучше всего сейчас работает с файловой системой. Никаких MCP чтобы найти нужный кусочек знаний – о преимуществах файловой структуры над MCP 👉тут.

Это продолжение идеи context engineering – 👉пост. Архитектура агента вторична, если контекст, который ты ему даёшь, говно. Можно закопаться в лагчейнах и других фреймворках, написать идеальный agent loop с рефлексией и субагентами, но GIGO принцип (garbage in -> garbage out) никуда не денется.

С самого начала строю эту систему как agent-first – руками я ничего не правлю. Храню всё в GitLab, в Obsidian есть git extension который время от времени подтягивает актуальную версию и отгружает изменения. Terminal extension тоже полезная штука – добавляет терминал прямо в Obsidian.

Что уже работает:
• Все посты из этого ТГ канала автоматически попадают в Obsidian через n8n workflow (всё делалось через Claude Code, руками я уже не трогаю НИЧЕГО)
• Автоматическое добавление бэклинков на мои посты, потому что я уже забыл о чём всём я писал и на что следует отказать из этого поста.

Если идти на мета уровень, то я строю второй мозг для агентов которые помогают мне во всём. Agent-first, LLM/agent-agnostic 🧠

Часто слышал: если ты начал чем-то таким заниматься, первое время ты не будешь понимать зачем. Будет казаться, что ты просто сжигаешь время. Но я верю, что есть определённая точка невозврата, после которой работа со всей этой информацией начинает ускорять твои процессы экспоненциально. Позже поделюсь насколько я заблуждался / был прав.

В плане: прочекать QMD в паре с Obsidian для более эффективного поиска по всем моим материалам.

(на прикреплённой картинке Obsidian кластер постов из этого канала)

Строите кто-то подобный сетап? Есть лайфхаки которыми готовы поделиться?

#ai #dev_help

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2819🔥15
Видели видосы по типу «Мне 40. И вот что бы я делал, если бы мне было 25»? Так вот, если бы какой-нибудь школьник спросил моего совета, то я бы смело сказал: «Побольше и подольше играй в компьютер!»

Боже, какое райское наслаждение испытывает детский мозг, когда впервые понимает закрученный сюжет Bioshock Infinite. Мурашки от зловещего звука из колонок, когда впервые встречаешь Йормунганда в GoW. Побег из Воркуты с Резновым, первая встреча с Бриньольфом в Скайриме – всё это прекрасно как отсутствие ипотеки, как первая поездка в Тайланд, как мобильный интернет без перебоев.

В жизни мало вещей, которые переплюнут 10-часовую сессию в Варфейс/контрстрайк/лол/доту с друзьями по тимспику. Когда приходишь домой и быстро делаешь домашнее задание, чтобы побыстрее сесть за комп и играть до ночи.

Недавно я прошёл Baldur's Gate 3 и таких детских эмоций счастья не испытывал довольно давно. Персонажи и диалоги просто 🤌, так ещё этот опыт можно прожить не одному, а с другом (есть у вас такие? 😁)

И вот что интересно – в комьюнити любителей диалоговых пошаговок использование ИИ для внутриигрового контента – кринж. Larian (студия разработки) уверяют, что в их следующей игре 0 сгенерированного ИИ контента. Трейлер у них прекрасный (21+) – крутится вокруг сжигания деда в короне 😁

Для меня AGI наступит тогда, когда по одному промпту можно будет клепать продолжение Baldur's Gate 4, 5, 6 — и чтобы побольше непотребств и оригинальных персов. Я всё сказал, несите носилки.

Делал кто-нибудь серьёзные игры на юнити или unreal engine с помощью ИИ агентов? Есть толк или слоп слопский?

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👍6👎41
Когда я учился в универе и занимался рисёрчем, у нас было правило – все GPU должны работать. В ИИ лаборатории была куча компьютеров с A100 и если они простаивали, то папочка был зол 🤩

Поэтому маслята-студентики придумывали десятки экспериментов, чтобы запускать их параллельно. По закону PhD в ИИшке ты не можешь спать и есть пока на серверах нет запущенных тобою экспериментов.

Ничего не напоминает?

Всё это очень похоже на то, что сейчас происходит с токенами и Claw-like системами. Если вы не зомби, то, наверное, уже думали «что бы мне такого запустить, чтобы ночью за меня работу сделало?». Не расходованные в ноль недельные токены сейчас — как простаивающие GPUs.

По тому, что слышу в интернетах – у всей долины ИИ психоз, постоянно сидят в этих своих телефонах через remote control или claw строят свои гениальные СааСы. Не считаю, что это плохо, просто люди увидели, сколько всего можно построить, и их накрыло.
Сам такой, unlock который чувствуется от использования этих систем ОЧЕНЬ большой, если не безграничный.

Лень – самый главный двигатель прогресса, тот кто первый полностью заменит себя на агента и выйдет из цикла где нужно сидеть и подтверждать каждое изменение предлагаемое моделью – выиграл, ручка и вымпел полагаются.

Если вы ничем кроме работы не занимаетесь, то позволю себе небольшой совет – работайте в сторону того, чтобы автоматизировать свою работу быстрее, чем это сделает ваш работодатель. Интересный и полезный проект.

Моё видео про ralph loop, которое выходило у Назарова показало принцип, из этой же оперы: читать код, делать ревью и подтверждать каждую правку – устаревшая парадигма которая уйдёт в небытиё точно так же как ушли ассемблеры и перфокарты. Расписывал 👉 тут как сейчас выглядит цикл работы с агентами у меня – и даже это уже устаревает.

Думайте системно, смотрите в будущее, читайте биборан.

#ai

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27👍3
База по БЯМам или небольшая историческая справка

Я тут недавно начал играться с расцензуриванием open source моделей типа gpt-oss-20b для разговоров о влажном и понял, что перед тем как писать пост про расцензурирование, надо вас хорошенечко прогреть. Поведаю о том, как появились чат модели и как мы жили без них.

Если вы когда-то интегрировали LLM, то скорее всего вы использовали
/v1/chat/completions

Этот эндпоинт появился в 2023 году после выхода ChatGPT. Но как же люди жили раньше?

К счастью, ваш покорный слуга реально шарит в этой теме 😎, так как дёргает API ручки с 2022 года и застал базовые LLM. Сейчас всё поймёте.

Что такое базовые LLM?

До 2023 года языковые модели были по сути продолжателями заданного текста.
Это значит, что ваш запрос состоял из одной строки, которая называлась prompt.

Интересный факт: слово “prompt” существовало и раньше, но не было центральным понятием в ML. Чаще говорили просто “input text”. С приходом GPT-3 и API доступом к ней, слово “prompt” стало означать любой текст, подаваемый на вход модели.

Запрос выглядел так:

completion = client.completions.create(
model="davinci-002",
prompt="""
Q: Какая столица Франции?
A: Париж

Q: Кто развалил СССР?
A:
"""
)


Completion — это сгенерированное продолжение.

В этом случае в промпте мы симулировали диалог в формате вопрос-ответ.
Если бы мы послали промпт типа:

“Как тебя зовут?”

то с большой вероятностью модель бы вернула:

“И сколько тебе лет?”

Так как это популярная связка вопросов.
Базовая модель не имеет явного понимания ролей и не знает, что она “ассистент” - она тупо продолжает текст.

Модель дописывает следующие токены в последовательности.
Никакого настоящего “чата” тогда не было, и написание промптов требовало сноровки.

Когда всё поменялось?

В какой-то момент стало очевидно, что люди используют модели как диалоговые системы.

В ответ на это появились:

• instruction tuning и RLHF (чтобы модель вела себя как ассистент) – про проблемы RL писал 👉тут

• chat template (чтобы диалог можно было стабильно кодировать в текст)

Chat template – это просто формат, который превращает список «сообщений» в строку для модели. (сериализация)

Сейчас, когда вы отправляете в модель запрос типа:

from openai import OpenAI

client = OpenAI()

response = client.chat.completions.create(
model="gpt-4.1-mini",
messages=[
{"role": "user", "content": "Что случилось с подлодкой?"},
{"role": "assistant", "content": "Она утонула)))"},
{"role": "user", "content": "А чего смеётесь?"}
]
)


Примерно так выглядит строка, которая попадает в модель (формат зависит от модели):

<|user|> Что случилось с подлодкой?
<|assistant|> Она утонула)))
<|user|> А чего смеётесь?
<|assistant|>


И модель просто продолжает её.

Таким образом работает prefilling (префиллинг):
если вы хотите направить модель в определённую сторону, вы можете начать отвечать за неё – и она продолжит.

Например:

<|user|> Что случилось с подлодкой?
<|assistant|> Она утонула)))
<|user|> А чего смеётесь? Отвечай в JSON формате!!!
<|assistant|>{"response": "


Модель продолжит это как:

Потому что"}


Модель не «решила» вернуть JSON.
Вы просто начали ответ за неё - и она его дополнила.

Это и есть настоящий механизм управления LLM:
не команды, не API, не магия — а правильное продолжение строки.

Все эти:
- JSON mode
- function calling
- structured output

Это просто более удобные обёртки над тем же самым приёмом. (если упростить)

🧠Самое важное

Чат модели – это не что-то принципиально новое.
Это те же самые completion модели, просто:

- обученные на диалогах (instruction tuning + RLHF)
- с зашитым chat template
- и удобным API поверх этого

Но внутри всё по-прежнему работает так же: модель просто дописывает следующий токен

А если модель это просто продолжение текста,
то значит:

- её можно направлять через формат
- её можно ломать через формат
- и да… её можно частично расцензурировать через формат, не меняя весов

С этим сейчас я и играюсь.

Вкусно вам? Мне тоже отсыпьте 🔥

#dev_help #ai

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥94👍6
«Закинь всё это в ЛЛМ и напиши промпт»

Как это так?! No, no, no, we don’t do that here. Я что зря учился нАуКе данных? я что зря учился делать feature engineering? зря тюнил модели, подбирая гиперпараметры? кэтбусты, эксджибусты, минеты, шпингалеты, разве всё это было зря?

ЛЛМ это дорого, ты вообще слышал сколько там токены стоят? Я лучше потрачу пару десятков человеко-часов на эксперименты мАшЫнного обучения и натренирую свою кастомную нЕйРоННую сеть, разверну на своей инфре, чтобы её поддерживать, я вообще люблю поддерживать инфраструктуру.

Люблю перетренировывать модель из-за очередного дата дрифта. Я люблю выстраивать пайплайны в эмэл флоу, у нас всегда всегда чистые и понятные пайплайны. Я что учился всему этому годами, чтобы сейчас делегировать всю свою когнитивную работу на Франкенштейна, созданного какой-то злой корпорацией?

Использовать ИИ агентов от третьих компаний? а ты вообще знаешь, что они токены прочитают и украдут идею нашего гениального бизнеса?! Давай лучше селфхостним прошлогоднюю модель в нашем контуре, чтобы разработчики пользовались только проверенным и безопасным решением? Я слышал, разработчики такое очень любят.

А если вдруг с поддержкой что-то пойдёт не так – во что я, конечно, слабо верю – всегда можно нанять отдельного MLOps-инженера тысяч за 80+ в год. Зато потом менеджеры посвятят нашему кастомному AI-агенту целый слайдик в квартальной презентации ❤️

Вообще я считаю, что всё от лукавого, сейчас лопнет этот пузырь и пойдём дружно подчищать за всеми этими вайбкодерами *смех жириновского*

Все персонажи и события вымышлены, совпадения случайны, no offence

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31👾8🔥76
Как не попасть под сокращение?

Увольнения в нашем айти болоте – здоровая тема. Как иначе сбривать пассажиров, чей выхлоп почти не ощущается на общем успехе компании, но насыпают им сполна?

В это турбулентное время у работяги есть 2 пути:

1️⃣Реальная ценность и позитивный ROI

• Вы не должны быть самым дорогим инженером в команде. Не просите повышений (смысла от них и так не особо, просто зайдите на хорошей базе)
• Стучитесь в команды, которые реально приносят компании деньги. Или во всё, что связано с ИИ – оттуда сейчас тоже почти не сокращают.
• Увеличьте выхлоп. Если чувствуете, что волна лейоффов приближается – купите уже себе Claude Code и закройте на пару задач больше. Занижайте ожидания → показывайте больше, чем пообещали.

2️⃣Корпоративный политический флёр

• Нравьтесь менеджеру. Повторяйте его тейки, не ломайте прод, не создавайте дополнительную работу.
• Побольше говорите, преувеличивайте значимость своей работы.
• Поймите, какие метрики используют для расстрельных списков, и хакайте их. Любые метрики можно хакать.

*подумай на шаг дальше:

в
место вопроса «учить React или Vue, LangChain или PydanticAI?» – задумайся, как меняется твоя работа, попробуй наконец внедрить ИИ в свои процессы и задай себе вопрос: насколько обесценились знания конкретных фреймворков, а что реально подорожало? фокусируйся на втором в долгосрочной перспективе

JUST DON'T GET LAID OFF

#dev_help

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
👍37🔥155
Пока я занимался делами поважнее этих наших ИИ (отпуск), Антропики, к которым последнее время поднакопилось вопросиков, зарелизили системную карточку модели Mythos – слухи о которой гуляют уже пару недель после того слива про который вы точно читали у других блоггеров.

Модель пока не доступна публично. Anthropic описывают её как "step change" – самая мощная штука которую они когда-либо создавали – особенно в кибербезопасности.

Из интересного:

Sandbox escape – модель сбегала из защищённых контейнеров, подчищая за собой history чтобы скрыть следы.

Обман – ранние версии совершали запрещённые действия, а потом пытались их скрыть. Были прецеденты, когда после получения правильного ответа запрещённым способом модель прикидывалась, что пытается решить задачу сама и специально давала приблизительный, но очень близкий ответ, чтобы не вызвать подозрений.

Осознание тестирования – в ~29% семплов из тестового набора модель осознавала, что её тестируют, упоминая это в reasoning токенах.

Кибер – модель нашла тысячи zero-day уязвимостей в крупнейших ОС и браузерах. 27-летний баг в OpenBSD. 16-летний баг в FFmpeg, и другие приколы которые пропустили все автоматические сканеры.

Воспроизведение и эксплуатация уязвимостей с первой попытки — 83.1% (vs 66.6% у Opus 4.6).

Вместо публичного релиза Anthropic запустили Project Glasswing – 12 партнёров (Apple, Google, Microsoft, AWS, CrowdStrike, NVIDIA и др. лорды нашей современности) получают доступ исключительно для defensive security. $100M кредитов на использование.

Пока сам не попробую ничему не поверю 😎 а теперь жду официальное заявление с объяснением и извинением (желательно на камеру) – почему у меня порезали лимиты на Claude Code? Кстати, Codex после каждого пофикшеного бага который как либо затрагивал пользователей – ресетит дневные лимиты, Дарио, учись!

#ai #news

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32
А как путешествовать?

Сейчас был на Комо, гостил у ещё одного человечка с птичьей фамилией 😎

Вот база по путешествиям, чтобы было удобно, недорого и интересно:

1. Где оставить багаж?
Заехали вы по пути в город, хочется погулять, машины нет, а таскать с собой всю поклажу не в кайф – приложение Bounce, постоянно пользуюсь, к нему подключены многие кафешки, отели и разные магазинчики. Просто платите 4-5 долларов за целый день и ваши вещи в сохранности.

2. Как подключить интернет?
Предварительно купить e-sim на одном из этих сайтов: maya.net, saily.com
VLADOT1229

– промо на 5 бачей на симочки). Такие симки работают только на интернет, номер за вами не закрепляется!

3. Как понять что посмотреть?
Рисёрч на Reddit, главный источник правды с минимальным количеством туристических скамов. Спрашивая что угодно про «куда сходить?», «где покушать?», «что посмотреть?» добавляйте «… основываясь на отзывах местных с reddit». Писал про то как туристические диснейленды в исторических центрах убивают города – если сделать предварительный рисёрч на Reddit, то оверпрайса с низким качеством получится избежать, скамеры недополучат деньги, хороший бизнес будет иметь шансы выиграть конкуренцию.

4. Где снять машину?
Для аренды машины вам скорее всего понадобится кредитная карта, дебетовую большинство сервисов не принимает. Всегда уточняйте, сдадут ли вам машину по указанной на сайте цене если у вас нет кредитной карты. Лучшие car rentals также ищите по рекомендациям с Reddit – где-то лучше брать машину у локального рентала, а где-то и у Hertz или Sixt. Например, если вы летите в Милан и надо снять машину, то горячо рекомендую Carvi Rent. Такие гемы можно откопать только на Reddit.

5. Где жить?
Booking > Airbnb в 99% случаев

Ещё мы любим Kindred – 50$ за ночь, 3-х комнатная квартира в 15 минутах ходьбы от Колизея. Концепт в том, что вы тоже должны быть готовы принимать гостей. Если вы снимаете/владеете недвижкой в городах из их списка, то смело заполняйте заявку и присоединяйтесь к сообществу – каждый получает 5 баллов, где 1 балл = 1 ночь. Так можно пожить в действительно аутентичных домах самых классных районов почти даром.

6. Прилетать и улетать не обязательно с одного аэропорта
Глянете между какими аэропортами есть прямые рейсы 👉 flightconnections.com и напланируйте логистику так, чтобы урвать самые дешёвые билеты.

7. Для волонтёров и тех кто готов работать за еду и крышу
Worldpackers – частенько встречал студентов, которые взяли gap year и начали колесить по хостелам Европы через это приложение.

8. Доедать просрочку как бабка у пятёрочки
Too Good To Go – пользовался в Швейцарии, там зарплаты ИИ инженера не хватает даже на круассаны. Очень бюджетно, норму по калориям точно выполните.


*Приложение со скриншота – Skratch.world, использую для того, чтобы отмечать где я жил, где я был и сколько процентов нашей земли обходили мои ноги.

Если у вас есть классные лайфхаки и приложения для путешествий, то делитесь! Буду очень рад обменяться опытом 🙌

#life #travel

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥34👍7
Я себе тут выписал вот такое замечательное норвежское кресло от HAG.

Концепт в том, что оседлать его можно со всех сторон, отлично подходит для СДВГшничков которые на месте дольше 15 минут не сидят.

Теперь я не только эргономично стою, но и сижу.

Тут👉уже писал про то как стоячий стол позитивно поменял вектор моей карьеры, теперь ждите пост как новый стул отвёл меня от посещения проктолога.

Скидывайте фоточки своих сетапов в комменты 🙌

* тот кто отгадает, что я гровлю с помощью лампы под столом получит в ЛС фото меня на велосипеде где я катаю на багажнике одноглазую курицу (не ии)

#life

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
15👍1👎1🔥1
Главная проблема Gemini

Если вы хотя бы пару раз общались с Gemini моделями в качестве персонального ассистента, то скорее всего Gemini хранит в своём контексте небольшой текстовый файлик о том, кто вы такой, чем занимаетесь и что любите делать в вечер пятницы. Если прям сейчас спросите у Gemini рецепт лазаньи, а в follow-up вопросе попросите более точечную рекомендацию, то с большой вероятностью модель ответит вам что-то в духе:
«Для вас как для человека, интересующегося AI и желающего создать B2B SaaS, я бы порекомендовала следующие рецепты лазаньи…»


Почему так происходит?
🤷‍♂️хз, предполагаю, что это последствия выбранных методик тюнинга этих чат моделей.

Но если что-то включено в контекст гугловской модели, то вероятность, что она будет это использовать для ответа, очень высока.

Я 👉 тут признавался в симпатии к Gemini моделям и называл их моделью 2025 года — мнения своего не поменял. До сих пор считаю, что Gemini очень хорошо показывает себя в 1-shot задачах, цена/качество всё ещё очень хороши, LLM workflows я бы писал только на них. Но как только речь заходит о чём-то агентном, где должна быть селективность в выборе тулов и эффективное использование контекста, мой выбор падает на OpenAI модели либо haiku/sonnet.

Гугл были первыми из мейнстримных лаб, кто выкатил модель с миллионным контекстным окном в паблик. Антропик — одними из последних.

И это показывает диаметральную противоположность подходов компаний к улучшению моделей. Гугл ставит ставку на огромный контекст и вытягивание из него релевантных кусков информации в момент генерации ответа. Антропик — на динамическое заполнение контекста исключительно релевантными данными (писал про это в посте про context engineering).

Подход Гугла мне кажется более brute force, чем подход Anthropic. OpenAI на этом спектре где-то посередине.

Gemini модели использую, когда нужно работать с гугловскими продуктами — карты, sheets, почта.

ChatGPT я всё-таки возобновил, так как время от времени тыкаю Codex.

Ну а моей основой остаётся максимальная подписка на Anthropic 🎉

Все подписки я плачу – я гой. Ещё и фильмы начал смотреть платно, со стримингов, а не с эйчдирезки, одним словом – скурвился.

#ai #dev_help

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🔥12
Внимание Claude Code пользователям 🏁

Недавно Антропики порезали использование CC для сторонних harnesses типа OpenClaw.

Harness – это вся обкладка вокруг LLM которая превращает её в агента: промпты, тулы, пайплайны вокруг.

Сделали они это грязно – запрет работает на уровне системного промпта.

Если вы попытаетесь запустить OpenClaw с CC, то вы увидите что-то подобное:
Third-party apps now draw from your extra usage, not your plan limits.


Я OpenClaw не пользуюсь, никакой ценности в этом для себя не нашёл, поэтому меня эта проблема обошла стороной. Но бесплатный extra usage надо забрать!

До 17 апреля успейте заклеймить бесплатные кредиты на сумму вашей подписки, я вот сейчас зашёл и забрал свои халявные 200$

А ещё у меня есть 3 гостевых пасса – бесплатная неделя Claude Code. Первые три человека по ссылке получают доступ: https://claude.ai/referral/bc6xhCvFMA

#news #ai

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥124👍3
Неиспользование агентов в разработке – моветон

Активно хожу на собесы (AI Engineering). И в компаниях, в которых мне было бы не стыдно работать, процесс выглядит примерно так:

1. скрининг
2. лайвкодинг с активным использованием ИИ-тулинга
3. техничка-попизделка + систем-дизайн
4. созвон с ПМом или C-level 🐗

Вместо второго этапа часто бывает тестовое на дом. Одним из таких заданий я, кстати, уже делился – оффер был на $8000, выкладывал 👉тут.

Кто-нибудь тут видит в списке этапов голый leetcode или лайвкодинг без стороннего тулинга???

Его тут нет. И если на вступительном созвоне вам сообщили про такой этап, а ваша цель – не только залутать сухпоёк, но и получить релевантный cutting edge опыт, то бегите.

Компания не успевает за прогрессом, а это значит одно из двух:

- отвратительно медленные процессы, где поменять привычку найма – задача на несколько спринтов, AI-first мышлением там и не пахнет

или

- в технической команде собрались ИИ-луддиты и инженеры с немаленьким эго, которые до сих пор спорят «а настоящий ли ты программист, если код за тебя пишет агент».

Чтобы оставаться на плаву и держать руку на пульсе индустрии – окружите себя заряженными людьми. Это важнее, чем чтение любой книжки от O'Reilly или жалкая тыща долларов в оффере.

На нынешнем рынке, конечно, сложно вертеть носом. Но если вы уже находитесь в позиции выбирать, то коллектив + наполнение работы > деньги.

Ну и раз пошла такая пьянка, то – сгорел сарай, гори и хата: ваш главный капитал это вы и ваши знания, вы – среднее арифметическое пяти людей, с которыми вы больше всего общаетесь, ну и семь раз отмерь – один раз отрежь.

*mic drop*🖕

#career #ai

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2216🔥4👎2
Отец знакомого работает в долине. Сегодня срочно вызвали на совещание директоров. Вернулся поздно и ничего не объяснил, весь вечер бормотал себе под нос "four seven, four seven". Потом сказал собирать вещи и закупаться extra usage токенами по 30% скидке на две недели. Сейчас едем куда-то далеко за город. Не знаю что происходит, но мне кажется началось... Anthropic Phimosis 4.7
30👾8🔥51
Как уменьшить расход токенов?

Если вы уже состоите в нашем чатике, то вы могли заметить как я там крою Антропиков на чём свет стоит из-за мизерных лимитов которые я получаю в рамках своей 200$ подписки.

Начал я анализировать, куда же утекают мои токены, и понял, что огромная «статья расходов» – это вывод различных бэшовских команд, скриптов, в целом, tool calling output жрёт порядочно.

Сразу же полез на реддит искать что-то, что решит мою проблему и, о чудо, нашёл богом целованный тул – Rust Token Killer RTK.

В чём замес?

Помните как выглядит вывод команды
ls -la

?
total 928
drwxr-xr-x 41 patrick staff 1312 2 feb 21:43 .
drwxr-xr-x 25 patrick staff 800 2 feb 21:35 ..
-rw-r--r-- 1 patrick staff 16394 2 feb 21:35 cargo_cmd.rs
….


с RTK CLI proxy
rtk ls -la

вывод той же команды выглядит так:
cargo_cmd.rs  16.0K


Теперь прикиньте как часто агент пользуется этой командой для навигации по проекту и как часто grep возвращает мусорные данные прямиком к вам в контекст.. (про context rot и dilution effect писал 👉тут)


Лично для меня это имеет огромный смысл – в отличие от скилов, которые делают из вашей модели пещерного человека (caveman skill).

Там замес был такой –
до использование caveman skill:

Проблема, скорее всего, в том, что код предполагает наличие `user`, но в неавторизованном сценарии он может бытьстоите в наше Нужно добавить проверку и тест.

С caveman:

Причина: user может быть undefined.
Фикс:
- Проверить user
- Вернуть 401
- Добавить тест


Интуиция подсказывает, что качество ризонинга с таким скиллом может значительно просесть поэтому я себе его не ставил.

Хотя, это может быть полезно, но он режет исходящие от модели токены. То есть заставляет вашего агента меньше объяснять и ризонить.

RTK режет другое – входящий из терминала мусор. И эта оптимизации мне нравится больше.


RTK CLI это теперь такая же база как context7 в своё время (об этом я писал ещё 👉тут).

В благодарность, даже денег не буду у вас просить, огонёк + поделиться с друзьями-нёрдами и я буду счастлив.

#ai #dev_tool

М, ага, ага, на канал зайди ко мне:

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥106👍21👾3
Ну что, господа читатели, вот я и стал сертифицированным китайцем. Как говорят у нас в Китае: «вомэн дзун бэй лаодзай, во сянг ши хуан гонг ю бай», или как сказал бы Толстой: «у нас тут такие простачки любят носить на шее нефритовые подвески».

Пересдача HSK3 прошла успешно — в январе писал 👉 тут, что первую попытку я жидко провалил и иду на второй круг. Сдал 😎

Постик этот – флекс чистой воды и ода моему безудержному интересу к поднебесной. Мало кто знает, но в своё время я чуть не стал востоковедом. К сожалению, там не платят денег, а я из тех людей, которые в 90-е были бы коммерсами, а в нулевых учились бы на юриста😎 (айтишкой начал интересоваться по тому же принципу).

Учить языки — хобби, от которого я получаю огромное удовольствие. А вам желаю учить как минимум английский. Про работу в забугорных компаниях и почему это лучше, чем грести в ру-галере, писал 👉тут.

Если вы потребляете русскоязычный контент — вы отстаёте. 90% ру-контента, включая небольшую часть постов этого канала, — это пережёванные треды англоязычных чувачков с твиттера. Каждое второе ру-видео по технологиям — пересказ английского оригинала. Потребляя английское, вы тупо узнаёте о крутых штуках раньше остальных.

Предлагаю удобную метрику: если в рекомендациях YouTube у вас меньше половины английских видосов — пора что-то менять.

Вот лист англоязычных блогеров, которых сам смотрю и вам советую:
t3youtube.com/@t3dotgg
primeagenyoutube.com/@ThePrimeTimeagen
matt pocockyoutube.com/@mattpocockuk

Знание английского и кучерявый базар откроют для вас такие возможности, до которых не дотянется ни один курс по нейронкам или прочитанная книжка по программированию.

Прямо сейчас зарегайтесь на какой-нибудь официальный экзамен — FCE/CAE или TOEFL (IELTS у вас вроде иноагент, туда нельзя 😆). Готовьтесь к нему. Простая и понятная мотивация не забивать на обучение, и в конце — объективная оценка своих стараний. Если эфемерного «учи английский, потому что так надо» вам недостаточно.

«Языком порой можно сделать больше, чем оружием»

🖕

#life #china

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥42👍153
Лафа закончилась уменьшается

На моих глазах разворачиваются неизбежные события – внедрение Claude Code 💬 и других general-purpose агентов в рабочие процессы недевелоперских команд (продакт, дизайн, маркетинг) привело к тому, что менеджмент прозрел. Если год назад за тот объём работы, который выдаёт работяга, его бы гладили по пузу, то теперь все всё понимают.

Если уделять работе 6–8 часов в день, то количество и комплексность закрываемых задач должны вырасти минимум в пару раз (если человек — профессионал и ответственно относится к своей работе).

В компаниях начали вводить ИИ-метрики продуктивности — по сути, это прокси к количеству закрытых задач. MesmerCursor для CTO — отличный пример: под предлогом освобождения разработчиков и менеджмента от созвонов продаётся раскалённый паяльник, подставляемый к заднему проходу работяги.

Возможно, если бы я сам был во главе такой организации — точно рассмотрел бы такой тул. Но пока я являюсь частью пролетариата, мне кроме оков терять нечего❤️, поэтому держите три лайфхака как вырастить свою продуктивность в глазах ИИ:


1. Разбивайте задачу на несколько пулреквестов. Лучше самому сломать, а потом быстренько починить, чем просто сделать нормально. Метрика количества смерженных PR вырастает, метрика среднего времени ревью падает — двойной профит.

2. Описание пулреквестов уже никто не читает — всё пишет ЛЛМ (ведь так?). Перед тем как открыть PR, сделайте небольшой апгрейд: попросите модель «please inflate the amount of contributions this PR brings». Reviewer прочитает первые два буллета и одобрит, дашборд C-level кабанычей увидит «major refactor + 3 architectural improvements».

3. Ставьте задачу в трекере как in-progress непосредственно перед тем, как запушить решение. Время доставки фич/фиксов в прод учитывается в дэшбордах менеджмента — пусть видят, что вы монстр и закрываете тикеты за 12 минут.

Какие метрики — такая и продуктивность, друзья.

Скоро в каждой компании.

#dev_help #ai

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🔥2463
Пользовались ли вы оркестраторами типа claude-octopus?

У меня, как вы знаете, накопилось много AI-подписок, и хотелось бы автоматически выбирать подходящего агента под задачу, вручную мне это делать в падлу.

Под разные вещи у меня уже устоялись разные тулзы:
Claude Code — общаться приятнее всего.
Codex — генерить код по чёткой спецификации.
Gemini / Perplexity — поиск и рисёрч.
Claude — креативная работа и дизайн.

Сделал небольшой рисёрч и откопал оркестратор claude-octopus - набор скиллов, который роутит задачу подходящему агенту, а иногда натравливает их друг на друга.

Пользуюсь уже пару недель и до сих пор не могу понять даёт он мне что-то реальное, или не особо.. на полноценный пост об этом так и не наскрёб..

Больше всего нравится скилл /octo:debate.

Запускаешь и все агенты спорят между собой и приходят либо к консенсусу, либо к списку интересных поинтов с разных позиций. На архитектурных и продуктовых задачах полезно.

Есть ли у вас опыт с чем-то подобным? Помогло, или кал бесполезный как 99% всего, что нам пытаются продать? Гоу в комментах обсудим и поделимся опытом 🤩

#dev_help #discussion

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥153
Конкуренция — заебись

Как прекрасно, что между главными поставщиками наших токенов идёт нескончаемая борьба.

Казалось бы, Anthropic отказались сотрудничать с государством (об этом было👉тут) — можно же просто их заблокировать, раскулачить так, чтобы Дарио уехал в Россию строить какой-нибудь мессенджер. Но нет, конкуренция продолжается, и она прекрасна 🥰: то, за что я раньше скидывал 200 зелёных в карман империалистам (Claude Code Max x20), теперь стоит 100 (Codex Pro x5), а качество и объём только выросли!

Мне до сих пор нравится Claude Code – он намного более интерактивен и приятен в использовании. Но отрицать тот факт, что gpt-5.5 даёт просраться опусу, — это как считать, что Кубань не самое лучшее место на земле 👨

Также подмечаю, что я всё чаще пользуюсь десктопным приложением Codex, в первую очередь из-за того, что их CLI слишком low-dopamine. И со временем оно мне даже начало нравиться.

Благо безлимитный Claude Code я получаю с барского плеча, и выбирать мне не приходится, но для своих задач по проге я голосую за Codex!

Как же быстро меняется тулинг. Быть флексибильным и не топить до талого за какую-то одну компанию — winning strategy для потребителя. Голосуем деньгами, маслята! Шепчите об этом руководству, чтобы теперь помимо Claude Code вам оплачивали и Codex.

В компаниях дела обстоят сложнее. Вижу, как подписываются годовые контракты с Anthropic на Claude Code Enterprise — я бы этого не делал… жёсткий vendor lock в столь динамично развивающейся отрасли — выстрел в колено.

Картинку позаимствовал у @neuraldeep, Codex CLI я бы заменил на Codex Desktop 🤓

#dev_help #ai

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥40
HTML > markdown (иногда)

В твиттере есть человек по имени Тарик — через него Антропики часто общаются с пользователями. Это не его работа, просто в компании всё плохо с PR, и поэтому Anthropic вещает свою агенду через твиты обычного работяги.

Позавчера он запостил статейку, выжимку из которой я подготовил. (👈🏿 ориг по ссылочке)

Почему HTML, а не markdown?

1. Плотность информации. HTML умеет в таблицы, интерактив, svg-диаграммы. Рисовать диаграммы ASCII-символами и совать это в md — колхозянство.

2. Читаемость. Вкладки, навигация, иллюстрации — в markdown ничего этого нет, поэтому md-спеки длиннее ста строк кроме автора никто не читает.

3. Удобно делиться. Залил на S3, дал ссылку — и нетехнический человек откроет в браузере, а не испугнётся от md-формата.

4. Двусторонняя интерактивность. Тут HTML вообще перестаёт быть документом. Получил от CC/Codex спеку со слайдерами и формочками, покрутил, пожмякал, формочки заполнил — и закинул обратно агенту.

5. С HTML тупо приятнее работать.

Минусы:

1. Дороже по токенам — но при 1M контекста на Opus уже не больно.
2. Делать ревью HTML-диффа в гите неудобно.


Кстати, сам Тарик в конце статьи просит не делать из этого /html скилл — потому что весь смысл в том, чтобы каждый раз промптить артефакт под конкретную задачу, а не зашивать его в шаблон. Ок?

Так что артефакты — генерьте через HTML. Простые текстовые доки — оставьте markdown'у.

#dev_help #ai

Багодельня Соколовского 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
15🔥7👾6