Ebout Data Science | Дима Савелко
5.2K subscribers
335 photos
35 videos
2 files
147 links
Ebout Data Science by @ngmdite | По поводу менторства пиши на @savelkoteam
Download Telegram
Андрюша Карпатый снова навалил базы: nanochat miniseries v1 😮

Андрей Карпатый не перестаёт радовать нас годным контентом. Он выкатил жирный апдейт в своём репозитории nanochat - проекте, который учит создавать свой ChatLGBT с полного нуля.

Если раньше мы просто учились запускать пайплайн, чтобы оно работало, то теперь Андрюха погружает нас именно в сам процесс обучения. Главный вопрос апдейта: как тратить вычислительные ресурсы (бабосиксаны) максимально эффективно? 🤔

Разбираем, что там внутри:

1️⃣ Scaling Laws
Для многих новичков подбор параметров модели звучит как что-то непонятное, но Карпатый показывает, что это - строгая и понятная математика. Суть проста: хватит гадать на кофейной гуще, какую архитектуру выбрать и сколько данных скормить. Бро использует законы масштабирования.

Эксперимент: Карпатый запустил серию обучений (miniseries) с фиксированным бюджетом (~$100 на H100) и потратил его по-разному:
🟣 Одни модели были «маленькими», но учились долго (много токенов)
🟡 Другие были «жирными», но учились быстро (мало токенов)

Результат: Все модели стоили одинаково, но одна конкретная конфигурация дала лучшее качество

2️⃣ Предсказуемость - наше всё
Вы не играете в казик, когда запускаете обучение. Вы можете провести дешёвые эксперименты за сотку баксов, найти идеальную формулу, а затем просто увеличить масштаб (вложить $100k или $1M) и гарантированно получить ожидаемый прирост качества. Инженеры OpenAI/Anthropic не тыкают пальцем в небо, они так считает деньги и масштабы 🍗

3️⃣ Сдвиг фокуса на Pretraining
В первой версии nanochat фишкой был «полный цикл» до веб-интерфейса. В miniseries v1 акцент сместился на Pretraining. Запомните: именно здесь закладывается фундамент интеллекта. Если вы обосрались на претрейне, то никакой файн-тюн (SFT/RLHF) это уже не исправит 🍌

Что с этим делать? Если хотите реально понимать, как работают LLM , а не просто импортировать либы:
Залетайте в обсуждение: github.com/karpathy/nanochat/discussions/420
Смотрите на графики Loss vs Compute
Ковыряйте код скрипта miniseries.sh - это эталон того, как нужно организовывать эксперименты

Итог 🏋️
Масштабирование - это сплошная инженерка. Андрюха дал вам песочницу, чтобы освоить её за копейки, прежде чем лезть в серьёзные бюджеты. Поэтому тыкаем это обсуждение с ЛЛМ-кой, чтобы понять его
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥138❤‍🔥3🍌2
Data Science умирает? Вся правда о рынке 2026 года

Говорят, что ЧатЛГБТ заменит программистов, а джунам больше нет места в IT. Многие думают: «Не поздно ли я собрался?». Спойлер: Халява действительно закончилась. Эпоха «легкого входа» через курсы прошла, и рынок перестал принимать типов после яндекс практикума. Но для профессионалов сейчас открывается самое денежное время 😁

В этом видео я продам вам идею, почему 2026 год - исторически лучший момент для старта в Data Science, если вы готовы играть по-взрослому 💃

В выпуске:
- Причина №1: Почему бизнес - от заводов до пиццерий - готов платить любые деньги за Прикладной ИИ?
- Причина №2: Как высокий порог входа отсеял конкурентов и почему это вам на руку.
- Причина №3: Зарплатный лифт: как быстро проскочить путь от стажёра/джунишки до сеньора.
- Причина №4: Эпоха LLM: как учиться в 10 раз быстрее и не попасть в ловушку «вечного студента».
- Причина №5: Как ваш прошлый опыт (юриста, врача, менеджера) делает вас «Единорогом» с зарплатой х3 к рынку при правильном подходе

СсылОЧКА на видосик:
https://youtu.be/dDJaX9MnO4w
Please open Telegram to view this post
VIEW IN TELEGRAM
9🔥6🤣5😍2🍌1
Из Фронтендера в NLP-Гигачада за месяц: Как мы залутали два оффера по 300к 🐵

Многие дрочат курсы годами, смотрят видосы на ютубе и думают, что оффер свалится с неба. Но на деле получают болт и отказы из-за нерелевантного опыта. Лично мне - это знакомая история 😓

Сегодня расскажу про кейс моего слона Тимура (два оффера на 300к). Он больше года пытался вкатиться в ML из Фронтенда. Ботал теорию всю подряд, смотрел записи чужих собесов, но рынок его тупо игнорил. Резюме было мёртвым: 1-2 приглашения в месяц и постоянные отказы на скринингах из-за фильтров по опыту. Парень просто упёрся в стену и топтался на месте

И тут самое лучшее ментосртво начало уничтожать 💪

Мы созвонились на бесплатной консультации, разобрали его ситуацию, выбрали вектор развития (он выбрал разъебать в NLP), по итогу он залетел на пакет до оффера.

Что мы сделали:
1️⃣ Пересобрали резюме: упаковали опыт так, что HR-ы перестали его фильтровать и начали сами за ним бегать.
2️⃣ Построили чёткий RoadMap до Middle: только база и то, что реально спрашивают на собесах прямо сейчас.
3️⃣ Провели жёсткие мок-интервью: подсветили пробелы в хардах, я дал ему конкретные ресурсы, где быстро докрутить теорию.
4️⃣ Ликвидировали страх собесов: cделали из него уверенного в себе специалиста, который стал сам выбирать из множества офферов

Итог:
🟣 Первая неделя: Конверсия улетела в космос - 10 приглашений на собесы (вместо 1-2 в месяц)
🟡 Третья неделя: Тимур уже спокойно щёлкал технические собесы как орешки.
🟢 Четвёртая неделя: ТИМУР ЗАСЕЯЛ, ДВА ОФФЕРА В NLP/ML ПО 300к 💸

Вот так работает системный подход: пока одни плаки-плаки, что рынок перегрет и джуны никому не нужны, мои слоны забирают самые жирные офферы. Тимур - огромный красавчик, горжусь!

Больше отзывов тут. А вам предлагаю тебе залететь на бесплатную консультацию с моей командой, на которой поможем тебе построить твой маршрут до оффера. Пиши на @savelkoteam
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥1511🔥6🍌2🥰1😁1🤔1
Cursor vs Claude Code: Кто кого уничтожит?

Сейчас активно погружаюсь в хайп-кодинг, поэтому стало интересно чем отличается claude code от cursor`а? С cursor я дружу, но никогда не щупал claude code, но многие о нём очень часто говорили и именно его чаще всего юзают. Поэтому давайте разбираться, в чем принципиальная разница между ними?

Глобальная философия: Accelerator vs Delegator
🟣 Cursor - это ускоритель, такой помогатор, где ты всё ещё пилот. Ты всё ещё пишешь код, и ты сам управляешь процессом, а Cursor просто делает тебя х10 быстрее. Это инструмент для состояния потока: итерации занимают секунды, контекст индексируется через RAG, чтобы выдавать ответы мгновенно, иногда жертвуя глубиной ради скорости 🍴
🟡 Claude Code - это такое подрядчик/аутсорсер. Ты говоришь «сделай рефакторинг этих 50 файлов, чтобы я заработал много деняк», и он уходит думать, планировать, выполнять команды и гонять лысого. Под капотом у него честные 200k токенов контекста, которые он держит целиком, не обрезая их, как это иногда делает Cursor для оптимизации. Это хоть медленно (одна задача может занять 3-5 минут) и дорого (жрёт токены API как не в себя), но зато он может перелопатить полпроекта, пока вы смотрите рилсы, ну или тоже гоняете лысого 🤤

С технической точки зрения Cursor работает как акселератор - он ускоряет микро-действия разработчика. Claude Code работает как делегатор - он забирает на себя целый пласт работы, выполняя её последовательно и автономно. Один требует вашего постоянного внимания и кликов, второй - чёткого ТЗ и бюджета на токены.

Где подвох?
Cursor работает по подписке: ты платишь фикс (20$ в месяц + платишь за дополнительные токены) и понимаешь, сколько у тебя запросов. Claude Code - это пылесос для денег, он работает через подписку Claude Pro ($20/месяц) или мессенджер Max ($100-$200/месяц). Если дать ему сложную задачу на анализ всего проекта, он может сжечь твой лимит быстрее, чем ты успеешь написать промпт 😔

Итог для слоняр:
Не надо выбирать, надо комбинировать. Гигачады используют гибридный подход: Claude Code загоняют в терминал для глобальных архитектурных изменений и черновых работ, а в Cursor полируют результат и пишут фичи в реальном времени. Cursor - чтобы летать, Claude - чтобы копать и сиять

Вот такой ресёрч я провёл, такие выводы сделал, а вы уже щупали Claude Code или сидите на Cursor? 👇
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
24🔥12❤‍🔥5🍌2🥰1🙈1
Гайд по выходу из жопы: Как не порваться на старте? (часть 2) 🤯

В прошлом посте мы с вами рисовали красивую картинку на 10 лет вперед (Точку С) и смотрели правде в глаза в Точке А. Кто пропустил - бегом читать (шаблон из 1 части), иначе навигатор в светлое будущее вас уведет в Нижнекамск, а не в Дубай 🚬

Вот вы составили гайд по выходу из жопы, расписали планы до 2036 года и декомпозировали на год. И перед вами лежит список из 50 целей: и инглиш подтянуть, и спину вылечить, и миллион заработать, и жену на свидание сводить.

Что происходит дальше у 99% людей? Включается режим «обосрусь, но не покорюсь», мы пытаемся делать ВСЁ и сразу. Итог предсказуем: к февралю дофамин падает в ноль, мы лежим на диване и чувствуем себя ничтожествами 🤡

Чтобы реально ехать, а не газовать на месте, нужно поженить мозг и сердце. В моей стратегии есть для этого пиздатая табличка - матрица приоритетов 📊

Как это работает?

Берешь свой список целей из декомпозиции и прогоняешь каждую через два вопроса:
🟣 ХОЧУ: Как ты чувствуешь сердцем? Насколько тебя это реально драйвит от 1 до 10? Не надо для успешного успеха, не мама сказала, а лично у тебя горят глаза?
🟡 МОГУ: Твоё рациональное, как ты думаешь мозгом? Насколько у тебя СЕЙЧАС есть ресурсы (кэш, время, навыки, здоровье) это сделать от 1 до 10?

А теперь вся суть - умножаем эти цифры

Пример на пальцах:
1️⃣ Цель 1: Купить Ламбу
- Хочу: 10 (Мечта детства, чтоб пацаны оценили!)
- Могу: 1 (Денег хватает только на бензин для Лады и дошик).
- Итог: 10 баллов и пошёл нахуй со своей ламбой

2️⃣ Цель 2: Починить спину (массаж/зал)
- Хочу: 6 (Не то чтобы мечта, но спина ноет как у деда)
- Могу: 8 (Зал в соседнем подъезде, абонемент потянуть могу)
- Итог: 48 баллов, и ты красавчик, начни со спины, а дальше до ламбы недалеко

В чем главный инсайт? 🤔
Мы привыкли биться головой в цели с рейтингом 10 (Ламба), где нет ресурсов. Это путь к выгоранию и депрессии. А стратегия - это искусство маленьких побед

Цель с рейтингом 48 (Спина) - это твой низко висящий фрукт. Сделав её, ты получишь быстрый результат, закроешь дыру в здоровье (энергия у тебя повыситься) и получишь дофамин, чтобы потом качать ресурсы на Ламбу.

Твоя домашка: 📝
1️⃣ Напиши себе личную стратегию из предыдущего поста
2️⃣ Выпиши цели на 2026 год
3️⃣ Проставь баллы «Хочу» и «Могу»
4️⃣ Перемножь и отсортируй от большего к меньшему

Те задачи, что окажутся наверху списка — это твои приоритетные задачи. Именно с них надо начинать год, чтобы почувствовать, что ты не просто мечтатель, а машина по достижению целей 😐

Кидайте свои топ-3 цели, которые прошли фильтр в комментарии, очень хочется услышать их! 👇
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥127❤‍🔥4🤣2🥰1🍌1