Ebout Data Science | Дима Савелко
2K subscribers
140 photos
11 videos
86 links
Ebout Data Science by @ngmdite
Download Telegram
Сбор гигачадов в одной папке

Читая множество каналов, я вижу кучу годного контента, которым хотел бы поделиться с вами. Поэтому мы собрались каналами и сделали папочку, в которой собраны люди, которые могут рассказать вам много чего интересного и полезного, а самое главное простым и понятным языком 💡

Самая сочность, которую я бы почитал:
🟣Введение в Kaggle / что это такое и с чем его едят - Никита убил
🟡 Роадмап по быстрому вкатыванию в датасаенс и отдельные посты (1, 2, 3, 4,) по ботке разных дисциплин от Саши
🔵 Рассказ про стартап Audio2MIDI, у ребят 4к пользователей в месяц, статьи в СМИ, венчурные инвестиции - полный жир

Каналы ребят мощные и за ними действительно интересно следить, поэтому можешь подписаться, не пожалеешь 💃
Please open Telegram to view this post
VIEW IN TELEGRAM
🍌134🔥4🥰1
Уничтожение резюме, или как резюме поможет тебе залутать побольше зарплаты 😁

Многие думают, что зарплата напрямую зависит от ваших хардов, поэтому многие только и делают, что учат фреймворки, читают статьи и стараются прокачать технические навыки. Но давайте будем честны: в большинстве случаев компания наймёт человека норм по софтам и норм по хардам, нежели ужасного чувака по софтам и классного по хардам.

Несофтовый человек будет ебашить сисю пива каждый созвон, отвечать токсично и на попытку договориться с ним вы будете слышать пару приятных слов о вашей матери, зато такой человек идеально будет писать код, к которому нельзя придраться 👎

Сегодня речь пойдёт о софт скиллах, а именно про создание резюме. Резюме - это ваше лицо перед работодателем, если у вас красивое личико, то это плюс social credits, а если у вас всё лицо в прыщах, с морщинами и складками даже под губой, то минус social credits 👎

Поэтому наша задача - сделать очень красивое и понятные резюме для HR`а:
1️⃣ Чтобы при его просмотре HR позвал вас на собеседование
2️⃣ Чтобы люди, которые принимают решение о прохождении на дальнейшие этапы и о ЗП, посмотрели на ваше резюме, ахуели, и поняли что его надо брать на высокую ЗП

Что должно быть в резюме Дата Саентиста 🤔
1️⃣ Формула описания опыта работы (Пример - 1 картинка): 

Формула - Я сделал A с помощью B, как итог получил C
A - то, что вы сделали.
B - инструменты, указываете выжимку технологий и инструментов, которые вы использовали для решения проблемы.
C - результаты или метрики. Они не обязательно должны быть в цифрах, они могут быть в неком “улучшении”: улучшил рекомендательную систему, но желательно - цифры

Это нужно для того, чтобы:
А - рекрутёр понимал, что вы сделали. Убираем его вопрос "Занимался ли он тем же самым, что и в нашей компании?"
B - С помощью каких технологий вы сделали - вопрос "У него такой же стек, как и у нас?"
C - Какой успех в цифрах вы принесли - "А точно ли он приносит пользу компании?". Если нет цифры, то можно очень аккуратно её придумать, но главное, чтобы вы смогли пояснить за неё.

2️⃣ Делайте буллеты - это такие разделители текста абзаца с помощью точек.
В одной работе у вас должно быть два-три буллета. Каждый буллет описывает одну задачу или проект на работе, также не нужно писать в одном булете больше 3 предложений.
Булеты помогают структурировать информацию, рекрутер сразу понимает структуру резюме, поэтому ему проще читать его.

3️⃣ Пишите стек!
В резюме точно должны быть указаны теги технологий, их можно указать, как и в отдельном поле (такое есть на hh), или после описания вашего опыта. Это нужно, чтобы совпадали ключевые слова в фильтре и у HR`а

Мой ученик как-то сказал:
резюме у нас топ, потому что парень из XXX или как-то так, стартап, сказал, что такое резюме, как у меня, у супер единиц встречается 🚶‍♂️


Эти базовые три пункта помогут апнуть твоё резюме на более качественный уровень, что поможет тебе повысить конверсию на hh.

Но это ещё не всё, что нужно знать при создании качественного резюме для Data Scientist`а. Получить оффер пожирнее и лучше знаний можно получить на менторстве
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🍌7👍5🤯2🥰1
NLP-Собеседование Middle Data Scientist | Вопросы и глубокое объяснение

NLP-секция - неотъемлемая часть получения оффера для NLP инженера. Как раз таки в этом видео я даю базу, которую спрашивают на подобных собеседованиях и объясняю на пальцах эти темы так, чтобы ты точно на них ответил.

Разбираем 💃
- TF-IDF, BM25, плюсы-минусы
- Лемматизация, стемминг, очистка и предобработка данных
- Word2Vec (CBOW, SkipGram, Negative Sampling), FastText, Glove
- Концептуальные различия между Word2Vec и TF-IDF

Все вопросы с собеседования я собрал в этом ноушене.

https://youtu.be/xuF2y9YnBKc
https://youtu.be/xuF2y9YnBKc
https://youtu.be/xuF2y9YnBKc
Please open Telegram to view this post
VIEW IN TELEGRAM
🍌26👍11🔥91❤‍🔥1🥰1👏1
Всем привет!

Приглашаем вас на наш первый митап в 2025 – AI Agents x Web3 BuildCon 😛

Мероприятие пройдет 4 марта совместно с нашими друзьями из московского блокчейн-сообщества Msk Frens.

👥 AI Agents x Web3 BuildCon — митап для фаундеров и разработчиков, которые работают над запуском AI-продуктов в Web3.

Это не абстрактные дискуссии, а конкретные кейсы от тех, кто уже строит продукты с использованием децентрализованного ИИ

- Как билдить AI-агентов?
- Где искать инфраструктуру и полезные контакты?
- Что реально работает в Web3 и AI?

📌 В программе: Лаборатория блокчейн Сбера, Сбер AI, Fluence, TETRIX, VARA, ComBox и другие. Спикеры расскажут, как создают AI-решения для бизнеса и поделятся ценным опытом.

👉 Регистрация на мероприятие обязательна
ВАЖНО: Для участия необходима регистрация и подтверждение регистрации. Для прохода на площадку необходим паспорт.

📍 Где пройдет ивент?

Адрес: Кутузовский пр-кт 32к1, 2-ой этаж, конференц-зал.

Как добраться: Яндекс Карты | Google Карты

🎙 О чем будем говорить?

1. Будущее AI агентов в web3 — что делать после волны мем-коинов?

- Куликов Константин Юрьевич, Исполнительный директор, Sber AI
- Илья Душин, генеральный директор, ГК Т.Т.Консалтинг&ComBox Technology: О том как запустить платежного агента в web3
- Руслан Вяльцев, CEO quarm, Цифровой художник, креативный директор о главных нарративах рынка AI-агентов в web3
- Артем Субботин, CEO TETRIX, Бизнес-модели, механика работы и особенности монетизации AI в блокчейне

2. Децентрализованные ИИ и инфраструктура для агентов: Возможно ли?

- Евгений Пономарев, co-founder Fluence
- Николай Вольф, CEO VARA

3. Доклад: “Разработка финансово автономного агента”

- Владимир Попов, исполнительный директор Лаборатории блокчейн Сбера

и другие темы

Нетворкинг: после основной программы – обсуждаем, знакомимся, строим связи.


Если вы: блокчейн-разработчик; ИИ-разработчик; заинтересованный в технологиях ИИ + блокчейн пользователь, то это мероприятие для вас!

На AI Agents x Web3 BuildCon вы сможете узнать больше о способах интеграции ИИ-агентов в проекты Web3, а также задать вопросы фаундерам успешных бизнесов.

До встречи на ивенте! 🏃‍♂️

#мероприятия
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Теперь даже ваша собака будет понимать логистическую регрессию 🗣

Вот уже прошло второе занятие по ML от Ebout Data Science, делюсь его итогами. Мы проводим живые занятия в небольших группах (до 30 человек), где у вас есть возможность общаться с преподавателем на протяжении всего обучения 👨‍🦰

По теории мы прошли
🔘 как строить строить выборки train/val/test, и как их оценивать результаты модели
🔘 Какие бывают проблемы с данными: пропуски, выбросы, мультиколлинеарность, утечка данных
🔘Что такое недообучение и переобучение?
🔘 И что такое регуляризация линейных моделей: L1, L2, Elastic Net, и чем они оличаются?

А попрактиковались в:
🟣работе с мультиколлирированными данными на синтетическом датасете
🟡самостоятельно реализовали методы регуляризации
🔵анализировали влияние регуляризации на веса, интерпретация
🟢решили задачу на kaggle: задача на прогнозирования цены квартиры с помощью линрег

А вот отзывы учеников на второе занятие 🍷
Математическую часть объяснил довольно понятно хорошо разжеван материал, матформулы даны с понятными пояснениями

Как и в прошлый раз, практическая часть реализация на питоне с нуля - самое полезное. ещё примеры были хорошие

- то, что покрываешь тему исчерпывающе
- есть домашка полезная!

В этот раз понравился сам материал: синтез статистики и машинного обучения + очень доходчиво все было объяснено преподавателем


На третьем занятии "Классификация. Логистическая регрессия. Метрики", которые пройдёт в четверг (6 марта) с 18:00 по 19:30 - мы сделаем уклон в теорию логистической регрессии, а на четвёртом занятии всё будем смотреть через призму соревок на Kaggle!

А также дадим вам список вопросов, которые спрашивают на собесе по логистической регрессии... 💃

В теоретической части мы потеоретизируем про:
🟡 Что такое задача классификации?
🔵 Как решать задачи бинарной классификации с помощью логистической регрессии?
🟢 Вывод логистической регрессии: вероятностный подход, метод максимального правдоподобия, геометрический смысл
🟣 Что такое регуляризация у логистической регрессии?
🟢 И какие бывают метрики бинарной классификации для меток классов и вероятностей?

А на практической части мы попрактикуемся в:
🟣 Выводе формул для логистической регрессии
🟡 Реализуем логистическую регрессию с нуля
🔵 Порешаем задачи бинарной классификации на тривиальных данных
🟢 По экспериментируем с метриками, и сделаем анализ устойчивости к балансу классов

Ученики довольны, ученики получают сошиал кредитс на собесах и всё ближе и ближе к офферу. Для записи пишите @Alexander_Isaev1
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8🍌4❤‍🔥3🥰21
Ошибки, которые ты можешь допустить на собеседовании 👎

1️⃣ Нужно слушать и слышать собеседующего
Просматривая записи своих учеников, постоянно вижу одну и ту же картину: человека спрашивают одно, а он начинает отвечать на что-то совершенно левое. Например: “Какие метрики были на проекте и как поняли, что нужны именно они?” — “Да, метрики, там, конечно, много всего интересного… нужно сначала начать с данных (длинный монолог про данные, уходящий в лес)… и вот я уже голый среди кавказцев”. 🤨

Запомни простую вещь: внимательно слушай вопрос и отвечай строго на него, а не на тот, что у тебя в голове.

2️⃣ Ты должен быть сосочкой в вебке
Ты можешь сидеть дома в одних и тех же трусах с дырками размером с Аргентину, не снимая их третий день подряд, но на собеседовании ты должен выглядеть как Райан Гослинг в лучшие годы. 💀
Поменяй наконец футболку с козявкой по центру и причешись — ухоженность и опрятность это реальный ключ к успешному интервью. Тебе приятно общаться с человеком, у которого вместо бархатистых волос просто засохший баребух на голове? Выглядеть опрятно и ухоженно – обязательное условие успешного интервью. ⌨️

3️⃣ Стань сигма-боем на собесах
Вот тебя спросили “Что такое линейная регрессия?”, а ты в жизни такого вопроса не слышал! Не нужно паники, напряги челюсть и начни на уверенных щах говорить, то что знаешь. 😎
Зачастую собеседующий гасит вопросами, если видят в тебе слабость, а если ты показываешь тестостерон и уверенность, то есть шанс того, что прокатит. Уверенность и спокойствие могут выручить даже в ситуации незнания.

4️⃣ Побольше показывай ход своих мыслей
Вот я включил режим сигма-боя, и что мне говорить дальше? Ты должен показать ход своих мыслей, иногда точный ответ не особо и важен — собеседующему хочется понять, как именно ты думаешь. Задают вопрос, ты говоришь: “Честно говоря, подзабыл, но давайте порассуждаем…”, и дальше рассуждай максимально логично и чётко. Демонстрируй свою логику и способность мыслить вслух 🎙

5️⃣ Пишем секцию ML System Design в онлайн-доске
Опять же: один из критериев на собесе - это показать ход вашей мысли, а как вы можете лучше донести ход своих мыслей? Графически! И особенно это удобно при решении задачи по ML System Design. Тут виден ваш ход мысли - собеседующему легче вас понять, вы сами понимаете на каком вы этапе - вам легче рассуждать. Короче, win2win. 🗣
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18🍌12❤‍🔥6👎2🥰21😁1💯1
Алгоритмическое собеседование в Data Science | симметрия деревьев | поиск кратчайшего пути | BFS

Алгоритмы стали базой для собеседований по Data Science, поэтому к ним точно нужно быть готовым, чтобы получить большой и жирный оффер 😘

Поэтому сегодня разбираем задачи с собеседований, которые задают в Российском бигтехе:
- симметрия деревьев , рекурсия
- поиск кратчайшего пути , BFS , поиск в ширину
- оценка сложности алгоритма по времени и по памяти

Новый дроп смотрим здесь 😎
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥129👍7🍌2🔥1🥰1🏆1
Жестко понимаем базу Classic ML на картинках

Я расцелую ноги, руки, пальцы ног и даже пальцы рук тому человеку, который сделал mlu-explain 😍
Если ты посмотрел уже 5 лекций по деревьям, бустингу или другой теме по ML и всё равно ничего не понимаешь, то руки в ноги и бегом на этот сайт. Там настолько просто, понятно и интерактивно в иллюстрациях объясняют темы в ML, что даже самый прожжённый гуманитарий поймёт 🗣

Там есть множество тем, в который ты можешь покрутить разные гиперпараметры, чтобы понять, как работает алгоритм в ClassicML, также это всё заправляется стеной объяснения.

Сам по нему делаю видосы и кидаю своим ученикам на менторстве. Поэтому залетай и пойми же уже наконец градиентный бустинг 💃
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🍌20👍9🤩3🥰21
Я запрещаю вам срать или новая модель gpt-4o

Мне точно нравится новая модель генерации картинок в gpt-4o 💃

Основные изменения 😵
1️⃣ GPT-4o использует авторегрессионную модель, встроенную непосредственно в архитектуру ChatGPT
2️⃣ Поддержка Image-to-Image: Появилась возможность использовать изображения на входе и создавать их модификации например, скинуть фотку и попросить сделать подпись "Я запрещаю вам срать!".
3️⃣ Повышенная фотореалистичность: улучшена точность генерации изображений, позволяющая получать реалистичные фотографии
4️⃣ Улучшенное следование инструкциям и над безопасностью поработали

Также смотри, что получилось у @Nikotineaddiction
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🍌20👍54🔥4❤‍🔥1🥰1🤣1
Уничтожительный RoadMap по прохождению MLSD, или как пройти секцию ML System Design

Секция по ML System Design - это очень важная секция, она показывает вашу сеньорность. И чтобы получить большой и жирный оффер, то надо её пройти так, чтобы вас сразу звали на позицию Chief Data Scientist

И вот что нужно знать:
1️⃣ Подготовка
🟣 Сначала нужно почитать про верха, поэтому я бы начал с моего пайпика уничтожения MLSD, чтобы вспомнить основы.
- Если вы с нуля, то нужно углубиться в MLSD, для этого советую прочитать первую главу книги "System Design. Машинное обучение. Подготовка к сложному интервью" - в ней рассказывают более подробно про каждый этап MLSD.
🟡 Чтобы понимать как проводиться само собеседование, то посмотрите собеседования с Валерой Бабушкиным. Все собеседования есть в конце данного поста 🗣
🟢 И вишенка на торте - советую почитать уже готовые дизайны систем по тем областям, в которых работает ваша компания, такие можно глянуть на этом сайте. Например: если идёте в Сбер, то не нужно идти в Сбер, ну или если идёте в Авито в отдел скоринга, то скорее всего вас спросят что-то про скоринг, почитайте про это.

2️⃣ Визуализируйте ваше решение
🟣 Ваша цель - как можно понятнее объяснить собеседующему ваше решение. А для этого прям супер подходит интерактивная доска (miro, excalidraw), на который вы графически (как в картинках этого поста) излагаете свои мысли: разбиваете объяснение на блоки, расписываете метрики, данные, baseline и тд - такой способ для собеседующего будет намного понятнее, чем просто голосом проговаривать ваше решение. К тому же вы сами будете более эффективны в решении задачи, смотря на доску 🤨

3️⃣ Важные вещи, которые стоит помнить
🟡 На старте поймите, что вам нужно и идите строго по назначенной цели! Ну очень часто так бывает, что кандидат куда-то влево уходит, а собеседующему это не надо. И после этого HR вам пишет: “К сожалению, мы выбрали другого кандидата, сорян, надо было слушать в начале цель задачи.” - ну это норм ответ, ты же не решил задачу 😵
🔵 В идеале вы должны говорить 90% всего времени. В основном собеседующий ожидает от вас полного решения от А до Я без его подсказок, но это в мире единорогов и конфет, а на самом деле получается так, что вы говорите 70/30 - старайтесь по большей части говорить вы. Если что-то не знаете, но уточнить нужно, то говорите: “Предположу, что у нас такие-то данные, подскажите, на сколько у меня релевантная гипотеза для вашего магазина для взрослых?”
🟢 Не бойтесь спрашивать, но в меру, пока не поняли до конца. Я тут не говорю просить подсказок, но норм спросить про условия, которых ты не понял или не знаешь (но с фразой “предположу…”). Нет ничего плохого, если ты спросишь, это наоборот приблизить тебя к решению 😓
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
24👍12🍌8🔥5🥰2
Я сеньор, что дальше?

Вот представьте, что вы уже все собесы прошли, у вас 5 лет опыт, вы бывалый сеньор, и у вас возникает вопрос "хто я? а что дальше? "🥔

Вот и я столкнулся с такой проблемой, и на помощь мне пришёл канал Саши Big Ledovsky - это место, где встречаются технологии, карьера и здравый смысл 💡

Саша рассказывает о важных карьерных решениях, которые нужно принимать на определённом этапе вашего профессионального роста. Менеджмент или стартап? Стабильность или постоянные вызовы? Пики точёные или хуи дрочёные? 🤨

Каждый пост — это осмысленная дискуссия о реальных карьерных развилках и о том, как их преодолеть.

Те посты, которые мне больше всего зашли:
- Выбор, который обнаруживаешь к середине карьеры
- Калибровки. Команда - это набор разных людей или Одинаковые критерии для всех?
- Нужны ли AI продакты
- Мысли после месяца кодинга с AI
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣12👍4🤓4🍌3🥰1