Start Career in DS
11.9K subscribers
93 photos
1 video
10 files
317 links
Тут публикуются материалы для прокачки скиллов в DS и подготовки к собеседованиям.

Пишем про технические тулзы, визуализацию данных, бизнесовые задачи, разбираем ML-алгоритмы и обсуждаем смежные темы :)

Автор: @RAVasiliev

№ 5141779667
Download Telegram
Start Career in DS
Как рассказать про ту или иную тему на собеседовании? Какие вопросы могут задать? Запускаю цикл видео, которые ответят на эти и многие другие вопросы. https://youtu.be/MM4onsNaLlI P.S. На первый выпуск ушло прям очень много сил и времени, огромнейшее спасибо…
🔥Вторая часть видео про линейную регрессию!
В нём разбираются уже более сложные вещи.
Ключевые моменты: внутрянка sklearn LinearModel, решение линейной регрессии через SVD, градиентный спуск, стохастический градиентный спуск.
Как и всегда, буду рад любой обратной связи (как положительной, так и отрицательной) где угодно.
https://youtu.be/gZxtdPY6e_o
DLStories — канал о глубоком обучении и искусственном интеллекте, который ведут ребята из DLSchool — школы глубокого обучения на базе МФТИ.

В канале вы найдете:
- разборы архитектур новых нейросетей
- обучающие материалы: статьи, видео, подкасты на DL-тематику
- рассуждения о влиянии ИИ на социум
- новости и веселые истории из мира ИИ

Будьте в курсе последних тенденций в области DL и ИИ! ⬇️

@dl_stories
Наверное, кто-то меня невзлюбит за эту статью и я получу большой отток в канале, но поделиться очень хочется 🙂
Автора лично не знаю, статью взял у ребят из @quas6
Ключевая мысль, которую я хочу ею донести - DS'ы бывают разными. Не ведитесь на название позиции, обязательно узнавайте чем вы будете заниматься и в каких условиях будете работать. Лучше - просите прямо конкретные примеры задач команды и равняйте их на себя, а ещё лучше - находите людей, которые в отделе работают.
mesyarik.ru/18/sberbank.html

P.S. Даже в рамках компании от отдела к отделу задачи и условия могут отличаться кардинально, поэтому не воспринимайте статью в штыки
👍1
Карта базовой математики для ML: https://app.learney.me
В вершинах - материалы, которые помогут изучить тему. Очень полезная штука.
👍4
Легендарная статья, которая позволит вам объяснить любому человеку с улицы что такое Data Science:

https://vas3k.ru/blog/machine_learning/
👍6🔥2
Прекрасный тренажёр по #pandas, позволит вспомнить основные хинты перед собеседованием (и не только):
https://www.machinelearningplus.com/python/101-pandas-exercises-python/
👍7
Всех с наступающим, а кого-то уже и с наступившим :)

Прошедший год в цифрах:
• Канал в телеграмме вырос более чем в 2 раза!
• Суммарные просмотры канала превысили 250k
Более 150 постов были собраны в единую страничку на Notion
• Был запущен канал на Youtube, он уже набрал >350 подписчиков :)
Там уже есть и интервью, и обучающие видео. Дальше - больше!
Записаны и находятся в монтаже видео с несколькими очень интересными личностями:
1. С лидом из MTS AI (мастер и грандмастер Kaggle!)
2. С легендой российского и лондонского Data Science :)
Ссылочка: https://youtube.com/channel/UC58kXi5NtsovarEcx4FfsiA

А чего бы вам хотелось бы видеть больше в канале в 2022 году?)
👍21🔥9
Ключевые распределения.
На собеседованиях очень любят задачки на классический тервер а-ля
• Из ящика, в котором 4 красных, 5 зелёных и 1 синий шар вытаскиваются шары с возвращением. Каково матожидание первого вытягивание синего шара?
• В среднем в магазин заходят 3 человека в минуту. Какова вероятность того, что за 2 минуты в магазин зайдет не более 1 человека?
• Согласно какому распределению распределяется число изюминок в булочках?

Для того, чтобы в этом всём разобраться, здорово понимать какие ключевые распределения есть.
Вот эта статья позволит это вспомнить: https://habr.com/ru/post/311092/
👍22🔥19
К слову про задачки на теорию вероятностей.
Я тут недавно нашёл вот такой вот такую подборку задач из Я, которую давали на одном из дней карьеры в МГУ.
За, кажется, 4 решённых задачи можно было получить что-то вроде футболки и скип одного из первых этапов отбора на стажировку :)
👍17🔥10
🔥🔥🔥 Интервью с Андреем Лукьяненко, лидом из MTS AI, мастером соревнований и грандмастером ноутбуков на Kaggle!

Андрей прошёл путь из ERP консалтинга в DL и сейчас является одним из самых узнаваемых участников российского DS-комьюнити 🙂

https://youtu.be/pjvJoGwXVXU

P.S. Поддержите видео лайком + комментом, это будет безумно полезно для продвижения канала!
🔥16👍7🎉1
Курс по нейронкам с уклоном в CV от Samsung.
Буквально вчера допрошёл очень зашедший мне курс "Нейронные сети и компьютерное зрение".
Зашёл он мне по ряду причин:
1. Большинство сложных вещей объясняют реально на пальцах. Вплоть до того, что "Для того, чтобы понять градиентный спуск - представьте что вам нужно спуститься с горы к озеру. Как вы это будете делать?"
2. Достаточное количество теоретических задач. Их я бы сказал много, но необходимо их решать на сертификат с отличием, если проходите курс просто по фану - можно пропустить. Тем не менее, многие из них - вопросы, которые во-первых реально позволяют лучшие понять тему (к примеру, руками считать производные выхода нейронки по параметрам), во-вторых - реально встречаются на собеседованиях
3. Хорошие практические задания. Местами дебильные и муторные (ручная реализация свёрточного слоя), но, опять же, позволяющие лучше понять что происходит
4. Последний семинар - фактически готовый гайд для старта участия в соревнованиях по CV на Kaggle. Ну и, собственно, задание там - побить baseline в одном из мейнстримных соревнований (Cleaned vs Dirty).
5. Курс целиком и полностью бесплатный 🙂

Имхо если вы помните универскую математику, +- уверенно программируете на питоне и хотите познать CV - он вам зайдёт.

В общем, рекомендую:
https://stepik.org/course/50352
👍33🔥4🤩1
Учебник ШАДа продолжает пополняться!
Почитал про алгоритмы и оценку моделей - одни из лучших объяснений, которые я видел. В том плане, что погружение достаточно плавное: сначала даётся интуитивное понимание (которого и многим не хватает), а потом уже постепенное погружение в детали.

Очень советую всем как минимум почитать блок про градиентный бустинг, как максимум - прям поразбираться со всеми блоками.
Ссылка: https://ml-handbook.ru
👍29🔥4🤩4
В канале часто появляются материалы относительно тех или иных ML-алгоритмов. Но вот конкретные приложения к прикладным задачам найти не так просто.
У Вани Максимова есть очень хороший канал ML for Value. В нем он разбирает применение различных подходов к решению практических задач.
Ваня долгое время работал в DS консалтинге, сейчас руководит одной из DS команд в Delivery Club, так что ему есть что рассказать 🙂
Ссылка на канал: https://t.me/ml4value
🔥8👍7
Для тех, кто пропустил: ODS запускает поток своего бесплатного курса по по Data Science! Курс уже стартанул, но войти в него можно и сейчас.

https://ods.ai/tracks/open-ml-course/about

Подробную инфу про курс и про то, как на него записаться, можно почитать тут.
Там очень хорошее разнообразие тем и ведёт его Петя Ермаков - я проходил его курсы в DataGym, он очень клёво умеет объяснять :)
👍18🔥8🤩2
Ещё один клёвый тренажёр+учебник по #SQL.
Кому sql-ex кажется сложноватым и некрасивым - этот ресурс зайдёт.
На сайте есть платная версия (которая позволяет смотреть авторские решения), но можно вполне обойтись и без неё.

Тут можно потренироваться в хитрых джойнах, агрегациях и понабивать руку. Интерфейс очень приятный и позволяет потыкать схему БД, даёт подсказки как в коде, так и непосредственно по решению. В более сложные штуки (к примеру, в оконные функции) этот ресурс не лезет. Ну и запросы даже в самых сложных задачках получаются не сказать чтобы громоздкие.

Ссылка: https://sql-academy.org/ru/trainer
👍13🔥3