VICDS
643 subscribers
30 photos
18 videos
9 files
190 links
Канал о Data Science, ML, AI - книги, курсы, статьи.
Download Telegram
Live stream scheduled for
КАК УЗНАТЬ КАКИЕ ВОПРОСЫ ЗАДАДУТ НА СОБЕСЕДОВАНИИ???

Классическое собеседование можно разделитесь на три части:
1. Звонок от HR, расскажут о вакансии, узнают релевантно ли вам и ваш опыт, передадут резюме команде, если ок, назначат встречу;
2. Первый этап собеседования — рассказываете о себе и своём опыте подробно: какие задачи решали, какие подходы использовали, на какую метрику ориентировались и почему. 🙉Тут важно хорошо вспомнить, что вы делали, или прям просмотреть проекты, для этого хорошо бы иметь портфолио на git, к которому можно быстро обратиться. ☝🏻Это очень важно, так как чаще всего вопросы задают именно по вашим проектам, что, как и почему, разбираются на сколько хорошо вы понимаете то, что делали. ❗️После этого теоретического этапа могут дать тестовое задание - новичкам обязательно соглашаться и делать, потом можно будет так же добавить проект в портфолио. Если прошли первый этап, по итогам созвона или тестового задания идете дальше.
3. Второй этап собеседования проходит обычно с тимлидом/ техлидом и представляет собой техническое собеседование, где проверяют навыки программирования, знания алгоритмов и структур данных и тд.. ⁉️Вопросов может быть великое множество, но подготовиться вполне реально и полезно, выучив один раз будите счастливы многие годы. Если было тестовое, то могут задать вопросы по нему.
Сегодня, 02.06 в 19:00 будет стрим, поговорим о собесах 🤯 c DS @nikolay_frolov

Подключайтесь, задавайте свои вопросы 😅
Live stream started
Запись стрима о собеседованиях в DS.
Ссылка на упомянутое соревнование:

https://www.kaggle.com/competitions/image-matching-challenge-2022
+ полезности по Python
Forwarded from Nik
Algoritms.ipynb
35 KB
ЧТО ОБЯЗАТЕЛЬНО НУЖНО ЗНАТЬ В DATA SCIENCE?

1. Машинное обучение

Машинное обучение - это основа науки о данных. Специалисты по обработке данных должны хорошо разбираться в ML.

2. Моделирование

Математические модели позволяют выполнять быстрые вычисления и делать прогнозы на основе данных. Моделирование является частью машинного обучения и включает в себя определение того, какой алгоритм является наиболее подходящим для решения конкретной задачи.

3. Статистика

Статистика лежит в основе науки о данных. Уверенное владение статистикой может помочь извлечь больше информации и получить более значимые результаты.

4. Программирование

Для успешного выполнения проекта по DS требуется определенный уровень программирования. Наиболее распространенными языком программирования является Python. Он особенно популярен, потому что прост в освоении и поддерживает множество библиотек для data science и ML.

5. Базы данных

Специалист по обработке данных должен понимать, как работают базы данных, как ими управлять и как извлекать из них данные.

⁉️Продолжите список?
КАК УПРАВЛЯТЬ DATA SCIENCE ПРОЕКТОМ?

В классической разработке программисты взаимодействуют с несколькими версиями кода - любая доработка это изменение исходной версии кода.
Чтобы предотвратить путаницу и ошибки, разработчики используют системы управления версиями, например, Git.
В системе управления версиями есть центральный репозиторий кода, представляющий текущее состояние проекта. Далем его копию, вносим нужные правки, тестируем и, если все хорошо, добавляем к исходной версии👌

😑В проектах связанных с машинным обучением все немного сложнее, помимо кода, есть ещё данные, модели и куча экспериментов, версии которых тоже необходимо отслеживать.

Так вот для контроля версий моделей можно использовать библиотеки с открытием исходным кодом ClearML/MlFlow.
А масштабные эксперименты удобно проводить в AirFlow, так как удобно использовать асинхронный граф между задачами.

А вы следите за своими экспериментами?
Стажировки лучший способ притронуться к реальным задачам и получить первый опыт, а если повезёт то первый offer.

Поэтому я собрала несколько актуальных стажировок в крупных компаниях:

https://vk.tinkoff.ru/start_osen2022

https://job.mts.ru/youth#section-steps

https://job.megafon.ru/internship

https://job.ozon.ru/internships/

https://yandex.ru/yaintern/?ysclid=l5ebax4k61718876020


Рекомендую попытаться, подготовить резюме и порешать тестовые, пройти собесы🔥

Удачи 🍀
Forwarded from Pavel Dubinin
Полезные ссылки для знакомства и работы с DataLens

Большой функциональный демо дашборд:
- datalens.yandex/demo - публичный, только чтение
- Развернуть дашборд в своем DataLens для редактирования

Сообщество:
- Телеграм чат (вы сейчас тут)
- Предложить и проголосовать за новую фичу
- Плейлист официальных видео на YouTube

Обучение:
- Быстрый старт, пошаговая инструкция
- Более детальные пошаговые инструкции по сценариям
- Туториалы по аналитическим функциям: агрегации, оконные функции, Level-of-Detail выражения
- Создание SQL-чартов (если вам нужно больше гибкости модели данных)
- Образовательные проекты

FAQ
- FAQ в документации
- ETL для DataLens?
- Яндекс.Метрика и DataLens

Публичные кейсы использования DataLens:
- КазаньЭкспресс - Аналитика retail маркетплейса
- Правительство С.-Петербурга - Аналитика городских сервисов
- Окраина - Аналитика на мясоперерабатывающем заводе
- МВидео - Платформа данных в облаке, геоаналитика
- Rubetek - Аналитика IOT по датчикам домов и квартир застройщика ПИК
- Moneycare - Кредитный брокер, корпоративный BI
- AnywayAnyDay - Аналитика онлайн туристического агентства
- JustSchool - Аналитика над CRM школы английского языка
- SevenTech - Аналитика технологического стартапа над ClickHouse
- НефтеТрансСервис - Промышленная аналитика интернета вещей
- RADAR - Аналитика аудитории наружной рекламы по всей России
- Цифровое образование - Аналитика олимпиад, учеников, школ
- Биологический Факультет МГУ - Предсказание и аналитика урожая
- tproger – Веб аналитика портала
- Car-Taxi - Продуктовая аналитика сервиса эвакуации авто
- Datanomics - Анализ результатов прогнозирования в ритейле
- Кинопоиск - Публичная статистика оценок фильмов

Примеры публичных дашбордов:
- Анализ качества воздуха
- Статистика коронавируса
- Погода
- Показатели Российских ВУЗов
- Демография Ставрополья
- Исследование про работу вахтовым методом в РФ
- Безработица РФ
- Пример с LOD выражениями от @ab0xa

Презентации:
- DataLens
- Yandex Cloud Data Platform

Помощь:
- Обсудить ваш проект
- Завести тикет в техподдержку
- Оставить заявку на помощь партнера Yandex Cloud
- Публичный каталог партнеров
Forwarded from AvitoTech
Олег Харатов из команды DWH выступит 21 июля на IT’s Tinkoff Data Meetup, чтобы поделиться знанием, как найти данные о данных. Приглашаем зарегистрироваться!

Тем временем в открытом доступе появился доклад Жени Николаева, коллеги Олега, который презентовался на Smart Data 2021. В нём — о продуктовом подходе к разработке платформы хранилища данных.

Кстати, мы даже статью такую писали. Помните?

#dwh_avitotech #видео_avitotech #avitoteam
Приглашаем на тест-драйв Yandex DataLens по следам «BI круг Громова»

🗓 21 июля в 15:00 (Мск) эксперты «Ёлва», BI Consult и Yandex проведут тест-драйв Yandex DataLens в рамках road-show российских BI-решений.

На вебинаре познакомим с компонентами и архитектурой DataLens и детально разберем решение реального кейса:

▫️ Загрузка данных в Yandex Cloud с помощью Object Storage
▫️ Импорт данных в витрину ClickHouse и подключение DataLens к ClickHouse как к источнику данных
▫️ Создание набора данных (датасета)
▫️ Построение визуализаций и дашбордов в сервисе DataLens

Регистрация 👈
КАК ПОВЫСИТЬ ЗАРПЛАТУ 2Х?

💸💸Самый простой и очевидный способ это найти хорошую вакансию, подготовиться и заполучить ее.

Но если вы долго работаете на одном месте, у вас хороший коллектив и вообще отличная командная работа - вы не хотите никуда уходить🙄

В таком случае вы можете расчитывать на повышение зп на 20-30% в год/пол года (зависит от компании) или ожидать премию за хорошую работу, если постараетесь.

Но есть некая «несправедливость» на рынке труда 🙃:

- зарплатные вилки новых позиций могут быть выше, чем ваши текущие🙀

Это объясняется конкуренцией на рынке вакансий - компании вынуждены предлагать релевантные цифры, но это совсем не значит повышение зп всем уже имеющимся сотрудникам соответственно🤨

💵 Поэтому если вы хотите получать зп соответствующую рынку, вам необходимо часто менять место работы.

⁉️Так делают многие и в этом есть как + так и -, можете подумать о них в комментариях.

🤓Так же есть ещё один рискованный способ поднять свою зп - принести новый оффер своему начальнику, т.е. заполучить вакансию с интересными вам цифрами и сказать об этом на текущем месте.

‼️Если вы являетесь ценным сотрудником, вам могут предложить контр оффер и обсудить новые условия

⚠️Ну или пожелать вам хорошей работы на новом месте, к этому тоже нужно быть готовым.

⁉️Были ли у вас такие случаи?
This media is not supported in your browser
VIEW IN TELEGRAM
Кто хочет узнать всю информацию о курсе одним из первых, оставляете заявку:

https://forms.yandex.ru/cloud/62dbb3e0fe6772ff501936d6/
VICDS pinned a video
В ЧЕМ РАЗНИЦА???
Business Intelligence VS Data Science

👨‍💻В работе с данными есть множество направлений, которые тесно пересекаются между собой и даже часто выполняют одни и те же задачи для бизнеса.
С другой стороны, всех специалистов разделяют по специальностям, так как компетенции у каждого преобладают свои. Давайте разберемся в чем разница между Business Intelligence и Data Science.

❗️Понятие Business Intelligence связано с технологиями, практиками и анализом информации для бизнеса. Сами BI системы позволяют делать продукты, которые используют данные в качестве основы для анализа текущей, прошедшей или предсказания будущей ситуации для бизнеса и бизнес-показателей. Это позволяет предоставлять ценную информацию для конечных пользователей и людей, принимающих бизнес-решения.

📌Ключевыми задачами в BI являются:
создание аналитических хранилищ данных внутри компании
разработка и настройка интерактивной отчетности компании на основе данных
построение систем принятия решений на основе анализа данных

👩‍🎓Соответственно, ключевыми компетенциями специалистов по BI будут:
знание и понимание бизнес-домена
понимание методик бизнес-анализа
работа с аналитическими хранилищами данных
описание и разработка аналитических систем и ETL/ELT процессов
работа с данными (извлечение, проверка на качество, описание модели, очистка)
работа с бизнес-метриками
работа с BI инструментами

❗️Data Science же, в какой то мере, идет дальше, помимо стандартного анализа данных, расчета метрик и получения информации, из данных извлекают знания с помощью алгоритмов машинного обучения (ML).

📌Ключевыми задачами в DS являются:
предобработка данных и построение на их основе признаков для обучения модели
построение ML моделей, их оптимизация и тестирование
внедрение модели в систему принятия решений

👩‍🎓Ключевые компетенции специалистов по DS:
знание и понимание бизнес-домена
работа с хранилищами для извлечения данных
работа с данными (предобработка, построение признакового пространства)
знание математики, статистики, ML и построение моделей на их основе
работа с ML и бизнес-метриками
навык программирования и знания ПО для разработки: Pycharm, Git и тд;

⁉️Каким направлением вам хотелось бы заниматься?

Совместный пост с https://t.me/data_study