7.37K subscribers
1.8K photos
78 videos
1 file
1.36K links
Мы — образовательная платформа в сфере аналитики Simulative: simulative.ru

Создаём курсы-симуляторы, где обучаем не на «апельсинках», а на кейсах из реального бизнеса.

Наш уютный чат: @itresume_chat
Поддержка: @simulative_support
Download Telegram
Media is too big
VIEW IN TELEGRAM
Как проходит процесс работы с данными?

Ментор курса «ML-инженер» Мария Жарова поделилась базовым скриптом работы с данными, и где в этой цепочке находится инженер машинного обучения 👆🏻

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥52
SQL — главный инструмент аналитика данных. Почему без него вы упускаете 90% вакансий?

На вебинаре 19 февраля разберём, что такое SQL, почему аналитикам данных важно разбираться в этом инструменте, и порешаем задачи по SQL, в которых наши студенты чаще всего допускают ошибки.

Эксперт вебинара — Евгений Буторин, руководитель отдела CRM-аналитики развития клиентской базы в Альфа Банке и ментор курса «Аналитик данных».

Регистрируйтесь на вебинар и изучайте SQL вместе с нами!

🟠 19 февраля, 19:00 МСК
➡️ Зарегистрироваться

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥642
Как ускорить обработку больших датафреймов в pandas

Привет! На связи Мария Жарова, ментор курса «ML-инженер» 👋🏻

Представьте ситуацию: ваш DataFrame на несколько миллионов строк, и обычные операции вроде apply или groupby становятся ужасно медленными… Причина проста — обычный pandas работает только на одном ядре процессора. Но есть и хорошие новости — можно разогнать обработку данных в разы, если делать это параллельно!

В этом поможет библиотека Pandarallel — она позволяет распараллеливать привычные методы pandas, задействуя все ядра вашего компьютера.

Что умеет Pandarallel:

🟠 Параллельный аналог applyparallel_apply;
🟠 «Параллельная» версия mapparallel_map;
🟠 Ускоренный groupby через parallel_apply;
🟠 Ускоренный rolling также через parallel_apply.

Мы попробовали на тестовом датасете — и получили кратное ускорение, результаты смотрите на скринах. Или попробуйте сами:

# установка библиотеки
# pip install -q pandarallel

from pandarallel import pandarallel
import pandas as pd

# инициализация библиотеки
pandarallel.initialize(progress_bar=True)

# тестовый датасет
df = pd.DataFrame({
'A': range(1, 1000001),
'B': range(1000001, 2000001)
})

def add_columns(row):
'''тестовая функция для apply'''
return row['A'] + row['B']

df['C'] = df.parallel_apply(add_columns, axis=1)

def multiply_by_two(x):
'''тестовая функция для map'''
return x * 2

df['D'] = df['C'].parallel_map(multiply_by_two)


Официальная документация тут: Pandarallel 😎

А на последнем скрине оставлю весь список возможностей библиотеки и как их реализовать.

Ставьте ❤️, если было полезно — и сохраняйте, чтобы не потерять!

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
12🔥113👍1
This media is not supported in your browser
VIEW IN TELEGRAM
5🔥32
Simulative
Мы готовы к «прожарке» резюме, а вы? Присоединяйтесь к вебинару 18 февраля, где HR-эксперт Наталья Рожкова разберёт ваши резюме и сопроводительные письма, оценит их глазами рекрутера и покажет, какие ошибки мешают получить оффер. На вебинаре вы: Посмотрите…
«Прожариваем» ваши резюме уже через 2 часа!

Вас ждёт полноценный разбор четырёх резюме и сопроводительных писем от подписчиков, а также общие ошибки и советы, которые помогут вам получить заветный оффер.

➡️ Регистрация на вебинар

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥32
4 признака, что ваша карьера аналитика зашла в тупик

Вы регулярно делаете однотипные отчёты, но зарплата и задачи не растут? Возможно, вы застряли в профессиональном тупике. Проверьте себя по этим 4 признакам:

1️⃣ Вы пользуетесь одним инструментом

Например, вы виртуозно работаете в Excel или пишете сложные SQL-запросы. Но стоит в вакансии увидеть Airflow или требования к настройке дашбордов в Power BI/Metabase — вы пролистываете её.

Проблема в том, что рынок всё реже ищет узких исполнителей — ему нужны универсалы, которые могут собрать пайплайн, проанализировать данные и визуализировать результат.


2️⃣ Вы не видите бизнес-задачу

Вам ставят ТЗ: «Сделайте выгрузку по продажам за квартал». Вы делаете, но зачем? Вы не спрашиваете и не знаете — вы исполнитель запросов, а не партнёр для бизнеса. Такой специалист не может влиять на решения и, как следствие, на свой доход.


3️⃣ Ваш анализ никогда не превращается во внедрение

Вы нашли инсайт, показали его руководителю — и на этом всё закончилось. Вы не умеете упаковывать анализ в работающее, регулярное решение. А значит, ваша ценность для компании остаётся низкой.


4️⃣ У вас нет целостного портфолио «под ключ»

Нет ни одного примера, где бы вы полностью прошли путь: настройка хранилища, сбор и обработка данных, анализ и визуализация, автоматизация отчёта. Именно такое портфолио сейчас убеждает работодателей больше, чем диплом.


🫸🏻 Как сломать потолок? Стать fullstack-аналитиком, универсальным специалистом, который закрывает весь цикл работы с данными. Именно таких мы готовим на нашем курсе.

За 17 месяцев вы не просто изучите стек, а выполните 90+ проектов, собрав готовое портфолио «под ключ». Вы научитесь:

Видеть задачу от бизнес-вопроса до внедрения;
Автоматизировать рутину и строить аналитические пайплайны;
Говорить с бизнесом на его языке, предлагая решения.

🪟 Прорваться сквозь потолок: simulative.ru/fullstack-analyst

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥31
Как аналитики используют ИИ: 3 примера

Привет! На связи Марина Ермак, автор курса «ИИ для анализа данных» 🚀

Приведу несколько примеров, как можно использовать нейросети на реальных задачах аналитика, вместе с ответами нейросети в карточках:

1️⃣ Поиск и анализ по документу

Мы загружаем документацию/заметки со встречи/etc. в нейросеть, затем задаём вопросы по содержанию. Например:

Кластеризуй предложения со встречи по тематическим группам и приведи точные цитаты для каждой группы. Важно, чтобы все цитаты были упомянуты.

На основе прикреплённых файлов сделай саммари и найди все упоминания следующих трендов: <тренд 1>, < тренд 2>, … Приводи точные цитаты.


2️⃣ Генерация SQL-запроса по описанию базы данных и сути задачи

Описываем, какая у нас архитектура БД и таблиц, которые нам нужны в запросе, затем саму суть запроса. Например:

Напиши мне SQL-запрос под задачу:

Найдите максимальный возраст (количество лет) среди обучающихся 10 классов на сегодняшний день. Для получения текущих даты и времени используйте функцию NOW().

Схему БД прикрепляю на скрине.


3️⃣ Регулярное исследование трендов (ChatGPT)

Например:

Проведи исследование по современным трендам в мире финтеха и банкинга в России и в Европе/США.


Как видите, использовать нейросети можно в абсолютно разных задачах и процессах. Делитесь в комментариях, какие задачи вы бы хотели автоматизировать (или уже отдаёте ИИ) — в следующих постах разберём их подробнее


📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥95👍11
This media is not supported in your browser
VIEW IN TELEGRAM
🔥54👍2
Решаем задачи по SQL через пару часов

Евгений Буторин, ментор курса «Аналитик данных», ждёт вас на вебинаре, где мы посмотрим, в каких задачах студенты совершают ошибки чаще всего, и научимся собирать SQL-запросы за 30 секунд 🧡

➡️ Регистрируйтесь!

📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥5👍2
Вопрос от подписчика: насколько нужно разбираться в статистике и теории вероятностей, чтобы стать аналитиком?

Отвечает Мария Жарова 👇🏻

Кстати, уже сегодня стартует поток курса «ML-инженер» с её менторской поддержкой! Присоединяйтесь: simulative.ru/ml-engineer


📊 Simulative
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥433
This media is not supported in your browser
VIEW IN TELEGRAM
6🔥43👍1