Datalytics
9.07K subscribers
218 photos
17 videos
5 files
673 links
Канал для аналитиков данных про Python, карьерное развитие в анализе данных, всякое разное

Автор – @ax_makarov

Отдельный канал про ChatGPT и его практическое применение —  @ai_forge

Чат канала — @pydata_chat

Вакансии — @data_hr
Download Telegram
Ищу к себе в команду Продуктового исследователя, который знаком с направлениями Data Science, Data Analysis и Data Engineering, или имеющего большое желание погрузиться в одну из них.

В этой роли человек будет добывать данные, позволяющие команде улучшать программу обучения и определять дальнейший вектор развития продуктов. При этом нужно будет исследовать рынок вакансий в сфере работы с данными, а также общаться со студентами, выпускниками и работодателями.

Отличная возможность для тех, кто хочет и умеет заниматься количественными и качественными исследованиями, имея при этом возможность влиять на конечный продукт.

Полное описание можно посмотреть здесь: https://praktikum.yandex.ru/promo/hr/product-researcher

Для отклика или рекомендации пишите в тг Юре @zyuzyaev
Business | System analyst - канал для всех, кому интересен бизнес/системный анализ. Ежедневно публикуются обучающие материалы и полезные статьи, с помощью которых вы прокачаете hard и soft skills.

Здесь вы найдёте:
переведённые статьи с английского языка
обучающие видео с ведущими IT-специалистами
актуальные новости
профессиональный юмор
Знаете как порой говорят «Математика ум в порядок приводит». Так вот в моём случае можно сказать, что «Эксель ум в порядок приводит»

Впервые я познакомился с Экселем где-то в школе, когда мы там учились в одной ячейке писать 2, в другой 2, а в третьей через формулу получалось 4. Уже магия. Затем какое-то понимание табличных процессоров мне пригодилось в университете, когда я за половину своей группы прорешал курсовые по статистике, которые можно было полностью сделать в Эксель. Нам всем тогда давали разные выборки с данными и нужно было посчитать разные статистические показатели: медиану, среднее, дисперсию, построили гистограмму и ещё всякие штуки, которые тогда казались бесполезными (ох как я ошибался). Принцип, по которому можно было сделать вычисления для всех курсовых был одинаковый, поэтому тут Эксель выручил: я сделал форму, которая по сути считала всю курсовую, только успевай менять данные. Уже тогда я где-то в глубине своей ленивой души полюбил концепцию «сделай что-то один раз, а потом автоматизируй»

Но настоящее моё помешательство на Эксель случилось, когда я пошёл на свою первую работу — на ней я сидел в Эксель 80% своего времени. Для кого-то это может показаться самой ненавистной работой — ну что может быть хуже, чем весь день красноглазить в таблички? Для меня же наоборот. Я часто ловил себя на том, что мне интересно приводить таблички и процессы к такому виду, чтобы они работали без меня. Это требовало усилий, изучения новых функций, бесконечного гуглежа и просиживания на форумах. При этом это научило меня этому безумному упорству нёрдов — привычке не жалеть времени, чтобы найти ответ на какой-то небольшой технический вопрос, из-за которого всё не работает так, как хочется

В процессе такой автоматизации своего мира я всё больше высвобождал времени для того, чтобы изучить что-то новое и покопаться в чём-то ещё, поставить себе ещё какой-то новый вызов. То есть именно Эксель научил меня привычке освобождать себя от рутины, но при этом забивать освободившееся время поисками того как ещё лучше использовать инструмент. В какой-то момент я понял, что всё более менее доступное я уже понимаю, инструмент исчерпан для меня. Можно было бы двигаться и глубже, например, изучая VBA и автоматизировать ещё больше. Но мне это показалось сложным и ненужным, поэтому подумал, что надо искать что-то другое. Так от Экселя я пришёл в веб-аналитику и дальше двинулся в освоение мира всяких там сессий, просмотров страниц и настройки событий, что привело меня к аналитике данных, но Excel до сих пор не выходит из обихода моих регулярных инструментов

Короче, учите Эксель (конечно, если ещё не умеете программировать) – он меняет способ восприятия и голову в порядок приводит
👍1
Вчера Юрий Борзило выложил в Фейсбуке пост про доверительные интервалы в работе аналитика. Это хороший пост, так как он поднял проблему использования статистики как инструмента получения достоверных выводов

Максим Годзи из Retentioneering в группе «Python для анализа данных» написал большой пост, где разобрал этот кейс с точки зрения границ применимости, а также значимости этого для бизнеса. Мне кажется получилась хорошая мини-дискуссия, детально разбирающая этот кейс, освещая все подводные камни

Ниже, с разрешения Юрия и Максима, я привожу текст первоначального поста Юрия и ответа Максима. Посты достаточно длинные, поэтому размещаю их на telegraph, но советую прочитать полностью, чтобы понять все причинно-следственные связи, о которых говорят Юрий и Максим

Доверительные интервалы в работе аналитика
Почему я считаю важным разместить этот пост?

Во-первых, он показывает, что в использовании многих инструментов есть границы применимости. То, что можно назвать подводными камнями. И очень важно разбирать публично эти подводные камни, рассказывать о них, объяснять, вступать в продуктивную аргументированную дискуссию

Во-вторых, как будто это оказалось для меня глотком свежего воздуха. Я часто встречаю в интернете другой тип дискуссий: попытку выставить собеседника «дураком», аргументировав это фразой «вы ни в чём не разбираетесь, тогда не пишите ничего». Особенно часто это касается областей, в которых прослеживается «наукоёмкость» и «систематичность», то есть областей где много математического или инженерного фундамента. К такой отрасли относится и аналитика данных. Мне кажется это катастрофически снижает культуру дискуссий, ограничивает развитие отрасли и бьёт по самоценке людей, входящих в эту индустрию. Я верю, что открытый диалог, аргументированное объяснение и работа над ошибками в формате взаимопомощи, а не «тыкания носом» — это то, что делает нас всех лучше как сообщество единомышленников

Как мне кажется, такой уровень дискуссии и объяснений — это то, чего крайне не хватает в русскоязычном коммюнити аналитиков за пределами профессиональных конференций. Моя большая мечта — выстраивать такое коммюнити, где эксперты как Юрий и Максим будут активно делиться такими кейсами, повышая уровень экспертизы всего рынка. Ограничивающим фактором тут является то, что такое качество объяснений и глубина мысли требуют очень больших вложений сил и времени

А ещё, пользуясь случаем, хочу анонсировать, что на конференции Матемаркетинг-2021 я буду выступать с докладом «Математика как прикладная область знаний в работе и карьере аналитика», где в том числе попытаемся разобраться как аналитику усилить свою математическую интуицию, лучше понимать подводные камни использования статистических инструментов. Рассчитываю, что этот доклад будет результатом переосмысления коллективного опыта различных экспертов аналитики, поэтому если вам есть что сказать про математику/статистику, задать вопросы мне, Юрию или Максиму — пишите в комментариях
Совершенно оффтопный пост с очень личной просьбой

Была когда-то (а может и есть сейчас) такая компания «Кирилл и Мефодий». Они занимались производством интерактивных энциклопедий на CD/DVD в начале 2000х, когда ещё мало у кого был нормальный интернет. Может быть у кого-то есть контакты того, кто там работал или работает до сих пор. Буду рад, если поделитесь
Forwarded from Этюды для программистов на Python (Дима Федоров)
🔥 Подготовил новый перевод с кейсами: Исследуем отношение между переменными 🐼

1⃣ Мы будем визуализировать отношения с помощью диаграмм рассеяния (scatter plots), диаграмм размаха (box plots) и скрипичных диаграмм (violin plots).

2⃣ И количественно определять отношения, используя корреляцию (correlation) и простую регрессию (simple regression).

Самый важный урок этого блокнота заключается в том, что вы всегда должны визуализировать взаимосвязь между переменными, прежде чем пытаться ее количественно оценить; в противном случае вас могут ввести в заблуждение.

👉 Ссылка на html-версию

👉 Ссылка на Colab

🐍 Остальные переводы по ссылке: https://dfedorov.spb.ru/pandas/
Отличный джоб-тайтл вакансии. Сразу понятно кого ищут
Forwarded from Reveal the Data
Год назад мы с Колей Валиотти сделали дашбород по рынку вакансий аналитиков. 🎉 Подводим итоги за год! Сделали это в виде карточек по разным направлениям аналитики — пощёлкайте и сравните разные профессии.

А ещё, подобрали ТГ каналы, чтобы качаться в каждой из областей:
— Про BI и Табло — Reveal The Data =)
— Про аналитику и DS — Left Join
— Про системный анализ — BA|SA
— Про DE — Инжиниринг данных
— Про маркетинг — Матемаркетинг
— Про Web — WebAnalytics

🔗 Карточки на Табло Паблик
🔗
Основной дашборд
Disclaimer: данные по вакансиям с HH для Москвы и Питера. Профессии определяются по наличию ключевых слов в названии вакансии (есть BI → BI-аналитик, есть ML → Data Scientist и т.п.). Больше всего вакансий в разделе просто «аналитик» и «бизнес-аналитик», так как под ними часто понимают разные обязанности. Зарплаты указаны как средние и чистыми. Кажется, что можно умножать на ×1.2-1.4 и будет примерно рынок.
#пример #ссылка
Интересно сейчас разные специалисты рассуждают о будущем аналитики, аналитика.
В частности Алексей Свирин написал интересный пост в fb. В мимолетный миг досуга также надумал сформировать свое мнение.
Не вижу проблемы в том, что дата-аналитика как есть сейчас сдохнет. Ну и ладно, такова жизнь.
У себя в голове не могу толком разделить продуктового и дата-аналитиков. Так как продуктовый, конечно, должен уметь работать с данными, а аналитик данных должен обладать продуктовым мышлением, иначе толка от него не будет.
К вариантам, которые предложил Алексей (системный аналитик, продуктолог, программист, дата-инженер) уверенно добавлю обычного продуктового аналитика.
Предыдущий мой руководитель прекрасно понимал, как нужно работать с аналитиком: даешь аналитику проблему и он идет ее решать. И таких проблем может быть 100500. Ведь жизнь не ограничивается АБ тестами и дашбордами - любой живой развивающийся продукт требует постоянного решения многих вопросов, типа ответов на вопросы как нам сделать?, почему?, когда?, а что, если? и тд. И, слабо понимаю, как изучение прекрасных красивых дашбордов все это сможет сделать.
Аналитик сам решит, какие инструменты применить, в каком формате презентовать и обосновать результат. Наверное, поэтому, при знании только GA, экселя и совсем плохого SQL я никогда не был джуном. И благодарен ему за это.
Менеджеры продукта сами все это не сделают - у них другие обязанности. А аналитик, как его не называй, продуктовый, данных, еще как-то, просто быть самостоятельнее, и, наверное, шире владеть хард и софт-скилами, хорошо понимать, как работает компания. И, конечно, уметь проводить полный цикл решения проблемы, от "пойду в бд" по защиты отчета и рекомендаций.
И все это отлично.
Часто слышу от нанимающих менеджеров, что они ищут аналитиков, обладающих одним или несколькими типами мышления: аналитическое мышление, продуктовое мышление, бизнесовое мышление

При этом ясное дело, что каждый нанимающий менеджер мыслит все 3 типа мышления совершенно по-разному

Например, для меня:
🌳 аналитическое — про модели, структуры внутри моделей, ограничения, скрытые в моделях (видеть деревья за лесом)
👨‍🔬 продуктовое — про гипотезы и оценку effort/impact (как влиять на лес через рациональный выбор наиболее эффективных способов)
💸 бизнесовое — про цели и принципы достижения этих целей с помощью организационных структур (зачем нам что-то делать с лесом и как организовать лесников)

Понятно, что это дискуссия об определениях абстрактных понятий, а значит правильный ответ может и есть, но он такой же абстрактный. А ещё это всё субъективно для каждого нанимающего менеджера, потому что исходит из целей компании. Но интересно узнать что вы понимаете под аналитическим/продуктовым/бизнесовым мышлением?
Должен вот в чём признаться — я очень не люблю рисовать что-то в Miro

Мне мешает, что форма объектов в Miro в каком-то смысле превалирует над содержанием. При этом иногда приходится схематизировать, ведь многие знания проще передавать в виде схем. Но для меня схема всегда только визуальная репрезентация каких-то упорядоченных данных, которые могут быть описаны через некоторую нотацию: таблицу, определенной структуры или текстом с какой-то стандартизированной разметкой, которую сам придумал. Сначала структура — потом наполнение

В большинстве случаев, я набрасываю что-то в текстовом файле или в таблице, а потом на основе этого уже рисую в Miro схему, которую можно показать кому-то. Мне самому в этом случае схема уже не очень то нужна, потому что я смогу быстро ориентироваться в той структуре, которую создал изначально. А визуализация нужна как более эффективный способ коммуникации

Сегодня узнал про фреймворк mermaid.js, который позволяет из описанных текстом правил (читай Markdown) создавать диаграммы разного типа: диаграммы процессов, Гантта и даже User Journey. Я и раньше встречал фреймворки для отрисовки схем из текста. Но прелесть mermaid.js в том, что эта штука безболезненно встраивается в заметки Obsidian, или рендерится с помощью сервисов типа kroki.io в виде айфрейма, который можно вставить в Notion

О новый дивный мир, где everything as code
Forwarded from LEFT JOIN
Смена подгузников, отсутствие сна: новый baby-project dataviz

Сегодня в блоге очень личная статья. Дело в том, что в декабре прошлого года я стал папой, а это значит, что наша с супругой семейная жизнь перевернулась с ног на голову. Кроме того, что это для меня большое событие, я подошел к нему еще и с аналитической точки зрения, а именно построил дашборд, используя данные о ребенке в течение первых 8 месяцев его жизни. И сегодня я хочу показать как круто меняется жизнь семьи на примере собственного анализа данных жизни первых 8 месяцев малыша. Данные я собирал с помощью приложения BabyTracker, а затем визуализировал их в Tableau, чтобы затем проанализировать их и поделиться своими выводами, которые у меня появились к настоящему моменту.
Подробный пост со всеми графиками и нюансами их построения вы можете прочесть в блоге, а самый главный его вывод я вам расскажу уже сейчас: дети — это прекрасно! ❤️
📈 Как создавать быстрые и точные диаграммы разброса с большим количеством данных на Python


https://dev-gang.ru/article/kak-sozdavat-bystrye-i-tocznye-diagrammy-razbrosa-s-bolshim-koliczestvom-dannyh-na-python-4f6zzxa0gq/

@machinelearning_ru