Datalytics
9.01K subscribers
211 photos
12 videos
5 files
649 links
Канал для аналитиков данных про Python, карьерное развитие в анализе данных, всякое разное

Автор – @ax_makarov

Отдельный канал про ChatGPT и его практическое применение —  @ai_forge

Чат канала — @pydata_chat

Вакансии — @data_hr
Download Telegram
Каждый месяц мы проводим сотни тестов и экспериментов, чтобы сделать продукт полезным для пользователя, а шоппинг – легким и вдохновляющим. 

На встрече 27 июня обсудим наш опыт: особенности гео-тестов, подходы к ускорению A/B-тестов, а также поговорим о том, как оценивать сложные контент-продукты. 

Программа:

19:05 – 19:40: Подходы к ускорению A/B-тестов для Data-продуктов
Анжелика Шахурина, Team Lead of Product analytics в Lamoda Tech

19:40 – 20:15: Гео-тесты: инструкция по применению
Иван Уваров, Product analyst в Lamoda Tech

20:25 – 21:00: Как оценить эффективность контент-продукта, если страшно проводить A/B-тест?
Сима Гиззатуллина, Product analyst в Lamoda Tech

Места в офисе быстро закончились, но мы ждем тебя на онлайн-встрече 27 июня в 19:00! Подробности и регистрация по ссылке.

Реклама. ООО «Ламода Тех». ИНН 7734461512. erid: LjN8KCW4L
Forwarded from AI Forge (Алексей Макаров)
Тем временем Anthropic зарелизили Claude 3.5 Sonnet и цифры по математическому бенчмарку GSM8K переваливают за 95%

Надо признать, что GSM8K не только проверяет способность модели выдавать правильный ответ на задачку, но и ее способность правильно решать эту задачу

Вот кстати интересная статья про то как SurgeAI помогали OpenAI в создании бенчмарка GSM8K – https://www.surgehq.ai//blog/how-we-built-it-openais-gsm8k-dataset-of-8500-math-problems
Почему аналитика данных must have для любого бизнеса?

Главная цель работы аналитиков — это помочь бизнесу принять верное решение. Цель не в том, чтобы построить миллион графиков, а в том, чтобы помочь компании решить свои бизнесовые задачи. Именно за это аналитикам платят хорошие зарплаты — за то, что их работа позволяет компании зарабатывать больше и тратить эффективней.

На бесплатном онлайн-курсе «Аналитика за шесть уроков» эксперты-практики из Changellenge >> Education докажут, что в аналитику может перейти практически каждый — независимо от возраста и начального образования. Почувствуйте себя аналитиком:

✔️Изучите азы основных аналитических программ;
✔️Решите базовые задачи от экспертов-практиков;
✔️Разберетесь с направлениями и выберите подходящее для себя;
✔️Получите сертификат о прохождении курса и пошаговый план по переходу в новую профессию.

«Аналитика за шесть уроков» — это всего 20 минут в день, чтобы понять, что такое аналитика, решить первые задачи и сделать шаг к развитию своей карьеры. А еще сертификат о прохождении курса и советы по переходу из любой профессии. Напомню, это бесплатно!

Для всех участников курса до 30 апреля действует дополнительная скидка 15 000 руб. на образовательные программы Changellenge >> Education. Оставьте заявку и участвуйте в розыгрыше подарков на 100 000 рублей!

Регистрируйтесь по ссылке.

Реклама. ООО "ВЫСШАЯ ШКОЛА АНАЛИТИКИ И СТРАТЕГИИ". ИНН 7716917009. erid: 2VtzqvRr8eB
🔥 Это база с 1900 вопросами с собеседований по анализу данных, машинному обучению, sql. Фишка в том, что вопросы разбирают эксперты, которые сами проводят собесы и дают примеры правильных ответов. Вы легко получите оффер, изучив популярные вопросы
А тут целая супре полезная папка для подготовку к мл собесу для вас.💼
#статья: Как сделать А/B-тест в офлайне, на примере ускорения доставки в Самокате.

В офлайне существуют особенности и ограничения для продуктовой аналитики.
Как же провести А/B-тест в физическом мире? Продуктовый аналитик Илья Лоладзе в своей статье поделится, как с этим попыталась справиться его команда из samokat.tech.

Автор расскажет:

- С какими особенностями и ограничениями может столкнуться продуктовый аналитик в офлайне.
- Стоит ли рассчитывать на интуицию в поисках главной метрики в таком нетипичном эксперименте.
⁃ К каким издержкам нужно быть готовым, учитывая человеческий фактор / Какие подводные камни ожидают продуктовую аналитику в ходе работы офлайн.

Данная статья будет интересна всем продуктовым аналитикам, которые хотят узнать больше о работе с А/В тестами офлайн. А также тем, кто любит эксперименты, внося небольшие изменения в привычный процесс.

https://habr.com/ru/companies/samokat_tech/articles/821777/
Многие спрашивают на консультациях: зачем аналитику развивать продуктовое мышление?

Нанимающие менеджеры ищут аналитиков, способных уточнять задачи через продуктовое мышление. Поэтому, чтобы оставаться востребованным специалистом, аналитику нужен рост «вширь», и развитие продуктового мышления пойдет ему только в плюс

Такое мышление помогает анализировать деятельность с точки зрения пользы для продукта в целом.🔎 Аналитик здесь может увидеть и подсветить важные точки развития продукта через призму своих компетенций и «приближенности» к raw data

Аналитик помогает сгенерировать и приоритизировать гипотезы, оценить потенциал фич и измерить результаты экспериментов 🧮

Аналитик может помочь с определением вектора развития продукта и говорить на языке бизнес-импакта 📈. Когда аналитик говорит: «Эта фича может принести Х миллионов дохода», это резонирует с бизнесом намного больше, чем технические детали. А ещё аналитик может подсветить какие-то тонкие моменты для реализации фичи или проверки гипотезы, чтобы сделать ее успешной или более быстро валидируемой 💸

Со временем у такого специалиста формируется интуиция, что может «выстрелить», а что нет. Поэтому продуктовое мышление делает аналитика полноценным бизнес-партнером и ценным советником для продакт-менеджеров и CPO 🤝

Продуктовое мышление аналитика является инструментом оптимизации дорожной карты развития продукта и влияет на формирование стратегии 📊

Я считаю, что эти навыки делают аналитика более влиятельным в рамках компании и в дальнейшем помогут ему расти и в зоне ответственности, и в зарплате
🔄Представьте, что вы работаете с большими объемами данных, но каждая попытка обработки информации занимает часы, если не дни. Вы сталкиваетесь с проблемами масштабирования и сложности потоков данных, что тормозит ваш проект и мешает достигать поставленных целей.

А теперь представьте, что время обработки данных сокращается в разы благодаря использованию продвинутых технологий стриминга. Вы спокойно справляетесь с любыми объемами информации, легко направляя потоки данных так, как вам нужно. Вы больше не испытываете трудностей с масштабированием и сложностью проектов.

🟡 Приходите на наш практический открытый урок «Spark, знакомство с структурным стримингом» 27 июня в 20:00 мск.

Занятие будет полезно:

- специалистам аналитики данных и Data Engineering;
- руководителям и менеджерам команд разработки.

Спикер Валентин Шилин — старший программист/аналитик данных в зарубежной компании.

➡️ Пройдите короткий тест, чтобы посетить урок: https://clck.ru/3BU5nP

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru
Please open Telegram to view this post
VIEW IN TELEGRAM
level up вашей карьеры инженера данных

У вас уже есть опыт работы, но вы хотите выделиться на фоне «джунов» и охватить всю архитектуру DWH целиком — тогда присоединяйтесь к курсу «Инженер данных» от karpov.courses и экспертов из Яндекса, Ozon, Vk и Сбера.

За 5 месяцев вы освоите все актуальные технологии. А для большего погружения в работу, вы поработаете с ETL-процессами крупной двухуровневой платформы данных, закрепите понимание инструментов Airflow, Spark + S3 и Greenplum и поймёте, как использовать их в связке друг с другом.

После обучения вы научитесь учитывать все взаимосвязи большого хранилища, понимать потребности заказчика и воспринимать данные как конечный продукт.

Получите скидку 5% по промокоду DATALYTIX до 30.06.2024 и расширяйте свои навыки: https://clc.to/erid_LjN8Jyk94
Открыт демо-доступ к курсу Data Warehouse на базе dbt для инженеров и аналитиков данных

Этот курс - не просто обучение, а полноценный тренажер, где вы освоите один из самых востребованных инструментов аналитики, решая сложные практические задачи. Изучите DataOps практики, постройте хранилище данных на базе dbt, подготовьте и проанализируйте данные.

В тренажере вы освоите:
1. Типы хранилищ данных DWH и их построение
2. Подготовку и тестирование данных, Data Quality
3. Построение ELT-pipelines
4. Моделирование данных на базе dbt и PostgreSQL
5. Принципы работы с СУБД на базе Postgres
6. Продвинутую аналитику и визуализацию данных
7. Современные DataOps-практики, оптимизацию производительности и многое другое

Сейчас открыт демо-доступ к первым четырем практическим урокам для всех желающих.

[ Регистрация на демо-доступ ]

Реклама. ООО "ИНЖЕНЕРКАТЕХ". ИНН 9715483673 erid: 2VtzqvMtP6Y
💛💛💚❤️💛❤️💛⤵️
Устали от скучных и статичных дашбордов?

👉🏻Хотите создавать интерактивные и визуально привлекательные дашборды, которые оживят ваши данные?

Тогда вам сюда!

На открытом уроке «Создание кастомных дэшбордов с помощью Plotly Dash» вы:

- познакомитесь с Plotly Dash — мощной библиотекой для создания интерактивных веб-приложений и дэшбордов;
- научитесь превращать сырые данные в понятные и красивые визуальные единицы;
- сможете создавать удобные и функциональные интерфейсы для взаимодействия с данными.

Присоединяйтесь 9 июля в 20:00 мск и станьте мастером визуализации в аналитике данных!

8️⃣9️⃣🔟Регистрируйстесь сейчас по ссылке: https://otus.pw/XZLw/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Data Analytics Jobs
⚠️ Центральный Университет в поиске Академического лида курса Python

Кандидат должен быть готов к:
- Созданию Game Change истории, находя оптимальный баланс между академическим обучением и современными EdTech-решениями.
- Созданию прочных связей между учебным процессом и реальными потребностями работодателей.
- Созданию Legacy с нуля, обладая при этом исключительной гибкостью и способностью быстро адаптироваться к требованиям современного рынка.

# Портрет кандидата:

На собственном опыте знает всю широту возможностей языка программирования Python, от бизнес-аналитики до машинного обучения и разработки.

Опыт работы в индустрии и образовательной среде позволяет ему понять и задизайнить в курс ключевые инсайты для 3-х профильных треков:

- Синий трек Data Analyst: Python как прикладной инструмент для анализа данных и бизнес-задач.
- Красный трек ML Engineer: Python как средство для разработки и тестирования ML-моделей.
- Чёрный трек Software Engineer: Python в контексте разработки и понимание его ограничений.

Подробное описание в Notion

📱 Telegram: @ludi_magister
Please open Telegram to view this post
VIEW IN TELEGRAM
Вы тоже сможете вырасти до хардового аналитика уровня Middle+. Как?
Добавьте к своим скилам навыки в проектировании архитектуры и интеграций веб-сервисов!

Три месяца назад мы уже писали про этот курс. Сейчас пишем еще раз, потому что у курса вышло полезное обновление, уже доступное ученикам, независимо от того, когда они его купили.
—————
📚 Первое: в портфолио включили примеры интеграций от крупных BigTech-компаний. Это позволит вам понять, как технологии применяются в реальных бизнес-контекстах.
🌐 Второе: обновили портфолио. Теперь в нём есть задания повышенного уровня сложности для каждой темы. Это небольшие реальные проекты, с помощью которых можно не только проверить, но и улучшить свои навыки!
✔️Третье: вышел новый модуль про проектирование баз данных - нормализация, транзакции, основы DWH, индексы.
💬Четвертое: стал активен чат учеников (общение, обмен опытом, помощь внутри сообщества)
—————
• Результат после прохождения курса: 15 рабочих проектов в портфолио-резюме
• Доступ к урокам и всем обновлениям останется навсегда
• Фундаментальная база
• Всю программу и отзывы смотрите в боте курса

Когда перейдете в бот курса, то получите бесплатные открытые уроки по архитектуре и интеграциям. Польза 👇

@studyit_help_bot

Скидка на курс от канала
— 1 000₽ на Stepik по промокоду
DATAL2 до конца июля.
Please open Telegram to view this post
VIEW IN TELEGRAM
💛💛💚💛💛

Утопаете в данных и не знаете, как их эффективно визуализировать? Мечтаете об инструменте, который поможет создавать наглядные и информативные дэшборды?

Представьте: вы с легкостью подключаетесь к любым источникам данных, создаете интерактивные графики и диаграммы, а ваши дэшборды вызывают восхищение у коллег и руководства!

Хотите это реализовать? Открытый урок «Знакомство с Apache Superset. Установка, настройка и базовый функционал» — ваш первый шаг к освоению мощного инструмента для визуализации данных! 23 июля в 20:00 мск присоединяйтесь и узнайте, как легко и быстро превратить данные в указатели для дальнейших действий компании.

🔗Записывайтесь по ссылке прямо сейчас, чтобы посетить бесплатный урок: https://otus.pw/EBuG/


Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Не будем утомлять вас рассказами о ДМС, крутых офисах и других плюшках. Вот главное о том, почему продуктовые аналитики выбирают Т-Банк:

Актуальный стек. Здесь следят за трендами и быстро внедряют новое.
Прозрачная система роста. Вы всегда будете знать, какие навыки нужно подтянуть и как получить повышение.
Вы окажетесь среди профессионалов, у которых можно многому научиться. А если захотите, можете стать ментором для младших коллег.
Общение на «ты». Так проще.
Здесь развивают комьюнити. Можно участвовать в митапах и подкастах.

Больше о вакансиях здесь

Реклама. АО «Тинькофф Банк», ИНН 7710140679
Проходить собеседования — это навык. Если в 2024-м вы хотите
— меньше волноваться на собесах,
— эффективнее отвечать на вопросы и грамотно задавать их,

читайте канал про собеседования в IT, где собран опыт и кандидата, и работодателя.
——————
🔹Булат ходит на собесы из азарта и интереса и пишет, что да как: какие были этапы, какие задавали вопросы.
Лонгрид раз — про интервью к поставщику и разработчику технологий для бирж
Два — про интервью в финтех
Три — в Medtech

🔹Булат сам нанимает сотрудников и рассказывает, почему кандидату отказали.
Лонгрид раз — про закрытые ответы
Два — про улыбку и болтовню
Три — про кандидата, который спорил
—————
Подписывайтесь, чтобы быть готовыми к собеседованию, а в случае отказа — сохранять здравую самооценку.

https://t.me/tryoutonadancefloor
👆
Наткнулся тут на интересную статью 2009 года, где автор высказывает мнение о том, что изобретение VisiCalc (первого приложения электронных таблиц) необратимо изменило мир и то как принимаются решения

Основная мысль состоит в том, что электронные таблицы демократизировали процесс «что-если» (what-if) анализа. Во-первых, до электронных таблиц было меньше аналитиков. Во-вторых, раньше этим аналитикам было сложнее оперировать большим количеством переменных. Никто не просил от каких-нибудь финансистов разработать 20 вариантов расчетов с разными входными данными, потому что в головах менеджеров не было такой парадигмы как «хочу чтобы мне смоделировали все варианты». Не могу подтвердить или опровергнуть что это так. Думаю, что менеджеры всегда принимали решения на основе подсчетов, вопрос точности этих подсчетов, гранулярности данных, а также возможности принимать в расчет вариантивность и вероятностную природу многих переменных. Почитайте, например, про модель EOQ (Economic order quantity), которую еще при Форде использовали для расчета экономики предприятия. Проблема в том, что экономика усложнялась и примитивная EOQ уже не подходила

В общем, спредшиты настолько демократизировали процесс работы с данными, который ранее был доступен только статистикам и ученым, что каждый менеджер начал все считать и моделировать. И начал простить считать и моделировать своих подчиненных. И вот тут то и появилась парадигма «принеси мне метрики». Что в итоге привело к буму «количественного менеджмента», ну и дальше трансформировалось в data-driven и в наукообразное «рост бизнеса как набора гипотез»

Я не буду тут распинаться про то, что даже в нашу data-driven эпоху с ее верой в «объективность данных» очень многое зависит от человеческого фактора, в том числе от качества интерпретации и выводов, которые строятся на основе данных. Мне интереснее другое

В статье приводится пример с переносом завода – мол, факторный анализ позволил оценить что дешевле производить товар в другом регионе, а потеря качества не повлияет на конечную прибыль. Но как мне кажется, тут вопрос ответственности людей, которые принимают решения о переносе, а не технологии, благодаря которой стал возможен «оптимальный расчет»

И все тут лежит скорее в части логики современного общества, из-за которой мы все больше и больше нуждаемся в предиктивной аналитике. И есть у меня подозрение что именно благодаря этой логике мы видим бум AI и влажные фантазии вокруг того, что AI революционизирует бизнес. А по факту сделаем очередной Excel
🎓 Архив слитых курсов прямо в телеграм!

Вот огромная база материалов, которая пополняется каждый день!

>Python (96гб видео)
>С++(51 курсов)
>Java (23гб видео)
>Базы данных (50гб курсов)
>C# (45гб курсов)
>Английский (101гб курсов)
>PHP (43гб видео)
>Мобильная разработка (22гб курсов)
>Go ( 132гб видео)
>Rust (35 гб видео)
>SQL (43гб видео)
>MySQL (31гб видео)
>Другое (1679 гб видео)

Огромный кладезь топовых материалов более 20198Гб: Курсов, свежих книг, шпаргалок, гайдов , лекций, — всё в одном месте: @datacours
Пузырь генеративного ИИ начал лопаться, считает Маркус. Он упрекает обучателей крупнейших нейросеток в том, что у них нет внятной бизнес-модели, которая окупила бы гигантские затраты этого сектора. Вложены уже сотни млрд. $, а главный вопрос надежности/галлюцинаций так и не решен, что резко ограничивает применимость технологии.

Он и не будет решен, т.к. это неотъемлемое свойство GenAI, настаивает Маркус.

В целом он твердит об этом давно, но теперь предрекает крах уже в этом году: “Пользователи потеряли веру, клиенты потеряли веру, венчурные инвесторы потеряли веру”. Возможно, его сподвиг недавний отчет Goldman Sachs “Gen AI: too much spend, too little benefit?”, где проводится та же мысль, более мягкими словами (см. также разбор отчета).

Несмотря на ряд успехов GenAI, например, в генеративной (био)химии, можно видеть, как тускнеют ожидания и как меняется тон комментариев, не только у Маркуса. Все наигрались в генерацию картинок/текстов и хотят, наконец, использовать ИИ в реальных задачах. Но этот переход не дается — в силу самой природы GenAI. Ключевой изъян в том, что GenAI беззащитен перед т.н. “выбросами”. Если на входе паттерн, сильно отличный от паттернов в обучающей выборке, на ответ нельзя положиться. Такой ИИ не понимает и не мыслит, он создает новые данные по шаблону старых.

Масштабирование не избавит от проблем (см. “AI scaling myths”). Метрики, где ИИ превосходит людей в решении задач, не измеряют интеллект/мышление, а превосходство может быть хрупким. Синтетические данные — не панацея от дефицита данных для обучения, такой маневр быстро ведет к коллапсу, т.к. каждая следующая модель учится не на реальности, а на предсказании реальности предыдущей моделью, и даже малые ошибки итеративно усиливаются.

Я бы не использовал слово “пузырь”. GenAI очень интересный инструмент, со временем мы поймем, как сделать его не просто удивляющим, но и полезным. Но отрезвление ожиданий — хороший признак.
Аналитика! Продукт! Мотор!

22 августа на больших экранах премьера аналитического митапа от команды Купер.тех (ex СберМаркет Tech). 

Объединим четыре сюжетные линии и завершим кульминационной afterparty:

🎬 Предсказание оптимального ПВЗ покупателя на Авито. Directed by Ксения Кригер, аналитик в команде логистики, Авито.

🎬 Факторный анализ Retention пользователей самовывоза и B2B. Directed by Никита Истомин и Евгений Кадыгров, продуктовые аналитики самовывоза и B2B, Купер.

🎬 Не CSAT’ом едины: как анализировать клиентский опыт с помощью ML-алгоритмов? Directed by Владислав Петраков, руководитель продуктовой аналитики Платформы Origination, и Анна Муратова, продуктовый аналитик, Т-Банк.

🎬 Как ошибиться в АВ-тестах, даже если хорошо знаешь математику. Directed by Никита Мананников, руководитель направления аналитики BX, Ozon.

🗓 22 августа в 19:00 по Москве, КАРО 11 Октябрь.

Регистрируйся по ссылке и приятного просмотра!

Реклама. ООО «ИНСТАМАРТ СЕРВИС», ИНН: 9705118142. Ерид: LjN8KE4Et