Анализ самых популярных AI-инструментов на GitHub
Кажется, сейчас все только и делают, что обучают модели и разрабатывают все новые приложения на основе AI, которые за вас пишут тексты, рисуют картинки и кодят.
Выяснили, так или это и как на самом деле выглядит мир AI open source-приложений на GitHub — кто их разрабатывает, что разрабатывают и собираются ли останавливаться. То есть выяснил кое-кто другой, а мы вам расскажем самое главное из этого исследования.
В выборку попали 845 репозиториев с GitHub, у которых было 500 звездочек или больше и слова gpt, llm, generative AI в описании. Они делятся на 4 группы.
1️⃣ Приложения на основе ИИ — самая популярная категория.
2️⃣ Инструменты для разработки, которые помогают с промпт-инжирингом или предоставляют интерфейс для взаимодействия с ИИ.
3️⃣ Инструменты для работы моделями — обучения, создания датасетов.
4️⃣ Инструменты для создания инфраструктуры для разработки — все, что связано с управлением данными, мониторингом и вычислениями.
В первой половине 2023 виден взрывной рост числа новых проектов во всех 4 категориях, который вышел на плато в сентябре. Рост, вероятно, связан с релизом ChatGPT и Stable Diffusion в 2022, а замедление — с перенасыщением рынка.
🔜 845 репозиториев выложены 594 аккаунтами. 20 из них разместили 4 или более приложения или инструмента — на них приходится 23% всех репозиториев, попавших в выборку.
🔜 19 аккаунтов из топ-20 принадлежат организациям (3 из них — Google) и только один личный.
🔜 Вклад в развитие проектов в выборке сделали 20 000 разработчиков.
🔥 AI все еще на хайпе, но хайп недолговечен. Большинство проектов быстро набирают популярность после выкладки, но потом прирост звездочек снижается.
В оригинале статьи — больше цифр, графики и ссылки на самые интересные проекты.
Кажется, сейчас все только и делают, что обучают модели и разрабатывают все новые приложения на основе AI, которые за вас пишут тексты, рисуют картинки и кодят.
Выяснили, так или это и как на самом деле выглядит мир AI open source-приложений на GitHub — кто их разрабатывает, что разрабатывают и собираются ли останавливаться. То есть выяснил кое-кто другой, а мы вам расскажем самое главное из этого исследования.
В выборку попали 845 репозиториев с GitHub, у которых было 500 звездочек или больше и слова gpt, llm, generative AI в описании. Они делятся на 4 группы.
В первой половине 2023 виден взрывной рост числа новых проектов во всех 4 категориях, который вышел на плато в сентябре. Рост, вероятно, связан с релизом ChatGPT и Stable Diffusion в 2022, а замедление — с перенасыщением рынка.
В оригинале статьи — больше цифр, графики и ссылки на самые интересные проекты.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍81🔥30🤔25👌14🏆7
Иногда они возвращаются
В прошлую субботу мы вам немного спойлернули новый проект — точнее, возвращение старого.
Data Heroes — подкаст о супергероях, чья сила в данных. Уже вышло три сезона, и у каждого была своя тема.
1️⃣ Первый — про то, как прокачаться как аналитик и начать карьеру в этой сфере. Разбирались, как выбрать школу, найти мотивацию, научиться тайм-менеджменту и стать идеальным кандидатом в глазах эйчара.
❤️ Наш любимый выпуск: как победить синдром самозванца.
2️⃣ Второй — про разные направления. Поговорили про датавиз, Data Science и мировой рынок аналитики. В специальных выпусках рассказали, как составить крутое резюме.
❤️ Наш любимый выпуск: как убеждать с помощью визуализации.
3️⃣ Третий — про то, как строить бизнес и личный бренд в аналитике. Поделились секретами мастерства, как вести канал и подкаст про данные.
❤️ Наш любимый выпуск: как будет меняться работа аналитика с развитием искусственного интеллекта.
Сейчас вовсю идет работа над 4 сезоном, и у него тоже будет своя тема. Мы пока не расскажем, какая она, но вы можете попробовать угадать в комментариях!
Первый эпизод выйдет уже совсем скоро!
В прошлую субботу мы вам немного спойлернули новый проект — точнее, возвращение старого.
Data Heroes — подкаст о супергероях, чья сила в данных. Уже вышло три сезона, и у каждого была своя тема.
Сейчас вовсю идет работа над 4 сезоном, и у него тоже будет своя тема. Мы пока не расскажем, какая она, но вы можете попробовать угадать в комментариях!
Первый эпизод выйдет уже совсем скоро!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤97👍53🏆15🤩8😍8
Как связаны сакура и изменение климата?
Наверное, никто не удивится, что в Японии к сакуре относятся очень серьезно и с 9 века ведут хроники, отмечая, в какой день ее цветение достигло пика.
На основе этих данных построили график с 812 года по 2023. На нем отмечены дни, когда сакура цвела особенно пышно, и среднее значение за 20 лет. Он интерактивный, можно приближать, удалять, рассмотреть каждый год в отдельности.👀
Данные для графика предоставил исследователь из Osaka Metropolitan University Ясуюки Аоно. Он их собирал не просто из любви к искусству, а для изучения того, как менялся климат и температура воздуха весной. Из-за того, что погода становилась теплее пик цветения сакуры наступает раньше, а кривая среднего за 20 лет опускается все ниже.
Наверное, никто не удивится, что в Японии к сакуре относятся очень серьезно и с 9 века ведут хроники, отмечая, в какой день ее цветение достигло пика.
На основе этих данных построили график с 812 года по 2023. На нем отмечены дни, когда сакура цвела особенно пышно, и среднее значение за 20 лет. Он интерактивный, можно приближать, удалять, рассмотреть каждый год в отдельности.
Данные для графика предоставил исследователь из Osaka Metropolitan University Ясуюки Аоно. Он их собирал не просто из любви к искусству, а для изучения того, как менялся климат и температура воздуха весной. Из-за того, что погода становилась теплее пик цветения сакуры наступает раньше, а кривая среднего за 20 лет опускается все ниже.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍85❤66🏆17⚡13😍8
Карта вашей базы данных
Базы данных нередко состоят из множества разных таблиц. Разобраться в структуре может быть непросто, но тут на помощь приходят схемы. Они показывают перечень таблиц, их содержимое и взаимосвязи — то есть содержатся ли в одной таблице ключи к какой-то другой.
Инструментов, которые помогают составлять схемы, довольно много. Преимущество сегодняшнего с говорящим названием SQLite Schema Diagram Generator в том, что он бесплатный, маленький и простой.
🔜 Понадобится скачать файлик с гитхаба и отдельный тул GraphViz. Файлик генерирует схему в формате GraphViz, а последний ее визуализирует. Вот и все — куда уж проще.
Базы данных нередко состоят из множества разных таблиц. Разобраться в структуре может быть непросто, но тут на помощь приходят схемы. Они показывают перечень таблиц, их содержимое и взаимосвязи — то есть содержатся ли в одной таблице ключи к какой-то другой.
Инструментов, которые помогают составлять схемы, довольно много. Преимущество сегодняшнего с говорящим названием SQLite Schema Diagram Generator в том, что он бесплатный, маленький и простой.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍81❤41⚡21👌16🏆10
Новый набор в ШАД!
Классные новости про наших друзей из Школы анализа данных Яндекса. С 1 апреля у них стартовал новый набор, который будет аж на треть больше, чем в прошлом году — в школу поступят более 400 студентов.
В ШАДе готовят специалистов в области DS и ML, и так как спрос на эти профессии растет, то и набор увеличивают. Кроме того, в этом году будет дополнительная возможность поступить — поучаствовать в очной олимпиаде
🔜 Обучение бесплатное, но надо успешно сдать вступительные экзамены и преодолеть высокий конкурс — как правило, 17 человек на место.
🔜 Есть два трека. Первый — для студентов и выпускников технических специальностей, второй — для практикующих аналитиков и разработчиков с опытом от 3-х лет.
🔜 В программе много практики и погружения в реальные проекты и задачи.
Это крутой проект, который помогает развивать аналитику и ML в России, поэтому мы решили рассказать про него подробнее в карточках. Если среди наших подписчиков есть те, кто учился в ШАДе или хочет поступить — будем рады, если поделитесь своими мыслями и впечатлениями!❤️
Классные новости про наших друзей из Школы анализа данных Яндекса. С 1 апреля у них стартовал новый набор, который будет аж на треть больше, чем в прошлом году — в школу поступят более 400 студентов.
В ШАДе готовят специалистов в области DS и ML, и так как спрос на эти профессии растет, то и набор увеличивают. Кроме того, в этом году будет дополнительная возможность поступить — поучаствовать в очной олимпиаде
Это крутой проект, который помогает развивать аналитику и ML в России, поэтому мы решили рассказать про него подробнее в карточках. Если среди наших подписчиков есть те, кто учился в ШАДе или хочет поступить — будем рады, если поделитесь своими мыслями и впечатлениями!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍94❤57⚡21🤓7🤡1
Самые популярные ошибки в построении аналитики в EdTech
⚡️ Внимание-внимание! На канале «Дата Коля» — новое видео для профессионалов из сферы эдтех и всех, кто хочет больше узнать о том, как строится аналитика на практике. Ролик посвящен главным вопросам, с которыми сталкиваются онлайн-школы.
🔜 Как подружить между собой данные из разных систем, чтобы отследить путь клиента и посчитать наконец-то стоимость лида?
🔜 Как перестать тратить время на заполнение бесконечных табличек и автоматизировать работу с данными?
🔜 Как выбрать инструменты для аналитики и создания отчетов и дашбордов, в обстановке, когда многие из них стали недоступны в России?
🔥 Смотрите по ссылке. Если у вас есть знакомые, которые работают в онлайн-образовании, поделитесь видео с ними и получите плюсик в карму.
⚡️ Внимание-внимание! На канале «Дата Коля» — новое видео для профессионалов из сферы эдтех и всех, кто хочет больше узнать о том, как строится аналитика на практике. Ролик посвящен главным вопросам, с которыми сталкиваются онлайн-школы.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍57🤔14❤3🔥3🤡1
Киберпанк-романтика из X: часть 2
Мальчик: знакомится с девушками в Tinder с помощью ChatGPT.
Мужчина: заводит семейную доску в Notion вместе с женой.
💬 Один юзер в Твиттере именно так и сделал и поделился своей идеей с общественностью. Они с женой используют эту доску для того, чтобы планировать домашние дела, составлять списки покупок, вести бюджет и хранить важную информацию вроде личных документов. Еще там есть такие разделы, как «Важные вещи, которые мы узнали друг о друге», «Долгосрочные надежды и цели» и «Лог воспоминаний о свиданиях». ❤️
💬 В отдельной колонке у них ссылка на список одиноких друзей, которых они хотели бы познакомить друг с другом.
Идея интересная, хотя, наверное, не все пары захотят так скрупулезно расписывать свою жизнь в карточках Notion.
Твиттер отреагировал в своем духе — шутками, что это прекрасный документ для онбординга будущих жен, и вопросами, требует ли он заполнить тикет в Jira, когда жена просит прибить полочку.
Некоторым, впрочем, доска понравилась, и они даже попросили ссылку на шаблон. Вот она, кстати. А вы что думаете?
Мальчик: знакомится с девушками в Tinder с помощью ChatGPT.
Мужчина: заводит семейную доску в Notion вместе с женой.
Идея интересная, хотя, наверное, не все пары захотят так скрупулезно расписывать свою жизнь в карточках Notion.
Твиттер отреагировал в своем духе — шутками, что это прекрасный документ для онбординга будущих жен, и вопросами, требует ли он заполнить тикет в Jira, когда жена просит прибить полочку.
Некоторым, впрочем, доска понравилась, и они даже попросили ссылку на шаблон. Вот она, кстати. А вы что думаете?
Please open Telegram to view this post
VIEW IN TELEGRAM
❤82👍51🏆12⚡7🔥4
Стали бы пользоваться такой доской?
Anonymous Poll
23%
Конечно, уже скачиваю шаблон
16%
Да, но я бы сделал(а) свой вариант
44%
Нет, но понимаю, тех, кто стал бы
3%
Нет, и считаю, что это глупость
14%
Кнопка для тех, кто хочет посмотреть ответы
🔥6👍3❤2🥰2
Data Heroes: старт 4-го сезона!
После долгой паузы стартует 4-й сезон подкаста о супергероях в области аналитики — Data Heroes.
У каждого сезона была своя тема, и этот — не исключение. На этот раз спикерами станут предприниматели и основатели онлайн-школ. Будем разговаривать про данные в эдтехе и рынок онлайн-образования: в России и за границей.
🔜 Гость первого выпуска — Анатолий Карпов, один из основателей karpov.courses и автор курсов, с которых многие начинали свой путь в аналитике и IT. «Основы статистики» навсегда останутся в наших сердцах. ❤️
Первый выпуск получился очень насыщенным:
🔵 Путь от аналитика до фаундера: как выпускник психологического факультета начал работать с данными в VK и основал свою компанию без инвестиций (но не один)?
🔵 Развитие эдтех-стартапа на конкурентном рынке, где уже много сильных игроков с крутой репутацией и большими ресурсами. Как менялся проект karpov.courses (и как он выглядит сейчас), как ученики убедили расширить линейку курсов и как работает подход к продвижению Content-First?
🔵 Рынок труда в эпоху ИИ: как LLM не отнимут работу у аналитиков — точнее, кто её отнимет, если не они?
🔵 И то, ради чего мы здесь собрались — как профессионалы работают с данными в своей компании? Почему в начале пути у стартапов нет аналитики и это нормально? А когда она все же появляется — какие метрики надо считать и какой дашборд самый главный?
В этом сезоне все новое: новый формат интервью 1-на-1, новая большая тема и даже появилась новая площадка — YouTube. Смотрите, слушайте, пишите комментарии — мы ждем вашего фидбека!
Посмотреть и послушать: видео-версия на YouTube👀
Просто послушать: Яндекс Музыка, Apple Podcasts, Google Podcasts, Spotify, Mave, CastBox, Overcast
После долгой паузы стартует 4-й сезон подкаста о супергероях в области аналитики — Data Heroes.
У каждого сезона была своя тема, и этот — не исключение. На этот раз спикерами станут предприниматели и основатели онлайн-школ. Будем разговаривать про данные в эдтехе и рынок онлайн-образования: в России и за границей.
Первый выпуск получился очень насыщенным:
В этом сезоне все новое: новый формат интервью 1-на-1, новая большая тема и даже появилась новая площадка — YouTube. Смотрите, слушайте, пишите комментарии — мы ждем вашего фидбека!
Посмотреть и послушать: видео-версия на YouTube
Просто послушать: Яндекс Музыка, Apple Podcasts, Google Podcasts, Spotify, Mave, CastBox, Overcast
Please open Telegram to view this post
VIEW IN TELEGRAM
❤80👍57⚡32🏆14🔥12
Что внутри рекомендательных алгоритмов?
Рекомендательные алгоритмы некоторых сервисов могут вызвать легкий (или не легкий) экзистенциальный кризис.
У вас же бывает такое, что смотрите, что вам предлагает купить маркетплейс или какие фильмы советует онлайн-кинотеатр, и задаетесь вопросом — кем вообще он меня считают? Чем я заслужил такие рекомендации? Почему они думают, что мне понравится это?
С прошлого года завеса тайны немного приоткрылась. Правда, только для тех, кто пользуется российскими сервисами — их обязали раскрыть механизм работы рекомендательных алгоритмов.
🔜 Это коснулось всех, у кого есть какая-то система рекомендации контента на основе действий пользователя — онлайн-магазинов и кинотеатров, развлекательных порталов, служб доставки еды или заказа такси и так далее. Даже hh.ru попался.
🔜 Теперь на их сайтах появились отдельные странички, где описывается, какие данные о поведении пользователей они собирают. А также по этапам расписано, как обрабатывает информацию.
🔜 Написано, к сожалению, без подробностей и максимально сухим языком, но в статье на vc.ru вытащили все самое интересное.
Хотя российские сервисы пока не рассказывают подробно, как работают их алгоритмы, про их зарубежные аналоги информации побольше. На одном классном Youtube-канале даже есть видео про систему рекомендаций Netflix. Мы про него уже рассказывали, но вдруг вы пропустили. 😉
Рекомендательные алгоритмы некоторых сервисов могут вызвать легкий (или не легкий) экзистенциальный кризис.
У вас же бывает такое, что смотрите, что вам предлагает купить маркетплейс или какие фильмы советует онлайн-кинотеатр, и задаетесь вопросом — кем вообще он меня считают? Чем я заслужил такие рекомендации? Почему они думают, что мне понравится это?
С прошлого года завеса тайны немного приоткрылась. Правда, только для тех, кто пользуется российскими сервисами — их обязали раскрыть механизм работы рекомендательных алгоритмов.
Хотя российские сервисы пока не рассказывают подробно, как работают их алгоритмы, про их зарубежные аналоги информации побольше. На одном классном Youtube-канале даже есть видео про систему рекомендаций Netflix. Мы про него уже рассказывали, но вдруг вы пропустили. 😉
Please open Telegram to view this post
VIEW IN TELEGRAM
👍82❤43⚡30🏆13🤩5
Деловое предложение: вы нам бусты, мы вам сторисы
Правда ведь было бы классно никогда не пропускать последние новости и самые интересные посты, которые выходят на канале?❤️
💙 Чтобы эта мечта стала реальностью, предлагаем отдать свой голос за LEFT JOIN. Тогда мы сможем постить сторис и делиться разными полезными штуками еще и там. Спамить всем подряд не будем, но думаем, что этот новый (для нас) формат поможет нам стать ближе и еще больше делиться с вами крутым контентом.
Кстати, пишите в комментариях — какие сторис от LEFT JOIN вы хотели бы видеть?
Правда ведь было бы классно никогда не пропускать последние новости и самые интересные посты, которые выходят на канале?
Кстати, пишите в комментариях — какие сторис от LEFT JOIN вы хотели бы видеть?
Please open Telegram to view this post
VIEW IN TELEGRAM
❤68👍36⚡13👎8🔥3
У нас есть GPT дома
…и она написана на SQL.
Да, именно так — разработчик Алексей Боленок написал генеративную нейросеть на SQL.
Наверное, на этом пост можно закончить и просто дать ссылку на оригинал статьи в блоге Алексея и на перевод на Хабре.
Но все-таки расскажем немного, что вас ждет.
LLM способны генерировать логичные тексты на естественном языке за счет того, что предсказывают, в каком порядке слова должны идти друг за другом. Алексей показал, что происходит «под капотом» LLM, когда она это делает.
Если совсем кратко:
🔵 Модель получает промпт и преобразует его список токенов.
🔵 Затем она возвращает массив кортежей — строк и чисел. В строках — токены (слова или их части), в числах — вероятность, с которой этот токен «подойдет» для ответа.
🔵 Модель выбирает подходящий токен и вносит его в список. Так она последовательно токен за токеном строит ответ.
🔵 В конце концов, она преобразует токены в текст.
Все эти шаги Алексей реализовал с помощью SQL-запросов — всего понадобилось 500 строк, чтобы получить модель, которая смогла поздравить его с Новым годом. Просто пост он выложил 31 декабря. 🎄
Для тех, кто хочет перейти сразу к делу и пощупать GPT на SQL своими руками — репозиторий с кодом на Гитхабе.
…и она написана на SQL.
Да, именно так — разработчик Алексей Боленок написал генеративную нейросеть на SQL.
Наверное, на этом пост можно закончить и просто дать ссылку на оригинал статьи в блоге Алексея и на перевод на Хабре.
Но все-таки расскажем немного, что вас ждет.
LLM способны генерировать логичные тексты на естественном языке за счет того, что предсказывают, в каком порядке слова должны идти друг за другом. Алексей показал, что происходит «под капотом» LLM, когда она это делает.
Если совсем кратко:
Все эти шаги Алексей реализовал с помощью SQL-запросов — всего понадобилось 500 строк, чтобы получить модель, которая смогла поздравить его с Новым годом. Просто пост он выложил 31 декабря. 🎄
Для тех, кто хочет перейти сразу к делу и пощупать GPT на SQL своими руками — репозиторий с кодом на Гитхабе.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤74⚡20🔥14🏆7🤣4
Как Apple следит за пользователями
Apple часто подчеркивает, как много внимания уделяет безопасности и защите личных данных пользователей. Рекламные ролики на эту тему у них получаются отличные, например, вот такой и такой.
Главной угрозой «прайваси» считаются сторонние приложения, которые собирают и непонятно куда сливают информацию. Команда исследователей из финского университета Aalto решила проверить, а как дела с родным ПО Apple, установленным почти на всех девайсах?
В исследовании «участвовали» 8 дефолтных приложений: Safari, Siri, Family Sharing, iMessage, FaceTime, Location Services, Find My и Touch ID.
💬 Оказалось, что все они, само собой, собирают данные. Запретить им это делать можно, но это сложнее чем кажется. Например, отключение Siri убирает только голосовое управление. При этом виртуальный ассистент продолжает фоново собирать данные из других приложений.
💬 Чтобы совсем оградить себя от Большого Брата, надо ковыряться в настройках, заходить в разные разделы и ставить (или снимать) всевозможные галочки. Официальные документы от Apple запутанные и неполные, поэтому пользователю может быть сложно с их помощью разобраться, какие именно данные собирает приложение и как это остановить.
💬 Исследователи пригласили 15 добровольцев, никто из которых не смог найти и снять все разрешения на сбор данных.
💬 Куда идут все эти данные, неизвестно. Один из исследователей предположил, что они могут использоваться для обучения ИИ, на котором работает Siri.
В общем, ничего удивительного — корпорации следят за своими клиентами и всеми силами мешают попыткам их остановить. Можно понагнетать панику и рассказать, какие нехорошие люди работают в Apple, но вряд ли в этом есть смысл. Лучшее, что можно сделать с этой информацией — начать внимательнее относиться девайсам, которые мы регулярно используем, и не лениться заглядывать в настройки.
Ну, и раз заговорили про Apple — участвуйте в опросе на вечную тему.👇🏻
Apple часто подчеркивает, как много внимания уделяет безопасности и защите личных данных пользователей. Рекламные ролики на эту тему у них получаются отличные, например, вот такой и такой.
Главной угрозой «прайваси» считаются сторонние приложения, которые собирают и непонятно куда сливают информацию. Команда исследователей из финского университета Aalto решила проверить, а как дела с родным ПО Apple, установленным почти на всех девайсах?
В исследовании «участвовали» 8 дефолтных приложений: Safari, Siri, Family Sharing, iMessage, FaceTime, Location Services, Find My и Touch ID.
В общем, ничего удивительного — корпорации следят за своими клиентами и всеми силами мешают попыткам их остановить. Можно понагнетать панику и рассказать, какие нехорошие люди работают в Apple, но вряд ли в этом есть смысл. Лучшее, что можно сделать с этой информацией — начать внимательнее относиться девайсам, которые мы регулярно используем, и не лениться заглядывать в настройки.
Ну, и раз заговорили про Apple — участвуйте в опросе на вечную тему.👇🏻
Please open Telegram to view this post
VIEW IN TELEGRAM
❤60👍49🏆16😁5😱2
Apple или Android?
Anonymous Poll
44%
Я выбираю Apple!
40%
Я за Android
1%
Оба не нравятся, у меня свой вариант
15%
А я просто хочу посмотреть результаты
😱2👾2
Помогите стартапу найти доверие к данным
Представьте: французский эдтех-стартап. Данных, которые надо анализировать, немало: соцсети, рекламные кабинеты, платежи, активность студентов. Все это собирается, складывается в базу и выводится на красивые дашборды на Tableau.
🔜 Пока все стандартно, но вот первый сюжетный твист: раз в месяц стартап обращается к сторонней компании, которая берет все их данные и пересчитывает в табличке в Excel. Потому что дашборды — это, конечно, классно, но что они там рисуют — непонятно, а в табличке все четко и понятно.
Представили? А нам и представлять не надо. Это один из наших клиентов, у которого сложилась довольно интересная ситуация с данными — MentorShow.
🔜 Второй сюжетный твист: в какой-то момент ребята решили, что одна база данных хорошо, а две лучше, поэтому данные стали хранить сразу в PostgreSQL и Redshift. Если отбросить иронию, то почему это произошло, мы не знаем, но последствия у этого были предсказуемые. Логика распределения данных по базам была непонятной, они дублировались, путались, и в итоге никакого доверия к ним не было.
Вот и приходилось руками пересчитывать.
💬 MentorShow эта интересная ситуация надоела, и они решили переходить на ClickHouse. Тут к ним присоединились мы и помогли перенести данные в новую базу, пересчитать метрики на старых дашбордах и сделать несколько новых — уже на Superset.
💬 В какой-то момент от они вообще отказались и от ClickHouse. В итоге построили новую инфраструктуру данных: Airflow для сбора данных — хранение в S3 — обработка в Athena — визуализация в Tableau и Superset.
💬 Чуть более официально и про метрики и результаты, еще и со скринами дашбордов рассказываем на сайте Valiotti Analytics и на Edmetrics.
Но главный результат — больше не приходилось ничего пересчитывать в Excel, потому что данные были корректными и заслуживающими доверия. Happy end!❤️
Рассказали не только, чтобы похвастаться, с какими кейсами приходилось справляться, но и поделиться, как интересно бывает организована работа с данными в разных компаниях.
Представьте: французский эдтех-стартап. Данных, которые надо анализировать, немало: соцсети, рекламные кабинеты, платежи, активность студентов. Все это собирается, складывается в базу и выводится на красивые дашборды на Tableau.
Представили? А нам и представлять не надо. Это один из наших клиентов, у которого сложилась довольно интересная ситуация с данными — MentorShow.
Вот и приходилось руками пересчитывать.
Но главный результат — больше не приходилось ничего пересчитывать в Excel, потому что данные были корректными и заслуживающими доверия. Happy end!
Рассказали не только, чтобы похвастаться, с какими кейсами приходилось справляться, но и поделиться, как интересно бывает организована работа с данными в разных компаниях.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥80❤29⚡21👍4🤓1
AARRR: пиратский фреймворк для маркетологов
Начинаем серию постов про работу с данными в маркетинге! Первый — про фреймворк AARRR. Это метод построения системы метрик, который помогает разобраться, какие показатели и зачем нужно отслеживать.
AARRR — это не пиратский вопль (хотя похоже), а аббревиатура, где каждая буква — этап жизненного цикла клиента.
🔜 Аcquisition — привлечение. Клиент узнал о вас: нагуглил, ткнул на объявление, услышал рекламную интеграцию у блогера.
На что смотреть? Показы объявлений, клики и их стоимость. Эффективность разных платформ (кто привел больше людей — VK или Tg?) и объявлений (какой баннер сработал лучше — с котиком или без?).
🔜 Аctivation — активация. Клиент зарегистрировался, оставил заявку, сделал покупку.
На что смотреть? Сколько человек прошли путь от регистрации до оформления заказа. Если на каком-то этапе они срезаются (регистрируются, но не кладут товары в корзину и уходят), надо искать причины. Это могут технические проблемы на сайте или непонятный интерфейс — то есть юзер не понимает, что ему делать.
🔜 Retention — удержание. Клиент продолжает пользоваться вашим продуктом: заходить в приложение, учиться на курсе, делать повторные заказы.
На что смотреть? Как часто одни и те же люди обращаются к вам, открывают пуши или письма.
🔜 Revenue — доход. Самый приятный этап — клиент пользуется вашими услугами и платит за них деньги.
На что смотреть? Средний чек, средняя выручка на клиента, совокупный доход на пользователя, количество покупок.
🔜 Referral — рекомендация. Клиент рекомендует вас знакомым.
На что смотреть? Результаты реферальных программ, число расшариваний постов в соцсетях.
AARRR разработали в помощь стартапам, чтобы быстро оценить жизнеспособность бизнеса. Он помогает увидеть весь путь клиента, построить воронку продаж и понять, не проседает ли конверсия на каком-то этапе. Список метрик для каждого бизнеса будет свой, но мы постарались осветить общие принципы, чтобы стало понятно в какую сторону копать.
Начинаем серию постов про работу с данными в маркетинге! Первый — про фреймворк AARRR. Это метод построения системы метрик, который помогает разобраться, какие показатели и зачем нужно отслеживать.
AARRR — это не пиратский вопль (хотя похоже), а аббревиатура, где каждая буква — этап жизненного цикла клиента.
На что смотреть? Показы объявлений, клики и их стоимость. Эффективность разных платформ (кто привел больше людей — VK или Tg?) и объявлений (какой баннер сработал лучше — с котиком или без?).
На что смотреть? Сколько человек прошли путь от регистрации до оформления заказа. Если на каком-то этапе они срезаются (регистрируются, но не кладут товары в корзину и уходят), надо искать причины. Это могут технические проблемы на сайте или непонятный интерфейс — то есть юзер не понимает, что ему делать.
На что смотреть? Как часто одни и те же люди обращаются к вам, открывают пуши или письма.
На что смотреть? Средний чек, средняя выручка на клиента, совокупный доход на пользователя, количество покупок.
На что смотреть? Результаты реферальных программ, число расшариваний постов в соцсетях.
AARRR разработали в помощь стартапам, чтобы быстро оценить жизнеспособность бизнеса. Он помогает увидеть весь путь клиента, построить воронку продаж и понять, не проседает ли конверсия на каком-то этапе. Список метрик для каждого бизнеса будет свой, но мы постарались осветить общие принципы, чтобы стало понятно в какую сторону копать.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤72👍37🔥13👌6🏆5
Курс по Product-Led Growth — бесплатно на 24 часа
У меня вся семья довольно технологичная. У меня дата-агентство, мой родной брат Костя — продакт-директор, который работал в VK и PandaDoc, а мой двоюродный брат Костя — генеральный директор одной известной российской BI-компании. Ничего себе? 😨
Сейчас первый Костя живет в Лондоне. Я недавно был у него в гостях, и он рассказал мне, что опубликовал на Udemy свой курс по Product-Led Growth.
Это подход, когда продукт сам привлекает, монетизирует и удерживает пользователей. Во многом благодаря ему SaaS-компании в секторе B2B последние годы так стремительно росли в оценке. Ему следуют и во многом обязаны своим успехом Slack, Figma, Canva и Dropbox.
🔜 Зачем аналитику понимать PLG?
Чтобы находить продуктовые проблемы и предлагать решения лучше и быстрее, чем другие аналитики, конечно! Это поможет начать говорить с продуктовыми командами на одном языке и глубже понимать причины и последствия многих решений.
🔜 Что будет на курсе?
Курс рассказывает, как научиться структурированно подходить к определению факторов роста продукта и влиять на продуктовую воронку через изменения и эксперименты.
На следующие 24 часа этот курс сделали бесплатным для подписчиков LEFT JOIN🔥 Переходите по ссылке.
P.S. Язык курса — английский. Из России доступен через VPN.
У меня вся семья довольно технологичная. У меня дата-агентство, мой родной брат Костя — продакт-директор, который работал в VK и PandaDoc, а мой двоюродный брат Костя — генеральный директор одной известной российской BI-компании. Ничего себе? 😨
Сейчас первый Костя живет в Лондоне. Я недавно был у него в гостях, и он рассказал мне, что опубликовал на Udemy свой курс по Product-Led Growth.
Это подход, когда продукт сам привлекает, монетизирует и удерживает пользователей. Во многом благодаря ему SaaS-компании в секторе B2B последние годы так стремительно росли в оценке. Ему следуют и во многом обязаны своим успехом Slack, Figma, Canva и Dropbox.
Чтобы находить продуктовые проблемы и предлагать решения лучше и быстрее, чем другие аналитики, конечно! Это поможет начать говорить с продуктовыми командами на одном языке и глубже понимать причины и последствия многих решений.
Курс рассказывает, как научиться структурированно подходить к определению факторов роста продукта и влиять на продуктовую воронку через изменения и эксперименты.
На следующие 24 часа этот курс сделали бесплатным для подписчиков LEFT JOIN
P.S. Язык курса — английский. Из России доступен через VPN.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍84❤63⚡20🏆8🤔3