topdatalab
1.27K subscribers
98 photos
10 videos
17 files
221 links
Канал поддержки книги «Как монетизировать данные». https://topdatalab.ru
Download Telegram
Часть 1 про стартапы (в трех постах)

Я решил поделиться советами, которые мне лично пригодились бы, когда я только начинал создавать стартап. Этот пост дополняет 12 главу (Задачи и стартапы) моей книги.


Еще в начале своей карьеры, работая аналитиком данных, я, как и многие, мечтал сделать что-то большое и действительно полезное для людей. Мне хотелось творчества, хотелось не просто исследовать данные, а пощупать результаты своего труда. Я работал в течение 10 лет в нескольких компаниях-стартапах, прежде чем в 2012-м году стать сооснователем компании, которая предоставляла рекомендательный сервис для e-commerce. В 2020-м во время пандемии COVID я на год ушел в творческий отпуск - написал книгу, выпустил ее на Amazon, а летом 2021 года полностью вышел из успешной компании (cash positive, 150+ сотрудников в России, Европе и Южной Америке). Сейчас я разрабатываю с нуля свой следующий проект.

Плюсы создания собственного стартапа

Уверенность в том, что действительно делаешь что-то полезное. С моей точки зрения, это самое важное. Именно эта уверенность будет вам помогать продолжать свой путь после многочисленных неудач (а кто сказал, что их не будет?).

Рост навыков по экспоненте - ограничений нет. Я считаю это вторым по важности фактором. Вам придется очень быстро осваивать навыки, которые нужны в вашей работе. У вас сразу будет возможность их применить. Если в курсах и книгах приходится иметь дело с искусственными примерами, то здесь вы будете решать реальные задачи. Плюс у вас будут серьезные вычислительные ограничения, от этого игра становится интересней.

Полная ответственность за результат. И она действительно полная. Здесь уже нельзя перенести вину за неудачи на ваших менеджеров и коллег. Но с другой стороны, в случае успеха - этот успех будет принадлежать вам и команде, которую вы наняли.

В случае успеха больший доход. Успех - это когда вы оказались в нужном месте в нужное время и воспользовались ситуацией. Но это не отменяет того, что придется много работать. Зато если ваш стартап выстрелит, вы получите больше денег, чем если бы остались на обычной работе.

Часть 2 про стартапы (в трех постах)

МИНУСЫ

Свободного времени будет меньше. В тот момент, когда я начал делать стартап, я вышел на новую работу, и у меня родилась дочь - приходилось все это совмещать. Умственная работа отличается от физической тем, что после рабочего дня голова продолжает работать и решать нерешенные задачи. Поэтому в чистый Worklife баланс я не верю.

Вероятность выстрела стартапа не такая большая. Да, это риск. Но с моей точки зрения разумный риск оправдан. Даже если у вас не получится, ваши взгляды на жизнь и работу изменятся. Вы станете более независимы в суждениях и будете меньше следовать мейнстриму. Ну и как минимум попробуете сложное дело, на которое мало кто решается. Даже если вы вернетесь на обычную работу, то будете видеть картину гораздо шире, чем раньше.

Меньше творчества, больше бизнеса. В стартапе действовать нужно очень быстро и при этом получать гарантированный результат. Если у меня есть выбор между двумя ML алгоритмами - первый сложный в разработке и теоретически дает лучше результат, а второй легкий, но и метрики у него средние - я всегда выберу тот, что легче, как шаг номер один. Да, первый алгоритм можно поместить в backlog гипотез, но скорее всего, уже через несколько месяцев вы измените и его.
Часть 2 про стартапы (в трех постах)

МИНУСЫ - продолжение

Теория не всегда совпадает с практикой. Последние 10 лет я разрабатывал рекомендательные алгоритмы для e-commerce. В научных статьях по этой теме используются стандартные метрики (Precision, Recall, Novelty, Diversity - поставить ссылку). Кажется, бери научную статью и делай. Этот подход хорошо работает, например, в компьютерном зрении, но не в моей области. Покупка - это отложенное событие. Покупатель может ее совершить через несколько часов и даже дней. Поэтому нет прямой связи между научными метриками и конверсией посетителя в заказ. (поставить ссылку)

Нельзя просто взять и уйти. Если с обычной работы можно просто уволиться, то стартап - это игра вдолгую. Вы связаны отношениями с партнерами, с командой, которую вы наняли, с клиентами. Часть 2

Именно поэтому покупатели стартапа выплачивают стоимость долей фаундерам не сразу, а частями. Если фаундер уйдет, бизнес может развалиться. У меня выход из компании занял год - я написал книгу, убедился, что все без меня работает. Я вышел, продав свою долю дешевле, чем мог бы, выиграв ценное свободное время.

Конфликты всегда будут. Я имею в виду отношения между основателями. Вначале вы работаете плечом к плечу, не думая ни о чем. И если получается то, что уже можно поделить - возникают конфликты. Кто-то больше делает, у кого-то меняется вектор развития, кто-то выгорел. Конфликты случаются в большинстве стартапов.

“Начальник” у вас будет жестче, чем у вас были в найме. Если вы думаете, что уйдете из найма и будете работать только на себя, то это не так. Как минимум, у вас будут клиенты, которые вам платят и требуют свое. Если у вас уже есть инвесторы, то и они. Все они - ваши новые “начальники”.

10 СОВЕТОВ для идущих из аналитики данных в основателей

Идея продукта для одного клиента. Вначале была идея, потом продукт. Если у вас есть идея, самый лучший способ ее проверить - реализовать ее на своей текущей работе с пользой для компании. Например, мой проект родился за много лет до того, как мы с партнерами создали компанию - рекомендательные системы я развивал как side project, еще работая по найму. Поэтому я сразу понимал, что и как делать, особенно на начальном этапе. MVP (Minimum Viable Product) тогда я смог собрать с закрытыми глазами.

Понимание инженерии - как дешево масштабировать продукт на тысячи клиентов. Очень важно уметь минимальными усилиями масштабировать продукт. Для этого нужно изучить практики внедрения моделей в production. Кроме Питона и SQL неплохо владеть каким-нибудь компилируемым языком программирования (Java, Scala, С#, C++). Полезно понимать, как использовать базы данных разного типа и Hadoop. Мне лично очень помогло посещение офиса Netflix, где я получил пару советов относительно ПО с открытым кодом и Hadoop. Изучение и внедрение Hadoop у меня заняло около полугода. Также я услышал про Spark на видео конференции O’Reilly STRATA. В своем стартапе мы были одними из первых, кто внедрял Spark в production.

Правильная метрика - залог успеха. Казалось бы, выбери общепринятую метрику для вашей ML модели - и все получится. К сожалению, это не так. Вы слышали проблемы метрик классификации для здравоохранения? Например, у вас есть два разных ПЦР теста COVID: тест A выдает больше ложноположительных результатов, тест B - ложноотрицательных. Тест A отправит больше здоровых людей на карантин, что будет вредно с экономической точки зрения. Тест B пропустит больше больных, и они будут распространять болезнь. Выбор теста очень непростой, он будет зависеть от обстоятельств. Перед таким же выбором вы будете стоять после A/B тестов двух разных алгоритмов. Например, в рекомендательных системах я сталкивался с ситуациями, когда алгоритм улучшал интересующую меня метрику, но сами рекомендации визуально выглядели хуже. Это “улучшение” очень сложно продать клиентам, даже несмотря на улучшение коммерческих метрик (конверсия посетителя в покупателя или средний чек).
Часть 3 про стартапы (в трех постах)

10 СОВЕТОВ - продолжение

Фулл тайм лучше, чем делать стартап по вечерам. Я сам программировал по вечерам и выходным. Даже завел себе второй ноутбук, который носил на текущую работу, чтобы иногда программировать и там. Вечером после трудового дня я уставал, поэтому код, который я писал, содержал очень много багов. Их приходилось исправлять весь следующий день. Скажу больше - некоторые из них были исправлены только через несколько лет. Поэтому постарайтесь найти возможность полностью посвятить себя своему проекту, это сэкономит вам много сил и времени в будущем.

Важность профессионального опыта. C ним легче достичь успеха, не привлекая большие инвестиции. А вот отсутствие опыта придется заливать деньгами. Поэтому неплохо было бы перед стартапом хорошо поработать в активных развивающихся компаниях, где можно многому научиться. Когда-то такой совет мне дал мой бывший босс. А если вы еще и поработали на стороне своего потенциального клиента, вам будет намного легче понимать его интересы. Известно, что во время продуктового интервью клиент вам все не скажет. Многие проблемы сложно осознать и озвучить. Мне очень помог опыт работы аналитиком в e-commerce. Первый стартап я сделал на основе полученных там знаний.

B2B стартап с большей вероятностью выстрелит, чем B2C. B2B потребует меньше инвестиций, меньше сотрудников, и средний чек транзакции там намного выше. Для самоокупаемости в B2B вам нужно привлечь намного меньше клиентов, чем если бы вы это делали в B2C.

Нет карго-культу. Легче всего копировать, что делают другие, особенно компании FAANG. Ваша компания и внутренняя культура уникальны, и просто натянуть шаблоны каких-либо стандартов, например, разработки, развертывания ML моделей или продукта не получится. Подвергайте сомнению любые стандарты, скорее всего вы создадите свои собственные, основанные на принципах здравого смысла, которые подходят именно вам.

Облака на старте лучше. Сейчас облака как конструктор Лего - не нужно думать о железных и софтовых проблемах, и масштабироваться относительно легко. Первый проект я делал на арендованном железе. Я развернул там Hadoop и настроил все вычисления алгоритмов. Второй свой проект я сразу начал создавать в облаке, где трачу на это намного меньше времени.

Клиенты хотят увеличение собственных продаж, а не просто аналитику их данных. Аналитический продукт намного тяжелее продавать, чем систему, которая просто повышает продажи клиенту. А если этот эффект еще и легко проверить, например, в том же Google Analytics, то ваш продукт будет раскупаться как горячие пирожки. Собственно, поэтому я не стал создавать проект по аналитике, а сразу пошел туда, где данные повышают продажи напрямую - например, в рекомендательных сервисах.

Self-service analytics. Старайтесь привить культуру аналитики самообслуживания в своей компании. Никто не любит, когда к нему приходит поток задач, которые можно сделать на “калькуляторе”. Я называю это monkey tasks - очень простые задачи, которые можно сделать самостоятельно двумя-тремя кликами мыши. Чтобы ими не заниматься, а делать более важные продуктовые задачи, нужно три условия:
1) Удобная интерактивная аналитическая система (OLAP, Tableau, Metabase, )
2) Качественные данные
3) Обученные пользователи
Если вложить усилия в эти три направления, то это хорошо окупится даже в условиях стартапа, где развитие происходит очень быстро.
Если кто-то интересуется рекомендательными системами, то я нашел очень хороший пост про последнюю конференцию по рекомендательным системам RecSys 2021. Автор поста занимается сейчас разработкой алгоримов на базе Deep Learning.
https://www.yusp.com/blog-posts/recsys-2021-impressions-summary/
Друзья, я работаю над своим новым проектом в области маркетинга баз данных, повышающим маржинальность бизнеса (271 страница книги)!

Мне нужны собеседники - владельцы бизнесов, директора по маркетингу, маркетологи небольших компаний.
Важные критерии:
1. Ваша база клиентов не меньше нескольких сотен
2. Хотя бы некоторые клиенты делают повторные действия (покупки, подписки)
3. У вас есть возможность прямого контакта с ними через любые каналы (email, телефон, мессенджеры)

Если интересно, то связаться со мной можно в личке или по email rzykov@topdatalab.com

PS: Like, share, repost приветствуются!
1
Привет, меня зовут Зыков Роман. Я автор этого канала и книги “Роман с Data Science. Как монетизировать большие данные». Где можно приобрести книгу:
Бумажная
https://www.ozon.ru/product/roman-s-data-science-kak-monetizirovat-bolshie-dannye-zykov-roman-259016021/

Электронная
https://www.litres.ru/roman-zykov/roman-s-data-science-kak-monetizirovat-bolshie-dannye/ и https://ru.bookmate.com/books/TINMewr8

Аудиокнига
https://www.litres.ru/roman-zykov/roman-s-data-science-kak-monetizirovat-bolshie-dannye-66271250/

На английском напечатанная и электронная
https://www.amazon.com/dp/B09CVD8T5K
🔥3
Вопрос читателям книги, вам понятно, что если навести камеру телефона на QR код в книге, то откроется источник (веб страница), на который ссылается текст?
Anonymous Poll
84%
Да
6%
Нет
10%
Не читал
В это воскресенье 19 декабря в 14:00 - два писателя (почти два капитана) расскажут про свои книги в библиотеке на Бауманской!

« Презентация книг «Графики, которые убеждают всех» А. Богачева и «Роман с Data Science» Р. Зыкова

Авторы двух книг в мире аналитики и визуализации данных, вышедших в последний год, объединились, чтобы представить вам свои работы и рассказать, как они создавались.»

Я принесу несколько экземпляров моих книг, и еще захвачу английскую версию.

Ссылка в первом комментарии!
Пример неправильной разбивки данных при построении гистограмм. График с небольшими пиками каждые семь дней - неправильный, гладкая гистограмма - правильный. Их отличает только параметр - на сколько столбцов разбить гистограмму.
Новая картина Васи Ложкина касается и аналитики данных :)
Всем привет! 27 января на англоязычном вебинаре Toloka.ai я расскажу подробно про опыт использования ассессоров Толоки для рекомендательных систем. Контент уникальный, я такого даже на RecSys в Бостоне не видел. Я кратко писал об этом на 210 странице моей книги, здесь будут подробности. Ссылка на регистрацию здесь: https://toloka.ai/community/data-driven-ai-meetup
https://ojs.aaai.org/index.php/aimagazine/article/download/18140/18876

Вышла статья от Netflix об использовании Deep Learning для рекомендательных систем. (Английский язык). В DL для рекомендаций я не сильно верю, но возможно у Netflix получилось это сделать.
👍4
Прямо сейчас будет трансляция моего доклада про использование толоки для рекомендаций
Если вы интересуетесь рекомендательными системами, то есть интересная новость. Recsys выпустила видеозаписи своей последней конференции на youtube

https://m.youtube.com/playlist?list=PLaZufLfJumb-Zu0Rvuc0hroeqG3bdWTFr