Всем, привет! В 17:40 19 марта (пятница) выступлю на митапе с небольшим докладом
Retail Rocket - как мы «растили» рекомендации для онлайн магазинов. Кейс длиной в 13 лет
Роман Зыков
— Ozon.ru: как в далеком 2007 году мы решились на создание рекомендаций, когда еще не было понятия "менеджер продукта";
— Retail Rocket: сложности и вызовы, которые привели к созданию лидера российского рынка в области рекомендательных систем.
https://epicgrowth.ru/analyticsforgrowth
Retail Rocket - как мы «растили» рекомендации для онлайн магазинов. Кейс длиной в 13 лет
Роман Зыков
— Ozon.ru: как в далеком 2007 году мы решились на создание рекомендаций, когда еще не было понятия "менеджер продукта";
— Retail Rocket: сложности и вызовы, которые привели к созданию лидера российского рынка в области рекомендательных систем.
https://epicgrowth.ru/analyticsforgrowth
epicgrowth.ru
Онлайн-митап! Аналитика для роста продуктов
Кейсы от Booking.сom и др.
Издательство Питер опубликовало отрывок из книги: https://m.habr.com/ru/company/piter/blog/549768/
Хабр
Книга «Роман с Data Science. Как монетизировать большие данные»
Привет, Хаброжители! Мы сдали в типографию новую книгу Романа Зыкова rzykov. Она предназначена для думающих читателей, которые хотят попробовать свои силы в области анализа данных и создавать...
Ребята, всем привет! Если кто хочет подписать у меня имеющуюся у вас книгу, то я буду тут https://www.defaqto.ru/event/paradise-jam/05.05.2021-20.00
Начиная с 18:00 до 22:00. Заходите на огонек.
Начиная с 18:00 до 22:00. Заходите на огонек.
Бар Дефакто
PARADISE JAM | Концерт | Бар Дефакто
Молодые, крутые и дерзкие музыканты новой волны превращают DeFAQto в музыкальный рай!
Планы на ближайшие два дня:
1) В четверг 20 мая по просьбе проекта DataLearn проведу вебинар «Как научить менеджеров правильно работать с Data Scientists” https://youtu.be/zPUNZZtMvNI
2) В пятницу 21 мая в 13:20 буду на круглом столе по этике данных: https://tellingstories.ru/#rec313326044
Заходите, подключайтесь, берите с собой книгу, оставлю автограф с котом!
1) В четверг 20 мая по просьбе проекта DataLearn проведу вебинар «Как научить менеджеров правильно работать с Data Scientists” https://youtu.be/zPUNZZtMvNI
2) В пятницу 21 мая в 13:20 буду на круглом столе по этике данных: https://tellingstories.ru/#rec313326044
Заходите, подключайтесь, берите с собой книгу, оставлю автограф с котом!
Наконец-то получил первый полный отзыв! Критика это хорошо, значит внимательно читал :)
«Отзыв (можно публиковать, если хочется)
Я не совсем целевая аудитория и узнал не так много нового из этой книги. Тем не менее, она оказалась довольно полезной в том, что позволила посмотреть чужими глазами на те проблемы, с которыми я сталкиваюсь на работе. Обычно это узнаешь при общении с коллегами или из статей, а тут целая книга. И несколько интересных идей я отсюда все же почерпнул.
В книге действительно рассмотрены почти все аспекты работы отдела аналитики в компании: какие задачи стоят, какие инструменты используются, кто и как с этим всем работает, чего можно ждать и как выращивать.
Какие-то вещи я бы подал немного иначе, с чем-то я не согласен, но во всей книге я не встретил каких-то оторванных от реальности вещей. Чувствуется, что автор собрал не одни грабли на пути от начала карьеры в аналитике и до написания этой книги.
Я бы точно порекомендовал эту книгу руководителям, которые еще не имели опыта работы с аналитикой за пределами базовых инструментов вроде таблиц в экселе.
Я бы порекомендовал эту книгу аналитикам, которые уже набрались профессионального опыта, но еще не очень понимают роль аналитики в бизнесе.
И я бы порекомендовал эту книгу людям, которые уже обладают каким-то опытом и пониманием того, как работает бизнес, но только собираются заняться аналитикой.»
«Отзыв (можно публиковать, если хочется)
Я не совсем целевая аудитория и узнал не так много нового из этой книги. Тем не менее, она оказалась довольно полезной в том, что позволила посмотреть чужими глазами на те проблемы, с которыми я сталкиваюсь на работе. Обычно это узнаешь при общении с коллегами или из статей, а тут целая книга. И несколько интересных идей я отсюда все же почерпнул.
В книге действительно рассмотрены почти все аспекты работы отдела аналитики в компании: какие задачи стоят, какие инструменты используются, кто и как с этим всем работает, чего можно ждать и как выращивать.
Какие-то вещи я бы подал немного иначе, с чем-то я не согласен, но во всей книге я не встретил каких-то оторванных от реальности вещей. Чувствуется, что автор собрал не одни грабли на пути от начала карьеры в аналитике и до написания этой книги.
Я бы точно порекомендовал эту книгу руководителям, которые еще не имели опыта работы с аналитикой за пределами базовых инструментов вроде таблиц в экселе.
Я бы порекомендовал эту книгу аналитикам, которые уже набрались профессионального опыта, но еще не очень понимают роль аналитики в бизнесе.
И я бы порекомендовал эту книгу людям, которые уже обладают каким-то опытом и пониманием того, как работает бизнес, но только собираются заняться аналитикой.»
Продолжение
«Мои замечания, вопросы и дополнения:
1) Четвёртая глава показалась довольно сумбурной. Раздел про датасет внезапно появляется без всякой подводки и немного выбивает из контекста, потому что до этого обсуждали навыки и процессы.
2) [с.92] Вся книга до этого считает, что у читателя нет знаний статистики. И тут «нормальное распределение» и «гистограмма». На моем опыте, люди не в теме пугаются таких слов, а гистограммой могут считать вообще любой график. «Медиана – это значение, которое делит выборку пополам». Вообще не поймут, я проверял. А потом ещё и про расстояние перцентилей от медианы говорим, никак не объясняя, что такое перцентили. Абзац с определением я бы подвинул на место перед первым использованием термина. Экспоненциальное распределение тоже без предварительного определения. Вообще глава резко уходит в математику.
3) [с.94] В scatter plot же не обязательно зависимая и независимая переменные. И не всегда это про показ зависимости. Те же кластеры визуализировать. Например, возраст и вес, которые не зависят друг от друга (для взрослых людей).
4) [с.105] Просто комментарий. Мне нравится определение бигдаты через VVV: Volume, Velocity, Variety.
5) Про опыт работы с HR-агентствами. Да, крутые hr-агентства делают поиск топов или редких специалистов проще, т.к. у них хорошая база контактов наработана. Но есть риск красиво оформленного середнячка, хотя для кандидата это плюс. Несколько раз через Владимирскую искали и с New.HR сталкивался. Они вроде по России одни из самых известных.
6) [с.152] ETL. Extract transformation layer. Первый раз сталкиваюсь с такой расшифровкой. Extract-Transform-Load же. И в ELT, соответственно, меняются этапы, когда мы сначала сохраняем данные, а потом обрабатываем.
7) [с.152] "Визуализация гораздо лучше, чем у альтернативных инструментов (особенно у Tableau)". Я раза три перечитывал предложение. Читалось как "Визуализация гораздо лучше, особенно чем у Tableau.".
8) [с.153] "Несложный визуальный ETL как в Tableau". У табло все сложные штуки вынесли в отдельный софт Tableau Prep. Я с ним не работал, но они именно там предлагают обрабатывать данные перед загрузков в табло. Еще я слышал, что в последних версиях они что-то вроде модели данных все же добавили в само табло.
9) [с.155] Ещё один минус облаков в почти полном отсутствии кастомизации и сложности интеграции с другими системами. Я больше двух лет работал с Amazon Redshift и это довольно негативный опыт.
10) [с.166] Текст про звезду, а на картинке снежинка. У звезды только одна точка схождения лучей – единая таблица фактов. А вот у звезды могут быть измерения, которые сходятся в измерения, а в центральную таблицу фактов.
11) [с.218] Несколько раз опечатка в слове "приоритизируются".
12) [с.260] Просто любопытно. На СМИ наезжают за "отравление" Навального, мол не было никаких отравлений, вы все врете. Нет рисков у книжки, если кто-то идейный прочитает? Ну и местами политические темы проскакивают в тексте.
13) [с.280] В главе про стартапы круто было бы рассказать про аналитику: на что смотрят инвесторы, какие цифры им обычно нужны и все такое. А то в текущем виде глава как-то выбивается из темы аналитики.
14) Местами, особенно в районо 90-х страниц, совсем много упоминаний Retail Rocket становится. Временами совсем как реклама выглядит =)
15) Идея с QR классная, но не всегда удобная. На каких-то страницах очень хотелось посмотреть, на что именно ссылка (в тексте не было), но для этого пришлось бы брать телефон, открывать камеру, сканировать, открывать ссылку. И это просто для того, чтобы посмотреть, а что за источник.
16) Местами в книге, где речь шла про аналитику, чувствовался перекос в сторону ML. Страницы не записал, но кажется в контексте технологий. Описывались сценарии, которые ближе к ML, чем к обычной аналитике. Но, в принципе, в названии книги и написано "Data Science".
17) [с.285] Thomann классные =)
18) Книга очень легко и приятно читается! Чаще околотехническая литература выходит довольно нудной.»
«Мои замечания, вопросы и дополнения:
1) Четвёртая глава показалась довольно сумбурной. Раздел про датасет внезапно появляется без всякой подводки и немного выбивает из контекста, потому что до этого обсуждали навыки и процессы.
2) [с.92] Вся книга до этого считает, что у читателя нет знаний статистики. И тут «нормальное распределение» и «гистограмма». На моем опыте, люди не в теме пугаются таких слов, а гистограммой могут считать вообще любой график. «Медиана – это значение, которое делит выборку пополам». Вообще не поймут, я проверял. А потом ещё и про расстояние перцентилей от медианы говорим, никак не объясняя, что такое перцентили. Абзац с определением я бы подвинул на место перед первым использованием термина. Экспоненциальное распределение тоже без предварительного определения. Вообще глава резко уходит в математику.
3) [с.94] В scatter plot же не обязательно зависимая и независимая переменные. И не всегда это про показ зависимости. Те же кластеры визуализировать. Например, возраст и вес, которые не зависят друг от друга (для взрослых людей).
4) [с.105] Просто комментарий. Мне нравится определение бигдаты через VVV: Volume, Velocity, Variety.
5) Про опыт работы с HR-агентствами. Да, крутые hr-агентства делают поиск топов или редких специалистов проще, т.к. у них хорошая база контактов наработана. Но есть риск красиво оформленного середнячка, хотя для кандидата это плюс. Несколько раз через Владимирскую искали и с New.HR сталкивался. Они вроде по России одни из самых известных.
6) [с.152] ETL. Extract transformation layer. Первый раз сталкиваюсь с такой расшифровкой. Extract-Transform-Load же. И в ELT, соответственно, меняются этапы, когда мы сначала сохраняем данные, а потом обрабатываем.
7) [с.152] "Визуализация гораздо лучше, чем у альтернативных инструментов (особенно у Tableau)". Я раза три перечитывал предложение. Читалось как "Визуализация гораздо лучше, особенно чем у Tableau.".
8) [с.153] "Несложный визуальный ETL как в Tableau". У табло все сложные штуки вынесли в отдельный софт Tableau Prep. Я с ним не работал, но они именно там предлагают обрабатывать данные перед загрузков в табло. Еще я слышал, что в последних версиях они что-то вроде модели данных все же добавили в само табло.
9) [с.155] Ещё один минус облаков в почти полном отсутствии кастомизации и сложности интеграции с другими системами. Я больше двух лет работал с Amazon Redshift и это довольно негативный опыт.
10) [с.166] Текст про звезду, а на картинке снежинка. У звезды только одна точка схождения лучей – единая таблица фактов. А вот у звезды могут быть измерения, которые сходятся в измерения, а в центральную таблицу фактов.
11) [с.218] Несколько раз опечатка в слове "приоритизируются".
12) [с.260] Просто любопытно. На СМИ наезжают за "отравление" Навального, мол не было никаких отравлений, вы все врете. Нет рисков у книжки, если кто-то идейный прочитает? Ну и местами политические темы проскакивают в тексте.
13) [с.280] В главе про стартапы круто было бы рассказать про аналитику: на что смотрят инвесторы, какие цифры им обычно нужны и все такое. А то в текущем виде глава как-то выбивается из темы аналитики.
14) Местами, особенно в районо 90-х страниц, совсем много упоминаний Retail Rocket становится. Временами совсем как реклама выглядит =)
15) Идея с QR классная, но не всегда удобная. На каких-то страницах очень хотелось посмотреть, на что именно ссылка (в тексте не было), но для этого пришлось бы брать телефон, открывать камеру, сканировать, открывать ссылку. И это просто для того, чтобы посмотреть, а что за источник.
16) Местами в книге, где речь шла про аналитику, чувствовался перекос в сторону ML. Страницы не записал, но кажется в контексте технологий. Описывались сценарии, которые ближе к ML, чем к обычной аналитике. Но, в принципе, в названии книги и написано "Data Science".
17) [с.285] Thomann классные =)
18) Книга очень легко и приятно читается! Чаще околотехническая литература выходит довольно нудной.»
В книжном магазине Республика 27 мая (четверг) c 19:00 до 21:00 на Маяковской я проведу автограф-сессию и дам бесплатные консультации. В самом магазине будет десяток экземпляров моих книг. Если вы еще не купили, то можно приобрести сразу там. Увы, тираж закончился. Не забудьте маски.
Адрес: Москва, м. Маяковская, ул. 1-я Тверская-Ямская, 10
Дата и время: 27 мая с 19:00 до 21:00
Адрес: Москва, м. Маяковская, ул. 1-я Тверская-Ямская, 10
Дата и время: 27 мая с 19:00 до 21:00
Доступность книги
1) Электронная версия https://www.piter.com/product/roman-s-data-science-kak-monetizirovat-bolshie-dannye
2) Бумажная версия https://www.wildberries.ru/catalog/27782594/detail.aspx
В других магазинах почти не осталось. Есть просьба - прочитали книгу - напишите отзыв в магазине, даже критический.
Доп. тираж будет в июне
1) Электронная версия https://www.piter.com/product/roman-s-data-science-kak-monetizirovat-bolshie-dannye
2) Бумажная версия https://www.wildberries.ru/catalog/27782594/detail.aspx
В других магазинах почти не осталось. Есть просьба - прочитали книгу - напишите отзыв в магазине, даже критический.
Доп. тираж будет в июне
www.piter.com
Роман с Data Science. Как монетизировать большие данные
Как довести проекты машинного обучения (machine learning) и искусственного интеллекта до топового уровня
topdatalab pinned «Доступность книги 1) Электронная версия https://www.piter.com/product/roman-s-data-science-kak-monetizirovat-bolshie-dannye 2) Бумажная версия https://www.wildberries.ru/catalog/27782594/detail.aspx В других магазинах почти не осталось. Есть просьба - прочитали…»
Хорошая новость про этику данных (глава 11 книги). Я надеюсь это улучшит ситуацию. https://www.forbes.ru/newsroom/tehnologii/431007-yandeks-pozvolil-polzovatelyam-udalyat-svoi-dannye?fbclid=IwAR099u86JWPunesqAq7i5nneaJgUitsixXvauzTd7b8av3QW94u27EUfTMc
Forbes.ru
«Яндекс» позволил пользователям удалять свои данные
Пользователи получили возможность изучить и удалить данные, которые собрали о них сервисы «Яндекса». Удалить можно, к примеру, историю запросов к «Алисе», просмотров страниц в «Дзене» или сведения о посещенных местах
Книга заняла второе место по популярности в своей категории на labirint.ru
Если вы уже читали книгу, то обратили внимание на подзаголовок «Конфликт исследователя и бизнеса». Завтра 17 июня в 19:00 я буду обсуждать эту тему на вебинаре в рамках фестиваля Data Fest 2021. Ссылка на регистрацию тут: https://topdatalab.ru/taplink
Полезные мысли
На конференции в Москве Ральф Кимбалл (один из теоретиков хранилищ данных) сказал про юзабилити отчетных систем - посчитайте количество кликов, которые нужно сделать пользователю, чтобы получить требуемый отчет. Чем их меньше, тем лучше.
Я сам себя ловил на мысли, что некоторые вещи ленился делать, потому что нужно много времени потратить на получение нужных цифр. Мы должны думать о пользователях, чтобы им было удобно работать с данными. Самая лучшая аналитическая система будет работать со скоростью мысли.
На конференции в Москве Ральф Кимбалл (один из теоретиков хранилищ данных) сказал про юзабилити отчетных систем - посчитайте количество кликов, которые нужно сделать пользователю, чтобы получить требуемый отчет. Чем их меньше, тем лучше.
Я сам себя ловил на мысли, что некоторые вещи ленился делать, потому что нужно много времени потратить на получение нужных цифр. Мы должны думать о пользователях, чтобы им было удобно работать с данными. Самая лучшая аналитическая система будет работать со скоростью мысли.
Отзыв на книгу из Токио https://www.linkedin.com/feed/update/activity:6813674890869121024
topdatalab
Если вы уже читали книгу, то обратили внимание на подзаголовок «Конфликт исследователя и бизнеса». Завтра 17 июня в 19:00 я буду обсуждать эту тему на вебинаре в рамках фестиваля Data Fest 2021. Ссылка на регистрацию тут: https://topdatalab.ru/taplink
Видео выложено тут: https://youtu.be/Rn-eWG5t-is
YouTube
Конфликт исследователя и бизнеса, Роман Зыков
Конфликт исследователя и бизнеса, Роман Зыков, Автор книги “Роман с Data Science”, сооснователь Retail Rocket
Исследователи хотят развиваться и делать крутые вещи (самореализация по пирамиде Маслоу). Бизнес хочет зарабатывать деньги - это написано в уставе…
Исследователи хотят развиваться и делать крутые вещи (самореализация по пирамиде Маслоу). Бизнес хочет зарабатывать деньги - это написано в уставе…
