Канал Саши Михайлова
107 subscribers
130 photos
197 links
работаю с данными, интересуюсь разным

я — @SashaMikhailov
Download Telegram
Forwarded from Подкасты евридей (Саша Михайлов)
Две истории от аналитиков в Яндексе

Беслан бросил универ и открыл с приятелем студию по разработке сайтов. А где сайты, там и продвижение в Директе: так Беслан стал «просто считать маркетинговые деньги».

Бизнес потом закрылся и Беслан продолжил считать маркетинговые деньги уже для других компаний: сначала на стороне клиента, а потом уже и в Яндексе.

Интересно про ротацию внутри Яндекса — когда со временем все интересные задачи уже стали просто рутинами, можно перевестись в другое направление, где будет всё в новинку.

***

Женя — тюрколог: она честно отучилась в университете и с интересом изучала там восточную культуру. Потом работала переводчиком и даже перевела целую книгу.

Потом, скучая на работе, нашла удалённую подработку в Яндексе — асессором. Яндекс как раз выходил на рынок Турции и им нужны были специалисты со знанием местной культуры и языка.

Потом подработка превратилась в постоянную работу, потом ушла, училась новому, потом вернулась — в общем, было интересно послушать историю Жени.
Forwarded from addmeto
Удивительная статья в удивительном месте, Sinead Bovel (это офигенной красоты и ума фотомодель, погуглите) пишет в Vogue о том, что уверена, скоро она будет конкурировать в своей работе с ИИ. Т.е. уже и модели поумнее поняли, откуда ветер дует. Да, запрограммированная модель развивается, улучшается, растет и не стареет. А мы люди скорее наоборот https://www.vogue.com/article/sinead-bovell-model-artificial-intelligence
Всем нужно дёшево?

Встречал такой тезис: всем нужно дешево. Главное, чтобы было хотя бы на рубль дешевле. На этом принципе строятся тендерны: кто дал дешевле, то и выиграл.

Где-то в этом же мире существуют магазины типа Азбуки Вкуса или той же Магнолии. Там не самые низкие цены, но тем не менее там есть покупатели.

Или вот пришла Яндекс.Лавка и говорит: «привезём продукты за 15 минут» — продукты у вашей двери быстрее, чем вы сами сходите в магазин. Заметьте, и ни слова про цены.

И никто не будет сверять стоимость килограмма картошки с Пятёрочке и Лавке — это бессмысленно. Кому надо дешевле — пойдут в Пятёрочку, а кому надо через 15 минут к двери — откроют приложение и сделают заказ.

Так что, не всем нужно просто дёшево.

Максим Ильяхов приводил в пример шиномонтаж за 20 тысяч, вместо двух:

«…Не просто поменять резину, а забрать машину с парковки, отвезти в цех, поменять колеса и вернуть на парковку, а шины помыть, высушить и сдать на хранение, и за все это заплатить карточкой — вот уже это может стоить не 1500 рублей, а 6000. Заодно провести ТО, подготовить машину к зиме, почистить салон, залить незамерзайку, заменить воздушный фильтр, покрыть дворники какой-нибудь наносмазкой — уже 10 000. Сделать это за ночь, чтобы утром тебя уже ждала полностью готовая к зиме машина — 15 000. Плюс взять летнюю резину на хранение — вот и получился шиномонтаж за 20 000. Есть люди, которые готовы платить за удобство»
совмещаю приятное с полезным: и послушал подскастик для души, и заодно узнал, что думают в Дзене и ivi про моральную сторону своих рекомендательных сервисов
Forwarded from Подкасты евридей (Саша Михайлов)
Рекомендательные сервисы

Онлайн-кинотеатру нужно, чтобы больше людей и как можно дольше смотрели его фильмы. Для этого ему нужно предлагать подходящие фильмы зрителям, чтобы те с большой вероятностью захотели их посмотреть.

Как выбрать какой фильм предложить зрителю?

1. Можно просто рандомом или тупо по порядку из топ 100 фильмов. Практика показывает, что это не эффективно: никакой персонализации и зрители потихоньку разжигаются.
2. Можно делать редакторские подборки. Эффективность выше, но нужна отдельная редакция, и чем больше аудитория — тем больше нужно редакторов.
3. Можно передать решение машинам: это называется рекомендательные сервисы. Алгоритмы смотрят на много-много характеристик каждого зрителя и пробуют предсказать на какие фильмы конкретно этот зритель кликнет с бо́льшей вероятностью. Эффективность по сравнению с первыми двумя способами доказана на практике.

Такие штуки есть во многих сервисах в интернете. По скромным подсчётам, каждый владелец смартфона и компьютера сталкивается с подобным десятки раз за день.

Иван Ямщиков допросил ребят из Дзена и ivi о том, как их платформы предлагают контент своим пользователям.

ссылки на послушать (и подписаться!)
https://t.me/progulka/147

и, надеюсь, у вас есть Overcast 🙂
https://overcast.fm/+Pqr0S7ZdA
Влад Исмагилов из Яндексю.Маркет о том, что нужно знать начинающему аналитику:

1. Любознательность.
2. Базовая практика. Для начала для себя: спарсить погоду или Циан.
3. Базовое понимание, что за цифрами есть математическая база
4. Понимание, зачем цифры нужны бизнесу и как будут приниматься решения на их основе.


https://t.me/just_analytics/15

П.С.: будет легче читаться, если хотя бы разбить текст на абзацы 🙃
https://telegra.ph/chto-nuzhno-znat-dzhunior-analitiku-07-30
у JetBrains есть даже официальный WeChat — они точно что-то знают)
Если посмотреть ближайшую кофейню или купить билет в кино, то это к Яндексу.

А если надо найти нужную функцию в питоне или понять, почему код не работает, то я открываю Гугл.

Да, приходится искать на английском, но в этом больше плюсов, чем минусов. Не нужно спрягать слова или выдумывать синонимы, как могли бы описать мою проблему другие: вопросы задают такие же «знатоки» английского, как и я: хватит даже школьного уровня.

Обычно прям забиваю ключевые слова в поиск:
python string to datetime

(я даже мануал по pandas каждый раз открываю через гугл ¯\_(ツ)_/¯ )
О пользе измерений или как заваривать вкусный чай

Задача: заварить вкусный чай нужной крепости.

Чтобы заварить чай, нужно насыпать в чайник чай и залить кипятком. Вот мы засыпаем листья чая в чайник: сыпем прям через край, особо не заморачиваясь.

По итогам возможны два варианта:
1. Чай получился нужной крепости
2. Слишком крепко или недостаточно крепко

Тогда в следующий раз мы захотим первый вариант повторить, а второй — исправить. То есть в первом случае засыпать столько же чая, а во втором — изменить количество чая.

Но чтобы это сделать, в обоих случая надо знать точное количество чая из первой попытки. Иначе как же его изменять (или повторить)?

Вот почему гуру менеджмента Питер Друкер говорил, что нельзя улучшить то, что не измеряешь:

If You Can't Measure It, You Can't Improve It.
Patreon прислал чек за июль — отличный повод пошерить список поддерживаемых проектов. Добро пожаловать в 2020, в новую эпоху поддержки любимых авторов (и монетизации экспертизы).
Роман Бунин поговорил с Дмитрием Аношиным про карьеру дата инженера в Амазоне.

(я сейчас прохожу курс Дмитрия по введение в дата инжиниринг и очень рекомендую. Курсы бесплатный, выложен на Ютубе)

Дмитрий — человек большой активности, только послушав про его опыт уже хочется запилить какую-нибудь презентацию. Дикая мотивация.

Очень полезно про поиск работы: мониторить рынок и требования, откликаться на любые подходящие вакансии, участвовать в любой движухе.

Слушать и смотреть:
https://t.me/revealthedata/122

Читать:
https://t.me/revealthedata/123

А вот сам курс Дмитрия «введение в дата инжиниринг и аналитику»
Прочитал книгу Moneyball: The Art of Winning an Unfair Game. Мне было интересно, как менеджер бейсбольной команды Oakland Athletics использовал статистику и аналитику, чтобы выстроить дееспособную команду с минимальным бюджетом. Топовая команда — New York Yankees —тратила на зарплаты игроков 40 миллионов (и ещё ~100 было в резерве), Oakland Athletics — только сорок; и эти две команды встретились в финале сезона.

Автор книги Майкл Льюис проделал большую журналистскую работу: крутился вокруг команды, делал пометки. Он хотел написать статью, но по количеству и качеству собранного материала стало ясно, что это уже целая книга.

Книга постепенно повествует о сезоне 2002: начиная с драфта в начале сезона; тренировки и регулярные игры в середине; и игры плей-оф в конце.

Поскольку бейсбол у нас не очень популярный, книга известна прежде всего тем, что по ней сняли фильм «Человек, который изменил всё» с Бредом Питтом в главной роли.

Главное преимущество книги перед фильмом: она длиннее и подробнее. В фильм просто бы не уместилось столько информации. Путь Билли Бина состоял из 10 лет спортивной карьеры и ещё 12 — офисной. Книга описывает сезон, когда Бин был на посту уже пять лет, три из которых он плотно занимался новой системой.

https://sashamikhailov.ru/blog/all/moneyball/
почему Excel не подходит для анализа данных:
Forwarded from addmeto
Вот вам пятничная новость: ученые переименовали за 2020 целых 27 цепочек в днк. Основная причина: Microsoft Excel на старых названиях думал что это даты :) Типичный пример - MARCH1 (membrane associated ring-CH-Type finger 1), который при вставке в эксель конвертировался в 1-Mar-2020.

Да, ученые всего мира много работают с экселем и такое название - реальная проблема. Удивительны пример правильной гибкости научного мира https://www.theverge.com/2020/8/6/21355674/human-genes-rename-microsoft-excel-misreading-dates?scrolla=5eb6d68b7fedc32c19ef33b4
пока разбираюсь с вопросом, насколько глубоко нужен питон дата-инжеренеру-аналитику, смотрю курс Яндекса по бэкенду. Там-то люди точно умеют в питон. Можно подсмотреть на их кухню и представить, что там делается — и что из этого может пригодится в работе аналитика.

а первой части рассказали про основные понятия в БД, а во второй начался уже полный хардкор:
⁃ драйверы (psycopg2, pg8000 и другие)
⁃ подключения, сессии, курсоры, транзакции
⁃ SQL Alchemy и её query builder
⁃ ORM и миграции