Dataism
3.63K subscribers
242 photos
49 videos
10 files
126 links
Бот для подготовки к IT-собесам @DataismPrepBot 📲
Недушный канал про аналитику, карьеру в IT и немного португальского лайфстайла.
Полезно аналитикам, дата-сатанистам и продактам.

По вопросам рекламы писать в лс канала
Download Telegram
А то тяжко что-то знаете ли

#мемы
😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Моё тотемное животное:

#мемы
😁1
Dataism pinned a video
О - отпуск

#книги
🔥1
О, вакансия for me.
Меня мама как раз называет змеючкой, вид, правда, не уточняла.

#мемы
Авиасейлс — кратко о сегодняшнем дне
🤬1
Я ещё и женщина, то есть и репродуктивный период короткий.
Комбо собрала получается?

#мемы
Богу помолился - mvp появился (с) коллега на работе

#мемы
🔥1
Ор выше гор.
Аж пожалела, что в прошлом году не приняла оффер indrive.
inDrive запустит конную доставку
Платформа транспортных и городских услуг рассматривает возможность запуска в Казахстане доставки товаров на лошадях.
https://profit.kz/news/64721/inDrive-zapustit-konnuu-dostavku/
🔥1😁1🤩1
Даже Илон Маск в шоке
Илон Маск с нами постит мемы про то, что парни не спят, парни мониторят ситуацию с "переворотом Вагнера".
😁1😱1
#трудовыебудни

Можно бесконечно долго сожалеть о трех вещах: о сообщениях бывшим, о том что много выпила на тусе и о том, что вовремя не была настроена проверка качества данных.

Нет, конечно, про базовую проверку на типы данных/null/объем данных сложно забыть. Но вот с бизнес-смыслом иногда бывает косяк.

А теперь расскажу о том, как это выглядит на практике (по мотивам задачи у меня на работе).
Представьте ситуацию: ваша компания/команда занимается аналитикой данных. Вы высылаете требования заказчику о формате передаваемых вам данных, где четко прописано, что в необходимой выгрузке конкретно вот это поле должно отвечать за что-то. У вас при этом под эту логику заточен расчет какого-то агрегата.
И вот вы льете данные, доверяя заказчику (ну, вы же скинули требования, там все четко написано, какие проблемы могут быть).
Данные залиты, базовые дашборды с метриками подняты и вы довольные сидите курите бамбук пьете кофеёк.

Проходит время, появляется потребность в создании нового дашборда с более детальной инфой. Начинаете делать, а там дичь какая-то на графиках. Аля суммы продаж на миллиарды в маленьком магазине в Урюпинске с населением в 100 человек, что явно вызывает подозрения.

И вот вы на батискафе (главное, чтобы это был не «Титан») совершаете погружение в пучину данных.
Начинаете проверять и понимаете, что в поле записано совершенно другое значение (не то, которое вы прописали в тербованиях заказчику). Неприятно очень знаете ли. Все это время и ваша команда, и заказчик смотрели на невалидные цифры.

В данных всегда больше ошибок, чем кажется. И последствия использования таких данных довольно печальные. Например, американские компании ежегодно терпят ущерб почти в 600 млн долларов. Так что, всегда лучше потратить больше времени на обвязку данных различными проверками на качество.

#трудовыебудни
🔥1
Я вот все сокрушалась по поводу факапа с бизнес-логикой в данных мол да как так, на ровном месте прозевать ошибку, а потом вспомнила историю из книги «Аналитическая культура»: агентство NASA потеряло орбитальныи‌ аппарат по исследованию Марса стоимостью 125 млн долл. из-за того, что команда технических специалистов корпорации Lockheed Martin (разработавшая и собравшая аппарат для NASA) использовала при расчетах английские единицы измерения [фунт, дюйм, фут], в то время как специалисты самого агентства пользовались более привычнои‌ метрическои‌ системои‌ для управления аппаратом.


хехе
http://edition.cnn.com/TECH/space/9909/30/mars.metric.02/

#трудовыебудни
🤯1
Личный бренд

Послушала наконец-то подкаст Ани Подображных из Авито и выписала основные моменты про личный бренд.
Почему вообще стала интересоваться личным брендом? Ну, кажется, что это неплохий вариант геймификации собственной жизни:)

Основные тезисы:
(порой очень очевидные, но, видимо, пока письменно не зафиксируешь - не запомнишь)

Личный бренд бывает внутренний (в пределах своей компании) и внешний.

Очень важно рассказывать о том, что ты делаешь. Можно проделать крутую работу и получить классный результат, но из-за того, что его не видно окружающим, складывается впечатление, что ничего не происходит. И не нужно бояться себя проявлять. Да, всегда будут люди в 1000 раз лучше тебя, но это вообще не должно быть проблемой.
Какие плюшки от личного бренда:
1) нетворк, инсайты. Когда начинаешь делать проект с нуля, но знаешь, что что-то подобное делали в других компаниях, то можно напрямую пингануть нужного человека.
2) можно делать какие-то совместные движухи
Качаешь личный бренд - > качаешь бренд компании. Это взаимовыгодная история.

Как работать над своим брендом
1) начинаем с цели.
Для чего тебе нужен личный бренд? Просто чтобы знали - это не ответ.
Надо именно проанализировать варианты и выбрать в какую сторону двигаться. Например, нетворкинг - одно направление, монетизация и поаышение дохода - совершенно другая история.
2) где развиваться?
Заход через тг - мягкий заход. Визитная карточка, простая история, всё понятно. Можно писать про себя, делиться реальными кейсами и тд.
3) аудитория.
Привлечение своих друзей и тд. Первая тысяча - всегда тяжело. Нужно вкладываться, дальше уже намного проще и рост органический.
4) выступления. На презентациях в слайдах можно указать мол вот я тут веду канал, подписывайтесь, ставьте лайки:)

Как начать выступать:
1) курсы часто проводят ивенты/митапы, куда очень легко залететь
2) писать статейки во вне (Vc, medium, хабр)

Я сама активненько слежу за вот этими людьми:
- Аня Подображных (продакт)
- Валерий Бабушкин (крутой ds, формировал data-driven культуру в x5)
- Виктор Кантор (тот самый с курсов по ds на курсере)
- Анатолий Карпов (легендарный курс на степике по основам статистики и основатель школы ds)
- Дмитрий Аношин (курс на youtube DataLearn, путь от завода до Амазона)
——————————————
Видосики для дегродства:
- Frying Pan (https://www.youtube.com/@FryingPan)
- Joma Tech (https://www.youtube.com/@jomaoppa)

Подкаст: [https://music.yandex.ru/album/24718255/track/114192648]

#карьера
👍1
Если достаточно долго мучить данные, они признаются [в чем угодно] (c) Рональд Круз

У меня память как у рыбки, поэтому стараюсь вести конспекты.
Дочитала на днях книгу Карла Андерсона «Аналитическая культура».
Эта ĸнига посвящена двум основным вопросам:
1) что означает для ĸомпании управление на основе данных?
2) ĸаĸ ĸомпания может ĸ нему прийти?
#книги
👍1
Недавно меня свитчнули на роль ds, так что решаемые задачи сильно поменялись. Мне такие перемены нравятся, в далёком 2018 году я как раз и начинала свой карьерный путь в качестве стажера ds.
Так вот текущая задача посвящена интересному эффекту в ритейле - каннибализации.

Каннибализация
Товары, обладающие схожими характеристиками, замещают друг друга. Спрос одного уменьшает продажи другого, то есть один товар "съедает" своего сородича.

Чем хорош эффект каннибализации:
1. У покупателей всегда есть выбор
2. Если вдруг в супермаркете один товар закончился, его заменит аналог

Чем плох эффект каннибализации:
1. Торговые полки занимает никому ненужный товар.
2. Пропадают деньги компании, которые потратились на закупку ненужного товара.
3. Менеджеры, логисты, грузчики, мерчендайзеры и продавцы зря потратили свои ресуры.

В большинстве случаев каннибализация не является преднамеренной и маркетологи хотят избежать этого, так как их цель все же привлечь новую клиентскую базу на новый продукт, а не перекинуть существующих потребителей со старого продукта на новый.
Например, компания «Вимм–Билль–Данн» выпускала всем известное молоко «Домик в деревне». Чуть позже компания добавила еще одно молоко в свой портфель брендов — «Милая Мила». На вкус они не отличались, ценовой сегмент одинаковый, рекламировались тоже примерно одинаково. С точки зрения потребителя они ничем друг от друга не отличались. Но товары начали конкурировать между собой и чтобы прекратить эффект каннибализации завод в конечном итоге перестал выпускать молоко «Милая Мила».

Однако есть и примеры целенаправленной каннибализации, особенно это часто встречается в технологической индустрии. Например, Apple старается выпускать новые поколения продуктов каждый год.
Демонстрируя на презентации новые фичи, они таким образом влияют на потребителей, чтобы те перестали покупать их устаревшие модели.

Интересное видео на тему каннибализации - https://www.youtube.com/watch?v=2djYDhQG_BM

#трудовыебудни
👍1🔥1
💻 БД под капотом.
Часть 1

БД состоит из различных компонентов, взаимодействующих между собой:

⚙️ Основные компоненты БД (Core Components):
Диспетчер процессов. Во многих БД имеется пул процессов/потоков, которыми нужно управлять. Причём в погоне за производительностью некоторые БД используют свои собственные потоки, а не предоставляемые ОС.
Диспетчер сети. Пропускная способность сети имеет большое значение, особенно для распределённых БД.
Диспетчер файловой системы. Первым «бутылочным горлышком» любой БД является производительность дисковой подсистемы. Поэтому очень важно иметь диспетчер, который идеально работает с файловой системой ОС или даже заменяет её.
Диспетчер памяти. Чтобы избежать эпичных зависаний при чтении или записи на диск, требуется большое количество оперативной памяти. Но когда её много, вам неизбежно потребуется эффективный диспетчер памяти. Особенно когда много одновременных запросов, использующих память.
Диспетчер безопасности. Управляет аутентификацией и авторизацией пользователей.
Диспетчер клиентов. Управляет клиентскими соединениями.

🛠 Инструменты (Tools):
Диспетчер резервного копирования. Для сохранения и восстановления базы данных
Диспетчер восстановления. Обеспечивает целостность данных при перезапуске БД после падения.
Диспетчер мониторинга. Занимается протоколированием всех активностей внутри БД и используется для наблюдения за её состоянием.
Диспетчер общего управления. Хранит метаданные (вроде наименований и структуры таблиц) и используется для управления базами, схемами, табличными пространствами и т.д.

📂 Диспетчер запросов (Query Manager):
Парсер запросов. Проверяет их валидность.
Рерайтер запросов. Осуществляет предварительную оптимизацию.
Оптимизатор запросов. Оптимизирует запрос.
Исполнитель запросов. Компилирует и исполняет.

📄 Диспетчер данных (Data Manager):
Диспетчер транзакций. Занимается их обработкой.
Диспетчер кэша. Используется для отправки данных перед использованием и перед записью на диск.
Диспетчер доступа к данным. Управляет доступом к данным в дисковой подсистеме.
#трудовыебудни