Дата-инженерские заметки
1.33K subscribers
66 photos
13 videos
7 files
50 links
Пытаюсь выжить в корпоративных реалиях, делюсь вопросами с дата-инженерских собеседований и ссылочками для подготовки к ним

Написать мне: @aylin_gee
Download Telegram
приехала вот из Москвы, успела даже встретиться с дата каналами.

Вот вы знали, что бизнес не максимальная категория такси? И что есть люди, которые исключительно ездят на премиум?
😁651
Я искренне считаю, что большинство ментальных проблем у людей связано с нехваткой денег.

В капитализме всё, что приносит нам дофамин, в той или иной мере платно.
Но, что ещё важнее, деньги это некий гарант безопасности.

Если у вас нет собственного жилья и накоплений, способных покрыть год жизни без работы, то каждое неправильно принятое решение будет обходиться вам дорого.

Вы буквально выживаете, и следовательно все решения принимаете из соображения безопасности, а не развития и долгосрочной выгоды.

О каком спокойствии и отсутствии тревоги вообще может идти речь?

Вся идея про то, что деньги не покупают вам счастье смешна. И человек, утверждающий это либо желает вам зла, либо затерялся в собственных иллюзиях.
28185
Лайвкодинг в Магнит OMNI

🤍 Задача 1

Таблица с 1 колонкой:id
---
1
2
3
4
5
NULL
NULL

-- Что вернет функция в запросе вида:
-- SELECT ... FROM table
count(*)
count(1)
count(id)
count('id')
count(NULL)

min(id)
max(id)
sum(id)
avg(id)

sum(id) OVER (ORDER BY id NULLS LAST) =

sum(id) OVER () =

🤍 Задача 2

В приложении Магнит есть много разных функций - заказ еды, покупка товаров в Маркете и т д.Есть таблица Usage, в которой хранится активное использование сервисов
(могут быть дубликаты, service_id указывает на таблицу Service).

Таблица Usage
user_id | service_id | ...
---------+------------+-----
1001 | 1 | ...
2001 | 1 |
1001 | 3 |
1001 | 3 |
...
Таблица Service (service_id - первичный ключ)
service_id | name
------------+----------
1 | Доставка
2 | Маркет
3 | Аптеки
...
Напишите запрос, который вернет список клиентов, которые пользовались всеми сервисами,
которые присутствуют в таблице Service

🤍 Задача 3

Имеем таблицу RIDE с поездками пользователей на такси ride_id | user_id | tariff | dt | cost
---------+---------+-------------+------------+------
2305001 | 1001 | econom | 2023-05-02 | 340
2305002 | 1001 | comfort | 2023-05-03 | 500
2305003 | 2001 | econom | 2023-05-01 | 120
2305004 | 2001 | econom | 2023-05-01 | 150
...
Найти всех пользователей, которые совершали поездки два (или более) дня подряд.

🤍 Задача 4

def array_intersection(a: list[int], b: list[int]) → list[int]:array_intersection([1, 2, 3], [2, 2, 5]) → [2]
array_intersection([1, 2, 2, 3], [1, 2, 2]) → [1, 2, 2]
Необходимо вернуть все пересечения листов.n(id)

#de_тестовое_livecoding
Please open Telegram to view this post
VIEW IN TELEGRAM
3443
причиной эмоционального дна оказался низкий ферритин и нехватка тусовок

лечилась в Москве и Нижнем Новгороде

завтра снова рабство по расписанию
2666🏆4
This media is not supported in your browser
VIEW IN TELEGRAM
как меняется зп Безоса и обычного работяги в реальном времени

за этот разговор Безос заработал месячную зп сеньора де из России
92😁1
SQL собес в Яндекс (была еще одна задачка - не сохранилась)

-- Дана таблица tbl со следующими данными

-- id
-- ----
-- 1
-- 2
-- 3
-- 4
-- 5
-- NULL
-- NULL

-- Что выведет каждый из запросов:

-- select ... from tbl

-- 1. count(*) =
-- 2. count(1) =
-- 3. count(id) =
-- 4. count(null) =
-- 5. min(id) =
-- 6. max(id) =
-- 7. sum(id) =
-- 8. avg(id) =


-- Есть две таблицы:
-- * groups (group_id, action_type) - группы
-- * communications (user_id, group_id, status) - отправки коммуникаций

-- При этом:
-- * action_type может быть "push" и "banner"
-- * status может быть "success" и "error"

-- Вопросы:
-- 1. Сколько групп с отправкой типа push?
-- 2. Сколько пользователей и в каких группах не получили коммуникации из-за ошибки?
-- 3. Вывести на экран тип отправок (push или banner), по которому было больше всего успешных отправок и число успешных отправок


-- Таблица issues - обращения в поддержку
-- * issue_id - идентификатор обращения
-- * created_dt - дата создания обращения
-- * tariff_name - тариф поддержки (free/paid)
-- * service_name - тема обращения (console/datalens/billing/etc.)
-- * first_response_sec - время от создания обращения до первого ответа в секундах
-- * last_response_sec - время от создания обращения до последнего ответа в секундах

-- Таблица responses - ответы на обращения в поддержку
-- * response_id - идентификатор ответа
-- * created_at - дата и время создания ответа
-- * author_id - идентификатор автора ответа
-- * issue_id - идентификатор обращения

-- 1. Какая доля тикетов была отвечена быстрее, чем за час, по дням?
-- 2. Вывести топ-10 обращений в платном тарифе, которые решались дольше всего
-- 3. Посчитать количество ответов для каждого обращения в поддержку, сколько человек из поддержки подключалось к обращению
-- 4. Посчитать отношение кол-ва обращений больше чем с одним ответом от числа всех обращений за день
-- 5. Для каждого обращения к поддержке вывести автора первого ответа на обращение
-- 6. Какие инсайты можно еще вытащить из этих данных, какие метрики можно посчитать?


Дата-инженерские заметки
#de_тестовое_livecoding

ставим сердечки, кидаем бусты🫶
3815
Все вокруг хотят, чтобы вы выиграли.

HR хочет, чтобы вы успешно прошли собес, так как ей выгодно закрыть позицию, как можно быстрее.

Собеседующий хочет, чтобы вы решили все задачи и ответили на все вопросы, так как ему не хочется проводить бесконечные технические интервью.

Человек, который с вами знакомится, хочет стать вашим другом, поэтому ему выгодно, чтоб встреча с вами прошла хорошо.

Список можно продолжать бесконечно, принцип применим ко всему в вашей жизни.
51
Сегодня мой день рождения!
И вот, что я поняла за этот год:

- жить весело и очень интересно

- в этом канале самые приятные и умные люди

- мой мир крутится вокруг меня, а ваш должен крутится вокруг вас - и это лучшее, что вы сделаете для себя, и ,на удивление, для своих близких
491512
Подружка поделилась списком контактов ребят, которые могут зарефералить вас в свою компанию (в основном в лондонские офисы)

Сделаем такое для нас?) Вы укажете свой контакт в аналогичном файле для рекомендашек?
Anonymous Poll
52%
да, добавил(а) бы свой контакт
34%
нет, но пользовался/лась бы
14%
не вижу потребности в списке
она 10/10, но это ее компания мечты
20😁106🏆3
Сегодня подписала заявление на увольнение😱

Решение далось легко; принимаю ваши поздравления💳

P.S Альфа банк - лучший банк
Please open Telegram to view this post
VIEW IN TELEGRAM
🏆36🔥1381
Вот, что я сделаю иначе на новом месте работы, чтобы снова не словить вайб на картинке:

🤍 Если телеграм активно используется для рабочей коммуникации, создам отдельный аккаунт для работы.

Во-первых, это избавляет от информационного шума, когда нужно сконцентрироваться исключительно на работе.
Во-вторых, это позволит мне делиться в профиле всем, не задумываясь о мнении коллег (смогу, например, указать этот канал)

🤍 Начну запрашивать фидбэк сильно раньше и чаще.

В моей команде мой перворманс вообще ни на что не влиял. Работаешь - хорошо, не работаешь - ок. Сначала это тревожит, затем демотивирует и слишком расслабляет.

🤍 Постараюсь почаще приезжать в офис, если часть команды будет сконцентрирована в одном городе. Работать с людьми, зная их лично, намного проще.
Please open Telegram to view this post
VIEW IN TELEGRAM
19
Проектируем хранилища данных с нуля

Спроектированное DWH — основа качественной аналитики, точно также как и инженер данных — незаменимый игрок любой в DS-команде.

Чтобы заложить фундамент для одного из важнейших скиллов инженера данных, приходите 10 сентября на следующий вебинар от Георгия Семенова, Chief Data Officer и ментора нового потока курса «Инженер данных».

В ходе вебинара мы разберем процесс построения хранилища данных на конкретном примере и узнаем:
🟠Зачем нужны хранилища данных
🟠Какие есть технологии хранилищ данных
🟠Как выбирать и выстраивать модель данных
🟠Как доставлять и обрабатывать данные
🟠Как делать данные качественными и доступными

🕗 Встречаемся 11 сентября в 19:00 МСК

💬 Обязательно ждем вас в лайве – вы сможете напрямую задать свои вопросы Георгию Семенову и еще лучше прокачаться в теме!

😶Регистрация на вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
53
писала ранее о списке рефералов и вот наконец создала свой.

Список сейчас открыт для редактирования. После редактирование закрою - нужно будет написать мне и я добавлю ваш контакт.
Если ваша компания уже есть в списке, добавьте свой контакт рядом с уже существующим рефералом.

📌В альфе рефералками заработала больше 100к, так что указывайте свои контакты.

💬Дата-инженерские заметки
ставим сердечки, кидаем бусты🫶
Please open Telegram to view this post
VIEW IN TELEGRAM
98🔥71
Дата-инженерские заметки pinned «писала ранее о списке рефералов и вот наконец создала свой. Список сейчас открыт для редактирования. После редактирование закрою - нужно будет написать мне и я добавлю ваш контакт. Если ваша компания уже есть в списке, добавьте свой контакт рядом с уже существующим…»
Если вы задумывались над тем, чем же все-таки занимаются аналитики, рекомендую подписаться на канал Data Brew!

Канал ведет тот самый аналитик, который смог построить карьеру после курсов и сейчас продолжает расти профессионально.

Автор
🤗 помогает в поиске работы
😊пишет о полезных для аналитиков хардах
🎁делится реальными историями с собеседований
🤬 рассказывает о боли аналитиков
😇 скидывает аналитические мемы

Подписывайся на @data_brew
Please open Telegram to view this post
VIEW IN TELEGRAM
🏆21