Аналитика в HR | HR-tech
421 subscribers
216 photos
84 links
HR-аналитика | HR-tech
Образовательный канал посвященный HR-аналитике, HRTech, рынку труда и его исследованиям.
Download Telegram
#Excel #умные_таблицы

⚡️ Умные таблицы (Excel Tables) — интересный инструмент в Excel, который многие просто игнорируют. И напрасно. У таких таблиц есть несколько очень полезных функций, которые упрощают работу по анализу больших таблиц.

🔹 Как создать:
Выбрать любую ячейку в таблице и нажать Ctrl+T или «Форматировать как таблицу» на вкладке Главная.

🔹 Преимущества:
— Автоматическое распространение формул и форматов данных на новые строки по всей таблице, если вы заволлите новую строку. Супер удобно.
— Удобно работать с динамическими массивами и формулами массивов
— Автооформление новых строк к единому формату
— Повышенная читаемость и чистота модели.

🔹 Недостатки:
— Не всегда совместимы со старыми макросами и внешними подключениями.
— В больших таблицах могут замедлять работу Excel.

🔹 Когда использовать:
Использовать стоит, когда это обновляемая и дополняемая БД, которая служит источником для других таблиц.
#Excel #массивы

Формулы массивов всегда стояли обособлено от остальных функций Excel из-за своей замороченности.
Но, начиная с 2019 года, в Excel появились динамические массивы, мир заиграл новыми красками и проклятье Ctrl+Shift+Enter кануло в вечность ))

⚡️ Динамические массивы — это формулы, которые возвращают сразу несколько значений и автоматически "разливаются" по ячейкам.
Работают это просто. В любой пустой ячейке можно вставить ссылку на часть таблицы или целую таблицу, при этом будет транспонирована или часть или вся таблица (как на скрине).

🔹 Особенности динамических массивов
— Если входной диапазон меняется (добавили строки), результат обновляется автоматически — никакой ручной корректировки формул.
— Если что-то поменяется в исходной таблице, то изменится и таблица по ссылке.
— Проводить манипуляции с данными в динамическом массиве нельзя. Это приводит к ошибке ПЕРЕНОС.
#исследования #выборка #методы_отбора

⚡️ Простая случайная выборка (simple random sample) — метод отбора выборки из генеральной совокупности (ГС), при котором отбираемые в выборку объекты определяются случайным образом — без какой-либо системы, квотирования или ограничений.

Это самый простой и интуитивно понятный метод формирования выборки. В этом его главный плюс.
Второе преимущество — простота технической реализации: вы определяете размер выборки и случайным образом отбираете объекты из ГС.
Причём чем больше случайных объектов мы выбираем, тем лучше выборка отражает свойства генеральной совокупности.

🔹 Подходит:
— Для больших генеральных совокупностей
— При равномерном распределении значений характеристик объектов в ГС

🔹 Не подходит:
— Для небольших генеральных совокупностей
— При наличии выбросов в характеристиках объектов наблюдения в ГС
#исследования #выборка #методы_отбора

⚡️ Стратифицированная выборка (stratified sample) — метод формирования выборки, при котором генеральная совокупность (ГС) разделяется на группы (страты) на основе определённого признака (или признаков). Это может быть пол, стаж, принадлежность к структурному подразделению, грейду и пр.

🔹 Метод отбора:
1. Определение признака (или признаков), на основе которого будет разделена ГС;
2. Разделение ГС на страты;
3. Определение количества объектов для отбора в выборку, исходя из соотношения страт между собой;
3. Отбор объектов из страт случайным образом.

🔹 Подходит:
— Для небольших генеральных совокупностей
— Когда необходимо работать с неоднородными ГС

🔹 Пример:
2/3 персонала в компании работает на производстве, 1/3 — в офисе.
Мы проводим общее исследование удовлетворённости и делим ГС на две страты: производство и офис.
2/3 объектов выбираем из страты «производство», 1/3 — из страты «офис».
#исследования #выборка #методы_отбора

⚡️ Групповая выборка (cluster sample) — метод формирования выборки, сочетающий элементы простой случайной и стратифицированной выборки.
Как и в стратифицированной выборке, вся генеральная совокупность (ГС) делится на группы (страты). Однако, в отличие от стратифицированной выборки, объекты внутри каждой страты разнородны, а сами страты схожи между собой. Считайте, что кластеры — это как маленькие ГС.

Это более сложный метод отбора, но он обеспечивает хорошую репрезентативность и позволяет работать с неоднородными ГС.

🔹 Метод отбора:
1. Разделение ГС на страты (кластеры), схожие между собой;
2. Выбор страты для выборки;
3. Определение размера выборки;
4. Случайный отбор объектов внутри выбранных страт.

🔹 Пример:
Исследование удовлетворённости в компании. Всех сотрудников случайным образом делим на 5 кластеров (страт), в каждой из которых сотрудники разнородны. Кластеры между собой схожи. Случайным образом выбираем один кластер и внутри него отбираем несколько объектов.
#метрики #CandB #SRP

⚡️Индекс вхождения в ЗП-диапазон (Salary Range Penetration, SRP) — это метрика, которая показывает, где находится оклад сотрудника относительно всего диапазона грейда (или зарплатной вилки).

🔹Формула:
SRP = (Оклад — нижняя граница диапазона) / (верхняя граница диапазона — нижняя граница диапазона)

🔹Как использовать (одна из стратегий применения SRP):
Отрицательное значение SRP означает, что оклад сотрудника не попадает в диапазон грейда для его должности. Обычно это зарплаты сотрудников, которые только приступили к работе, недавно перевелись на новую должность и пока не в полной мере соответствуют требованиям.
0,3–0,6 — вторая треть диапазона, соответствующая сотрудникам, которые в полном объёме выполняют свои задачи.
0,6–1 — верхняя треть, обычно включает высокоэффективных сотрудников или тех, кто готовится к повышению.
>1 — оклад превышает верхнюю границу диапазона. Такие должности считаются "переплаченными".

Классический подход — избегать значений SRP меньше 0 и больше 1.
#метод #переработки

⚡️ Метод анализа общей рабочей загруженности помогает выявить систематически перегруженных сотрудников до выгорания. Особенно важно в командах с гибким графиком или удалёнкой.

🔹 Как считать:
1. Собираем данные из систем учета времени (таймтрекеры, календарь, вход-выход)
2. Рассчитываем среднюю продолжительность дня (AvgHours):
Σ(рабочих часов) / кол-во рабочих дней
3. Сравниваем с нормативом (обычно 8 ч/день, обед.час не считаем).
4. Определим % превышения (Overload):
((AvgHours - 8) / 8)
5. Рассчитываем общую загруженность(TotalOvr):
(кол-во дней с переработками/всего рабочмз дней)

🔹Интерпретация:
Если Overload% > 0,15 или TоtalOvr> 0,25 — это красный флаг и повод для разговора.

Также важно учитывать дни с аномальной нагрузкой (например, >10 часов) и их частоту:
OverloadDaysRatio = (дней с >10 ч) / (всего дней). Это еще один показатель, который можно "зашить" в систему контроля загруженности сотрудников
#визуализация

⚡️ Граф анализа стажа — простой и доступный инструмент для экспресс диагностики жизненного цикла сотрудников в компании. Он показывает, как изменяется численность персонала по мере увеличения стажа работы.

🔹Построение:
Разбиваем сотрудников на группы по стажу (например: 0–6 мес, 6–12 мес, 1–2 года, 2–3 и т.д.)
Считаем количество сотрудников в каждой группе
Строим гистограмму или line chart — ось X: стаж, ось Y: кол-во сотрудников
Альтернатива — кумулятивная кривая оттока (cumulative attrition curve):
Ось X — месяцы с даты выхода
Ось Y — % сотрудников, покинувших компанию

🔹Пример:
на скрине выше построенный график с резким падением "выживаемости" на периоде 4 и более лет. Это может говорить о проблемах с построением долгосрочной карьеры к компании

Граф помогает выявлять уязвимые фазы (например, стаж <1 года) и принимать точечные меры: усиление онбординга, менторство, корректировка нагрузки.
#метрики #CandB #CR

⚡️Compa-ratio (или Comparative Ratio, CR) — одна из ключевых C&B-метрик в арсенале HR-аналитика. Она помогает определить, насколько уровень оклада сотрудника соответствует рыночным ориентирам.
CR показывает отношение фактической зарплаты к среднерыночной для аналогичной должности.

🔹 Compa-Ratio = (Фактическая зарплата / Рыночный ориентир) × 100%
> 100% — зарплата выше рынка
= 100% — зарплата соответствует рынку
< 100% — зарплата ниже рынка

🔹Для чего использовать:
—Принятие решений о пересмотре оклада;
—Проектирование ФОТ при запуске новых подразделений;
—Настройка политики по управлению компенсациями;
—Инструмент карьерного планирования.

🔹Пример:
Средняя рыночная зарплата логиста — 120 000 ₽. В компании сотрудник получает 100 000 ₽. Тогда:
CR = 100000 / 120000 = 0.83 (или 83%)
Вывод: зарплата сотрудника ниже рыночной.
#метрики #Shannon #diversity

⚡️Индекс Шеннона (Shannon Index, H) — простая и удобная метрика для оценки разнообразия в компании.
Чем равномернее представлены разные категории (пол, возраст, опыт), тем выше H.

🔹 H = -Σ(pᵢ * ln(pᵢ)),
где pᵢ — доля каждой категории (например, женщин, мужчин).
Максимальное значение H зависит от количества категорий (n). Если все категории равны по численности, то H = ln(n). Чем ближе фактический H к этому максимуму, тем выше разнообразие.

🔹 Пример:
в команде 6 мужчин и 4 женщины.
p₁ = 0.6, p₂ = 0.4
H = -[(0.6 * ln(0.6)) + (0.4 * ln(0.4))] ≈ 0.673

🔹 Интерпретация:
в нашем примере 2 группы м/ж. Их Ln(2) = 0,69. Это значение будет показывать максимальное разнообразие.
Мы получили 0,67. Уровень разнообразие в нашем примере высокий.

🔹 Использование:
—для сравнения подразделений и выявления “однородных” команд;
—для мониторинга diversity and inclusion, если компания их измеряет.

если вам лень считать руками, можно воспользоваться калькулятором. Например, таким или таким
#личное #Садовое

Сегодня в Москве прошёл интересный беговой ивент — забег по Садовому кольцу на 15 км.
Традиционно, результаты подвезли очень быстро, так что у нас есть возможность проанализировать их. Это никак не относится к HR-анализу, но автор, пользуясь своим положением, рассказывает ))

На графике гауссовое распределение результатов участников.
По оси Х - результаты в минутах, по оси Y - доля участников с этим результатом. Колонки - это отображение кол-ва участников с такими результатами.

Общие агрегированные данные на скрине, а вот самые "быстрые" города (от 5 участников, среднее время) по агрегированным данным:
Смоленск — 72.3 мин
Фрязино — 74.6 мин
Щёлково — 75.3 мин

В абсолютных же числах, как всегда, Казань — самый быстрый город России. Теперь живите с этим :)
#исследования

🔍 Внутренняя согласованность — это характеристика шкалы или опроса, показывающая, насколько все вопросы действительно измеряют одно и то же.
В HR-аналитике согласованность особенно важна при расчёте сложных индексов — вовлечённости, удовлетворённости, выгорания. Чем этот показатель выше, тем лучше.

🔹 Где нужна согласованность:
— При расчёте итоговых баллов (например, средний по шкале)
— В шкалах Ликерта (1–5, 1–7), где ответы агрегируются
— В опросах, где строится индекс или интегральный показатель
— В оценках компетенций с несколькими индикаторами в одном блоке

🔹 Где согласованность не требуется:
— В анкетах с независимыми блоками (офис, команда, задачи)
— В ситуациях, где важна каждая тема по отдельности

🔹 Пример:
Если вы используете 6 вопросов для оценки командного взаимодействия, но только 3 из них реально про команду, а остальные — про ИТ-системы и график работы, индекс теряет достоверность. Альфа Кронбаха (об этом в следующем посте) в этом случае покажет низкое значение.
#метрики #надежность #альфа_кронбаха

⚡️ Альфа Кронбаха (Cronbach’s alpha) — метрика, которая показывает, насколько надёжно работает ваш опрос или шкала. Используется для оценки внутренней согласованности набора вопросов.

🔹 Формула (упрощённая):
α = (N / (N - 1)) * (1 - (∑σ²_i / σ²_total)), где:
N — число вопросов,
σ²_i — дисперсия по каждому вопросу,
σ²_total — дисперсия по сумме баллов по всем вопросам.

🔹 Интерпретация на скрине.
Показатель сравнивается с пороговыми значениями. Опросник считается согласованным при α > 0.7

🔹Пример:
12 вопросов по вовлеченности, ответы по шкале от 1 до 5. Если α = 0.85 — отлично.
Если α < 0.7 — шкала ненадёжна, вопросы не «работают вместе».

Часто используется в психометрических опросниках, опросниках по вовлеченности и удовлетворенности. Выводится как дополнительное значение.
Альтернативный способ - воспользоваться калькулятором. Например, таким
⚡️Индекс Симпсона (Simpson’s Diversity Index, D) — показатель измеряет вероятность того, что два случайно выбранных сотрудника из коллектива будут принадлежать к разным категориям (по полу, возрасту, опыту и т.д.).

🔹 Формула: D = 1 - Σ(pᵢ²),
где pᵢ — доля категории i (например, женщин, мужчин).
Интерпретация:
D → 0 — одна доминирующая группа
0,4-0,6 — среднее значение (бенчмарк M&S)
D → 1 — равномерное распределение.

🔹 Пример:
Структура персонала в компании: 50% линейный персонал, 30% специалисты, 20% руководители.
D = 1 - [(0.5² + 0.3² + 0.2²)] = 1 - (0.25 + 0.09 + 0.04) = 0.62
Значение в норме, дополнительных действий не требуется.

🔹 Отличие от индекса Шеннона:
— Шеннон чувствительнее к редким категориям и логарифмически "штрафует" доминирование.
— Симпсон проще: он даёт «шанс» различий, и значение легче интерпретировать.

Если нужно быстро и наглядно сравнить отделы по разнообразию — Симпсон удобнее. Если интересны тонкие различия в структуре — выбирайте Шеннона.
#методы #согласованность

Вот очень простой (проще чем расчет Альфа Кронбаха) метод проверки согласованности ответов в опросах.

⚡️ Inter-Item Correlation — простой способ оценки согласованности опроса без сложных формул.
Суть метода доовльно проста, мы расчитываем корреляцию между всеми вопросами и смотрим на среднее значение этой коррелчции.
Логика метода простая: если вопросы измеряют одно и то же — они должны быть связаны, но не идентичны.

🔹 Как считать:

1. Рассчитываем корреляцию (обычно Пирсона или Спирмена) между всеми парами вопросов.
2. Находим среднее значение этих корреляций.
3. Интерпретируем значение:
0.7–1 — оптимально: шкала согласована.
<0.7 — слабая связь между вопросами.

Пример на скрине выше.
#методы #согласованность

Еще один метод проверки соглаосванности. Мб чуть более замороченный чем предыдущий.

⚡️ Split-Half Reliability — метод оценки надёжности опросника, когда мы делим наш опросник на две части и смотрим насколько ответы этих частей консистентны (взаимно согласованны).
Логика у метода простая: если опросник согласован, то ответы будут коррелировать между собой.

🔹 Метод:
1. Разделим шкалу на 2 половины, например: чётные и нечётные вопросы.
2. Для каждого респондента считаем сумму ответов по каждой половине.
3 . Находим корреляцию (Rsb) между этими суммами по формуле Спирмена-Брауна:
r_sb = 2r / (1 + r), где r - это ранговая корреляция Спирмена.
Rsb > 0.8 — шкала надёжна.
<0.7 — стоит пересмотреть вопросы или логику опроса.

🔹 Пример:
1. Находим корреляцию между Q1 и Q2,3 по Спирмену (на скрине выше):
ρ = 1 - (6 * ∑d²) / (n(n² - 1)) = (6 * 4.5) / (6 * (36 - 1)) = 0.871
2. Применим формулу Спирмена-Брауна:
r_sb = (2 * 0.871) / (1 + 0.871) ≈ 1.742 / 1.871 ≈ 0.93. Ответы согласованны.
#визуализация #excel #диаграммы

Чтобы не потеряться в многообразии графиков, вот мини гайд по основным диаграммам в Excel: какие есть и для чего их лучше всего использовать.

🔹 Гистограмма вертикальная— сравнение между категориями.
Подходит, если категорий немного.

🔹 Гистограмма горизонтальная — те же данные, но при длинных названиях категорий например, названия филиалов.

🔹 График — тренды и динамика.
Пример: изменение текучести персонала по кварталам, изменение продаж и пр.

🔹 Круговая (пайчарт) — доли от общего. Только если <6 сегментов!
Если больше, больше подойдет вторичная линейчатая.

🔹 Ящик с усами (boxplot) — визуализация медианы, квартилей, выбросов.
Пример: разброс зарплат в отделе: можно сразу увидеть медиану и «переплаты».

🔹 Точечная (scatter plot) — для отображения корреляции.
Пример: связь между вовлеченностью и производительностью.

🔹 С областями — динамика + вклад категорий во время.
Пример: как менялась доля каждого отдела в общем штате по месяцам.
#визуализация #excel #диаграммы #ступенчатая

⚡️ Ступенчатая диаграмма (Step Chart) — хороший способ отразить изменения, которые происходят не непрерывно, а скачкообразно, этапно. Например: изменение ставок, условий, политик и пр.

🔹 Когда применять:
— когда важно показать не тренд, а именно точки перехода каких-то состояний;
— для "фона" и накладывать на этот график другие графики. Например, показать как изменение системы мотивации влияет на текучесть и другие показатели.

🔹 Пример:

Бонусная ставка по отделу:
Янв–Март: 10%, Апр–Июнь: 12%, Июль–Сент: 8%, Окт–Дек: 15%.
Линейный график создаст иллюзию «плавного» изменения, хотя на деле ставка резко меняется. Ступенчатая диаграмма покажет: в каждый период ставка была фиксированной.

🔹 Как построить в Excel:
1. Подготовить исходную таблицу
2. Продублировать строки таким образом, чтобы каждое новое значение было конечным значением пред.периода (как на скрине)
3. Построить график ( scatter plot) по данным трансформированной таблицы.
#основы #исследования

Типичные задачи HR-аналитика связаны со сбором количественных данных и их анализом. Анализ заработных плат, исследование текучести, уровня абсентеизма и многое другое — это примеры количественных исследований.

Количественные методы лежат в основе корреляционного и регрессионного анализа, факторного и кластерного анализа, построения математических моделей и прогнозов. Именно эти методы обеспечивают связь между эмпирическими данными и математическими вычислениями.

Спектр применения количественных методов охватывает любые исследования, результаты которых могут быть выражены в числах, процентах и математических соотношениях. Это основа любой работы аналитика.

⚡️К инструментам количественных исследований относятся:
опросы
анкетирование,
— наблюдение
— эксперименты.


⚡️К техническим средствам для их проведения можно отнести:
Google Forms , SurveyMonkey, или их российские аналоги, например: Как дела от hh.ru и Яндекс Взгляд от Яндекса.