C#razy
99 subscribers
215 photos
46 videos
2 files
345 links
Путь в IT, рост, менторство, поддержка, прокачка, мотивация

👨‍💻 Senior .NET dev с 12+ лет опыта
📚 Учусь в MIT по Computer Science
🖥 100+ дней подряд LeetCode
⚒️ Работаю на зарубеж
💻 Веду блог про рост в IT с нуля
🧭 Помогаю понять, куда двигаться
Download Telegram
Forwarded from STEM: Science & Tech
Процентили. Дискретные и непрерывные процентили.

🇺🇸 Percentiles. Discrete and Continuous Percentiles

🇪🇸 Percentiles. Percentiles Discretos y Continuos

p-th percentile - это значение, ниже которого находится P процентов данных. Например, 90-й процентиль - это значение, ниже которого находится 90% наблюдений.

Для нахождения процентиля данные должны быть отсортированы в порядке возрастания. Процентили делят данные на 100 равных частей.

Важно упомянуть, что процентили бывают дискретными и непрерывными.

→ Непрерывный процентиль

Он может принимать любые значения в пределах диапазона данных, а не только те значения, которые непосредственно присутствуют в наборе данных.
Это позволяет более точно оценивать распределение данных, особенно когда мы хотим найти значение, которое находится между двумя существующими точками данных.

→ Дискретный процентиль

Может принимать значение из набора данных, которое наиболее близко соответствует желаемому проценту.

→ Найдем 90-й непрерывный процентиль для набора данных

Шаг 1. Нам нужен 90-й процентиль, поэтому P = 0.90.

Шаг 2. Исходный датасет: 2, 10, 1, 3, 40, 0

Шаг 3. Сортировка датасета: 0, 1, 2, 3, 10, 40

Шаг 4. Вычисляем позицию процентиля по формуле:
(P * (N - 1)) + 1 = 0.90 * (6 - 1) + 1 = 5.5.
Прибавляем единицу для того, чтобы позиция начинась с индекса = 1, а не 0.

Шаг 5. Применяем линейную интерполяцию. Формула: interpolated_value = a + (fraction * (b - a)).
Позиция 5.5 находится между 5-й и 6-й точками в отсортированном списке. 5-е значение: a = 10, а 6-е значение: b = 40, и fraction = 0.5 (дробная часть позиции 5.5).
res = 10 + (0.5 * (40 - 10)) = 25.

Шаг 6. Таким образом, значение на позиции 5.5, которое является 90-м процентилем для данного набора данных, составляет 25.

‼️ Важно не путать:
- Сам процентиль: 90-й
- Позицию 90-го процентиля в нашем датасете: 5.5
- Значение 90-го непрерывного процентиля в нашем датасете: 25.

Для дискретного процентиля:
поскольку он не использует интерполяцию, мы выбираем ближайшее значение, которое соответствует или превышает позицию 5.5. В данном случае это 6-е значение: percentile_90 = 40.

В следующем посте мы посмотрим на то, как процентили применяются в науке.

#math #statistics #computer_science #science