Forwarded from STEM: Science & Tech
Процентили. Дискретные и непрерывные процентили.
🇺🇸 Percentiles. Discrete and Continuous Percentiles
🇪🇸 Percentiles. Percentiles Discretos y Continuos
p-th percentile - это значение, ниже которого находится P процентов данных. Например, 90-й процентиль - это значение, ниже которого находится 90% наблюдений.
Для нахождения процентиля данные должны быть отсортированы в порядке возрастания. Процентили делят данные на 100 равных частей.
Важно упомянуть, что процентили бывают дискретными и непрерывными.
→ Непрерывный процентиль
Он может принимать любые значения в пределах диапазона данных, а не только те значения, которые непосредственно присутствуют в наборе данных.
Это позволяет более точно оценивать распределение данных, особенно когда мы хотим найти значение, которое находится между двумя существующими точками данных.
→ Дискретный процентиль
Может принимать значение из набора данных, которое наиболее близко соответствует желаемому проценту.
→ Найдем 90-й непрерывный процентиль для набора данных
Шаг 1. Нам нужен 90-й процентиль, поэтому P = 0.90.
Шаг 2. Исходный датасет: 2, 10, 1, 3, 40, 0
Шаг 3. Сортировка датасета: 0, 1, 2, 3, 10, 40
Шаг 4. Вычисляем позицию процентиля по формуле:
Прибавляем единицу для того, чтобы позиция начинась с индекса = 1, а не 0.
Шаг 5. Применяем линейную интерполяцию. Формула:
Позиция 5.5 находится между 5-й и 6-й точками в отсортированном списке. 5-е значение:
Шаг 6. Таким образом, значение на позиции 5.5, которое является 90-м процентилем для данного набора данных, составляет 25.
‼️ Важно не путать:
- Сам процентиль: 90-й
- Позицию 90-го процентиля в нашем датасете: 5.5
- Значение 90-го непрерывного процентиля в нашем датасете: 25.
Для дискретного процентиля:
поскольку он не использует интерполяцию, мы выбираем ближайшее значение, которое соответствует или превышает позицию 5.5. В данном случае это 6-е значение:
В следующем посте мы посмотрим на то, как процентили применяются в науке.
#math #statistics #computer_science #science
🇺🇸 Percentiles. Discrete and Continuous Percentiles
🇪🇸 Percentiles. Percentiles Discretos y Continuos
p-th percentile - это значение, ниже которого находится P процентов данных. Например, 90-й процентиль - это значение, ниже которого находится 90% наблюдений.
Для нахождения процентиля данные должны быть отсортированы в порядке возрастания. Процентили делят данные на 100 равных частей.
Важно упомянуть, что процентили бывают дискретными и непрерывными.
→ Непрерывный процентиль
Он может принимать любые значения в пределах диапазона данных, а не только те значения, которые непосредственно присутствуют в наборе данных.
Это позволяет более точно оценивать распределение данных, особенно когда мы хотим найти значение, которое находится между двумя существующими точками данных.
→ Дискретный процентиль
Может принимать значение из набора данных, которое наиболее близко соответствует желаемому проценту.
→ Найдем 90-й непрерывный процентиль для набора данных
Шаг 1. Нам нужен 90-й процентиль, поэтому P = 0.90.
Шаг 2. Исходный датасет: 2, 10, 1, 3, 40, 0
Шаг 3. Сортировка датасета: 0, 1, 2, 3, 10, 40
Шаг 4. Вычисляем позицию процентиля по формуле:
(P * (N - 1)) + 1
= 0.90 * (6 - 1) + 1
= 5.5
.Прибавляем единицу для того, чтобы позиция начинась с индекса = 1, а не 0.
Шаг 5. Применяем линейную интерполяцию. Формула:
interpolated_value = a + (fraction * (b - a))
.Позиция 5.5 находится между 5-й и 6-й точками в отсортированном списке. 5-е значение:
a = 10
, а 6-е значение: b = 40
, и fraction = 0.5
(дробная часть позиции 5.5).res = 10 + (0.5 * (40 - 10)) = 25
.Шаг 6. Таким образом, значение на позиции 5.5, которое является 90-м процентилем для данного набора данных, составляет 25.
‼️ Важно не путать:
- Сам процентиль: 90-й
- Позицию 90-го процентиля в нашем датасете: 5.5
- Значение 90-го непрерывного процентиля в нашем датасете: 25.
Для дискретного процентиля:
поскольку он не использует интерполяцию, мы выбираем ближайшее значение, которое соответствует или превышает позицию 5.5. В данном случае это 6-е значение:
percentile_90 = 40
.В следующем посте мы посмотрим на то, как процентили применяются в науке.
#math #statistics #computer_science #science