Библиотека собеса по Data Science | вопросы с собеседований

📌 Почему «логистическая регрессия» — это всё ещё регрессия, а не классификация

На первый взгляд, логистическая регрессия решает задачу классификации — ведь результатом часто становится 0 или 1. Но суть метода — в другом.

🔹 Что происходит на самом деле:

Модель вычисляет линейную комбинацию признаков, а затем пропускает её через сигмоиду — так получается число от 0 до 1, которое интерпретируется как вероятность принадлежности к положительному классу.

🔹 Почему это регрессия:

Потому что модель всё равно оптимизирует непрерывную функцию — отрицательное логарифмическое правдоподобие (log-loss), а не просто учится выбирать класс. Это приближает её к регрессионным методам: мы не просто «присваиваем» метку, а подгоняем параметры, как в классической регрессии.

🔹 А что насчёт классификации:

Классификацию мы получаем постфактум — когда применяем порог (обычно 0.5) к предсказанной вероятности.

⚠️ Главное — не путать внешний вид (0 или 1) с внутренней механикой. Логистическая регрессия — это регрессия, просто на логарифме вероятностей.

Библиотека собеса по Data Science

👍6❤1

1.07K views18:05

Библиотека собеса по Data Science | вопросы с собеседований

❓

Как избежать численной нестабильности в функции softmax

Когда входные значения (логиты) слишком велики по модулю, экспоненты в softmax могут привести к переполнению — например, e^{1000} становится слишком большим числом для компьютера.

✔️

Решение: вычитание максимума

Перед применением softmax нужно просто вычесть максимум из всех логитов:

Вместо e^{z_i} считаем e^{z_i − max(z)}

Это не изменит результат, потому что одинаковое смещение в числителе и знаменателе сократится.

👉

Почему это работает:

— Сдвигаем логиты ближе к нулю
— Избегаем переполнения экспоненты
— Повышаем численную стабильность

Библиотека собеса по Data Science

Please open Telegram to view this post