Linux | OpenSource | Tech
5 subscribers
1.47K links
Download Telegram
🔹 Что делает shuffle=True и как не сломать порядок

Привет, Хабр! В этой статье разберёмся с параметром shuffle=True в train_test_split.

📌 Что значит "перемешать"?
Это применение псевдорандомного алгоритма (например, Fisher-Yates) к индексам выборки, чтобы добиться независимости и одинакового распределения данных в train и test (i.i.d.).

🔍 Важно:
В scikit-learn shuffle=True включён по умолчанию, и если не учесть порядок данных, можно получить некорректные выборки.

👉 Читать подробнее на Habr

#DataScience #MachineLearning #Python #scikitlearn