🔹 Что делает shuffle=True и как не сломать порядок
Привет, Хабр! В этой статье разберёмся с параметром
📌 Что значит "перемешать"?
Это применение псевдорандомного алгоритма (например, Fisher-Yates) к индексам выборки, чтобы добиться независимости и одинакового распределения данных в train и test (i.i.d.).
🔍 Важно:
В scikit-learn
👉 Читать подробнее на Habr
#DataScience #MachineLearning #Python #scikitlearn
Привет, Хабр! В этой статье разберёмся с параметром
shuffle=True в train_test_split. 📌 Что значит "перемешать"?
Это применение псевдорандомного алгоритма (например, Fisher-Yates) к индексам выборки, чтобы добиться независимости и одинакового распределения данных в train и test (i.i.d.).
🔍 Важно:
В scikit-learn
shuffle=True включён по умолчанию, и если не учесть порядок данных, можно получить некорректные выборки. 👉 Читать подробнее на Habr
#DataScience #MachineLearning #Python #scikitlearn