Linux | OpenSource | Tech

🔢 Регулярная отчетность. Цифры решают все

📌 В эпоху data driven подхода убивают уже не словом, а цифрой — будь то EBITDA, ROI или просто семёрка в отчёте.

💡 Автор делится опытом: 10 лет назад аналитика казалась красивым, но бесполезным фасадом, а теперь цифры правят миром — от распознавания лиц до корпоративных решений.

🙃 Ирония в том, что даже «цифровые шаманы» из McKinsey и PWC когда-то создавали отчеты, которые пылились на полках… но времена изменились.

🔗 Читать продолжение

#Аналитика #DataScience #БизнесТехнологии

2 views16:27

🔹 Что делает shuffle=True и как не сломать порядок

Привет, Хабр! В этой статье разберёмся с параметром shuffle=True в train_test_split.

📌 Что значит "перемешать"?
Это применение псевдорандомного алгоритма (например, Fisher-Yates) к индексам выборки, чтобы добиться независимости и одинакового распределения данных в train и test (i.i.d.).

🔍 Важно:
В scikit-learn shuffle=True включён по умолчанию, и если не учесть порядок данных, можно получить некорректные выборки.

👉 Читать подробнее на Habr

#DataScience #MachineLearning #Python #scikitlearn

4 views18:49

About

Blog

Apps

Platform