Linux | OpenSource | Tech
5 subscribers
1.47K links
Download Telegram
🔢 Регулярная отчетность. Цифры решают все

📌 В эпоху data driven подхода убивают уже не словом, а цифрой — будь то EBITDA, ROI или просто семёрка в отчёте.

💡 Автор делится опытом: 10 лет назад аналитика казалась красивым, но бесполезным фасадом, а теперь цифры правят миром — от распознавания лиц до корпоративных решений.

🙃 Ирония в том, что даже «цифровые шаманы» из McKinsey и PWC когда-то создавали отчеты, которые пылились на полках… но времена изменились.

🔗 Читать продолжение

#Аналитика #DataScience #БизнесТехнологии
🔹 Что делает shuffle=True и как не сломать порядок

Привет, Хабр! В этой статье разберёмся с параметром shuffle=True в train_test_split.

📌 Что значит "перемешать"?
Это применение псевдорандомного алгоритма (например, Fisher-Yates) к индексам выборки, чтобы добиться независимости и одинакового распределения данных в train и test (i.i.d.).

🔍 Важно:
В scikit-learn shuffle=True включён по умолчанию, и если не учесть порядок данных, можно получить некорректные выборки.

👉 Читать подробнее на Habr

#DataScience #MachineLearning #Python #scikitlearn
🎓 45 открытых уроков июля: возможности роста для каждого

<img src="https://habrastorage.org/getpro/habr/uploadfiles/d21/fec/9b4/d21fec9b44300225474d607bb42277b2.jpg" />

🔹 **Бесплатные онлайн-уроки** от преподавателей OTUS ждут всех, кто хочет прокачаться в IT. В программе — архитектура DWH, сетевые протоколы, работа с ML-моделями, DevOps и многое другое.

🔹 **Чем полезно:**
Разберёте ключевые темы с экспертами
Закроете пробелы в знаниях
Сможете задать вопросы в прямом эфире

Выбирайте интересное направление и регистрируйтесь!

🔗 [Подробнее и запись](
https://habr.com/ru/companies/otus/articles/922266/?utmcampaign=922266&utmsource=habrahabr&utmmedium=rss)

#IT #Обучение #Программирование #DataScience #DevOps
🔹 От сырого кликстрима к чистым датасетам: как в Lamoda Tech работают с данными

Команда Lamoda Tech рассказала о своём опыте построения эффективной инфраструктуры для обработки данных.

📌 Проблемы, с которыми столкнулись:
- Разрозненные подходы к подготовке данных среди команд
- Дублирование логики и вычислительных ресурсов
- Трудности с переиспользованием данных
- Рост времени на запуск новых ML-продуктов и экспериментов

💡 Решение:
👉 Feature Storage — фреймворк на базе Apache Spark для стандартизации работы с датасетами
👉 Action Storage — специализированное решение для кликстрим-данных

Эти инструменты теперь — стандарт в Lamoda, ускоряющий разработку ML-моделей и упрощающий взаимодействие между командами.

📖 Подробнее — в статье на Habr: Читать далее

#DataScience #ML #BigData #Lamoda