Linux | OpenSource | Tech
5 subscribers
1.47K links
Download Telegram
🚀 Сегментация клиентов методом K-Means прямо в PostgreSQL

🔹 Что внутри?
- Нормализация фичей в materialized view
- PL/PythonU + scikit-learn для работы с K-Means без выгрузки данных
- Сохранение cluster_id обратно в таблицу
- SQL-аналитика доходности кластеров

📊 Зачем?
Кастомная кластеризация на стороне БД — быстро, безопасно и без лишних движений данными.

👉 Читать разбор: habr.com/ru/companies/otus/articles/930506

#PostgreSQL #DataScience #KMeans #Аналитика
🔍 Обновление онлайн-инструмента для сравнения Excel + добавлен экспорт

Разработчик доработал свой инструмент для сравнения Excel и CSV — теперь поддерживается вывод результатов в удобном формате.

📌 Что нового:
Возможность экспорта данных
Сравнение без конвертации файлов
Улучшенный интерфейс

💡 Зачем это нужно?
Автор, инженер данных, часто сталкивается с необходимостью проверки результатов миграции скриптов (например, из SAS в Databricks). Раньше приходилось использовать сторонние решения или писать свои скрипты, но теперь есть удобная альтернатива.

🔗 Читать подробнее на Habr

#Excel #DataScience #Инструменты