DenoiseLAB
486 subscribers
1.33K photos
159 videos
3 files
1.57K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_165

🔠Какие алгоримы поиска аномалий в данных существуют и чем они отличаются ? (Часть_1)

DBSCAN (Density-Based Spatial Clustering of Applications with Noise) - алгоритм кластеризации данных, который основывается на плотностной информации о расположении объектов. Он определяет кластеры как плотные области в пространстве признаков, разделенные областями разреженности;

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DBSCAN #ClusteringAlgorithm #DensityBasedClustering #OutlierDetection #LOF #LocalOutlierFactor #IsolationForest
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_165

🔠Какие алгоритмы поиска аномалий в данных существуют и чем они отличаются ? (Часть_2)

LOF (Local Outlier Factor): LOF также использует информацию о плотности для обнаружения аномалий. Он вычисляет локальный коэффициент выброса для каждого объекта, основываясь на плотности окрестности данного объекта по сравнению с плотностью окрестности его соседей. Значения LOF выше единицы указывают на аномальные объекты;

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DBSCAN #ClusteringAlgorithm #DensityBasedClustering #OutlierDetection #LOF #LocalOutlierFactor #IsolationForest
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_165

🔠Какие алгоритмы поиска аномалий в данных существуют и чем они отличаются ? (Часть_3)

Isolation Forest использует случайные деревья для изоляции аномалий. Он строит ансамбль изолирующих деревьев, разделяя объекты по случайным разделениям до тех пор, пока каждый объект не будет изолирован в отдельном листе. Аномалии обычно требуют меньшего числа разделений для изоляции, и поэтому имеют более короткий путь в дереве;

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DBSCAN #ClusteringAlgorithm #DensityBasedClustering #OutlierDetection #LOF #LocalOutlierFactor #IsolationForest
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_165

🔠Какие алгоритмы поиска аномалий в данных существуют и чем они отличаются ? (Часть_4)

One-Class SVM (Support Vector Machines): One-Class SVM - алгоритм, который строит модель только для "нормальных" данных. Он пытается найти гиперплоскость, которая наилучшим образом разделяет нормальные данные от выбросов в пространстве признаков. Объекты, находящиеся далеко от этой гиперплоскости, считаются аномалиями.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DBSCAN #ClusteringAlgorithm #DensityBasedClustering #OutlierDetection #LOF #LocalOutlierFactor #IsolationForest
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_165

🔠В чем разница между Rapids, Vaex, Pandas, Polars, Modin, Dask они же все для анализа данных ? (Часть_1)

Pandas предоставляет гибкие структуры данных, такие как DataFrame, и мощные инструменты для манипуляции, фильтрации, агрегации и анализа данных. Pandas обычно используется для работы с небольшими и средними объемами данных, которые могут поместиться в оперативную память одного компьютера;

Dask позволяет обрабатывать данные, превышающие объем доступной оперативной памяти, с использованием распределенных вычислений. Dask предоставляет абстракции, такие как DataFrame и Array, которые подобны структурам данных из Pandas и NumPyx;

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DBSCAN #ClusteringAlgorithm #DensityBasedClustering #OutlierDetection #LOF #LocalOutlierFactor #IsolationForest
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_165

🔠В чем разница между Rapids, Vaex, Pandas, Polars, Modin, Dask они же все для анализа данных ? (Часть_2)

Polars обладает высокой производительностью благодаря использованию Rust в своей реализации, а также предлагает возможности параллельной обработки данных. Она может работать с большими объемами данных и поддерживает некоторые распределенные вычисления;

Vaex использует ленивые вычисления и эффективные алгоритмы для выполнения операций над данными. Она обладает высокой производительностью и может работать с многопоточностью, многопроцессорностью и распределенными вычислениями;

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DBSCAN #ClusteringAlgorithm #DensityBasedClustering #OutlierDetection #LOF #LocalOutlierFactor #IsolationForest
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_165

🔠В чем разница между Rapids, Vaex, Pandas, Polars, Modin, Dask они же все для анализа данных ? (Часть_3)

Modin предоставляет интерфейс, совместимый с Pandas, но с оптимизированной производительностью. Она использует различные движки обратной совместимости, такие как Dask и Ray, для распределенных и параллельных вычислений.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DBSCAN #ClusteringAlgorithm #DensityBasedClustering #OutlierDetection #LOF #LocalOutlierFactor #IsolationForest
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_166

🔠 Что такое Tarantool и как он устроен ?

Tarantool — это база данных с открытым исходным кодом и высокой производительностью, которая сочетает в себе функциональность базы данных и сервера приложений. Tarantool состоит из:

1. In-Memory и Disk Storage: Tarantool предлагает возможность хранения данных как в оперативной памяти (In-Memory), так и на диске (Disk Storage). Это позволяет обеспечить высокую скорость доступа к данным и сохранить данные на долгосрочное хранение.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DBSCAN #ClusteringAlgorithm #DensityBasedClustering #OutlierDetection #LOF #LocalOutlierFactor #IsolationForest