DenoiseLAB
486 subscribers
1.33K photos
159 videos
3 files
1.57K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_160

🔠 Apache Storm - что это и как он устроен ? (Часть_3)

4. Масштабируемость и отказоустойчивость: Storm обладает встроенными механизмами для обнаружения сбоев и автоматического восстановления. Он может автоматически переназначать задачи (tasks) на другие узлы в случае сбоя, обеспечивая непрерывную работу системы.

5. Расширяемость и гибкость: Storm предоставляет гибкое API и возможность разработки пользовательских компонентов для обработки данных. Он также интегрируется с другими инструментами и системами, такими как Apache Hadoop, Apache Kafka и другими.

#ApacheSpark #bigdataprocessing #distributedcomputing #parallelprocessing #dataanalysis #highperformancecomputing #dataprocessing #API
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_161

🔠 Как проверить нормальность набора данных или признака? (Часть_1)

✔️Ответ: W-тест Шапиро-Уилка:

1. Рассчитывается выборочное среднее и ковариационная матрица выборки;
2. Затем вычисляются статистики заказа (например, i-е наименьшее число в выборке) и ожидаемые значения из статистики заказа, выбранные из стандартного нормального распределения;
3. Наконец, вычисляется W-статистика, которая сравнивается с критическим значением, полученным через моделирование Монте-Карло;
4. Если W-статистика значима, то гипотеза о нормальном распределении данных отвергается, то есть данные, не следуют нормальному распределению;

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_161

🔠 Как проверить нормальность набора данных или признака? (Часть_2)

✔️Ответ: Тест Мартинеса-Иглевича:

1. Вычисляются квантили выборки;
2. Эти квантили сравниваются с квантилями стандартного нормального распределения;
3. Расстояние между квантилями выборки и стандартного нормального распределения вычисляется для каждого квантиля;
4. Если все расстояния меньше некоторого критического значения, то гипотеза о нормальном распределении данных принимается.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
🤝Ребята, всем привет!!!

🥳Сегодня утром выяснилось, что у меня день рождения, как-то неожиданно для меня самого. Так что я буду, сегодня целый день пить бре*ди, играть в покер, веселить девчонок и вообще придаваться всяким безумствам )), ну мне можно !!!

P.S. Пить вредно!
Please open Telegram to view this post
VIEW IN TELEGRAM
2🎉1
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_161

🔠 Как проверить нормальность набора данных или признака? (Часть_3)

✔️Ответ: Тест Д'Агостино

1. Вычисляются эксцесс и асимметрия выборки и эти значения сравниваются с ожидаемыми значениями для нормального распределения;
2. Расстояние между вычисленными и ожидаемыми значениями вычисляется для каждого из них;
3. Если оба расстояния меньше некоторого критического значения, то гипотеза о нормальном распределении данных принимается.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_162

🔠 Что означает термин "Variance Inflation Factor" и как он интерпретируется и есть ли ему аналоги ? (Част ь_1)

✔️Ответ: "Variance Inflation Factor" (VIF) относится к статистическому показателю, используемому для измерения степени мультиколлинеарности в модели линейной регрессии. Мультиколлинеарность происходит, когда две или более независимые переменные в модели сильно коррелируют друг с другом, что может исказить результаты регрессии.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
😎Ребят всем кому интересно, повысить свою квалификацию по облакам. В первую очередь будет интересно DevOps. Экзамен бесплатный 50 вопросов.

👉https://forms.yandex.ru/cloud/654b815543f74f10618809e2?utm_source=share2&utm_content=success
Регистрация на пилотный экзамен — Yandex Forms
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_162

🔠 Что означает термин "Variance Inflation Factor" и как он интерпретируется и есть ли ему аналоги ? (Част ь_2)

✔️Ответ: VIF равен 1, когда вектор предиктора ортогонален каждому столбцу матрицы проектирования для регрессии предиктора на другие ковариаты. В противном случае, если вектор предиктора не ортогонален всем столбцам матрицы проектирования для регрессии предиктора на другие ковариаты, VIF будет больше 1.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_162

🔠 Что означает термин "Variance Inflation Factor" и как он интерпретируется и есть ли ему аналоги ? (Часть_3)

Интерпретация VIF следующая: если VIF предиктора равен 5.27 (корень из 5.27 = 2.3), это означает, что стандартная ошибка для коэффициента этого предиктора в 2.3 раза больше, чем если этот предиктор имел бы корреляцию 0 с другими предикторами в модели. VIF измеряет количество завышенных дисперсий, вызванных мультиколлинеарностью.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
👋Ребята всем привет !!!

⬆️ttps://forms.yandex.ru/surveys/13480376.2b1615f1e5011d41a65aefbf1fb2a6a117fbcffd?utm_source=share2&utm_content=success
YaTalks 2023 — Yandex Forms - безопасность языковых моделей, новая конфа в Белграде, присутствие онлайн, всех заинтересованных лиц приглашаем!
Please open Telegram to view this post
VIEW IN TELEGRAM
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_162

🔠 Что означает термин "Variance Inflation Factor" и как он интерпретируется и есть ли ему аналоги ? (Часть_4)

В качестве аналога VIF можно рассмотреть "Tolerance Index" (TI), который также используется для измерения степени мультиколлинеарности в модели. TI также представляет собой отношение дисперсии оценок параметра к дисперсии модели.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_163

🔠Всегда ли PCA спасает от проблемы "проклятие размерности" и если нет, то что можно использовать вместо него ? (Часть_1)

РСА не всегда спасает от проклятия размерности, однако существует несколько продвинутых алгоритмов для решения данной проблемы:

t-SNE (t-Distributed Stochastic Neighbor Embedding): Этот алгоритм позволяет визуализировать данные высокой размерности в двух или трех измерениях, сохраняя при этом их локальную и глобальную структуру. Он основан на вероятностной модели, которая пытается сохранить близость между объектами в исходном пространстве и их представлением в пространстве меньшей размерности.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#tSNE #DimensionalityReduction #DataVisualization #HighDimensionalData #ProbabilisticModel #LocalLinearEmbedding
⬆️Ребята напоминаю, у нас есть отдельный канал по общению на темы ML & DL

👋Заходи будем рады видеть, вот ссылка на чат:
https://t.me/DenoseLABChat
Please open Telegram to view this post
VIEW IN TELEGRAM
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_163

🔠Всегда ли PCA спасает от проблемы "проклятие размерности" и если нет, то что можно использовать вместо него ? (Часть_2)

LLE (Locally Linear Embedding): LLE ищет линейные зависимости между соседними точками данных и пытается сохранить эти зависимости при снижении размерности. Алгоритм строит локальные линейные модели для каждой точки данных и затем находит низкоразмерное представление, которое наилучшим образом воспроизводит эти локальные модели.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#tSNE #DimensionalityReduction #DataVisualization #HighDimensionalData #ProbabilisticModel #LocalLinearEmbedding
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_163

🔠Всегда ли PCA спасает от проблемы "проклятие размерности" и если нет, то что можно использовать вместо него ? (Часть_3)

UMAP (Uniform Manifold Approximation and Projection): UMAP является относительно новым алгоритмом снижения размерности, который сочетает в себе методы локальной связности и глобальной структуры данных. Он строит граф связности между точками данных и затем находит низкоразмерное представление, которое сохраняет геометрическую структуру данных.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#tSNE #DimensionalityReduction #DataVisualization #HighDimensionalData #ProbabilisticModel #LocalLinearEmbedding
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_164

🔠Какие есть разновидности Adam optimization и в чем их разница ? (Часть_1)

✔️Ответ: AdamW вводит дополнительное слагаемое в обновление параметров модели для уменьшения влияния больших значений параметров. Это помогает справиться с проблемой увеличения значений параметров во время обучения нейронных сетей, что может приводить к переобучению. Дополнительное слагаемое регуляризует обновление параметров и способствует лучшей обобщающей способности модели;

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#AdamW #ParameterUpdate #Regularization #NeuralNetworks #Overfitting #Nadam #NesterovMomentum #AMSGrad
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_164

🔠Какие есть разновидности Adam optimization и в чем их разница ? (Часть_2)

Nadam (Nesterov-accelerated Adaptive Moment Estimation) является вариацией алгоритма Adam с коррекцией Nesterov Momentum. Она использует модификацию алгоритма Momentum для вычисления градиентов в моменты времени, отличные от текущего;

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#AdamW #ParameterUpdate #Regularization #NeuralNetworks #Overfitting #Nadam #NesterovMomentum #AMSGrad
😵Shell GPTприспособление для улучшения производительности из командной строки на основе ChatGPT OpenAI

👋Забудьте о шпаргалках и заметках, теперь вы сможете получать точные ответы прямо в своем терминале, и вы, вероятно, сократите свои ежедневные поиски в сети, сэкономив свое драгоценное время и усилия.

Ссылка на проект
Please open Telegram to view this post
VIEW IN TELEGRAM
💰Очень необычный кейс выкатили ребята по вот этой статье: https://www.theguardian.com/technology/2023/oct/01/ai-artificial-intelligence-fashion-trend-forecasting-style

😵Ребята "запилили" сетки и собрали данные по прогнозированию будущих трендов моды. Казалось бы, мода и прогноз, это всегда было на грани перформанса и искусства. Более того, модельный бизнес, испокон веков был очень рискованной затеей и главное дорогостоящей. Видимо пришло время и сюда забраться сетям. Итак, что же было выявлено:

⬆️ Искусственный интеллект (ИИ) может помочь прогнозировать модные тенденции, экономя деньги и сокращая отходы;

⬆️ Прогнозы могут быть составлены на срок до одного года вперед, и результаты могут быть конкретными.

⬆️ Инструменты ИИ могут помочь разнообразить коллекции, выявляя демографические тенденции.

⬆️ Аналитики должны обладать более широким пониманием культурной и политической атмосферы.
Please open Telegram to view this post
VIEW IN TELEGRAM
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_164

🔠Какие есть разновидности Adam optimization и в чем их разница ? (Часть_3)

AMSGrad (Adaptive Moment Estimation with Variance Correction) вводит исправление для оценки второго момента градиентов. Оно предотвращает возможное увеличение оценки второго момента в сравнении с алгоритмом RMSprop;

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#AdamW #ParameterUpdate #Regularization #NeuralNetworks #Overfitting #Nadam #NesterovMomentum #AMSGrad