DenoiseLAB
486 subscribers
1.33K photos
159 videos
3 files
1.57K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
👋Ребята всем привет !!!

⬆️ttps://forms.yandex.ru/surveys/13480376.2b1615f1e5011d41a65aefbf1fb2a6a117fbcffd?utm_source=share2&utm_content=success
YaTalks 2023 — Yandex Forms - безопасность языковых моделей, новая конфа в Белграде, присутствие онлайн, всех заинтересованных лиц приглашаем!
Please open Telegram to view this post
VIEW IN TELEGRAM
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_162

🔠 Что означает термин "Variance Inflation Factor" и как он интерпретируется и есть ли ему аналоги ? (Часть_4)

В качестве аналога VIF можно рассмотреть "Tolerance Index" (TI), который также используется для измерения степени мультиколлинеарности в модели. TI также представляет собой отношение дисперсии оценок параметра к дисперсии модели.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_163

🔠Всегда ли PCA спасает от проблемы "проклятие размерности" и если нет, то что можно использовать вместо него ? (Часть_1)

РСА не всегда спасает от проклятия размерности, однако существует несколько продвинутых алгоритмов для решения данной проблемы:

t-SNE (t-Distributed Stochastic Neighbor Embedding): Этот алгоритм позволяет визуализировать данные высокой размерности в двух или трех измерениях, сохраняя при этом их локальную и глобальную структуру. Он основан на вероятностной модели, которая пытается сохранить близость между объектами в исходном пространстве и их представлением в пространстве меньшей размерности.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#tSNE #DimensionalityReduction #DataVisualization #HighDimensionalData #ProbabilisticModel #LocalLinearEmbedding
⬆️Ребята напоминаю, у нас есть отдельный канал по общению на темы ML & DL

👋Заходи будем рады видеть, вот ссылка на чат:
https://t.me/DenoseLABChat
Please open Telegram to view this post
VIEW IN TELEGRAM
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_163

🔠Всегда ли PCA спасает от проблемы "проклятие размерности" и если нет, то что можно использовать вместо него ? (Часть_2)

LLE (Locally Linear Embedding): LLE ищет линейные зависимости между соседними точками данных и пытается сохранить эти зависимости при снижении размерности. Алгоритм строит локальные линейные модели для каждой точки данных и затем находит низкоразмерное представление, которое наилучшим образом воспроизводит эти локальные модели.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#tSNE #DimensionalityReduction #DataVisualization #HighDimensionalData #ProbabilisticModel #LocalLinearEmbedding
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_163

🔠Всегда ли PCA спасает от проблемы "проклятие размерности" и если нет, то что можно использовать вместо него ? (Часть_3)

UMAP (Uniform Manifold Approximation and Projection): UMAP является относительно новым алгоритмом снижения размерности, который сочетает в себе методы локальной связности и глобальной структуры данных. Он строит граф связности между точками данных и затем находит низкоразмерное представление, которое сохраняет геометрическую структуру данных.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#tSNE #DimensionalityReduction #DataVisualization #HighDimensionalData #ProbabilisticModel #LocalLinearEmbedding
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_164

🔠Какие есть разновидности Adam optimization и в чем их разница ? (Часть_1)

✔️Ответ: AdamW вводит дополнительное слагаемое в обновление параметров модели для уменьшения влияния больших значений параметров. Это помогает справиться с проблемой увеличения значений параметров во время обучения нейронных сетей, что может приводить к переобучению. Дополнительное слагаемое регуляризует обновление параметров и способствует лучшей обобщающей способности модели;

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#AdamW #ParameterUpdate #Regularization #NeuralNetworks #Overfitting #Nadam #NesterovMomentum #AMSGrad
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_164

🔠Какие есть разновидности Adam optimization и в чем их разница ? (Часть_2)

Nadam (Nesterov-accelerated Adaptive Moment Estimation) является вариацией алгоритма Adam с коррекцией Nesterov Momentum. Она использует модификацию алгоритма Momentum для вычисления градиентов в моменты времени, отличные от текущего;

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#AdamW #ParameterUpdate #Regularization #NeuralNetworks #Overfitting #Nadam #NesterovMomentum #AMSGrad
😵Shell GPTприспособление для улучшения производительности из командной строки на основе ChatGPT OpenAI

👋Забудьте о шпаргалках и заметках, теперь вы сможете получать точные ответы прямо в своем терминале, и вы, вероятно, сократите свои ежедневные поиски в сети, сэкономив свое драгоценное время и усилия.

Ссылка на проект
Please open Telegram to view this post
VIEW IN TELEGRAM
💰Очень необычный кейс выкатили ребята по вот этой статье: https://www.theguardian.com/technology/2023/oct/01/ai-artificial-intelligence-fashion-trend-forecasting-style

😵Ребята "запилили" сетки и собрали данные по прогнозированию будущих трендов моды. Казалось бы, мода и прогноз, это всегда было на грани перформанса и искусства. Более того, модельный бизнес, испокон веков был очень рискованной затеей и главное дорогостоящей. Видимо пришло время и сюда забраться сетям. Итак, что же было выявлено:

⬆️ Искусственный интеллект (ИИ) может помочь прогнозировать модные тенденции, экономя деньги и сокращая отходы;

⬆️ Прогнозы могут быть составлены на срок до одного года вперед, и результаты могут быть конкретными.

⬆️ Инструменты ИИ могут помочь разнообразить коллекции, выявляя демографические тенденции.

⬆️ Аналитики должны обладать более широким пониманием культурной и политической атмосферы.
Please open Telegram to view this post
VIEW IN TELEGRAM
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_164

🔠Какие есть разновидности Adam optimization и в чем их разница ? (Часть_3)

AMSGrad (Adaptive Moment Estimation with Variance Correction) вводит исправление для оценки второго момента градиентов. Оно предотвращает возможное увеличение оценки второго момента в сравнении с алгоритмом RMSprop;

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#AdamW #ParameterUpdate #Regularization #NeuralNetworks #Overfitting #Nadam #NesterovMomentum #AMSGrad
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_164

🔠Какие есть разновидности Adam optimization и в чем их разница ? (Часть_4)

AdaBelief использует адаптивные скорректированные оценки моментов и вводит дополнительные гиперпараметры для контроля скорости обучения и сглаживания оценок моментов;

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#AdamW #ParameterUpdate #Regularization #NeuralNetworks #Overfitting #Nadam #NesterovMomentum #AMSGrad
ElevenLabs больше не король — вышла нейронка HierSpeech++, которая может клонировать голос, при этом — бесплатно.

В поле «промт» загружаем референс голоса, а в Input Text пишем, что хотим озвучить. Минус пока один — работает только с английским, но разрабы обещают скоро выпустить мультиязыковую модель.

Можно затестить на Hugging Face или загрузить локально с GitHub.
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_164

🔠Какие есть разновидности Adam optimization и в чем их разница ? (Часть_5)

RAdam (Rectified Adam) вводит коррекцию для оценки первого момента градиентов, чтобы устранить проблему смещения оценки первого момента на начальных итерациях обучения. RAdam также включает в себя масштабирование скорости обучения на начальных итерациях для стабилизации процесса обучения.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#AdamW #ParameterUpdate #Regularization #NeuralNetworks #Overfitting #Nadam #NesterovMomentum #AMSGrad
👍Собес на Изи в DS №9.

👉https://www.youtube.com/watch?v=8p79RYV3QLc
😎Что такое преобразование Бокса-Кокса, код, теория.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.
Вот такой вот кейс выдали: https://www.popsci.com/technology/ai-reads-audiobooks/. ИИ все больше захватывает рынок услуг, и теперь очередь добралась и до книгочеев. Чтож... какие тенденции мы видим сейчас:

1/ Синтетические голоса могут транслировать старые тексты на платформах, таких как Spotify;

2/ Проект Gutenberg сотрудничает с исследователями для создания 5000 аудиокниг с искусственным интеллектом, включая классические произведения литературы;

3/ Нейронный алгоритм преобразования текста в речь обучается на миллионах примеров человеческой речи и имитирует ее;

4/ Алгоритм может генерировать разные голоса с разными акцентами и создавать пользовательские голоса за пять секунд;

5/ Он может улавливать интонации и изменения, которые люди добавляют при чтении слов;

6/ Большие языковые модели принимают текст и заполняют пробелы, а нейронные алгоритмы преобразования текста в речь принимают текст и создают звуки, соответствующие тексту;

7/ Следующие шаги заключаются в улучшении качества и расширении коллекции аудиокниг до всех 60 000 в Project Gutenberg.
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_165

🔠Какие алгоримы поиска аномалий в данных существуют и чем они отличаются ? (Часть_1)

DBSCAN (Density-Based Spatial Clustering of Applications with Noise) - алгоритм кластеризации данных, который основывается на плотностной информации о расположении объектов. Он определяет кластеры как плотные области в пространстве признаков, разделенные областями разреженности;

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DBSCAN #ClusteringAlgorithm #DensityBasedClustering #OutlierDetection #LOF #LocalOutlierFactor #IsolationForest
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_165

🔠Какие алгоритмы поиска аномалий в данных существуют и чем они отличаются ? (Часть_2)

LOF (Local Outlier Factor): LOF также использует информацию о плотности для обнаружения аномалий. Он вычисляет локальный коэффициент выброса для каждого объекта, основываясь на плотности окрестности данного объекта по сравнению с плотностью окрестности его соседей. Значения LOF выше единицы указывают на аномальные объекты;

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DBSCAN #ClusteringAlgorithm #DensityBasedClustering #OutlierDetection #LOF #LocalOutlierFactor #IsolationForest
Новое исследование позволило по новому взглянуть на такой известный феном как "родинка". В ходе которого выяснилось, что влиние ИИ идет семимльными шагами и уже стоит на службе у врачей и диагностов. (https://www.dailymail.co.uk/health/article-12818673/More-patients-prefer-artificial-intelligence-assess-skin-cancer-wait-doctor.html).

Вот что удалось выяснить: - 62% респондентов предпочли бы, чтобы их оценивал искусственный интеллект (ИИ), а не врач.

Национальная служба здравоохранения объявила о планах расширить использование технологии, которая может анализировать изображения на наличие признаков заболевания.
Исследования показывают, что искусственный интеллект так же точно, как врач, выявляет рак кожи и может завершить оценку за считанные секунды.
Почти 80% опрошенных заявили, что они уверены в том, что компьютер может помочь врачам анализировать фотографии возможного рака кожи.
"От меланомы в Великобритании ежегодно умирает около 2 300 человек, а от плоскоклеточной карциномы - около 1 000."

"Опрос 300 человек был проведен компанией Skin Analytics, специализирующейся на искусственном интеллекте, чье программное обеспечение DERM для выявления рака кожи уже используется в NHS."

"Программа анализирует изображения кожных новообразований, а затем решает, относится ли это к случаям низкого риска - то есть пациенту скажут, что дальнейшее обследование не требуется, - или к случаям высокого риска - то есть за дело возьмется консультант-дерматолог, чтобы поставить диагноз."
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_165

🔠Какие алгоритмы поиска аномалий в данных существуют и чем они отличаются ? (Часть_3)

Isolation Forest использует случайные деревья для изоляции аномалий. Он строит ансамбль изолирующих деревьев, разделяя объекты по случайным разделениям до тех пор, пока каждый объект не будет изолирован в отдельном листе. Аномалии обычно требуют меньшего числа разделений для изоляции, и поэтому имеют более короткий путь в дереве;

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#DBSCAN #ClusteringAlgorithm #DensityBasedClustering #OutlierDetection #LOF #LocalOutlierFactor #IsolationForest