DenoiseLAB
486 subscribers
1.33K photos
159 videos
3 files
1.57K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
https://arxiv.org/pdf/2305.08596.pdf - рекомендуется к прочтению, DarkBert.
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_183

Сезонная ARIMA (SARIMA):

Преимущества:
- Учитывает как общую структуру ряда, так и сезонные паттерны.
- Может быть эффективна для данных с явно выраженной сезонностью.

Недостатки:
- Подбор параметров модели может быть сложным и требовать больше данных.
- Может быть неэффективна для данных без сезонности.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#time_series #AR_model #MA_model #autoregressive_model #moving_average_model #forecasting
😭Duolingo массово увольняет переводчиков, заменяя их нейросетями.

🤨Компания начала сокращать людей еще в середине декабря, но обсуждение этого вопроса активизировалось на Reddit только недавно. По некоторым оценкам, количество уволенных переводчиков может достигать тысячи человек.
Please open Telegram to view this post
VIEW IN TELEGRAM
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_184

🔠 Какие есть преимущества и недостатки у экспоненциального сглаживания ?

Преимущества:
- Проста в реализации и интерпретации.
- Может быть эффективна для данных с трендами и сезонностью.

Недостатки:
- Не учитывает сложные зависимости и нелинейности в данных.
- Может быть неэффективна для данных с быстро меняющимися трендами или большими выбросами.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#time_series #AR_model #MA_model #autoregressive_model #moving_average_model #forecasting
⚛️Аналитика: На самом деле ситуаций не такая страшная (Duolingvo увольняет тысячи сотрудников), переводчики перейдут в штат проектов занимающихся нейросетями и могут занять позиции тестировщиков сетей, фасилитаторов а также позиции в командах RedTeam и генерации контента, поставщиков и составителей узко-специализированных датасетов и аналитиков, которые занимаются консолидацией знаний в области языка.

⚛️Более того, скорое всего появятся Language-OSINT, эти люди будут заниматься выявлением малейших нововведений и изменений в языке и своевременно вносить правки в языковые модели (уже есть преценденты когда, особенно в молодежном сленге или профессиональном), для их молниеносного обучения. Так что спецов будет катастрофически не хватать, а 95% задач уйдет на автоматизацию. Резко возрастет спрос на носителей языка. Сюда же можно отнести задачи на выявление фейков.

⚛️То, что идет резкое сокращение гуманитарных специальностей это конечно шок для рынка, но не смертельный, более того, общая тенденция на рынке развития технологий показывает, что в скором времени, мы упремся в жесткую нехватку таких кадров и придем снова на исходную точку.

⚛️Более того, рынок разделится на потребление генерируемого контента и живого общения с носителем или экспертом в данной области. Таким образом мы видим тренд устойчивый на изменения не только по перераспределению рынка услуг, но и перераспределение рынка доставщиков услуг.

⚛️Говоря глобально, компании "опьяненные" успехом ИИ сейчас в долгой перспективе проиграют, так как они убирают кадры, за которыми им надо будет гоняться в будущем. Сетку можно нагенерить, обучить человека это долгий процесс, но его знания куда более хаотичны и многовекторны.

⚛️Модели надо будет переобучать, и выживет тот у кого эта модель будет качественнее, а без людей и их мозгов этого по нормальному не сделать. А это именно, то что и потребуется в будущем. Новость с Duolingvo говорит лишь о том, что их стратегия рассчитана на короткий период. Бизнес надо масштабировать, а не рубить его на корню, хотя, цели руководства нам не известны до конца.

⚛️На уровне государства, этот тренд увидел Китай в свое время и понял, что людей надо переводить на другие работы и переобучать их, тем самым снижается риск эмиграции, криминала, и прочих социальных вопросов. Как обычно, кадры решают все.

Ситуация все больше напоминает вот этот ролик: https://www.youtube.com/watch?v=7pd1wZa-kgk

Ждемс...
Please open Telegram to view this post
VIEW IN TELEGRAM
3
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_185

🔠 Какие есть преимущества и недостатки у структурные временные ряды ?

Преимущества:
- Учитывает различные компоненты временного ряда, включая тренды, сезонность и внешние факторы.
- Может быть эффективна для сложных временных рядов с несколькими компонентами.

Недостатки:
- Требует дополнительной информации о внешних факторах и их влиянии на ряд.
- Подбор параметров модели может быть сложным и требовать экспертных знаний.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#time_series #AR_model #MA_model #autoregressive_model #moving_average_model #forecasting
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_186

🔠 Какие есть преимущества и недостатки у моделей глубокого обучения ?

Преимущества:
- Способны улавливать сложные зависимости и нелинейности в данных.
- Могут быть эффективны для больших объемов данных и сложных временных рядов.

Недостатки:
- Требуют большого объема данных для обучения.
- Могут быть вычислительно сложными и требовать мощности вычислительных ресурсов.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#time_series #AR_model #MA_model #autoregressive_model #moving_average_model #forecasting
Новое веяние из Китая, ИИ наступает полным ходом.
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_187

🔠Что такое InfluxDB ? (Часть_1)

InfluxDB это временнАя база данных, специально разработанная для обработки и хранения временных данных. Она предназначена для сбора, хранения, визуализации и анализа данных, сгенерированных различными источниками, такими как датчики, устройства интернета вещей (IoT), системы мониторинга и другие приложения, где временные данные играют важную роль.

InfluxDB разработана с учетом высокой производительности и масштабируемости, что позволяет эффективно обрабатывать большие объемы данных, поступающих с высокой скоростью. Она основана на модели данных событийного журнала (event-based log), где каждая запись содержит временную метку (timestamp) и набор полей (fields), которые описывают измеряемые значения или свойства.

https://www.influxdata.com

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_187

🔠Что такое InfluxDB ? (Часть_2)

InfluxDB предлагает SQL-подобный язык запросов для извлечения данных, а также предоставляет API для записи и чтения данных. Она также обладает функциональностью агрегации, визуализации и возможностью создания наборов данных для долгосрочного хранения.

InfluxDB широко используется в области мониторинга и аналитики систем, где требуется обработка и хранение временных данных, таких как метрики производительности, логи, события и другие временные ряды.

https://www.influxdata.com

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#InfluxDB #database #time-series #data-storage #data-processing #monitoring #analytics #IoT #event-based-log #SQL #data-visualization #data-aggregation
В 2025 году МВД планирует запустить две системы «Клон» и «Конъюнктура».

«Клон» будет использоваться для выявления фактов подделки видеоизображений, которые могут быть в интересах правоохранительной деятельности.

«Конъюнктура» должна прогнозировать негативные события и чрезвычайные ситуации, а также моделировать сценарии реагирования на них.

@budni_manipulyatora

https://www.vedomosti.ru/technology/articles/2024/01/11/1014513-mvd-privlechet-neiroseti-k-poisku-pravonarushitelei
https://examregistration.github.com/login?ReturnUrl=%2Foverview - открыли доступ на регистрацию к экзамену по github, заинтересованные лица приглашаются к тесту.
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_188

🔠Что такое GLCM ?

GLCM - это матрица, которая представляет относительное распределение пикселей различных значений яркости в изображении. Гистограмма локальных бинарных шаблонов вычисляет статистические меры, такие как контрастность, однородность и корреляция, основываясь на GLCM.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#text analysis #GLCM #local binary pattern #image processing #computer vision #texture analysis #image classification #pattern recognition #feature extraction
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_189

🔠 Что такое LBP ?

Локальный бинарный шаблон (LBP) - это метод, который кодирует локальную структуру текстуры пикселей в изображении. Он работает путем сравнения центрального пикселя с его окружающими пикселями и присваивает бинарный код каждому пикселю в зависимости от его отношения к центральному пикселю. LBP может быть использован для извлечения текстурных характеристик, таких как шероховатость, текстурная грубость и микроструктуры изображения.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#text analysis #GLCM #local binary pattern #image processing #computer vision #texture analysis #image classification #pattern recognition #feature extraction
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_190

🔠 Что такое MobileUNet ? (Часть_1)

MobileUNet (Mobile U-Net) - это архитектура нейронной сети, основанная на U-Net, которая была специально разработана для обработки изображений на мобильных устройствах с ограниченными вычислительными ресурсами, такими как смартфоны или планшеты.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#MobileUNet #neural network architecture #image segmentation #U-Net #computer vision #mobile devices #optimization #convolutional neural network #feature extraction #image processing
2
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_190

🔠 Что такое MobileUNet ? (Часть_2)

U-Net - это архитектура нейронной сети, которая широко используется для сегментации изображений, в основном в медицинском изображении. Она состоит из энкодера и декодера, которые связаны между собой. Энкодер позволяет извлекать высокоуровневые признаки из изображения, а декодер восстанавливает пространственную информацию и генерирует сегментированное изображение.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#MobileUNet #neural network architecture #image segmentation #U-Net #computer vision #mobile devices #optimization #convolutional neural network #feature extraction #image processing
🎄Ребята напоминаю у нас есть чатик для общения, милости просим, кто в теме, обсуждаем все от политических событий, машинки до кибербеза. Рады всем, открыты любым мнениям и взглядам. Вот ссылочка:

👋 https://t.me/DenoseLABChat
Please open Telegram to view this post
VIEW IN TELEGRAM
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_190

🔠 Что такое MobileUNet ? (Часть_3)

MobileUNet оптимизирована для работе на мобильных устройствах, используя различные техники, такие как свертки с малыми фильтрами, сокращение числа каналов и применение точечных сверток для снижения вычислительной сложности и уменьшения размера модели. Такие оптимизации позволяют использовать MobileUNet на устройствах с ограниченными вычислительными ресурсами, при этом сохраняя достаточную точность сегментации изображений.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#MobileUNet #neural network architecture #image segmentation #U-Net #computer vision #mobile devices #optimization #convolutional neural network #feature extraction #image processing