Машинное обучение RU
17.7K subscribers
1.58K photos
207 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
✔️ Нейросети не могут нарисовать Карлсона. Объявлен челлендж

https://tproger.ru/articles/nejroseti-ne-mogut-narisovat-karlsona-objavlen-chellendzh/

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
8😁5👍2🔥1
⭐️ Lbl2Vec

Lbl2Vec — это алгоритм для неконтролируемой классификации документов и неконтролируемого поиска документов.

pip install lbl2vec

🖥 Github
📜 Paper
📌 Dataset

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥1
ℹ️ OpenVINO Training Extensions

OpenVINO Training Extensions (OTE) — это среда интерфейса командной строки (CLI), предназначенная для обучения модели глубокого обучения с минимальным кодом. OTE позволяет разработчикам обучать/выводить/оптимизировать модели с разнообразным сочетанием архитектур моделей и методов обучения с помощью встроеннного набора инструментов.

🖥 Github: https://github.com/openvinotoolkit/training_extensions

🗒 Paper: https://arxiv.org/pdf/2211.17170v1.pdf

📍 Roadmap: https://github.com/openvinotoolkit/training_extensions#roadmap

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51🔥1
⭐️ AI Модель от Google Health впервые будет внедрена в клиническую практику

Google Health продала лицензию на свои AI-модели для обнаружения рака молочной железы и анализа маммографий медицинской компании iCAD, которая интегрирует их в свои инструменты визуализации. Это первый случай, когда модель от Google Health будет внедрена в клиническую практику. Технология Google Health позволяет выявлять рак молочной железы на ранних стадиях, когда успешное лечение наиболее вероятно.

Технология iCAD используется в клиниках и МРТ-центрах в США и во всем мире. Акции iCAD подскочили на 25% сразу после объявления о заключении сделки с Google Health, принадлежащей Alphabet Inc.

В соответствии с подписанным соглашением Google передала iCAD лицензию на использование технологии искусственного интеллекта для лечения рака молочной железы и оценки рисков развития заболевания. iCAD собирается применять лицензированную технологию для дальнейшего улучшения своих алгоритмов анализа раковых опухолей на 3D и 2D снимках и коммерциализировать разработанные продукты. ICAD будет использовать инфраструктуру Google Cloud.

❤️ Читать

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
✔️ DAMO-YOLO - Python модуль для быстрого и точного обнаружения объектов. В репозитории также доступны для скачивания несколько мощных, предобученных моделей.

🖥 GitHub

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥41
💨 Переосмысление анализа Survival: Как заставить вашу модель выдавать кривые Survival

В компаниях, управляемых данными, приложения для определения времени до события играют решающую роль в принятии решений (и даже больше, чем мы можем себе представить). Под анализом времени до события мы имеем в виду все методы, используемые для измерения времени, которое проходит до тех пор, пока не произойдут интересующие нас события. Это простое определение может сразу же обозначить все преимущества разработки приложений для работы с событиями времени в бизнес-контексте (и не только).

Происхождение времени до события связано с областью медицины, чтобы ответить на такие вопросы, как: «Как долго живут анализируемые лица?». По этой причине термины «выживаемость» и «время до события» обычно используются как синонимы. В настоящее время, с широкомасштабным внедрением машинного обучения, методологии выживания обычно находят применение и в компаниях, не относящихся к медицинскому/клиническому сектору. Производитель может быть заинтересован в оценке ожидаемого срока службы некоторых двигателей; поставщику услуг может потребоваться рассчитать ожидаемый срок службы своих клиентов; финансовое учреждение может оценить риск неплатежеспособности заемщика с течением времени.

С практической точки зрения, для моделирования проблемы времени до события существует надлежащий набор методологий. Было выпущено множество сред выживания, от классических линейных статистических методов до более сложных подходов к машинному обучению и передовых решений для глубокого обучения. Все они замечательны, но они должны учитывать допущение, свойственное теории моделирования выживания, что может привести к низкой адаптивности или ограничениям для реальных случаев использования. По этим причинам удобный способ заниматься анализом выживаемости может состоять в том, чтобы рассматривать моделирование времени до события как проблему классификации.

В этом посте мы предлагаем обобщение для проведения анализа выживания с прогностическими возможностями. Мы стремимся смоделировать время, прошедшее между временем начала и интересующим событием, как проблему множественной бинарной классификации. При правильной и простой постобработке мы можем получить надежные и надежные индивидуальные кривые выживания. Мы можем сделать это, используя наш любимый алгоритм классификации, сделав поиск по параметрам, как всегда, и учитывая возможность калибровки наших результатов, чтобы сделать их более надежными.

❤️ Читать

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍71🔥1
🖥 Математическая модель предсказала лидера ЧМ по футболу в 2022 году

Математическая модель учитывает данные прошлых лет и показатели сборных.

Дисклеймер: не используйте модель для ставок на спорт, ради бога! Это всего лишь математика, развлечение для гиков, а не оракул, которому можно безусловно доверять. Реальность куда более непредсказуема, поэтому поберегите свои деньги.

❤️ Читать

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51👎1🔥1🤩1
✔️ NVIDIA’s New AI: Generating 3D Models!

Генеративная модель высококачественных трехмерных текстурированных форм, из любых изображений

⭐️ Разбор статьи
➡️ Статья

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍71🔥1
✔️ Руководство по проектированию и features engineering.

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🥰1
⭐️ Нейросеть превращает фото людей в персонажей аниме

За последние две недели в интернете будто бы не происходит ничего интереснее, чем тестирование разных нейросетей.

Пока в рунете пытаются нарисовать Карлсона на Midjourney, в западном сегменте пользователи вовсю играют с нейронкой, которая способна сделать из вас аниме-персонажей по фотографии.

Нейросеть получила название Different Dimension Me — это новая функция китайской соцсети QQ. Соответственно, весь интерфейс в приложении на китайском языке, но он интуитивно понятный, и воспользоваться нейросетью можно и без знания языка.

Присылайте свои сгенерированные фото в комменты

➡️ Инструкция

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥1
👦 Объясните так, как будто мне 10 лет: простое описание популярного алгоритма кластеризации k-средних

В статье объясним всем новичкам в мире алгоритмов машинного обучения принципы работы алгоритма K-means (k-средних), пользующегося большой популярностью при решении задач кластеризации. Постараемся избавиться от устрашающих математических нюансов и объяснить на уровне интуитивного понимания.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍93🔥2
🖥 Решение крупномасштабных задач машинного обучения на Python

➡️ Читать

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1🥰1
✔️ Байесовские структурные временные ряды — прогнозирование.

https://nathanielf.github.io/post/bayesian_structural_timeseries/

@machinelearning_ru
👍71🔥1
✔️ Обзор универсальных оптимизаций нейросетей

Бывает так, что очень большая модель не помещается на видеоадаптере и требуется 250 ГБ оперативной памяти. В этой связи надо находить баланс, можно уменьшить размер модели в сто раз и, при этом, уменьшить точность всего на половину процентного пункта. Например, Bert можно сжать с 560 Мб до 2 Мб, почти без потери качества.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥2🥰1
Вышел новый выпуск подкаста “Деньги любят техно”. Александр Сахнов, руководитель отдела мультивариативного анализа X5 Group и Артём Летин, руководитель подразделения разработки моделей для корпоративного сегмента клиентов ВТБ обсудили метод А/В-тестирования для оценки изменений в бизнесе.

Подкаст можно послушать на любой удобной для вас площадке.
👍41🔥1
🖥 Оптимизация разметки данных с помощью активного обучения

Подавляющее большинство инструментов глубокого обучения позволяет нам быстро создавать новые приложения с потрясающей производительностью, от программ компьютерного зрения, классифицирующих сложные объекты по фотографиям, до анализаторов естественного языка при помощи извлечения семантики из текстов. Однако самым серьёзным узким местом всех этих методик является огромное количество данных, необходимое для обучения моделей — обычно сотни тысяч примеров для обучения.

Если вы приступаете к созданию с нуля классификатора изображений, допустим, для распознавания несвежих продуктов на конвейерной ленте, для сбора и ручной разметки всех этих фотографий вам понадобятся недели или месяцы. К счастью, существует множество глубоких нейронных сетей, уже обученных на больших массивах данных фотографий с большим количеством классов. Они позволяют устранить проблему «холодного запуска». Идея, лежащая в основе трансферного обучения заключается в использовании результатов работы этих моделей, фиксирующих высокоуровневую семантику изображений, в качестве входящих данных для новых классификаторов, решающих требуемую задачу. Это значительно уменьшает объём данных, которые нужно аннотировать вручную — с сотен тысяч до тысяч.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41🔥1
😼 Dirty cat для категориальных переменных, или почему простых методов кодирования может быть недостаточно

Постановка проблемы

Большинство ML-алгоритмов предназначены только для количественных переменных, то есть переменных, которые имеют числовое выражение и отражают размеры или масштабы объекта. К примеру, возраст, размеры объекта, площадь и прочее аналогичное. Однако, многие признаки, участвующие в предсказании таргета, будь то регрессия или классификация, являются категориальными, то есть выражаются нечисловыми значениями — например, группа крови, пол или политическая партия.

Важным этапом предобработки данных для построения модели в этом случае будет кодирование категориальных переменных, и оказывается, что не все методы одинаково хороши для всех случаев. Попробую разобраться почему. Классический подход — это one-hot кодирование (далее – ohe), когда для каждого уникального значения в категориальном столбце создается новый столбец. Затем эти фиктивные переменные заполняются нулями и единицами — 1 означает ИСТИНА, 0 означает ЛОЖЬ — то есть категории моделируются как взаимоисключающие.

➡️ Читать дальше
✔️ Документация dirty_cat

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥1
✔️ 3 Способа хранения данных в приложениях компьютерного зрения

Когда дело доходит до компьютерного зрения, хранение данных является критически важным компонентом. Вы должны иметь возможность хранить изображения для обучения модели, а также результаты обработки для проверки модели. Есть несколько способов добиться этого, каждый из которых имеет свои преимущества и недостатки. В этом посте мы рассмотрим три различных способа хранения данных в приложениях компьютерного зрения: файловую систему, хранилище объектов, подобное S3, и Reduct Storaget. Мы также обсудим некоторые плюсы и минусы каждого варианта.

➡️ Читать дальше

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51🔥1
✔️ Огромный список шпаргалок Data science на все случаи жизни.

Тщательно подобранный список потрясающих шпаргалок по науке о данных, машинному обучению и статистике чтобы решать любые задачи.

➡️ Шпаргалки

ставьте ❤️ и отправляйте друзьям

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍2🔥1