DenoiseLAB
486 subscribers
1.33K photos
159 videos
3 files
1.57K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_191

🔠 Какие применения может иметь кросс-масштабный поток в компьютерном зрении ? (Часть_3)

Интерпретация и классификация изображений: Кросс-масштабный поток может быть использован для анализа изображений на различных масштабах и извлечения информации, которая может быть полезна для интерпретации и классификации изображений. Это может помочь в задачах распознавания образов, классификации объектов или анализа контекста на разных масштабах.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#cross-scale flow #computer vision #image processing #object detection #image segmentation #feature extraction #image analysis #multi-scale analysis #image classification #data augmentation
🔥3
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_191

🔠 Какие применения может иметь кросс-масштабный поток в компьютерном зрении ? (Часть_4)

Создание пирамид изображений: Кросс-масштабный поток используется для создания пирамид изображений, где изображение разделяется на несколько масштабов. Это может быть полезно для различных задач, таких как многомасштабный анализ, масштабирование изображений или обработка изображений на разных уровнях разрешения.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#cross-scale flow #computer vision #image processing #object detection #image segmentation #feature extraction #image analysis #multi-scale analysis #image classification #data augmentation
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_191

🔠 Какие применения может иметь кросс-масштабный поток в компьютерном зрении ? (Часть_5)

Аугментация данных: Кросс-масштабный поток может быть использован для аугментации данных путем создания изображений на разных масштабах. Это может помочь улучшить обучение моделей компьютерного зрения и повысить их инвариантность к масштабу.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#cross-scale flow #computer vision #image processing #object detection #image segmentation #feature extraction #image analysis #multi-scale analysis #image classification #data augmentation
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_192

🔠 В чем разница между ResNet18 и ResNet34 ?

ResNet18 и ResNet34 - это две разные архитектуры нейронных сетей, основанных на концепции ResNet (Residual Network). Главное отличие между ними заключается в количестве слоев и глубине архитектуры.

ResNet18 состоит из 18 слоев, включая сверточные слои, пакетную нормализацию (Batch Normalization) и полносвязные слои. Он имеет базовый блок, состоящий из двух сверточных слоев и пропуска (skip connection). Также в ResNet18 используются downsampling-блоки для уменьшения размерности входных данных.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#cross-scale flow #computer vision #image processing #object detection #image segmentation #feature extraction #image analysis #multi-scale analysis #image classification #data augmentation
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_192

🔠 В чем разница между ResNet18 и ResNet34 ? (Часть_2)

С другой стороны, ResNet34 состоит из 34 слоев и имеет более глубокую архитектуру по сравнению с ResNet18. Она также использует базовые блоки с двумя сверточными слоями и пропусками, а также downsampling-блоки. Отличие заключается в количестве базовых блоков - ResNet34 имеет 34 базовых блока, в то время как ResNet18 имеет только 18 базовых блоков.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#cross-scale flow #computer vision #image processing #object detection #image segmentation #feature extraction #image analysis #multi-scale analysis #image classification #data augmentation
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_192

🔠 В чем разница между ResNet18 и ResNet34 ? (Часть_3)

Использование более глубокой архитектуры, такой как ResNet34, может помочь в извлечении более сложных иерархических признаков из изображений, что может быть полезно в более сложных задачах компьютерного зрения. Однако, увеличение глубины архитектуры может потребовать больше вычислительных ресурсов и времени для обучения и использования модели.

https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.

#cross-scale flow #computer vision #image processing #object detection #image segmentation #feature extraction #image analysis #multi-scale analysis #image classification #data augmentation
Fable Motion — аналог Adobe After Effects с нейросетями. Рисуем набросок — получаем готовое видео с покадровой анимацией. Бесплатный пробный период.
Please open Telegram to view this post
VIEW IN TELEGRAM
Mobirise — сгенерирует лендинг по текстовой подсказке. Бесплатно, понимает русский язык.
Please open Telegram to view this post
VIEW IN TELEGRAM
Xembly — ИИ-ассистент для автоматизации рутинных задач.
Please open Telegram to view this post
VIEW IN TELEGRAM
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_193

🔠 Расскажите про методы увеличения производительности СУБД ? (Часть_1)

Использование индексов: Индексы позволяют ускорить поиск и выборку данных, добавляя дополнительные структуры данных, которые позволяют быстро находить нужные записи. Создание индексов на часто запрашиваемые столбцы может существенно ускорить выполнение запросов.

Оптимизация запросов: Оптимизация запросов включает анализ и переписывание запросов таким образом, чтобы они выполнялись более эффективно. Это включает выбор правильных операций соединения, использование подзапросов, объединение запросов и т. д.

https://boosty.to/denoise_lab/donate - поддержать наш канал.

#database #performance #optimization #indexing #query optimization #data normalization #database configuration #data caching #scaling #data storage

👍Чем больше шеров и лайков, тем больше полезного контента я буду выкладывать.
🙊Разработчики из Google Research представили Osmo — нейросеть, которая разбирается в запахах.

👍Osmo не нужно что-то нюхать, чтобы определить запах компонента. Искусственныи‌ интеллект может рассказать, как пахнет определенныи‌ объект, зная только его структуру молекул. В неи‌росеть уже вшита база данных о более 5000 молекулярных соединениях.

👍Osmo — внутренняя разработка Google Research. Она недоступна для всех пользователеи‌, но ее будут предоставлять в парфюмерные лаборатории.

https://www.osmo.ai/blog/science-paper-shows-osmo-ai-passes-the-sniff-test
🤯Китай внедряет новую блокчейн-платформу под названием RealDID для проверки настоящих имен граждан. Проект будет сотрудничать с Blockchain Service Network и предоставит несколько вариантов использования, таких как подтверждение личного имени, зашифрованная защита данных и сертификация личных данных.

🤯 Приложение позволит гражданам Китая анонимно регистрироваться и входить на онлайн-порталы с использованием децентрализованных идентификаторов (DID), обеспечивая конфиденциальность данных. Проект подчеркивает стремление Китая к ускоренной реализации и развитию новых технологий в области блокчейна, искусственного интеллекта, цифровых валют и других областей.

Только вопрос, как коррелируется проверка имен граждан и анонимность ?? ))
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_193

🔠 Расскажите про методы увеличения производительности СУБД ? (Часть_2)

Нормализация базы данных: Нормализация базы данных помогает устранить избыточность данных и обеспечить более эффективное использование памяти и процессора. Хорошо спроектированная и нормализованная база данных может ускорить выполнение запросов.

Правильная конфигурация СУБД: Настройка параметров СУБД, таких как размер буфера, размер кэша и других параметров, может существенно повлиять на производительность. Необходимо проводить тестирование и оптимизацию конфигурации для достижения наилучшей производительности.

https://boosty.to/denoise_lab/donate - поддержать наш канал.

#database #performance #optimization #indexing #query optimization #data normalization #database configuration #data caching #scaling #data storage

👍Чем больше шеров и лайков, тем больше полезного контента я буду выкладывать.
👍1
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_193

🔠 Расскажите про методы увеличения производительности СУБД ? (Часть_3)

Физическое размещение данных: Правильное распределение данных на физических носителях (дисках) может существенно повлиять на скорость доступа к данным. Размещение данных на разных дисках или разделах, использование RAID-массивов и другие техники могут улучшить производительность.

Кэширование данных: Использование кэшей позволяет хранить часто используемые данные в оперативной памяти, что сокращает время доступа к данным на диске. Кэширование может быть реализовано на уровне СУБД или приложения.

https://boosty.to/denoise_lab/donate - поддержать наш канал.

#database #performance #optimization #indexing #query optimization #data normalization #database configuration #data caching #scaling #data storage

👍Чем больше шеров и лайков, тем больше полезного контента я буду выкладывать.
🅰️🅰️🅰️Ребята всем привет, запускаем рубрику странные и необычные вопросы на собесах которые вам задавили, делитесь своим опытом, и что пошло не так ? Особенно крутые вопросы подробно разберем и просмотрим.

🔤🔤🔤Написать свой вопрос можно в коменты, все сообщения я прочитаю и внимательно дам экспертную оценку.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤐🤐🤐Очень интересное наблюдение провел. Сижу на Kaggle и решаю таски по продуктовой аналитике и предсказанию поведения пользователей на одном из соревнований. Есть датасет на 64 фичи. Он сборный из несколько частей, то есть исходный датасет состоит из 6 разношерстных датасетов, которые собирались как лоскутное одеяло по кускам и после этого делалось очистка датасета и генерация новых фичей.

🥵🥵🥵Стояла задача оптимизации решения, чтобы уменьшить размер датасета (датафрейма), но вместе с тем не потерять в точности по скору модели, при этом надо было пройти еще по памяти, так как Kaggle, дает лишь 30 гигабайт оперативной памяти на решение. На чанки разбивать не хотелось, поэтому было принято решение все ужать до единого куска и попробовать поработать плотно с ним.

😶‍🌫️😶‍🌫️😶‍🌫️Перерыл всю сеть на все возможные комбинации по решению, плотно поработал с разрядностью данных и представлением фичей в общем контексте, какие ролевантные какие нет, и как их можно использовать в более удобном формате, чтобы они давали больше профита на финале. То есть пошел не накручивать модели и их гиперпараметры, больше углубился в математику "сырых" данных.

🥳🥳🥳В итоге, удалось время обучения сократить на целый час и 30 минут, Карл !!! 1.5 часа выигрыша. Невероятно, я предполагал, что будет выигрышь, но не настолько круто, при этом скор по модели был улучшен.

😆😆😆 Да, соревнование не новое, но мне захотелось "потестить" и посмотреть, что в итоге получится и поработать с данными в более "спокойной" обстановке плюс здесь есть обширный набор фичей. В общем, плотно заходим на Kaggle и мутим там таски, благо на это сейчас есть время и ресурсы. В целом я доволен результатом, но можно еще улучшить. Все пруфы прилагаю. Из 2621 решения мое оказалось на 401. Максимальный скор, 0.40914, я показал 0.40223. В целом можно еще дожимать и поднимать скор, но задача была именно поработать с сырыми данными и посмотреть профит от оптимизации. Считаю в целом получилось.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_193

🔠 Расскажите про методы увеличения производительности СУБД ? (Часть_4)

Масштабирование: Если нагрузка на базу данных становится слишком большой, можно применить методы масштабирования, такие как горизонтальное или вертикальное масштабирование. Горизонтальное масштабирование включает добавление дополнительных серверов или узлов для распределения нагрузки, а вертикальное масштабирование - использование более мощного оборудования.

Использование хранилищ данных: Для некоторых типов данных и запросов, использование специализированных хранилищ данных, таких как колоночные базы данных или базы данных в памяти, может значительно повысить производительность.

https://boosty.to/denoise_lab/donate - поддержать наш канал.

#database #performance #optimization #indexing #query optimization #data normalization #database configuration #data caching #scaling #data storage

👍Чем больше шеров и лайков, тем больше полезного контента я буду выкладывать.