FLAML - это облегченная библиотека Python, которая автоматически определяет точные модели машинного обучения. Он автоматически выбирает учащихся и гиперпараметры, что значительно экономит время и усилия специалистов по машинному обучению. Согласно их репозиторию на GitHub, некоторыми функциями
FLAML являются:
#FLAML | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
В Keras для работы с изображениями используются генераторы. Генератор загружает изображения с диска, подготавливает правильные ответы по каждому изображению для обучения с учителем, и отправляет данные в модель для обучения.
Чтобы использовать генераторы необходимо подготовить изображения специальным образом. Нужно создать папки для изображений по количеству используемых классов. В каждую папку переписать изображения, относящиеся к этому классу.
#Keras | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
Kivy — библиотека Python с открытым исходным кодом предоставляет естественный пользовательский интерфейс, к которому можно легко получить доступ через Android, iOS, Linux или Windows. Это лицензированный открытый исходный код MIT. Библиотека очень полезна при создании мобильных приложений и мультитач-приложений.
Изначально он был разработан для Kivy iOS. Он использует такие элементы, как графическая библиотека, обширную поддержку аппаратных средств, таких как мышь, клавиатура и широкий спектр виджетов. Его также можно использовать в качестве промежуточного языка для создания пользовательских виджетов.
#Kivy #data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
Деревья решений позволяют построить предсказания для задач на табличных данных. В этом видео рассмотрим, как формируется дерево решений для задачи регрессии - задача машинного обучения, где предсказывается вещественная величина.
#machine_learning | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
PySpark — позволяет специалистам по обработке данных использовать Apache Spark (который поставляется с интерактивной оболочкой для Python и Scala) и Python для взаимодействия с устойчивыми распределенными наборами данных. Популярной библиотекой, интегрированной в PySpark, является Py4J, которая позволяет Python динамически взаимодействовать с объектами JVM
#PySpark #data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
Язык программирования Python в последнее время все чаще используется для анализа данных, как в науке, так и коммерческой сфере. Этому способствует простота языка, а также большое разнообразие открытых библиотек.
#Данные | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
PyPDF2 - это библиотека для работы с PDF-файлами на Python. В нем есть функции для чтения и записи PDF-файлов, а также инструменты для извлечения содержащихся в них данных и манипулирования ими. Он идеально подходит для извлечения текста и изображений из PDF-файлов, объединения и разделения PDF-файлов, а также добавления аннотаций и полей форм в PDF-файлы.
#PyPDF2 #data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
В последнее время в диджитал набирает популярность профессия data scientist — в новом выпуске рассказываем, какие задачи выполняет специалист и какими навыками нужно обладать
#data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
Pydot — Эта библиотека помогает генерировать ориентированные и неориентированные графики. Он служит интерфейсом для Graphviz (написан на чистом Python). Вы можете легко показать структуру графиков с помощью этой библиотеки. Это пригодится, когда вы разрабатываете алгоритмы, основанные на нейронных сетях и деревьях решений.
#Pydot #data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
Только ленивый не говорит, что работа с big data — профессия будущего. А автор даже больше скажет: это потребность «здесь и сейчас». До 2003 года мы создали столько петабайт данных, сколько сегодня производим каждые два дня.
#big_data | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
В этом видео мы посмотрим на известный датасет Титаник и проведем небольшой Разведочный Анализ Данных. Я объясню что такое признаки, какие они бывают, мы определим ключевые признаки, уберем незначительные (для модели) признаки из датасета, научимся замещать несколько признаков путем объединения их в один, а так же заполним пропущенные значения.
#Data_Analysis | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
SMAC-3 — Библиотека для последовательного выстраивания автоматизации машинного обучения.
#SMAC3 #data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
Будем честны, процесс довольно занудный, и чтобы выцепить хоть какие-то значимые инсайты про наши данные — требуется потратить достаточное количество времени активно используя любимую библиотеку визуализации.
#EDA | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
Машинное обучение - звучит сложно, если нет удобных инструментов. В этом видео расскажем о 7 удобных инструментах для тех, кто занимается машинным обучением
#machine_learning | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
CatBoost — это библиотека градиентного бустинга, созданная Яндексом. Она использует небрежные (oblivious) деревья решений, чтобы вырастить сбалансированное дерево. Одни и те же функции используются для создания левых и правых разделений (split) на каждом уровне дерева.
#CatBoost #data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
Обработка даже пары гигабайт данных на ноутбуке может стать сложной задачей, только если он не оснащен большим количеством оперативной памяти и не обладает хорошей вычислительной мощностью.
Несмотря на это, специалистам по анализу данных все еще приходится искать альтернативные решения для этой проблемы. Есть варианты настроить Pandas, чтобы обрабатывать огромные наборы данных, купить GPU или купить облачные вычислительные мощности. В этой статье мы рассмотрим, как использовать Dask для больших наборов данных на локальном компьютере.
#Dask #machine_learning | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
Поговорим с вами о pet-проектах, как их выбирать, зачем они нужны и влияют ли при устройстве на работу. Также подкинем несколько идей проектов для лучшего понимая, что можно взять в работу.
#data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
Apache Superset — это инструмент для исследования данных и машинного обучения, созданный на основе популярных технологий с открытым исходным кодом
#Apache_Superset #data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
Компьютерное зрение - удивительная область, которая позволяет компьютерам видеть и понимать мир через обработку изображений и видео. Одним из наиболее популярных инструментов для работы с компьютерным зрением является библиотека OpenCV. В этой статье мы рассмотрим, как использовать OpenCV для распознавания объектов на изображении.
#OpenCV #machine_learning | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM
Продолжаем тему Линейной Регрессии и на этот раз мы работаем с Множественной (Мультивариативной) Линейной Регрессией. Это когда у нас две или более независимых переменных определяют значение зависимой.
#data_science | Просто Python
Please open Telegram to view this post
VIEW IN TELEGRAM