ML для ленивых: ИИ ушёл на самообучение
Можно ли учить искусственный интеллект без утомительной разметки данных? Ответ — да. В машинном обучении существуют методы, позволяющие модели самостоятельно работать с неразмеченными данными и находить в них закономерности.
При обучении с учителем мы показываем модели: это стул, а это — стол или шкаф. То есть датасет размеченный, информация о данных известна, мы точно знаем, какой результат хотим от них получить.
При обучении без учителя мы просто запускаем модель в большую комнату, и она сама разбирается с объектами: классифицирует, ищет аномалии и ассоциации. Однако такой метод применим не во всех случаях. В статье вы узнаете, в каких именно.
#статья #ml
Можно ли учить искусственный интеллект без утомительной разметки данных? Ответ — да. В машинном обучении существуют методы, позволяющие модели самостоятельно работать с неразмеченными данными и находить в них закономерности.
При обучении с учителем мы показываем модели: это стул, а это — стол или шкаф. То есть датасет размеченный, информация о данных известна, мы точно знаем, какой результат хотим от них получить.
При обучении без учителя мы просто запускаем модель в большую комнату, и она сама разбирается с объектами: классифицирует, ищет аномалии и ассоциации. Однако такой метод применим не во всех случаях. В статье вы узнаете, в каких именно.
#статья #ml
Простой и универсальный шаблон для задач машинного обучения
В видео показан универсальный шаблон предобработки данных в Scikit-Learn, применимый для широкого круга задач ML.
Шаблон состоит из двух этапов: на первом происходит предобработка признаков, на втором обучается модель, а именно логистическая регрессия.
Автор справедливо отмечает ограничения подхода. Тем не менее, при грамотной адаптации он может стать хорошей стартовой точкой.
#туториал #scikit_learn #ml
В видео показан универсальный шаблон предобработки данных в Scikit-Learn, применимый для широкого круга задач ML.
Шаблон состоит из двух этапов: на первом происходит предобработка признаков, на втором обучается модель, а именно логистическая регрессия.
Автор справедливо отмечает ограничения подхода. Тем не менее, при грамотной адаптации он может стать хорошей стартовой точкой.
#туториал #scikit_learn #ml
Эндрю Ын: возможности в области искусственного интеллекта
Эндрю — один из ведущих экспертов в области искусственного интеллекта, основатель проектов DeepLearningAI, Landing AI и Coursera. В этом видео представлен перевод недавней презентации, где он подробно рассказывает о своём ви́дении технологий ИИ в ближайшем будущем и их влиянии на нашу жизнь.
Ключевые темы выступления:
— Влияние больших языковых моделей на разработку ПО.
— Создание стартапов в сфере ИИ — советы эксперта.
— Значение ИИ в решении этических вопросов.
— Перспективы расширения обучения с учителем и возможности для бизнеса.
#видео #ml
Эндрю — один из ведущих экспертов в области искусственного интеллекта, основатель проектов DeepLearningAI, Landing AI и Coursera. В этом видео представлен перевод недавней презентации, где он подробно рассказывает о своём ви́дении технологий ИИ в ближайшем будущем и их влиянии на нашу жизнь.
Ключевые темы выступления:
— Влияние больших языковых моделей на разработку ПО.
— Создание стартапов в сфере ИИ — советы эксперта.
— Значение ИИ в решении этических вопросов.
— Перспективы расширения обучения с учителем и возможности для бизнеса.
#видео #ml
Базовый курс по машинному обучению: ключевые понятия и примеры
В этой лекции подробно разбираются основы машинного обучения — скалярное произведение, метрики, линейные пространства. Рассматриваются простые, но эффективные алгоритмы: метод ближайших соседей (kNN) и наивный байесовский классификатор.
Лекция будет особенно полезна тем, кто только начинает изучать машинное обучение. Но и для старичков это хорошая возможность повторить базу.
#лекция #ml
В этой лекции подробно разбираются основы машинного обучения — скалярное произведение, метрики, линейные пространства. Рассматриваются простые, но эффективные алгоритмы: метод ближайших соседей (kNN) и наивный байесовский классификатор.
Лекция будет особенно полезна тем, кто только начинает изучать машинное обучение. Но и для старичков это хорошая возможность повторить базу.
#лекция #ml
YouTube
Тренировки по ML. Лекция 1: Вводная по ML + knn
Ссылка на материалы лекции: https://github.com/girafe-ai/ml-course/tree/23f_yandex_ml_trainings/step01_intro
Задачи машинного обучения в очевидных и неочевидных местах. Формальная постановка задачи обучения с учителем. Основные понятия в машинном обучении.…
Задачи машинного обучения в очевидных и неочевидных местах. Формальная постановка задачи обучения с учителем. Основные понятия в машинном обучении.…
Линейная регрессия и регуляризация
В данном видео подробно разбираются различные аспекты линейных моделей в машинном обучении. Объясняется суть линейной регрессии как одного из простейших, но эффективных методов.
Помимо этого рассматриваются особенности аналитического решения со среднеквадратичной ошибкой, теорема Гаусса-Маркова и использование методов регуляризации (L1 и L2) для повышения устойчивости моделей.
#лекция #ml
В данном видео подробно разбираются различные аспекты линейных моделей в машинном обучении. Объясняется суть линейной регрессии как одного из простейших, но эффективных методов.
Помимо этого рассматриваются особенности аналитического решения со среднеквадратичной ошибкой, теорема Гаусса-Маркова и использование методов регуляризации (L1 и L2) для повышения устойчивости моделей.
#лекция #ml
YouTube
Тренировки по ML. Лекция 2: Линейная регрессия и регуляризация
Ссылка на материалы лекции: https://github.com/girafe-ai/ml-course/tree/23f_yandex_ml_trainings/step02_linear_regression
Линейная регрессия. Аналитическое и градиентное решения. Неустойчивость решения. Теорема Гаусса-Маркова.
Ограничения на вектор параметров.…
Линейная регрессия. Аналитическое и градиентное решения. Неустойчивость решения. Теорема Гаусса-Маркова.
Ограничения на вектор параметров.…
Генеративный искусственный интеллект для начинающих
Microsoft выпустила обучающий курс, состоящий из 12 уроков, охватывающих ключевые аспекты принципов генеративного искусственного интеллекта и разработки приложений. В процессе обучения вы создадите собственный стартап по генеративному искусственному интеллекту, получив понимание того, что требуется для реализации ваших идей.
Особенно привлекательно то, что курс имеет собственный сервер в Discord, где участники могут общаться, задавать вопросы и делиться впечатлениями.
#полезности #ml
Microsoft выпустила обучающий курс, состоящий из 12 уроков, охватывающих ключевые аспекты принципов генеративного искусственного интеллекта и разработки приложений. В процессе обучения вы создадите собственный стартап по генеративному искусственному интеллекту, получив понимание того, что требуется для реализации ваших идей.
Особенно привлекательно то, что курс имеет собственный сервер в Discord, где участники могут общаться, задавать вопросы и делиться впечатлениями.
#полезности #ml
Orca 2: гигантский прорыв в области логики и рассуждения ИИ
Ранее мы уже говорили, что касатки далеко не глупые, но с того момента они стали ещё умнее. А если без шуток, то Microsoft расширила проект Orca, выпустив — Orca 2.
С общим числом параметров в 13 миллиардов она значительно превосходит модели аналогичного размера и демонстрирует производительность, сопоставимую или даже превосходящую модели в 5-10 раз большего размера.
В этом видео вы найдёте подробный анализ статьи о Orca 2 и тесты её возможностей на практике.
HuggingFace:
Orca-2-13b | Orca-2-7b
#llm #ml #orca
Ранее мы уже говорили, что касатки далеко не глупые, но с того момента они стали ещё умнее. А если без шуток, то Microsoft расширила проект Orca, выпустив — Orca 2.
С общим числом параметров в 13 миллиардов она значительно превосходит модели аналогичного размера и демонстрирует производительность, сопоставимую или даже превосходящую модели в 5-10 раз большего размера.
В этом видео вы найдёте подробный анализ статьи о Orca 2 и тесты её возможностей на практике.
HuggingFace:
Orca-2-13b | Orca-2-7b
#llm #ml #orca
Telegram
Нейроканал
Доказательство того, что косатки — очень умные животные
Правда это не совсем косатка, а Orca AI — новая языковая модель от Microsoft на 13 миллиардов параметров, обученная ChatGPT 3.5 и 4. Да-да, одни модели уже вовсю припахали учить другие.
При этом,…
Правда это не совсем косатка, а Orca AI — новая языковая модель от Microsoft на 13 миллиардов параметров, обученная ChatGPT 3.5 и 4. Да-да, одни модели уже вовсю припахали учить другие.
При этом,…
10 ключевых алгоритмов машинного обучения
Эта статья описывает 10 наиболее распространённых алгоритмов ML. Среди них: линейная и логистическая регрессия, метод опорных векторов, деревья решений, случайный лес, наивный байесовский классификатор, K-ближайших соседей, K-средних, алгоритмы понижения размерности и AdaBoost.
Для каждого алгоритма приведено краткое описание работы, основные преимущества и недостатки, а также типичные сферы применения и примеры конкретных задач ML.
#статья #алгоритмы #ml
Эта статья описывает 10 наиболее распространённых алгоритмов ML. Среди них: линейная и логистическая регрессия, метод опорных векторов, деревья решений, случайный лес, наивный байесовский классификатор, K-ближайших соседей, K-средних, алгоритмы понижения размерности и AdaBoost.
Для каждого алгоритма приведено краткое описание работы, основные преимущества и недостатки, а также типичные сферы применения и примеры конкретных задач ML.
#статья #алгоритмы #ml
Forwarded from Точка входа в программирование
Полезные материалы по Data Science и машинному обучению
Data Science - довольно сложная сфера, особенно для новичков. С чего стоит начать, на какие темы стоит обратить особое внимание, а какие лучше оставить на потом? Ответы на эти и многие другие вопросы вы сможете найти в этой ценнейшей статье. Её автор — опытный MLOps-инженер в отделе Data- и ML-продуктов Selectel.
В материале не просто даются названия книг и курсов, которые полезно было бы прочитать, но и дается понятие о том, почему это важно знать конкретно эту информацию и чем она поможет в будущем.
#ml #bigdata
Data Science - довольно сложная сфера, особенно для новичков. С чего стоит начать, на какие темы стоит обратить особое внимание, а какие лучше оставить на потом? Ответы на эти и многие другие вопросы вы сможете найти в этой ценнейшей статье. Её автор — опытный MLOps-инженер в отделе Data- и ML-продуктов Selectel.
В материале не просто даются названия книг и курсов, которые полезно было бы прочитать, но и дается понятие о том, почему это важно знать конкретно эту информацию и чем она поможет в будущем.
#ml #bigdata
Все перечисленные библиотеки имеют открытый исходный код и предназначены в основном для питонистов.
Анализ, очистка и подготовка данных:
Pandas — быстрая и гибкая очистка и подготовка данных.
Numpy — предварительная обработка данных, применяется для математических вычислений.
Statsmodels — статистический анализ временных рядов, выживаемости и многого другого.
YData Profiling — упрощает этап EDA, тщательно анализируя ваши данные в одной строке кода.
Машинное и глубокое обучение:
Scikit-learn — ключевая библиотека машинного обучения, содержит реализацию популярных алгоритмов (регрессия, кластеризация).
Keras — создание, настройка моделей, работает поверх таких фреймворков, как TensorFlow.
TensorFlow — создание, моделирование и тренировка нейросетей.
XGBoost — предоставляет эффективные алгоритмы для задач регрессии, классификации и ранжирования.
CatBoost — градиентный бустинг.
#библиотеки #ml #deeplearning #python
Анализ, очистка и подготовка данных:
Pandas — быстрая и гибкая очистка и подготовка данных.
Numpy — предварительная обработка данных, применяется для математических вычислений.
Statsmodels — статистический анализ временных рядов, выживаемости и многого другого.
YData Profiling — упрощает этап EDA, тщательно анализируя ваши данные в одной строке кода.
Машинное и глубокое обучение:
Scikit-learn — ключевая библиотека машинного обучения, содержит реализацию популярных алгоритмов (регрессия, кластеризация).
Keras — создание, настройка моделей, работает поверх таких фреймворков, как TensorFlow.
TensorFlow — создание, моделирование и тренировка нейросетей.
XGBoost — предоставляет эффективные алгоритмы для задач регрессии, классификации и ранжирования.
CatBoost — градиентный бустинг.
#библиотеки #ml #deeplearning #python
Машинное обучение на Python: пет-проект по извлечению информации
В этом видео автор подробно рассматривает задачу извлечения определённых сущностей из сканов документов (имена, даты, локации и прочее), используя ML.
Этот проект может стать основой для вашего собственного продукта, отличным дополнением к портфолио, а также служить основой для расширения функционала: создания модели для ответов на вопросы по отсканированным документам и реализации семантического поиска.
#нейровидео #ml
В этом видео автор подробно рассматривает задачу извлечения определённых сущностей из сканов документов (имена, даты, локации и прочее), используя ML.
Этот проект может стать основой для вашего собственного продукта, отличным дополнением к портфолио, а также служить основой для расширения функционала: создания модели для ответов на вопросы по отсканированным документам и реализации семантического поиска.
#нейровидео #ml
YouTube
🔥 РЕАЛЬНЫЙ ПРОЕКТ Машинное Обучение на Python - Парсинг Сканов Документов с Нейросетью
Войти в IT: Вся Необходимая База. 3 Уровня Объяснения Материала
https://stepik.org/a/196646/pay?promo=6796137481ce3a53 Если не можешь напрямую покупать со Stepik, заказывай отсюда:
https://avecoders.github.io/ave-coder-courses/ Введение в Искусственный Интеллект…
https://stepik.org/a/196646/pay?promo=6796137481ce3a53 Если не можешь напрямую покупать со Stepik, заказывай отсюда:
https://avecoders.github.io/ave-coder-courses/ Введение в Искусственный Интеллект…
«Грокаем машинное обучение»
Порог входа:
Для читателей, знакомых с основами языка Python, материалы не требуют предварительных знаний в области машинного обучения. Здесь отсутствует сложный академический жаргон, а для полного понимания изложенных концепций достаточно базовых знаний алгебры. В процессе чтения вы создадите модели для идентификации спама, распознавания изображений и приступите к другим захватывающим проектам.
Описание:
«Машинное обучение — это набор методов анализа данных, основанных на алгоритмах, которые дают все более точные результаты по мере поступления новых данных. Машинное обучение лежит в основе систем рекомендаций, программ распознавания лиц, «умных» колонок и даже беспилотных автомобилей. Эта уникальная книга объясняет основные понятия машинного обучения на простых и доступных примерах, увлекательных упражнениях и запоминающихся иллюстрациях.»
#почитать #ml
Порог входа:
Для читателей, знакомых с основами языка Python, материалы не требуют предварительных знаний в области машинного обучения. Здесь отсутствует сложный академический жаргон, а для полного понимания изложенных концепций достаточно базовых знаний алгебры. В процессе чтения вы создадите модели для идентификации спама, распознавания изображений и приступите к другим захватывающим проектам.
Описание:
«Машинное обучение — это набор методов анализа данных, основанных на алгоритмах, которые дают все более точные результаты по мере поступления новых данных. Машинное обучение лежит в основе систем рекомендаций, программ распознавания лиц, «умных» колонок и даже беспилотных автомобилей. Эта уникальная книга объясняет основные понятия машинного обучения на простых и доступных примерах, увлекательных упражнениях и запоминающихся иллюстрациях.»
#почитать #ml