У нас есть модель линейной регрессии с регуляризацией. Какое влияние оказывает увеличение lambda на смещение и дисперсию?
  Anonymous Quiz
    18%
    Увеличивает смещение, увеличивает дисперсию
      
    47%
    Увеличивает смещение, уменьшает дисперсию
      
    22%
    Уменьшает смещение, увеличивает дисперсию
      
    13%
    Уменьшает смещение, уменьшает дисперсию
      
    👍5
  Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
  
🥷 Путь ML-самурая: от школьной математики до передового машинного обучения
В новой статье рассказываем, что именно нужно изучить, чтобы стать ML-специалистом. Начинаем с простого — базовой математики, — а заканчиваем многомерным анализом и нейросетями.
О том, как не потерять мотивацию в процессе обучения, тоже написали 🤝 
👉 Читать статью
В новой статье рассказываем, что именно нужно изучить, чтобы стать ML-специалистом. Начинаем с простого — базовой математики, — а заканчиваем многомерным анализом и нейросетями.
👉 Читать статью
👍5
  ✍️ Воскресный разбор задач
Сегодня разберём вопрос про зависимость смещения и дисперсии от параметра lambda в линейной регрессии с регуляризацией.
🔹Регуляризация — это способ добавить к модели дополнительное ограничение на вектор весов. Обычно для этого используются L1- и L2-нормы. Их смысл заключается в добавлении к формуле линейной регрессии регуляризационного члена, который состоит из суммы весов, умноженной на lambda — коэффициент регуляризации.
Нетрудно догадаться, что lambda довольно сильно влияет на качество итогового решения. Если этот параметр, например, равен 1, то мы не прибавляем к формуле ничего кроме суммы весов, а если он равен 10, то прибавка, соответственно, становится десятикратной суммой весов.
👀 А теперь, держа это знание в голове, подумаем: что будет со смещением и дисперсией, когда мы увеличиваем lambda?
Напомним, смещение — это матожидание разности между истинным значением и тем, что было выдано моделью. Дисперсия — это разброс ответов модели, то есть мера того, насколько эти ответы варьируются в зависимости от данных. 
Если мы прибавляем к ответу модели сумму весов, да ещё и умноженную на 10, то матожидание между этим ответом и истинным значением, конечно, станет больше. То есть смещение увеличится. Но при этом модель будет, вероятно, лучше обобщать данные, и её дисперсия уменьшится. Поэтому стоит помнить, что что слишком большое значение lambda может привести к тому, что модель начнёт недообучаться.
#разбор_задач
Сегодня разберём вопрос про зависимость смещения и дисперсии от параметра lambda в линейной регрессии с регуляризацией.
🔹Регуляризация — это способ добавить к модели дополнительное ограничение на вектор весов. Обычно для этого используются L1- и L2-нормы. Их смысл заключается в добавлении к формуле линейной регрессии регуляризационного члена, который состоит из суммы весов, умноженной на lambda — коэффициент регуляризации.
Нетрудно догадаться, что lambda довольно сильно влияет на качество итогового решения. Если этот параметр, например, равен 1, то мы не прибавляем к формуле ничего кроме суммы весов, а если он равен 10, то прибавка, соответственно, становится десятикратной суммой весов.
👀 А теперь, держа это знание в голове, подумаем: что будет со смещением и дисперсией, когда мы увеличиваем lambda?
Если мы прибавляем к ответу модели сумму весов, да ещё и умноженную на 10, то матожидание между этим ответом и истинным значением, конечно, станет больше. То есть смещение увеличится. Но при этом модель будет, вероятно, лучше обобщать данные, и её дисперсия уменьшится. Поэтому стоит помнить, что что слишком большое значение lambda может привести к тому, что модель начнёт недообучаться.
#разбор_задач
👍3
  🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта. 
В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги
👉Подписаться👈
В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги
👉Подписаться👈
👍1
  😢8
  👍4
  Каково расстояние Жаккара между векторами a = 0111010101 и b = 0100011111?
  Anonymous Quiz
    41%
    0.5
      
    22%
    1.5
      
    18%
    2.5
      
    19%
    3
      
    👍7
  Forwarded from Библиотека питониста | Python, Django, Flask
  
🎨 Как сделать генератор ASCII-графики на Python 
Энтузиасты делают ASCII-ремейки «Звездных войн» и ролевые ASCII-игры. А мы напишем GUI-приложение для конвертации изображений в олдскульную ASCII-графику с помощью Python и библиотеки Pillow.
👉 Читать подробное руководство
Энтузиасты делают ASCII-ремейки «Звездных войн» и ролевые ASCII-игры. А мы напишем GUI-приложение для конвертации изображений в олдскульную ASCII-графику с помощью Python и библиотеки Pillow.
👉 Читать подробное руководство
👍2
  🔥1
  Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
  
👨💼 Молодая профессия: всё о бизнес-аналитике
Работа бизнес-аналитика высоко оплачивается, имеет массу перспектив и востребована на рынке труда. Специалисты в этой области помогают устранять проблемы на предприятиях, повышают их репутацию и делают конкурентоспособными на рынке.
В статье на Proglib разбираемся, какие задачи выполняет бизнес-аналитик, какие навыки ему необходимы и как этому обучиться.
👉 Читать статью
Работа бизнес-аналитика высоко оплачивается, имеет массу перспектив и востребована на рынке труда. Специалисты в этой области помогают устранять проблемы на предприятиях, повышают их репутацию и делают конкурентоспособными на рынке.
В статье на Proglib разбираемся, какие задачи выполняет бизнес-аналитик, какие навыки ему необходимы и как этому обучиться.
👉 Читать статью
❤1
  Нулевая корреляция между любыми двумя случайными переменными означает, что они независимы.
  Anonymous Quiz
    57%
    Правда
      
    43%
    Ложь
      
    ❤4
  ❗ Сложность алгоритмов
Простое описание сложности алгоритмов в одном видео.
Рассказывается с использованием графиков и хорошим объяснением происходящего.
👉 Ссылка
Простое описание сложности алгоритмов в одном видео.
Рассказывается с использованием графиков и хорошим объяснением происходящего.
👉 Ссылка
❤4
  Forwarded from Proglib.academy | IT-курсы
🏢 Как компании превращают данные в деньги: обзор российских практик Data Science 
Обсуждаем, куда податься с полученными навыками — как наука о данных используется в российских компаниях. Кейсы коммерческого использования Data Science на территории России в нашей статье: финансы и ритейл, наука и производство, информационные системы и индустрия развлечений.
Хотите приобрести навыки для выполнения этих кейсов, тогда забирайте курсы:
🔵  Математика для Data Science
🔵  Основы программирования на Python
👉Ссылка на статью
Обсуждаем, куда податься с полученными навыками — как наука о данных используется в российских компаниях. Кейсы коммерческого использования Data Science на территории России в нашей статье: финансы и ритейл, наука и производство, информационные системы и индустрия развлечений.
Хотите приобрести навыки для выполнения этих кейсов, тогда забирайте курсы:
👉Ссылка на статью
Please open Telegram to view this post
    VIEW IN TELEGRAM
  👍2
  🧑💻 Статьи для IT: как объяснять и распространять значимые идеи
Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.
Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.
Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.
👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.
Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.
Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.
👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
👍1
  Какой признак указывает на то, что распределение данных не имеет колоколообразную форму?
  Anonymous Quiz
    24%
    99.7% всех данных находится в диапазоне 6 стандартных отклонений
      
    69%
    Среднее значительно меньше медианы
      
    7%
    Нет выбросов
      
    👍3
  Forwarded from Азбука айтишника
📊 Data Science и Big Data: сходства и различия
В нашей статье разложим по полочкам сходства и различия между специализациями Data Science и Big Data.
🌻  Что внутри?
▪️ Термины
▪️ Применение
▪️ Навыки
▪️ Карьерные перспективы
👉  Ссылка на Статью
В нашей статье разложим по полочкам сходства и различия между специализациями Data Science и Big Data.
▪️ Термины
▪️ Применение
▪️ Навыки
▪️ Карьерные перспективы
Please open Telegram to view this post
    VIEW IN TELEGRAM
  ❤1
  Что выведет код с картинки выше?
  Anonymous Quiz
    12%
    [('A', 'B'), ('C', 'D')]
      
    9%
    [('A', 'B'), ('B', 'C'), ('C', 'D')]
      
    78%
    [('A', 'B'), ('A', 'C'), ('A', 'D'), ('B', 'C'), ('B', 'D'), ('C', 'D')]
      
    1%
    Ошибку
      
    