Proglib.academy | IT-курсы
3.23K subscribers
982 photos
17 videos
9 files
1.11K links
Proglib.academy — онлайн-курсы для программистов от создателей «Библиотека программиста».

Все курсы — https://proglib.io/w/9f60aed6

По любым вопросам: @n_kalinchikov
Download Telegram
✏️ Разбор задачи с экзамена ШАД

Условие: Пусть 1️⃣. Найдите значение параметра a, для которого множество (k, l, m, n) будет линейно зависимым.

Подсказка: Используйте метод Гаусса.

Решение: Требование задачи равносильно вырожденности матрицы коэффициентов. Совершая над ней элементарные преобразования строк и столбцов, получим: 2️⃣ Последняя матрица вырожденна 3️⃣

Ответ: 37/13

#задачи_шад
Что вы знаете про ансамблевые методы?

Когда речь заходит о машинном обучении, многие сразу вспоминают нейронные сети или деревья решений. Однако есть особый класс методов, способных значительно улучшить качество моделей — ансамблевые методы.

Ансамблевые методы — это подход в машинном обучении, при котором несколько моделей (часто простых) объединяются для получения более точного и надежного результата. Основная идея в том, что объединение слабых моделей в определенной структуре может дать гораздо более мощную «супермодель».

🌻 Почему ансамблевые методы эффективны?

Ансамбли используют разнообразие: разные модели могут компенсировать ошибки друг друга. Они снижают вероятность переобучения и позволяют обрабатывать сложные паттерны данных.

Подтяните свои знания о машинном обучении вместе с нашим курсом:
🔵 Базовые модели ML и приложения

#машинное_обучение
Please open Telegram to view this post
VIEW IN TELEGRAM
🏢 Как компании превращают данные в деньги: обзор российских практик Data Science

Обсуждаем, куда податься с полученными навыками — как наука о данных используется в российских компаниях. Кейсы коммерческого использования Data Science на территории России в нашей статье: финансы и ритейл, наука и производство, информационные системы и индустрия развлечений.

Хотите приобрести навыки для выполнения этих кейсов, тогда забирайте курсы:
🔵 Математика для Data Science
🔵 Основы программирования на Python

👉Ссылка на статью
Please open Telegram to view this post
VIEW IN TELEGRAM
📊 Data Science и Big Data: сходства и различия

В нашей статье разложим по полочкам сходства и различия между специализациями Data Science и Big Data.

🌻 Что внутри?

▪️ Термины
▪️ Применение
▪️ Навыки
▪️ Карьерные перспективы

👉 Ссылка на Статью
Please open Telegram to view this post
VIEW IN TELEGRAM
3️⃣ пет-проекта для начинающего ML специалиста

С проектами найти работу проще, а на ML-собеседованиях это даст вам значительное преимущество. Вот подборка из 5 проектов, которые стоит сделать каждому ML новичку:

1️⃣ Кредитный скоринг
Определите, стоит ли давать кредит. Возьмите датасет с Kaggle (например, GiveMeSomeCredit). Сделайте EDA, подготовьте данные, реализуйте базовую модель (логистическую регрессию), затем попробуйте другие: случайный лес, бустинг и т.п. Сравните метрики и презентуйте результаты. Отличный проект для новичков.

2️⃣ Наивный Байесовский классификатор (НБК)
Реализуйте классификатор спама. Подготовьте данные: удалите числа, знаки препинания, сделайте стемминг/лемматизацию. Затем постройте словарь и вычислите вероятности. Пример реализации: Naive Bayes на Kaggle. Углубитесь в теорию: вероятностные модели.

3️⃣ MLOps
Попробуйте развернуть минимальный прод: телеграм-бот или FastAPI. Освойте инструменты для автоматизации пайплайна (AirFlow) и запустите всё в облаке. Для более серьёзных проектов: изучите Docker, Kubernetes, Hadoop, Spark.

Заинтересовали проект, но не знаешь с чего начать? Тогда забирай курс:

🔵 Базовые модели ML и приложения
Please open Telegram to view this post
VIEW IN TELEGRAM
Привет, друзья! 👋

Мы готовим статью о распространенных ошибках в карьере программиста и хотели бы услышать ваше мнение! Поделитесь своими мыслями и опытом, и самые полезные советы мы включим в нашу статью. Вот несколько вопросов для вас:

🤔 С какими ошибками в своей карьере программиста вы сталкивались? Как вы их преодолели?
📚 Какие советы вы бы дали начинающим разработчикам, чтобы избежать распространенных ловушек в программировании?
🖥 Что, по вашему мнению, важно учитывать при планировании своей карьеры в IT, чтобы минимизировать сожаления в будущем?

Спасибо за ваше участие! 🚀
📌 Бесплатные шпаргалки для начинающих в программировании от CodeHype

Забирай мастхев шпоры в формате PDF:

➡️ Python
➡️ SQL
➡️ GIT
Please open Telegram to view this post
VIEW IN TELEGRAM
Какие действия предпримешь, при эвакуации?

🔥 — Радикально и эффективно
😁 — Запущу антивирус 80-го уровня
🌚 — Активирую режим «ничего не видел, ничего не знаю»

#memes
Please open Telegram to view this post
VIEW IN TELEGRAM
✍️ Воскресный разбор задач

Сегодня разберём вопрос про зависимость смещения и дисперсии от параметра lambda в линейной регрессии с регуляризацией.

🔹Регуляризация — это способ добавить к модели дополнительное ограничение на вектор весов. Обычно для этого используются L1- и L2-нормы. Их смысл заключается в добавлении к формуле линейной регрессии регуляризационного члена, который состоит из суммы весов, умноженной на lambda — коэффициент регуляризации.

Нетрудно догадаться, что lambda довольно сильно влияет на качество итогового решения. Если этот параметр, например, равен 1, то мы не прибавляем к формуле ничего кроме суммы весов, а если он равен 10, то прибавка, соответственно, становится десятикратной суммой весов.

👀 А теперь, держа это знание в голове, подумаем: что будет со смещением и дисперсией, когда мы увеличиваем lambda?

Напомним, смещение — это матожидание разности между истинным значением и тем, что было выдано моделью. Дисперсия — это разброс ответов модели, то есть мера того, насколько эти ответы варьируются в зависимости от данных.

Если мы прибавляем к ответу модели сумму весов, да ещё и умноженную на 10, то матожидание между этим ответом и истинным значением, конечно, станет больше. То есть смещение увеличится. Но при этом модель будет, вероятно, лучше обобщать данные, и её дисперсия уменьшится. Поэтому стоит помнить, что что слишком большое значение lambda может привести к тому, что модель начнёт недообучаться.

#разбор_задач
Топ 5 книг для начинающих программистов

Делимся книгами для начинающих программистов, чтобы начать свой путь в IT.
Please open Telegram to view this post
VIEW IN TELEGRAM
2️⃣ пет-проекта для начинающего ML-специалиста в Telegram

Продолжение прошлого поста:
3️⃣ пет-проекта для начинающего ML специалиста

1️⃣ Ранжирование и матчинг:

Начни с изучения задач ранжирования и примеров в интернете.

Основные подходы: поточечный, попарный, списочный. Рекомендуем начать с поточечного.

Будем предсказывать оценку релевантности для запросов тестового датасета. Попутно можно научиться парсить и собирать сырые данные, размечая их в Яндекс.Толока. Попробуй регрессию, затем Random Forest, XGBoost, LightGBM, CatBoost. Продвинутым можно поэкспериментировать с языковыми моделями: FastText, Word2Vec, BERT.

2️⃣ Рекомендательные системы:

Очень актуальная задача. Начни с простых подходов: content-based рекомендации, KNN. Затем попробуй факторизацию матриц через SVD или ALS. Для продвинутых: W2V, DSSM, SasRec/Bert4Rec, MultVAE, графовые нейронки (GCN), обучение с подкреплением (многорукие бандиты). Рекомендации можно также рассматривать как задачу ранжирования.
Please open Telegram to view this post
VIEW IN TELEGRAM
👨‍💼 Профессия системного аналитика в 2024 году: что нужно знать и где учиться

Освоить эту профессию непросто. Порог входа довольно высок, да и изучить придется немало. Однако, если разработчик не хочет идти в тимлиды или становиться менеджером, системная аналитика — перспективный вариант дальнейшей карьеры.

Рассматриваешь вариант стать системным аналитиком, тогда забирай курс:
🔵 Математика для Data Science

🔗 Статья
Please open Telegram to view this post
VIEW IN TELEGRAM
👨‍💼 Молодая профессия: всё о бизнес-аналитике

Работа бизнес-аналитика высоко оплачивается, имеет массу перспектив и востребована на рынке труда. Специалисты в этой области помогают устранять проблемы на предприятиях, повышают их репутацию и делают конкурентоспособными на рынке.

В статье на Proglib разбираемся, какие задачи выполняет бизнес-аналитик, какие навыки ему необходимы и как этому обучиться.

👉 Читать статью
✏️ Вопрос с реального собеседования по Python

В чем разница между «is» и «==»?

is проверяет идентичность, а == проверяет равенство.

Создайте несколько списков и назначьте им имена. Обратите внимание, что ниже b указывает на тот же объект, что и a:

a = [1,2,3]
b = a
c = [1,2,3]

Проверьте равенство и обратите внимание, что все объекты равны:
print(a == b)
print(a == c)
#=> True
#=> True

Но являются ли все они идентичными? Нет:
print(a is b)
print(a is c)
#=> True
#=> False

Можем проверить это, распечатав их идентификаторы объектов:
print(id(a))
print(id(b))
print(id(c))
#=> 4369567560
#=> 4369567560
#=> 4369567624

#собес_academy