ML Career
218 subscribers
121 photos
4 videos
2 files
148 links
Branched from @data_career
Download Telegram
🧹Так, что-то здесь запылилось всё порядком... Начнём разбирать накопленное, с конца (LIFO))
Forwarded from Dodo Engineering
13 базовых понятий, которые нужно знать аналитику или ML-инженеру

по версии Андрея Филипьева, CDO Dodo Engineering

Важно не просто знать, о чём идёт речь, но понимать как применять это в реальных задачах. Если есть ещё примеры на эти пункты, объяснение проблем и как их решали — это топ!

1. Случайная величина
2. Математическое ожидание (статья выше)
3. Закон больших чисел
4. Распределение
5. Нормальное распределение
6. Центральные предельные теоремы и причем тут нормальное распределение
7. Квантили (перцентили)
8. Доверительный интервал. Конкретные задачи.
9. Оценка стат. значимости
10. p-value
11. Смещение и дисперсия (bias and variance)
12. A Deeper look at Mean Squared Error — Count Bayesie
13. Нормализация и стандартизация


Есть вещи и посложнее, конечно — полный список того, о чём обычно Андрей спрашивает кандидатов, можно подглядеть у него в канале.
Forwarded from AIRI Institute
⚡️Самый долгожданный пост этого лета!

Записи лекций и семинаров летней школы по искусственному интеллекту «Лето с AIRI» с ведущими учеными из научно-исследовательских организаций и ВУЗов выложены на YouTube-канал.

🖇 Сохраняйте ссылку на плейлист

В этом году на Школе было много направлений: от обучения с подкреплением, робототехники, 3D компьютерного зрения до детектирования и диагностики аномалий в промышленности.

Институт AIRI
Forwarded from Data Whisperer
11 сентября стартует очередной запуск бесплатного курса
Machine Learning Zoomcamp

Zoomcamp как и всегда будет вести Алексей Григорьев, Principal Data Scientist at OLX Group.
Продолжительность курса 4 месяца.
Курс основан на книге
Machine Learning with Python Cookbook.

#обучение
🚀Стань экспертом в Machine Learning и MLOps!

🤖В сентябре в Risoma School стартуют два курса, где вы сможете прокачать навыки для проектов машинного обучения и MLOps:

1. MLOps для Data Science и разработки ML моделей - курс для Data Scientists & Analytics, для эффективной работы с экспериментами, моделями и подготовки production решений c FastAPI и Airflow.

2. MLOps для Batch Scoring: автоматизация пайплайнов и CI/CD c DVC, MLflow и Airflow - курс для Machine Learning, Data и DevOps инженеров.

💻 Вы научитесь:
•Управлять экспериментами и жизненным циклом моделей
•Работать с продвинутыми сценариями версионирования данных и моделей
•Использовать Git и следовать Git-flow
•Настраивать мониторинг работы моделей и данных в production
•Работать с Airflow, DVD, Evidently, MLflow, FastAPI, Grafana, Git, Docker, GitLab, GitLab CI

В программе лекции от экспертов ML с опытом в банкинге, MedTech, AdTech, Big Data.

C промокодом data_career вы получите скидку 10% на любой курс!

📌 Выбрать курс: risoma.ru/school.
💣 Научитесь создавать рекомендательные системы для контента

📌 Приходите 24 августа в 20:00 (мск) на открытый урок «Векторизация текстов для практических задач» в рамках курса «Natural Language Processing» от OTUS!

Что будем делать:

— Обсудим, как можно получать векторы текстов и использовать их в практических целях;
— Узнаем, как быстро сделать рекомендательную систему для текстов;
— Рассмотрим похожие статьи на основе тематического моделирования, экстрактивной суммаризации и векторизации FastText;
— Поищем похожие товары на основе векторизации TF-IDF;
— Обсудим векторизацию текстов архитектурой BERT.

👉 В результат вы узнаете, как эффективно подбирать похожие по смыслу и тематике тексты.

💻 Успейте зарегистрироваться по ссылке https://otus.pw/xfre/ , количество свободных слотов на регистрацию ограничено.

Нативная интеграция информация о продукте www.otus.ru
Если вам интересно, как устроен DS в Додо-пицце 😁
https://telesco.pe/data_feeling_back/226
☄️Открытый урок по языковым моделям от OTUS

4 сентября в 18:00 мск встречаемся на открытом уроке «Языковые модели: от статистических до ChatGPT» в рамках курса «Natural Language Processing (NLP)» от OTUS.

📣 Кому подходит этот урок:

- Практикующим Data Scientist и IT-специалистам, которые хотят глубже погрузиться в область NLP
- Тем, кто хочет узнать, что делает ChatGPT таким умным
- Людям, освоившим основы машинного обучения, но желающими развиваться в области DS

💪 Результаты урока:

Вы узнаете, что такое языковые модели и как их использовать для решения NLP-задач, а также изучите подходы к обучению больших языковых моделей, таких как ChatGPT.

Это отличная возможность совершенно бесплатно протестировать формат обучения и задать преподавателю любые вопросы в режиме реального времени 😎!

Пройдите тестирование курса, чтобы зарегистрироваться на урок - https://otus.pw/ZoC2T/
Нативная интеграция. Информация о продукте www.otus.ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Надеюсь, вы и так подписаны на эти #каналы 😁
Forwarded from Ivan Begtin (Ivan Begtin)
В рубрике полезных инструментов для работы с данными Jupyter AI [1] продукта который приносит AI в Jupyter Notebook. Фактически инструмент позволяет объяснять код, генерировать новые тетрадки, искать документацию и переписывать код. Выглядит полезно хотя его ещё не пробовал, но точно стоит попробовать создавая какую-то новую тетрадку в Jupyter.

Ссылки:
[1] https://jupyter-ai.readthedocs.io/en/latest/index.html

#opensource #ai #jupyter
Forwarded from Инжиниринг Данных (Dmitry)
Ну все, теперь Python in Excel. Значит не зря все это время пользователи держались руками и ногами за Excel, они знали, что однажды все поменяется, и они будут выгружать данные в Excel из хранилища или озера данных, подключать Excel к Kafka потоку и крутить модели машинного обучения, запускать MapReduce jobs, делать квантовые вычисления. Microsoft Excel мы в тебе не сомневались!💋

PS С сегодняшнего дня все Excel аналитики стали программистами и должны требовать прибавки, нет, удвоения зарплаты!🥳
Please open Telegram to view this post
VIEW IN TELEGRAM
Python и Excel

Только ленивый не написал о том, что питончик подвезли в эксель.
Еще больше экселек богу экселек на поддержку!

Но в целом, конечно же, новость хорошая.

https://support.microsoft.com/en-us/office/introduction-to-python-in-excel-55643c2e-ff56-4168-b1ce-9428c8308545

@ohmydataengineer
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Вы находитесь здесь.
Тут вот Гартнер предрекает на лихой спуск с горки ИИ-хайпа через пару лет.

Вопрос только в том, не начнет ли ИИ самостоятельно генерить все эти циклы хайпа.
Дипломы пишет, тесты проходит. А уж хайповать умеет как боженька.

Умные и немного кожано-пространные рассуждения тут:
https://www.gartner.com/en/articles/what-s-new-in-artificial-intelligence-from-the-2023-gartner-hype-cycle
и вот штука ещё интересная вспомнилась, может не видели ещё)
Сижу на митапе PyData. На скрине результаты опроса, какие вообще ML модели люди используют в проде.
https://www.modular.com/?utm_medium=email&_hsmi=273373997

#Mojo зарелизился для локального скачивания (пока для linux-а).

Это новый язык (который в будущем должен стать надмножеством python-а) от Крис Лэттнера, создателя LLVM-а.

Оно пока сырое - примеры из sklearn-а выполнить не может.

Ключевые идеи как всегда - скорость, параллельность, компиляция и т. д

#источник: https://t.me/c/1367207194/82378 <= https://t.me/+UX3tGhCumOv8p3Of