ML Advertising

На случай, если на собесе вас спросят про временную сложность основных ML алгоритмов

Сохраняем к себе!

#base

👍5🔥5

646 viewsedited 09:52

⚡ Regex101

Для тех, кому нужно попрактиковаться в регулярках, есть удобный редактор регулярных выражений Regex101. В нем приводятся объяснения символов, генератор кода для разных языков и дебаггер.

#base

regex101

regex101: build, test, and debug regex

Regular expression tester with syntax highlighting, explanation, cheat sheet for PHP/PCRE, Python, GO, JavaScript, Java, C#/.NET, Rust.

🔥5👍1

462 viewsedited 11:30

ML Advertising

🚀 Зачем ускорять модели на проде ?

Привет, сегодня хочу поделиться своими мыслями о том, почему так много вакансий в области Data Science акцентируют внимание на ускорении и конвертации нейронных сетей. Раньше достаточно было владеть навыками обучения моделей и знанием теории Байеса, но сейчас ко всему прочему нужно уметь оптимизировать прод.

Зачем это надо ?

1️⃣ Экономия ресурсов: Ускорение модели экономит вычислительные затраты. Быстрая сеть = больше батчей на GPU = экономия денег. Мы можем улучшить производительность уже существующих моделей без потери точности, используя фьюзинг, конвертацию и смену бэкенда.

2️⃣ Realtime обработка: в Real Time Bidding аукционах, в областях AR/VR, автономных роботов и других, решения нужно принимать в миллисекундах. Быстрый инференс обеспечивает эффективность в таких задачах, где каждая миллисекунда имеет значение.

3️⃣ Безопасность и локальное использование: с ужесточением правил приватности данных пользователей и растущей заботой о безопасности, помещение модели все чаще деплоят Embedded на девайс пользователя. Это не только уменьшает риски утечки данных, но и сокращает время ожидания для пользователей. При этом тяжеловемные модели нужно квантизировать, чтобы их инференс помещался в ограничения телефона или планшета.

#mlops

🔥3👍1

492 viewsedited 15:16

ML Advertising

🗺 Карта навыков ML инженера.

Yandex составил карту самых часто встречающихся запросов по ML на Stack Overflow, начиная с 2010 года. Навыками считали теги вопросов на Stack Overflow, популярностью навыков — число запросов, на которые Поиск отвечал страницами с соответствующими тегами. Размер навыка на карте соответствует числу посвящённых ему поисковых запросов. Теги объединены в кластеры.

Сохраняем к себе!

#practices

Компания Яндекс

Карта навыков ML-разработчиков

Библиотеки, фреймворки, инструменты и другие навыки, которые ML-разработчики регулярно используют в своей работе.

🔥3👍1

499 viewsedited 16:00

ML Advertising

🖥 Как отслеживать среду выполнения Docker с помощью Prometheus и Grafana

Среда выполнения Docker отслеживается для определения производительности и поведения контейнеров и хост-систем с помощью Prometheus и Grafana.

▪Docker для запуска контейнеров.
▪Prometheus для сбора метрик среды Docker.
▪Grafana для визуализации метрик, собранных с Prometheus.

#devops

Docker

Docker: Accelerated Container Application Development

Docker is a platform designed to help developers build, share, and run container applications. We handle the tedious setup, so you can focus on the code.

👍1🔥1

523 viewsedited 15:43

ML Advertising

The Best ChatGPT & AI Cheat Sheets.pdf

7.8 MB

Шпаргалки по ChatGPT и список из 30+ приложений полезных в быту и по хозяйству

Из доменов
- диалоговые ассистенты
- CustDev
- Productivity
- Image & Video
- Sales
- Marketing
- Плагины для ChatGPT
- Трудоустройство

Также много шпор по промпт-инжинирингу

#practices
#llm

👍5

575 viewsedited 13:14

ML Advertising

Контрольный список практик работы с Docker

👍1🔥1

415 views08:58

ML Advertising

Traffic Attribution

При проведении рекламной кампнии, когда мы продвигаем продукт на разных площадках, нам важно знать откуда приходит больше всего пользователей, и какой KPI на каждой из них. Чтобы это оценить, есть 2 подхода:

1️⃣ bottom-up – когда мы физически можем трекать, какой пользователь откуда пришёл, в явном виде посчитать ROI на каждый источник (Return On Investment, во сколько раз ты получил больше денег, чем потратил). Здесь пригождается разметка для более точной сегментации аудитории.

2️⃣ top-down – когда мы физически не можем трекать (например, мы не знаем, кто видел нашу наружную рекламу или кто просмотрел наш TikTok). Здесь применяется Marketing Mix Modelling. Т.е. здесь нам нужно понять, в каком соотношении распределять бюджет по разным каналам, когда известен только общий выхлоп.

Marketing Mix Modelling
Если в двух словах, то это стат модель, которая анализирует вклад различных каналов в общий результат кампании. Она учитывает факторы, такие как бюджеты на маркетинг, экономические показатели, конкурентную среду и т. д.

Для построения такой модели есть библиотека Robyn

#adtech

Medium

Market Mix Modeling (MMM) — 101

A primer on Market Mix Modeling.

👍4🔥1

476 viewsedited 13:10

ML Advertising

Обычно, я новости не публикую, но релиз text2video от OpenAI точно заслуживает внимания

362 viewsedited 11:03

ML Advertising

Forwarded from XOR