ML Advertising
1.21K subscribers
137 photos
13 videos
2 files
193 links
Пишу про AdTech, AI и разработку

Для связи: @evgenii_munin
Download Telegram
Traffic Attribution

При проведении рекламной кампнии, когда мы продвигаем продукт на разных площадках, нам важно знать откуда приходит больше всего пользователей, и какой KPI на каждой из них. Чтобы это оценить, есть 2 подхода:

1️⃣ bottom-up – когда мы физически можем трекать, какой пользователь откуда пришёл, в явном виде посчитать ROI на каждый источник (Return On Investment, во сколько раз ты получил больше денег, чем потратил). Здесь пригождается разметка для более точной сегментации аудитории.

2️⃣ top-down – когда мы физически не можем трекать (например, мы не знаем, кто видел нашу наружную рекламу или кто просмотрел наш TikTok). Здесь применяется Marketing Mix Modelling. Т.е. здесь нам нужно понять, в каком соотношении распределять бюджет по разным каналам, когда известен только общий выхлоп.

Marketing Mix Modelling
Если в двух словах, то это стат модель, которая анализирует вклад различных каналов в общий результат кампании. Она учитывает факторы, такие как бюджеты на маркетинг, экономические показатели, конкурентную среду и т. д.

Для построения такой модели есть библиотека Robyn

#adtech
👍4🔥1
Обычно, я новости не публикую, но релиз text2video от OpenAI точно заслуживает внимания
Forwarded from XOR
⚡️ Просто снова еще одна революция. Честно думал, что после ChatGPT пару лет будет без потрясений, но вчера ночью OpenAI представила новую text-to-video модель, которая работает просто а##ительно, просто посмотрите примеры.

Пока доступ только у «избранных» художников, сроков для всех не дают, но ждем. А технический разбор выйдет в нашем канале @data_secrets.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯2👍1🦄1
Основные архитектурные стили

Шпаргалка по архитектуре пригодится, чтобы вспомнить основные паттерны проектирования. Наиболее интересные из них на мой взгляд:

- Orchestration architecture: оркестратор, который направляет взаимодействие между сервисами. Пример оркестратора: Airflow, где мы строим направленные ациклические графы и можем управлять job'ами.

- CQRS: разделяет операции чтения и записи для хранилища данных. Также позволяет независимо их масштабировать.

- Layered (n-tier) architecture: разделяет приложение на логические слои.

- Microkernel: разделяет ядро на две части: core часть и часть, специфичную для клиента.

- Microservice: независимо развертываемые маленькие модульные сервисы (Kubernetes).

- Event-driven architecture: запись и чтение событий, часто в виде потока. В основном используется в асинхронном паттерне с использованием систем очередей (Kafka, RabbitMQ и т. д.).

#devops
👍6
📱 Квантование моделей или как сократить время инференса

Кроме настройки пайплайна, ML инженерам приходится решать задачи ускорения инференса моделей. Чтобы этого добиться существует несколько подходов и один из них таких подходов квантование.

Квантование - это метод понижения дискретности весов в модели. Так, модель (чаще всего сетка), обученная с использованием 32-битных чисел с плавающей запятой (float32) может быть заквантована и выполняться на мобильном процессоре в 8-битных беззнаковых целых числах (uint8) или в серверном решении с уполовиниванием ёмкости весов (float16).

Математически квантование можно представить, как если бы мы старались скукожить и сдвинуть распределение весов в более узкий диапазон (32 -> 8 бит).


q = int(w / S) - Z


Здесь w - это исходный вес, S - коэффициент сжатия, Z - константа для сдвига. При этом коэффициент S считается следующим образом


S = (beta - alpha) / (2^b - 1)


Где b - число бит, в которое производится квантование, например 8, alpha и beta - левая и правая границы возможных значений веса, симметричные или нет относительно нуля.

Квантование как инструмент широко применяется при разработке сеток. Так с его помощью удаётся поднять скорость в несколько раз (регистр, который до этого обрабатывал один float32, теперь может обработать четыре uint8 за раз).

Также Pytorch поддерживает API для механизма квантования

#mlops
👍3🔥3
В защиту SSP!

Ранее я уже писал, что участились случаи, когда вендоры программатик рекламы все чаще переходят от услуг посредников Supply Side Platform (SSP) на прямые сделки с издателями.

По этому вопросу Саймон Халстид, основатель Halstead Incubation Partners, подтвердил, что последнее время участились нападки на SSP, как на лишний орган в организме OpenRTB, якобы это такой налог на рекламные технологии.

Поэтому Саймон выступил в защиту SSP. В качестве аргументов он приводит то, что SSP выполняют всю тяжелую работу на начальных этапах воронки продаж:
- фильтрация невостребованного инвентрая и продвижения только тех Ad Opportunities, на которые будет спрос у DSP (которые представляют интересы рекламодателей)
- помощь издателям в монетизации их инвентаря и ценообразовании (оценке floor price для рекламного места на аукционе)
- управление форматами издателя: banner, inread, instream, carousel, native etc.

В конечном итоге эти усилия повышают ценность инвентаря и упрощают процессы. При этом также нельзя забывать, что Demand Side Platform'ы (DSP) действуют исключительно в интересах рекламодателя (чтобы улучшить их KPI кампании), и единственным кто защищает интересы издателей в продаже инвентаря является SSP.

Поэтому без SSP никуда!

#adtech
👍2🔥2
Stable Diffusion UI

Сегодня хочу привести сравнение двух инструментов на дифузионках

1⃣ AUTOMATIC1111/stable-diffusion-webui
Open Source решение на базе Stable Diffusion. На данный момент доступны чекпоинты для моделей SDXL, SD2.0. Web UI реализован на Gradio. В качестве функционала доступны text2img, Inpainting/ Outpainting, Color Sketch etc.

Из моего опыта работы с приложением для задачи Inpainting'а встречаются баги, где модель добавляет артефакты вне маски, при том, что размытие маски выставляется в ноль.

2⃣ ClipDrop
No-code инструмент, также использующий API Stable Diffusion с in-house доработками. Подходит для художников и креаторов, чтобы они могли кастовать последовательности моделей по своему усмотрению.

Также в нем исправлены баги, встречающиеся в открытых API. Подробно о функционале ClipDrop вы сможете найти информацию на канале Будущее наступает. Его автор, Сергей, предприниматель и руководитель ML разработкой, рассказывает про новинки и актуальные GenAI инструменты и их влияние на бизнес процессы

Го заценим 🔥
👍2🔥2
Production Level Deep Learning

Руководство по созданию продового пайплайна DL.

Что можно здесь найти?
- Описание жизненного цикла ML проекта
- Постановка целей и Mental Model
- Разметка данных и хранение: версионирование данных, предобработка фичей
- Обучение и валидация: фреймворки, тюнинг гиперпараметров, distributed training
- Тестирование: CI/CD, мониторинг

#mlops
👍5
Браузер Brave запускает self-serve рекламу

Браузер Brave, суть которого вращается вокруг конфиденциальности пользователей, запускает self-serve Ads Manager для размещения рекламы. Сейчас поддерживаются 2 формата

- Notification: по сути, это классические пуши
- Newsfeed: это умная лента

При этом в отсутствие 3rd party cookies и трекеров Brave сам запрашивает у пользователя согласие на обработку персональных данных. Поэтому таргетирование можно выставлять по типу ОС девайса (MacOS, iOS, Linux, Windows, Android), по стране или по стандартным сегментам IAB.

Также доступно два варианта бюджета:
- CPM (Cost-per-Mille) цена за 1000 просмотров для branding кампаний
- CPC (Cost-per-Click) цена за клик дл performance кампаний

#adtech
👍3
Weekly newsletter по ML

Если вы интересуетесь ML и LLM, команда DAIR.AI ведет репозиторий, где каждую неделю делает резюме топ 10 статей по актуальным SOTA ML моделям. Здесь вы сможете найти статьи по Stable Diffusion 3, Sora, Gemini 1.5, методам RAG, Depth Anything etc.

Сохраняем к себе, чтобы оставаться в курсе! 🔥
👍4🔥1
🌹 Девушки, дорогие подписчицы канала, хочу поздравить вас с праздником весны - 8 Марта!

Пусть ваши успехи в ML будут яркими, как и лучики утреннего солнца ☀️Пусть этот праздник подарит вам моменты радости в компании ваших близких и любимых! 🥰

С наилучшими пожеланиями,
Админ
9
Повторяем базу

Шпаргалка основных команд SQL. Сохраняем к себе!
👍5
🖥 Advanced ML Ops курс

https://pymagic.ru/hard-mlops

Мы совместно с pymagic запустили курс по Advanced MLOps с разбором таких инструментов как kubernetes, kafka, ci/cd и InfraAsCode.

Скидка для студентов наших курсов 20% по промокоду D4QDSZ (действителен до 31 марта)

Что вы узнаете на курсе:
1️⃣ Повторите основные компоненты ML-приложения, рассмотренные в первом курсе по MLOps

2️⃣Освоите методологию Infrastructure as Code (IaC) для управления инфраструктурой с использованием декларативных конфигураций

3️⃣Изучите архитектуру и компоненты Kubernetes, а также развернете свой кластер Kubernetes для REST-сервиса

4️⃣Настроите кластер в Confluent Cloud для работы с потоковыми данными

5️⃣Научитесь работать с Kafka Producer, Consumer, а также осуществлять запись и чтение сообщений из Kafka-топиков

6️⃣Получите глубокое понимание процесса Continuous Integration и Continuous Delivery (CI/CD)

7️⃣Освоите развертывание приложений с использованием ArgoCD - декларативного GitOps-инструмента для Continuous Delivery в Kubernetes

Подробноее на сайте https://pymagic.ru/hard-mlops 🔥
👍2🔥2