ML Advertising

📹 Продолжаем листинг LLM моделей. Сегодня на очереди Video Generation

Stable Video Diffusion
- Open Source'ная модель, разработана Stability AI. На данный момент под капотом SOTA модель SDXL. Также доступна генерация аудио

HeyGen
- Модель для клонирования голоса, коррекции движения губ и перевода языка в видео

Runway Gen-2
- Широкий набор инструментов Text2Video, Text + Image to Video, Image2Video, замена стиля etc.

Pika
- Аналогично Gen-2: замена стиля, Text2Video, Video2Video, inpainting. На данный момент готовится релиз обновления Pika 1.0

#llm

Stability AI

Multimodal media generation and editing tools designed for the best in the business. No creative challenge too big, no timeline too tight. Get to production with Stability AI, your enterprise-ready creative partner.

👍3🔥2

507 viewsedited 00:07

ML Advertising

📝 С генерацией видео и картинок мы разобрались. Теперь, давайте, рассмотрим модели для генерации текста

GPT-4
- Нашумевшая модель сильно расширила поддержку плагинов. Теперь она обрабатывает не только текстовые промпты, но и изображения, генерирует подписи под картинками, решает задачи Audio2Text и поддерживает web-browsing. Также стал доступен маркетплейс GPTStore для монетизации приложений, написанных на API ChatGPT.

Bard и Gemini
- Модели разработаны Google DeepMind. Ближайшие конкуренты ChatGPT. Сейчас выкатывается модель Gemini Ultra, которая бьет GPT-4 SOTA в плане описательных способностей на benchmark тестах DROP (reading comprehension), Big-Bench Hard (многоступенчатые описание), GSM8K (арифметические упражнения), HumanEval (генерация кода на Python)

Grok
- Разрабатывается xAI. Пока актуальная версия Grok-1 по бенчмаркам не дотягивает до GPT-4. На данный момент модель зарелизили для Premium+ пользователей X, по поводу общего релиза для глобальной аудитории ждем анонсов.

OverflowAI
- Stack Overflow разработал плагин для Visual Studio Code и Slack для поиска актуальных ответов на вопросы.

Mistral 7B / Mixtral 8x7B
- Модель также конкурент GPT-4. Здесь акцент сделан на открытость, Mistral AI предоставили модель для свободного скачивания. Также представлена улучшенная модель Mixtral Sparse Mixture-of-Experts с открытыми весами

#llm

Openai

GPT-4

We’ve created GPT-4, the latest milestone in OpenAI’s effort in scaling up deep learning. GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhibits…

👍2🔥1

508 viewsedited 00:04

ML Advertising

💵 Contribution margin

Ранее мы рассмотрели основные метрики для расчета эффективности рекламной кампании. Сегодня мы поговорим про Contribution Margin.

Это понятие ввел Abir Syed. Contribution Margin считается так же как и классическая маржа рекламной кампании, как разница между средней выручкой конверсии и стоимости за клик (Cost per Click CPC) или за тысячу отображений (Cost per Mille CPM). Но в отличие от обычной маржи Contribution Margin также учитывает постоянные расходы, как например зарплаты сотрудникам, аренда серверов и т.д. Таким образом, эта метрика дает более реалистичную оценку прибыли кампании

Почему метрика важна?
Приведу пример. Если Sales или AdOps менеджер видит ухудшение метрик кампании (к примеру низкое число отображений прификсированном бюджете ведет к повышению CPM), то его первая реакция - это уменьшить бюджет. При этом с одной стороны CPM уменьшается, но фиксированные расходы все равно остаются. В результате организация несет больше убытков от сжатие бюджета, чем от масштабирования

Также, вводя понятие Contribution Margin, мы можем видеть, как увеличение разнообразия креативов может помочь уменьшить стоимость за клик или отображение. Таким образом, метрику удобно применять при AБ-тестировании нескольких продуктов или фич.

#adtech

ML Advertising

Метрики в рекламных кампаниях ч.2

Сегодня мы продолжаем разбираться в том, как оценивать эффективность рекламной кампании. Ранее мы рассмотрели метрики Scroll rate, Completion rate, CTR, CVR. Сегодня мы рассмотрим метрики расходов на рекламу:

1️⃣ CPM (Cost…

🔥3👍2

509 viewsedited 07:57

ML Advertising

На случай, если на собесе вас спросят про временную сложность основных ML алгоритмов

Сохраняем к себе!

#base

👍5🔥5

646 viewsedited 09:52

ML Advertising

⚡ Regex101

Для тех, кому нужно попрактиковаться в регулярках, есть удобный редактор регулярных выражений Regex101. В нем приводятся объяснения символов, генератор кода для разных языков и дебаггер.

#base

regex101

regex101: build, test, and debug regex

Regular expression tester with syntax highlighting, explanation, cheat sheet for PHP/PCRE, Python, GO, JavaScript, Java, C#/.NET, Rust.

🔥5👍1

462 viewsedited 11:30

ML Advertising

🚀 Зачем ускорять модели на проде ?

Привет, сегодня хочу поделиться своими мыслями о том, почему так много вакансий в области Data Science акцентируют внимание на ускорении и конвертации нейронных сетей. Раньше достаточно было владеть навыками обучения моделей и знанием теории Байеса, но сейчас ко всему прочему нужно уметь оптимизировать прод.

Зачем это надо ?

1️⃣ Экономия ресурсов: Ускорение модели экономит вычислительные затраты. Быстрая сеть = больше батчей на GPU = экономия денег. Мы можем улучшить производительность уже существующих моделей без потери точности, используя фьюзинг, конвертацию и смену бэкенда.

2️⃣ Realtime обработка: в Real Time Bidding аукционах, в областях AR/VR, автономных роботов и других, решения нужно принимать в миллисекундах. Быстрый инференс обеспечивает эффективность в таких задачах, где каждая миллисекунда имеет значение.

3️⃣ Безопасность и локальное использование: с ужесточением правил приватности данных пользователей и растущей заботой о безопасности, помещение модели все чаще деплоят Embedded на девайс пользователя. Это не только уменьшает риски утечки данных, но и сокращает время ожидания для пользователей. При этом тяжеловемные модели нужно квантизировать, чтобы их инференс помещался в ограничения телефона или планшета.

#mlops

🔥3👍1

492 viewsedited 15:16

ML Advertising

🗺 Карта навыков ML инженера.

Yandex составил карту самых часто встречающихся запросов по ML на Stack Overflow, начиная с 2010 года. Навыками считали теги вопросов на Stack Overflow, популярностью навыков — число запросов, на которые Поиск отвечал страницами с соответствующими тегами. Размер навыка на карте соответствует числу посвящённых ему поисковых запросов. Теги объединены в кластеры.

Сохраняем к себе!

#practices

Компания Яндекс

Карта навыков ML-разработчиков

Библиотеки, фреймворки, инструменты и другие навыки, которые ML-разработчики регулярно используют в своей работе.

🔥3👍1

499 viewsedited 16:00

ML Advertising

🖥 Как отслеживать среду выполнения Docker с помощью Prometheus и Grafana

Среда выполнения Docker отслеживается для определения производительности и поведения контейнеров и хост-систем с помощью Prometheus и Grafana.

▪Docker для запуска контейнеров.
▪Prometheus для сбора метрик среды Docker.
▪Grafana для визуализации метрик, собранных с Prometheus.

#devops

Docker

Docker: Accelerated Container Application Development

Docker is a platform designed to help developers build, share, and run container applications. We handle the tedious setup, so you can focus on the code.

👍1🔥1

523 viewsedited 15:43

ML Advertising

The Best ChatGPT & AI Cheat Sheets.pdf

7.8 MB

Шпаргалки по ChatGPT и список из 30+ приложений полезных в быту и по хозяйству

Из доменов
- диалоговые ассистенты
- CustDev
- Productivity
- Image & Video
- Sales
- Marketing
- Плагины для ChatGPT
- Трудоустройство

Также много шпор по промпт-инжинирингу

#practices
#llm

👍5

575 viewsedited 13:14

ML Advertising

Контрольный список практик работы с Docker

👍1🔥1

415 views08:58

ML Advertising

Traffic Attribution

При проведении рекламной кампнии, когда мы продвигаем продукт на разных площадках, нам важно знать откуда приходит больше всего пользователей, и какой KPI на каждой из них. Чтобы это оценить, есть 2 подхода:

1️⃣ bottom-up – когда мы физически можем трекать, какой пользователь откуда пришёл, в явном виде посчитать ROI на каждый источник (Return On Investment, во сколько раз ты получил больше денег, чем потратил). Здесь пригождается разметка для более точной сегментации аудитории.

2️⃣ top-down – когда мы физически не можем трекать (например, мы не знаем, кто видел нашу наружную рекламу или кто просмотрел наш TikTok). Здесь применяется Marketing Mix Modelling. Т.е. здесь нам нужно понять, в каком соотношении распределять бюджет по разным каналам, когда известен только общий выхлоп.

Marketing Mix Modelling
Если в двух словах, то это стат модель, которая анализирует вклад различных каналов в общий результат кампании. Она учитывает факторы, такие как бюджеты на маркетинг, экономические показатели, конкурентную среду и т. д.

Для построения такой модели есть библиотека Robyn

#adtech

Medium

Market Mix Modeling (MMM) — 101

A primer on Market Mix Modeling.

👍4🔥1

476 viewsedited 13:10

ML Advertising

Обычно, я новости не публикую, но релиз text2video от OpenAI точно заслуживает внимания

362 viewsedited 11:03

ML Advertising

Forwarded from XOR