📹 Продолжаем листинг LLM моделей. Сегодня на очереди Video Generation
Stable Video Diffusion
- Open Source'ная модель, разработана Stability AI. На данный момент под капотом SOTA модель SDXL. Также доступна генерация аудио
HeyGen
- Модель для клонирования голоса, коррекции движения губ и перевода языка в видео
Runway Gen-2
- Широкий набор инструментов Text2Video, Text + Image to Video, Image2Video, замена стиля etc.
Pika
- Аналогично Gen-2: замена стиля, Text2Video, Video2Video, inpainting. На данный момент готовится релиз обновления Pika 1.0
#llm
Stable Video Diffusion
- Open Source'ная модель, разработана Stability AI. На данный момент под капотом SOTA модель SDXL. Также доступна генерация аудио
HeyGen
- Модель для клонирования голоса, коррекции движения губ и перевода языка в видео
Runway Gen-2
- Широкий набор инструментов Text2Video, Text + Image to Video, Image2Video, замена стиля etc.
Pika
- Аналогично Gen-2: замена стиля, Text2Video, Video2Video, inpainting. На данный момент готовится релиз обновления Pika 1.0
#llm
Stability AI
Multimodal media generation and editing tools designed for the best in the business. No creative challenge too big, no timeline too tight. Get to production with Stability AI, your enterprise-ready creative partner.
👍3🔥2
📝 С генерацией видео и картинок мы разобрались. Теперь, давайте, рассмотрим модели для генерации текста
GPT-4
- Нашумевшая модель сильно расширила поддержку плагинов. Теперь она обрабатывает не только текстовые промпты, но и изображения, генерирует подписи под картинками, решает задачи Audio2Text и поддерживает web-browsing. Также стал доступен маркетплейс GPTStore для монетизации приложений, написанных на API ChatGPT.
Bard и Gemini
- Модели разработаны Google DeepMind. Ближайшие конкуренты ChatGPT. Сейчас выкатывается модель Gemini Ultra, которая бьет GPT-4 SOTA в плане описательных способностей на benchmark тестах DROP (reading comprehension), Big-Bench Hard (многоступенчатые описание), GSM8K (арифметические упражнения), HumanEval (генерация кода на Python)
Grok
- Разрабатывается xAI. Пока актуальная версия Grok-1 по бенчмаркам не дотягивает до GPT-4. На данный момент модель зарелизили для Premium+ пользователей X, по поводу общего релиза для глобальной аудитории ждем анонсов.
OverflowAI
- Stack Overflow разработал плагин для Visual Studio Code и Slack для поиска актуальных ответов на вопросы.
Mistral 7B / Mixtral 8x7B
- Модель также конкурент GPT-4. Здесь акцент сделан на открытость, Mistral AI предоставили модель для свободного скачивания. Также представлена улучшенная модель Mixtral Sparse Mixture-of-Experts с открытыми весами
#llm
GPT-4
- Нашумевшая модель сильно расширила поддержку плагинов. Теперь она обрабатывает не только текстовые промпты, но и изображения, генерирует подписи под картинками, решает задачи Audio2Text и поддерживает web-browsing. Также стал доступен маркетплейс GPTStore для монетизации приложений, написанных на API ChatGPT.
Bard и Gemini
- Модели разработаны Google DeepMind. Ближайшие конкуренты ChatGPT. Сейчас выкатывается модель Gemini Ultra, которая бьет GPT-4 SOTA в плане описательных способностей на benchmark тестах DROP (reading comprehension), Big-Bench Hard (многоступенчатые описание), GSM8K (арифметические упражнения), HumanEval (генерация кода на Python)
Grok
- Разрабатывается xAI. Пока актуальная версия Grok-1 по бенчмаркам не дотягивает до GPT-4. На данный момент модель зарелизили для Premium+ пользователей X, по поводу общего релиза для глобальной аудитории ждем анонсов.
OverflowAI
- Stack Overflow разработал плагин для Visual Studio Code и Slack для поиска актуальных ответов на вопросы.
Mistral 7B / Mixtral 8x7B
- Модель также конкурент GPT-4. Здесь акцент сделан на открытость, Mistral AI предоставили модель для свободного скачивания. Также представлена улучшенная модель Mixtral Sparse Mixture-of-Experts с открытыми весами
#llm
Openai
GPT-4
We’ve created GPT-4, the latest milestone in OpenAI’s effort in scaling up deep learning. GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhibits…
👍2🔥1
💵 Contribution margin
Ранее мы рассмотрели основные метрики для расчета эффективности рекламной кампании. Сегодня мы поговорим про Contribution Margin.
Это понятие ввел Abir Syed. Contribution Margin считается так же как и классическая маржа рекламной кампании, как разница между средней выручкой конверсии и стоимости за клик (Cost per Click CPC) или за тысячу отображений (Cost per Mille CPM). Но в отличие от обычной маржи Contribution Margin также учитывает постоянные расходы, как например зарплаты сотрудникам, аренда серверов и т.д. Таким образом, эта метрика дает более реалистичную оценку прибыли кампании
Почему метрика важна?
Приведу пример. Если Sales или AdOps менеджер видит ухудшение метрик кампании (к примеру низкое число отображений прификсированном бюджете ведет к повышению CPM), то его первая реакция - это уменьшить бюджет. При этом с одной стороны CPM уменьшается, но фиксированные расходы все равно остаются. В результате организация несет больше убытков от сжатие бюджета, чем от масштабирования
Также, вводя понятие Contribution Margin, мы можем видеть, как увеличение разнообразия креативов может помочь уменьшить стоимость за клик или отображение. Таким образом, метрику удобно применять при AБ-тестировании нескольких продуктов или фич.
#adtech
Ранее мы рассмотрели основные метрики для расчета эффективности рекламной кампании. Сегодня мы поговорим про Contribution Margin.
Это понятие ввел Abir Syed. Contribution Margin считается так же как и классическая маржа рекламной кампании, как разница между средней выручкой конверсии и стоимости за клик (Cost per Click CPC) или за тысячу отображений (Cost per Mille CPM). Но в отличие от обычной маржи Contribution Margin также учитывает постоянные расходы, как например зарплаты сотрудникам, аренда серверов и т.д. Таким образом, эта метрика дает более реалистичную оценку прибыли кампании
Почему метрика важна?
Приведу пример. Если Sales или AdOps менеджер видит ухудшение метрик кампании (к примеру низкое число отображений прификсированном бюджете ведет к повышению CPM), то его первая реакция - это уменьшить бюджет. При этом с одной стороны CPM уменьшается, но фиксированные расходы все равно остаются. В результате организация несет больше убытков от сжатие бюджета, чем от масштабирования
Также, вводя понятие Contribution Margin, мы можем видеть, как увеличение разнообразия креативов может помочь уменьшить стоимость за клик или отображение. Таким образом, метрику удобно применять при AБ-тестировании нескольких продуктов или фич.
#adtech
Telegram
ML Advertising
Метрики в рекламных кампаниях ч.2
Сегодня мы продолжаем разбираться в том, как оценивать эффективность рекламной кампании. Ранее мы рассмотрели метрики Scroll rate, Completion rate, CTR, CVR. Сегодня мы рассмотрим метрики расходов на рекламу:
1️⃣ CPM (Cost…
Сегодня мы продолжаем разбираться в том, как оценивать эффективность рекламной кампании. Ранее мы рассмотрели метрики Scroll rate, Completion rate, CTR, CVR. Сегодня мы рассмотрим метрики расходов на рекламу:
1️⃣ CPM (Cost…
🔥3👍2
На случай, если на собесе вас спросят про временную сложность основных ML алгоритмов
Сохраняем к себе!
#base
Сохраняем к себе!
#base
👍5🔥5
⚡ Regex101
Для тех, кому нужно попрактиковаться в регулярках, есть удобный редактор регулярных выражений Regex101. В нем приводятся объяснения символов, генератор кода для разных языков и дебаггер.
#base
Для тех, кому нужно попрактиковаться в регулярках, есть удобный редактор регулярных выражений Regex101. В нем приводятся объяснения символов, генератор кода для разных языков и дебаггер.
#base
regex101
regex101: build, test, and debug regex
Regular expression tester with syntax highlighting, explanation, cheat sheet for PHP/PCRE, Python, GO, JavaScript, Java, C#/.NET, Rust.
🔥5👍1
🚀 Зачем ускорять модели на проде ?
Привет, сегодня хочу поделиться своими мыслями о том, почему так много вакансий в области Data Science акцентируют внимание на ускорении и конвертации нейронных сетей. Раньше достаточно было владеть навыками обучения моделей и знанием теории Байеса, но сейчас ко всему прочему нужно уметь оптимизировать прод.
Зачем это надо ?
1️⃣ Экономия ресурсов: Ускорение модели экономит вычислительные затраты. Быстрая сеть = больше батчей на GPU = экономия денег. Мы можем улучшить производительность уже существующих моделей без потери точности, используя фьюзинг, конвертацию и смену бэкенда.
2️⃣ Realtime обработка: в Real Time Bidding аукционах, в областях AR/VR, автономных роботов и других, решения нужно принимать в миллисекундах. Быстрый инференс обеспечивает эффективность в таких задачах, где каждая миллисекунда имеет значение.
3️⃣ Безопасность и локальное использование: с ужесточением правил приватности данных пользователей и растущей заботой о безопасности, помещение модели все чаще деплоят Embedded на девайс пользователя. Это не только уменьшает риски утечки данных, но и сокращает время ожидания для пользователей. При этом тяжеловемные модели нужно квантизировать, чтобы их инференс помещался в ограничения телефона или планшета.
#mlops
Привет, сегодня хочу поделиться своими мыслями о том, почему так много вакансий в области Data Science акцентируют внимание на ускорении и конвертации нейронных сетей. Раньше достаточно было владеть навыками обучения моделей и знанием теории Байеса, но сейчас ко всему прочему нужно уметь оптимизировать прод.
Зачем это надо ?
1️⃣ Экономия ресурсов: Ускорение модели экономит вычислительные затраты. Быстрая сеть = больше батчей на GPU = экономия денег. Мы можем улучшить производительность уже существующих моделей без потери точности, используя фьюзинг, конвертацию и смену бэкенда.
2️⃣ Realtime обработка: в Real Time Bidding аукционах, в областях AR/VR, автономных роботов и других, решения нужно принимать в миллисекундах. Быстрый инференс обеспечивает эффективность в таких задачах, где каждая миллисекунда имеет значение.
3️⃣ Безопасность и локальное использование: с ужесточением правил приватности данных пользователей и растущей заботой о безопасности, помещение модели все чаще деплоят Embedded на девайс пользователя. Это не только уменьшает риски утечки данных, но и сокращает время ожидания для пользователей. При этом тяжеловемные модели нужно квантизировать, чтобы их инференс помещался в ограничения телефона или планшета.
#mlops
🔥3👍1
🗺 Карта навыков ML инженера.
Yandex составил карту самых часто встречающихся запросов по ML на Stack Overflow, начиная с 2010 года. Навыками считали теги вопросов на Stack Overflow, популярностью навыков — число запросов, на которые Поиск отвечал страницами с соответствующими тегами. Размер навыка на карте соответствует числу посвящённых ему поисковых запросов. Теги объединены в кластеры.
Сохраняем к себе!
#practices
Yandex составил карту самых часто встречающихся запросов по ML на Stack Overflow, начиная с 2010 года. Навыками считали теги вопросов на Stack Overflow, популярностью навыков — число запросов, на которые Поиск отвечал страницами с соответствующими тегами. Размер навыка на карте соответствует числу посвящённых ему поисковых запросов. Теги объединены в кластеры.
Сохраняем к себе!
#practices
Компания Яндекс
Карта навыков ML-разработчиков
Библиотеки, фреймворки, инструменты и другие навыки, которые ML-разработчики регулярно используют в своей работе.
🔥3👍1
🖥 Как отслеживать среду выполнения Docker с помощью Prometheus и Grafana
Среда выполнения Docker отслеживается для определения производительности и поведения контейнеров и хост-систем с помощью Prometheus и Grafana.
▪Docker для запуска контейнеров.
▪Prometheus для сбора метрик среды Docker.
▪Grafana для визуализации метрик, собранных с Prometheus.
#devops
Среда выполнения Docker отслеживается для определения производительности и поведения контейнеров и хост-систем с помощью Prometheus и Grafana.
▪Docker для запуска контейнеров.
▪Prometheus для сбора метрик среды Docker.
▪Grafana для визуализации метрик, собранных с Prometheus.
#devops
Docker
Docker: Accelerated Container Application Development
Docker is a platform designed to help developers build, share, and run container applications. We handle the tedious setup, so you can focus on the code.
👍1🔥1
The Best ChatGPT & AI Cheat Sheets.pdf
7.8 MB
Шпаргалки по ChatGPT и список из 30+ приложений полезных в быту и по хозяйству
Из доменов
- диалоговые ассистенты
- CustDev
- Productivity
- Image & Video
- Sales
- Marketing
- Плагины для ChatGPT
- Трудоустройство
Также много шпор по промпт-инжинирингу
#practices
#llm
Из доменов
- диалоговые ассистенты
- CustDev
- Productivity
- Image & Video
- Sales
- Marketing
- Плагины для ChatGPT
- Трудоустройство
Также много шпор по промпт-инжинирингу
#practices
#llm
👍5
Traffic Attribution
При проведении рекламной кампнии, когда мы продвигаем продукт на разных площадках, нам важно знать откуда приходит больше всего пользователей, и какой KPI на каждой из них. Чтобы это оценить, есть 2 подхода:
1️⃣ bottom-up – когда мы физически можем трекать, какой пользователь откуда пришёл, в явном виде посчитать ROI на каждый источник (Return On Investment, во сколько раз ты получил больше денег, чем потратил). Здесь пригождается разметка для более точной сегментации аудитории.
2️⃣ top-down – когда мы физически не можем трекать (например, мы не знаем, кто видел нашу наружную рекламу или кто просмотрел наш TikTok). Здесь применяется Marketing Mix Modelling. Т.е. здесь нам нужно понять, в каком соотношении распределять бюджет по разным каналам, когда известен только общий выхлоп.
Marketing Mix Modelling
Если в двух словах, то это стат модель, которая анализирует вклад различных каналов в общий результат кампании. Она учитывает факторы, такие как бюджеты на маркетинг, экономические показатели, конкурентную среду и т. д.
Для построения такой модели есть библиотека Robyn
#adtech
При проведении рекламной кампнии, когда мы продвигаем продукт на разных площадках, нам важно знать откуда приходит больше всего пользователей, и какой KPI на каждой из них. Чтобы это оценить, есть 2 подхода:
1️⃣ bottom-up – когда мы физически можем трекать, какой пользователь откуда пришёл, в явном виде посчитать ROI на каждый источник (Return On Investment, во сколько раз ты получил больше денег, чем потратил). Здесь пригождается разметка для более точной сегментации аудитории.
2️⃣ top-down – когда мы физически не можем трекать (например, мы не знаем, кто видел нашу наружную рекламу или кто просмотрел наш TikTok). Здесь применяется Marketing Mix Modelling. Т.е. здесь нам нужно понять, в каком соотношении распределять бюджет по разным каналам, когда известен только общий выхлоп.
Marketing Mix Modelling
Если в двух словах, то это стат модель, которая анализирует вклад различных каналов в общий результат кампании. Она учитывает факторы, такие как бюджеты на маркетинг, экономические показатели, конкурентную среду и т. д.
Для построения такой модели есть библиотека Robyn
#adtech
Medium
Market Mix Modeling (MMM) — 101
A primer on Market Mix Modeling.
👍4🔥1
Обычно, я новости не публикую, но релиз text2video от OpenAI точно заслуживает внимания
Forwarded from XOR
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Пока доступ только у «избранных» художников, сроков для всех не дают, но ждем. А технический разбор выйдет в нашем канале @data_secrets.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯2👍1🦄1
Основные архитектурные стили
Шпаргалка по архитектуре пригодится, чтобы вспомнить основные паттерны проектирования. Наиболее интересные из них на мой взгляд:
- Orchestration architecture: оркестратор, который направляет взаимодействие между сервисами. Пример оркестратора: Airflow, где мы строим направленные ациклические графы и можем управлять job'ами.
- CQRS: разделяет операции чтения и записи для хранилища данных. Также позволяет независимо их масштабировать.
- Layered (n-tier) architecture: разделяет приложение на логические слои.
- Microkernel: разделяет ядро на две части: core часть и часть, специфичную для клиента.
- Microservice: независимо развертываемые маленькие модульные сервисы (Kubernetes).
- Event-driven architecture: запись и чтение событий, часто в виде потока. В основном используется в асинхронном паттерне с использованием систем очередей (Kafka, RabbitMQ и т. д.).
#devops
Шпаргалка по архитектуре пригодится, чтобы вспомнить основные паттерны проектирования. Наиболее интересные из них на мой взгляд:
- Orchestration architecture: оркестратор, который направляет взаимодействие между сервисами. Пример оркестратора: Airflow, где мы строим направленные ациклические графы и можем управлять job'ами.
- CQRS: разделяет операции чтения и записи для хранилища данных. Также позволяет независимо их масштабировать.
- Layered (n-tier) architecture: разделяет приложение на логические слои.
- Microkernel: разделяет ядро на две части: core часть и часть, специфичную для клиента.
- Microservice: независимо развертываемые маленькие модульные сервисы (Kubernetes).
- Event-driven architecture: запись и чтение событий, часто в виде потока. В основном используется в асинхронном паттерне с использованием систем очередей (Kafka, RabbitMQ и т. д.).
#devops
👍6