Как повысить квалификацию в Computer Vision
Приходите на ближайший поток CV Rocket, который стартует 17 марта!
Это курс для практикующих CV-инженеров, которые хотят закрыть пробелы в знаниях и узнать про подходы и лучшие практики от senior-инженеров.
Вы научитесь:
- готовить данные: собирать, устранять ошибки в разметке, мониторить качество
- отлаживать обучение, находить аномалии и интерпретировать результаты модели
- работать с metric learning и векторным поиском
- работать с видео: трекинг и action-recognition
- предобучать без разметки: от pretext-задач до современных SSL-алгоритмов
- адаптировать модели детекции, сегментации и OCR под сложные кейсы
Обучение длится 4 месяца и состоит из 13 лекций и 13 заданий.
Лекции проходят онлайн в Zoom, поэтому вы сможете задавать вопросы по ходу занятия.
🔥 До 16 марта вы можете записаться со скидкой 5%!
Переходите на сайт, изучайте подробности, читайте отзывы выпускников и записывайтесь на обучение!
До встречи на курсе! 🎓
Приходите на ближайший поток CV Rocket, который стартует 17 марта!
Это курс для практикующих CV-инженеров, которые хотят закрыть пробелы в знаниях и узнать про подходы и лучшие практики от senior-инженеров.
Вы научитесь:
- готовить данные: собирать, устранять ошибки в разметке, мониторить качество
- отлаживать обучение, находить аномалии и интерпретировать результаты модели
- работать с metric learning и векторным поиском
- работать с видео: трекинг и action-recognition
- предобучать без разметки: от pretext-задач до современных SSL-алгоритмов
- адаптировать модели детекции, сегментации и OCR под сложные кейсы
Обучение длится 4 месяца и состоит из 13 лекций и 13 заданий.
Лекции проходят онлайн в Zoom, поэтому вы сможете задавать вопросы по ходу занятия.
🔥 До 16 марта вы можете записаться со скидкой 5%!
Переходите на сайт, изучайте подробности, читайте отзывы выпускников и записывайтесь на обучение!
До встречи на курсе! 🎓
deepschool.ru
Научитесь решать сложные задачи в Computer Vision — DeepSchool
❤9👍7🔥4
Ванильный RAG не работает. Как исправить?
RAG — один из самых популярных сценариев для интеграции LLM в продукты. При этом большинство RAG-систем в реальных условиях ломаются уже на старте: галлюцинации, нерелевантные ответы, потерянный контекст.
Проблема не в идее, а в деталях. Ванильная схема «ретривер + генератор» — это только скелет. Без правильно настроенного эмбеддера, качественных данных, реранкера и дообученного генератора она не работает. А когда что-то идёт не так, то непонятно, за что взяться.
В этот четверг Дмитрий Калашников, NLP team lead в Яндексе, проведёт открытую лекцию и разложит систему по частям: где обычно ломается, как диагностировать проблему и что конкретно делать на каждом уровне пайплайна.
Мы разберём:
• типичные точки отказа: эмбеддер, поиск, реранкер, генератор, данные
• как локализовать проблему, прежде чем что-то чинить
• какие техники реально улучшают качество на каждом этапе
• как собрать из компонентов систему, которая держит нагрузку
На лекции также представим курс LLM Pro — для тех, кто хочет научиться строить полноценные NLP-системы с учётом требований к качеству и нагрузке.
Участникам лекции подарим скидку в 15% на обучение! 🎁
📅 Лекция пройдёт 19 марта в 19:00 МСК
Регистрируйтесь по ссылке и до встречи в четверг!
RAG — один из самых популярных сценариев для интеграции LLM в продукты. При этом большинство RAG-систем в реальных условиях ломаются уже на старте: галлюцинации, нерелевантные ответы, потерянный контекст.
Проблема не в идее, а в деталях. Ванильная схема «ретривер + генератор» — это только скелет. Без правильно настроенного эмбеддера, качественных данных, реранкера и дообученного генератора она не работает. А когда что-то идёт не так, то непонятно, за что взяться.
В этот четверг Дмитрий Калашников, NLP team lead в Яндексе, проведёт открытую лекцию и разложит систему по частям: где обычно ломается, как диагностировать проблему и что конкретно делать на каждом уровне пайплайна.
Мы разберём:
• типичные точки отказа: эмбеддер, поиск, реранкер, генератор, данные
• как локализовать проблему, прежде чем что-то чинить
• какие техники реально улучшают качество на каждом этапе
• как собрать из компонентов систему, которая держит нагрузку
На лекции также представим курс LLM Pro — для тех, кто хочет научиться строить полноценные NLP-системы с учётом требований к качеству и нагрузке.
Участникам лекции подарим скидку в 15% на обучение! 🎁
📅 Лекция пройдёт 19 марта в 19:00 МСК
Регистрируйтесь по ссылке и до встречи в четверг!
deepschool.ru
Ванильный RAG не работает. Как исправить? | Открытая лекция DeepSchool
Расскажем, как правильно выстроить пайплайн и превратить RAG из хаотичного набора компонентов в надёжный инструмент
❤12👍4🔥4🤩2⚡1
Токенизация и эмбеддинги в NLP: что спрашивают на собеседованиях
Ранее мы разобрали популярные вопросы про attention и трансформеры с NLP-собеседований, а сегодня расскажем, что происходит с текстом до модели — обсудим токенизацию и построение эмбеддингов.
Формат новой статьи тот же: вопросы с собеседований разбиты на модули, а ответы спрятаны под спойлерами. Cначала попробуйте ответить сами, а потом загляните в разбор и примеры 😉
Читайте новую статью по ссылке!
Автор: Алексей Яндутов
🪔 DeepSchool
Ранее мы разобрали популярные вопросы про attention и трансформеры с NLP-собеседований, а сегодня расскажем, что происходит с текстом до модели — обсудим токенизацию и построение эмбеддингов.
Формат новой статьи тот же: вопросы с собеседований разбиты на модули, а ответы спрятаны под спойлерами. Cначала попробуйте ответить сами, а потом загляните в разбор и примеры 😉
Читайте новую статью по ссылке!
Автор: Алексей Яндутов
Уже профессионально работаете с LLM? Соберите полноценные LLM-системы с учётом требований к качеству и нагрузке, разберите сложные кейсы и дизайны NLP-решений у нас на курсе LLM Pro.
Старт — 26 марта.
Читайте подробнее на сайте и присоединяйтесь к обучению ⚡️
Please open Telegram to view this post
VIEW IN TELEGRAM
❤18🔥12👍9🤝1
Встречаемся через 3 часа на лекции по RAG
Сегодня Дмитрий Калашников расскажет, как правильно выстроить пайплайн и превратить RAG из хаотичного набора компонентов в надёжный инструмент.
На лекции вы узнаете:
- почему ванильная схема «ретривер + генератор» почти никогда не даёт нужного качества
- с чего начинать улучшения: эмбеддер, поиск, реранкер, генератор, данные или что-то ещё
- какие задачи приходится решать, чтобы RAG действительно работал
- как из разрозненных компонент собрать надежный RAG-продукт
🔥 А также всем участникам подарим скидку 15% на курс LLM Pro — продвинутую программу, на которой вы научитесь строить системы, которые работают в реальном мире!
⏰ Начинаем сегодня, 19 марта, в 19:00 МСК
Регистрируйтесь по ссылке и приходите сегодня вечером!
Сегодня Дмитрий Калашников расскажет, как правильно выстроить пайплайн и превратить RAG из хаотичного набора компонентов в надёжный инструмент.
На лекции вы узнаете:
- почему ванильная схема «ретривер + генератор» почти никогда не даёт нужного качества
- с чего начинать улучшения: эмбеддер, поиск, реранкер, генератор, данные или что-то ещё
- какие задачи приходится решать, чтобы RAG действительно работал
- как из разрозненных компонент собрать надежный RAG-продукт
🔥 А также всем участникам подарим скидку 15% на курс LLM Pro — продвинутую программу, на которой вы научитесь строить системы, которые работают в реальном мире!
⏰ Начинаем сегодня, 19 марта, в 19:00 МСК
Регистрируйтесь по ссылке и приходите сегодня вечером!
deepschool.ru
Ванильный RAG не работает. Как исправить? | Открытая лекция DeepSchool
Расскажем, как правильно выстроить пайплайн и превратить RAG из хаотичного набора компонентов в надёжный инструмент
1❤7🔥3🤝3
Как собирать NLP-системы, которые работают под нагрузкой
Обучить модель, построить эмбеддер или воспользоваться API — не значит запустить рабочую систему. RAG галлюцинирует, агент ломается на реальных сценариях, эмбеддинги не работают на специфичном домене. С этими и другими проблемами мы разберёмся на курсе LLM Pro, который стартует 26 марта!
На курсе вы научитесь:
• проектировать и запускать NLP-системы под реальные продуктовые задачи
• адаптировать LLM и эмбеддинги под специфичный домен и «живые» данные
• собирать и размечать датасеты — даже если данных изначально почти нет
• решать задачи классификации, поиска, кластеризации и NER — с ограничениями продакшн-среды
• собирать свою RAG-систему: от ретривера и реранкера до генератора и оценки качества
• строить AI-агентов с нуля — на основе сценариев, функций и взаимодействия с внешней средой
Приходите, чтобы узнать про best practices от опытных инженеров из продуктовых команд и применять похожие подходы в своих проектах
🤖 До 25 марта вы можете присоединиться к обучению со скидкой 5%!
Изучайте программу и отзывы на сайте и записывайтесь на ближайший поток 🎓
Обучить модель, построить эмбеддер или воспользоваться API — не значит запустить рабочую систему. RAG галлюцинирует, агент ломается на реальных сценариях, эмбеддинги не работают на специфичном домене. С этими и другими проблемами мы разберёмся на курсе LLM Pro, который стартует 26 марта!
На курсе вы научитесь:
• проектировать и запускать NLP-системы под реальные продуктовые задачи
• адаптировать LLM и эмбеддинги под специфичный домен и «живые» данные
• собирать и размечать датасеты — даже если данных изначально почти нет
• решать задачи классификации, поиска, кластеризации и NER — с ограничениями продакшн-среды
• собирать свою RAG-систему: от ретривера и реранкера до генератора и оценки качества
• строить AI-агентов с нуля — на основе сценариев, функций и взаимодействия с внешней средой
Приходите, чтобы узнать про best practices от опытных инженеров из продуктовых команд и применять похожие подходы в своих проектах
🤖 До 25 марта вы можете присоединиться к обучению со скидкой 5%!
Изучайте программу и отзывы на сайте и записывайтесь на ближайший поток 🎓
deepschool.ru
Продвинутый курс по LLM и NLP System Design
Соберёте полноценные LLM-системы с учётом требований к качеству и нагрузке, разберёте сложные кейсы и дизайны NLP-решений
1❤11👍5🔥4
Продолжаем разбираться с LLM!
Подготовили 20 новых карточек с вопросами:
- зачем нужен GQA
- как scaling laws влияют на выбор модели
- FSDP vs DDP
- как изображения попадают в LLM
и много других. Готовьтесь к собеседованию здесь!
Теперь можно предложить вопрос со своего собеседования и мы его опубликуем. Для этого нажимайте «предложить вопрос» у коллекции «от сообщества 💚»
Подготовили 20 новых карточек с вопросами:
- зачем нужен GQA
- как scaling laws влияют на выбор модели
- FSDP vs DDP
- как изображения попадают в LLM
и много других. Готовьтесь к собеседованию здесь!
Теперь можно предложить вопрос со своего собеседования и мы его опубликуем. Для этого нажимайте «предложить вопрос» у коллекции «от сообщества 💚»
DeepSchool
Вопросы на собеседовании по LLM 2 — Карточки | DeepSchool
Вопросы про LLM часть 2
❤17🔥8👍5
Flash Attention-2
FlashAttention-2 — реализация алгоритма attention, которая значительно ускоряет вычисления в сравнении с первой версией и работает заметно быстрее стандартной реализации в PyTorch. В статье простыми словами разбираем, за счёт чего это происходит 👨🏼💻
Из нового материала вы узнаете:
- какие проблемы были у FlashAttention-1
- как удалось лучше загрузить GPU
- что изменилось в распределении вычислений
- и какую роль играет параллельный softmax
Читайте статью по ссылке! 👈🏼
Автор: Антон Наумов
🪔 DeepSchool
FlashAttention-2 — реализация алгоритма attention, которая значительно ускоряет вычисления в сравнении с первой версией и работает заметно быстрее стандартной реализации в PyTorch. В статье простыми словами разбираем, за счёт чего это происходит 👨🏼💻
Из нового материала вы узнаете:
- какие проблемы были у FlashAttention-1
- как удалось лучше загрузить GPU
- что изменилось в распределении вычислений
- и какую роль играет параллельный softmax
Читайте статью по ссылке! 👈🏼
Про ускорение LLM, дообучение и их деплой рассказываем на курсе LLM. Запишитесь в лист ожидания, чтобы первыми занять место и получить скидки до 20%🔥
Автор: Антон Наумов
Please open Telegram to view this post
VIEW IN TELEGRAM
DeepSchool
Flash Attention-2 - DeepSchool
Продолжаем разбор оптимизаций механизма attention и обсуждаем FlashAttention-2
2🔥23❤10👍7
Love, 3DCV & Robots
В этот четверг мы проведём воркшоп по использованию трёхмерных данных в CV-системах. На нём вы узнаете, как гуманоидные роботы собирают и обрабатывают 3D-информацию и что роднит их с аппаратом МРТ. Мы разберём, из каких этапов состоит пайплайн обработки 3D-данных и какие применения он находит в частных задачах.
Вы узнаете:
• как и откуда получать 3D-данные
• как их правильно выравнивать и предобрабатывать
• как работать с библиотекой Open3D
• какие 3D DL-модели существуют и для каких представлений данных они подходят
• как оценивать полученный результат
• в каких практических задачах применяется 3D и как именно
Во второй части воркшопа вы самостоятельно построите ключевые элементы пайплайна 3D-зрения для ориентации робота в комнате. Мы разделим вас на группы по 2-3 человека, и вы реализуете агрегацию и фильтрацию 3D-данных для построения модели комнаты, обработку данных нейросетью и извлечение информации для навигации робота. У вас будет эмулятор робота в пространстве, к которому вы допишете фрагменты обработки 3D-сцены.
Чтобы не терять времени на воркшопе, заранее установите Conda и настройте среду, используя этот environment.yml, с помощью команды: conda env create -f environment.yml
🙋♂️Спикер воркшопа — Давид Свитов, к.т.н., IIT, ex Researcher Samsung AI Center. Давид расскажет про обработку 3D-данных и поможет вам с выполнением задания.
📅 9 апреля, четверг, в 19:00 МСК
Регистрируйтесь по ссылке и приходите в четверг!
В этот четверг мы проведём воркшоп по использованию трёхмерных данных в CV-системах. На нём вы узнаете, как гуманоидные роботы собирают и обрабатывают 3D-информацию и что роднит их с аппаратом МРТ. Мы разберём, из каких этапов состоит пайплайн обработки 3D-данных и какие применения он находит в частных задачах.
Вы узнаете:
• как и откуда получать 3D-данные
• как их правильно выравнивать и предобрабатывать
• как работать с библиотекой Open3D
• какие 3D DL-модели существуют и для каких представлений данных они подходят
• как оценивать полученный результат
• в каких практических задачах применяется 3D и как именно
Во второй части воркшопа вы самостоятельно построите ключевые элементы пайплайна 3D-зрения для ориентации робота в комнате. Мы разделим вас на группы по 2-3 человека, и вы реализуете агрегацию и фильтрацию 3D-данных для построения модели комнаты, обработку данных нейросетью и извлечение информации для навигации робота. У вас будет эмулятор робота в пространстве, к которому вы допишете фрагменты обработки 3D-сцены.
Чтобы не терять времени на воркшопе, заранее установите Conda и настройте среду, используя этот environment.yml, с помощью команды: conda env create -f environment.yml
🙋♂️Спикер воркшопа — Давид Свитов, к.т.н., IIT, ex Researcher Samsung AI Center. Давид расскажет про обработку 3D-данных и поможет вам с выполнением задания.
Регистрируйтесь по ссылке и приходите в четверг!
Please open Telegram to view this post
VIEW IN TELEGRAM
deepschool.ru
Воркшоп по 3D данным в CV-пайплайнах | DeepSchool
Воркшоп, на котором разберём, из каких этапов состоит пайплайн обработки 3D-данных и в каких задачах он применяется, а вы построите пайплайн 3D-зрения для ориентации робота.
🔥21❤13⚡3👻2
Встречаемся через 3 часа на воркшопе по 3D CV
Сегодня разберём, из каких этапов состоит пайплайн обработки 3D-данных и какие применения он находит в частных задачах. А потом вы самостоятельно построите ключевые элементы пайплайна 3D-зрения для ориентации робота в комнате.
Вы узнаете:
• как и откуда получать 3D-данные
• как их правильно выравнивать и предобрабатывать
• как работать с библиотекой Open3D
• какие 3D DL-модели существуют и для каких представлений данных они подходят
• как оценивать полученный результат
• в каких практических задачах применяется 3D и как именно
Во второй части воркшопа мы разделим вас на группы, и вы реализуете агрегацию и фильтрацию 3D-данных для построения модели комнаты, обработку данных нейросетью и извлечение информации для навигации робота. У вас будет эмулятор робота в пространстве, к которому вы допишете фрагменты обработки 3D-сцены.
Чтобы не терять времени на воркшопе, заранее установите Conda и настройте среду, используя этот environment.yml, с помощью команды: conda env create -f environment.yml
📅 9 апреля, четверг, в 19:00 МСК
Регистрируйтесь по ссылке и приходите сегодня вечером!
Сегодня разберём, из каких этапов состоит пайплайн обработки 3D-данных и какие применения он находит в частных задачах. А потом вы самостоятельно построите ключевые элементы пайплайна 3D-зрения для ориентации робота в комнате.
Вы узнаете:
• как и откуда получать 3D-данные
• как их правильно выравнивать и предобрабатывать
• как работать с библиотекой Open3D
• какие 3D DL-модели существуют и для каких представлений данных они подходят
• как оценивать полученный результат
• в каких практических задачах применяется 3D и как именно
Во второй части воркшопа мы разделим вас на группы, и вы реализуете агрегацию и фильтрацию 3D-данных для построения модели комнаты, обработку данных нейросетью и извлечение информации для навигации робота. У вас будет эмулятор робота в пространстве, к которому вы допишете фрагменты обработки 3D-сцены.
Чтобы не терять времени на воркшопе, заранее установите Conda и настройте среду, используя этот environment.yml, с помощью команды: conda env create -f environment.yml
📅 9 апреля, четверг, в 19:00 МСК
Регистрируйтесь по ссылке и приходите сегодня вечером!
👌9❤5👍4
YOLO history. Part 9
А мы возвращаемся с разбором моделей семейства YOLO! 😎
В прошлой статье обсудили YOLOv8 и YOLOv11 — а значит, подобрались уже к самым передовым моделям. Сегодня рассмотрим все оставшиеся модели в одном посте 🤓
Итак, в новой статье:
- узнаем, как избавиться от NMS на примере YOLOv10
- поговорим об оптимизации attention для ускорения детекции из YOLOv12
- познакомимся с концепцией гиперграфа с помощью YOLOv13
Скорее читайте по ссылке! 👈🏼
🪔 DeepSchool
А мы возвращаемся с разбором моделей семейства YOLO! 😎
В прошлой статье обсудили YOLOv8 и YOLOv11 — а значит, подобрались уже к самым передовым моделям. Сегодня рассмотрим все оставшиеся модели в одном посте 🤓
Итак, в новой статье:
- узнаем, как избавиться от NMS на примере YOLOv10
- поговорим об оптимизации attention для ускорения детекции из YOLOv12
- познакомимся с концепцией гиперграфа с помощью YOLOv13
Скорее читайте по ссылке! 👈🏼
Please open Telegram to view this post
VIEW IN TELEGRAM
❤18🔥9👍8👏1
GENets: Neural Architecture Design For GPU-Efficienet Networks
Для многих GPU — основной девайс для инференса. А значит, получать высокие метрики при низком latency на нём — критически важно. Исследователи из Alibaba утверждают, что текущие быстрые решения не используют весь потенциал GPU.
В работе «Neural Architecture Design for GPU-Efficient Networks» они показывают, как проектировать сети для быстрого инференса на GPU и презентуют семейство backbones GENet.
О принципах построения свёрточных сетей для эффективного инференса на GPU и результатах авторов мы рассказали в новой статье!
Читайте материал по ссылке! 👈🏼
🪔 DeepSchool
Для многих GPU — основной девайс для инференса. А значит, получать высокие метрики при низком latency на нём — критически важно. Исследователи из Alibaba утверждают, что текущие быстрые решения не используют весь потенциал GPU.
В работе «Neural Architecture Design for GPU-Efficient Networks» они показывают, как проектировать сети для быстрого инференса на GPU и презентуют семейство backbones GENet.
О принципах построения свёрточных сетей для эффективного инференса на GPU и результатах авторов мы рассказали в новой статье!
Читайте материал по ссылке! 👈🏼
Приходите на курс «Ускорение нейросетей», чтобы разобраться в эффективных архитектурах и подходах к ускорению
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16👍12⚡5🔥3🤝1
Что под капотом у видеокодеков, генеративных моделей и тимлидов? | Подкаст с Ильдаром Идрисовым
В этом выпуске мы с Ильдаром Идрисовым, Head of ML Vinteo.ai, разбираемся, как устроены видеокодеки, почему лучшие модели не могут сгенерировать нам план квартиры и почему, став тимлидом, нужно ещё научиться им быть.
Смотрите по ссылке: https://youtu.be/stCi1eQSEYY 👈🏼
В этом выпуске мы с Ильдаром Идрисовым, Head of ML Vinteo.ai, разбираемся, как устроены видеокодеки, почему лучшие модели не могут сгенерировать нам план квартиры и почему, став тимлидом, нужно ещё научиться им быть.
Смотрите по ссылке: https://youtu.be/stCi1eQSEYY 👈🏼
YouTube
Что под капотом у видеокодеков, генеративных моделей и тимлидов? | Подкаст с Ильдаром Идрисовым
В этом выпуске мы с Ильдаром Идрисовым, Head of ML Vinteo.ai, разбираемся, как устроены видеокодеки, почему лучшие модели не могут сгенерировать нам план квартиры и почему, став тимлидом, нужно ещё научиться им быть.
0:00:20 | Знакомство с Ильдаром
0:02:40…
0:00:20 | Знакомство с Ильдаром
0:02:40…
🔥18❤12👍5
HNSW: строим маленькие миры для быстрого поиска
Поиск схожих объектов базовая задач в машинном обучении. Рекомендательные системы, семантический поиск, дедупликация, retrieval в RAG — везде нужно уметь быстро находить ближайшие векторы.
Но делать это «в лоб» — почти всегда довольно длительное занятие, поэтому зачастую используются приближенные методы.
В этой статье мы разберём один из таких методов — HNSW, и узнаем:
- как он работает
- почему гарантирует высокую скорость без сильной потери качества
- за счёт каких особенностей он настолько эффективен
- и как его параметры влияют на качество и скорость поиска
Читайте новую статью по ссылке: https://clck.ru/3TdhnE 🤩
Поиск схожих объектов базовая задач в машинном обучении. Рекомендательные системы, семантический поиск, дедупликация, retrieval в RAG — везде нужно уметь быстро находить ближайшие векторы.
Но делать это «в лоб» — почти всегда довольно длительное занятие, поэтому зачастую используются приближенные методы.
В этой статье мы разберём один из таких методов — HNSW, и узнаем:
- как он работает
- почему гарантирует высокую скорость без сильной потери качества
- за счёт каких особенностей он настолько эффективен
- и как его параметры влияют на качество и скорость поиска
Читайте новую статью по ссылке: https://clck.ru/3TdhnE 🤩
2❤18🔥13👍9
Разбираемся с тестированием
Подготовили карточки с вопросами по тестированию:
- пишем smoke-тесты на обучение модели
- разбираемся, зачем изобрели столько разных скоупов у фикстур
- боремся с долгой установкой в CI
- пишем регрессионный тест на метрики
и много других.
Формат тот же: вопрос на лицевой стороне, развёрнутый ответ с примерами — на обратной. Готовьтесь к собеседованию здесь!
Подготовили карточки с вопросами по тестированию:
- пишем smoke-тесты на обучение модели
- разбираемся, зачем изобрели столько разных скоупов у фикстур
- боремся с долгой установкой в CI
- пишем регрессионный тест на метрики
и много других.
Формат тот же: вопрос на лицевой стороне, развёрнутый ответ с примерами — на обратной. Готовьтесь к собеседованию здесь!
А если хотите подготовиться не только к вопросам по тестированию, но и разобраться во всём цикле разработки DL-сервисов, то приходите на курс DLOps, который стартует 4 июня!
DeepSchool
Вопросы на собеседовании по Тестирование — Карточки | DeepSchool
Учимся тестировать ML-приложения
🔥13❤8👍5
От ML-инженеров хотят всё больше. Раньше можно было просто обучить модель и перекинуть ноутбук бэкендеру «через стенку». Сейчас где-то нужно завернуть модель в Docker/сделать минимальное демо и довести его до пользователя. Где-то самому встроить модель в сложную систему. А где-то эту систему ещё и спроектировать.
Код-агенты, конечно, сильно упростили жизнь: собрать демку или MVP теперь проще некуда. Но они не сняли с нас главного: ответственности за полученное решение. По шапке будет получать не Claude:)
А отвечать за систему, в которой не знаешь, как устроены «кубики» — сомнительное удовольствие. Ты вроде что-то собрал и оно работает. Но почему именно так? —🤷♂️ . Что делать, когда сломается? — 🤷♂️ . Остаётся верить сетке на слово, что «так правильно». Спойлер: очень часто нет.
Чтобы «кубики» были не чёрными ящиками, а понятным набором инструментов, мы запускаем курс DLOps. За 4 месяца проходим всю цепочку: от сериализации модели и небольшого сервиса на FastAPI до Nvidia Triton, k8s и мониторинга. Учим создавать полноценные сервисы и доводить их до пользователя.
В этом потоке добавили лекцию про LLM observability. Наш DLOps построен вокруг «обычных» DL-моделей. Но чем дальше, тем меньше сервисов не ходит в LLM хотя бы просто по API. А за ними нужен глаз да глаз 😉
Обучение начинается 4 июня, а до 24 мая действует скидка 20% 🔥
Переходите на сайт, изучайте подробности и оставляйте заявку на курс!
Если возникают вопросы, пишите нам в поддержку в Телеграм!
Код-агенты, конечно, сильно упростили жизнь: собрать демку или MVP теперь проще некуда. Но они не сняли с нас главного: ответственности за полученное решение. По шапке будет получать не Claude:)
А отвечать за систему, в которой не знаешь, как устроены «кубики» — сомнительное удовольствие. Ты вроде что-то собрал и оно работает. Но почему именно так? —
Чтобы «кубики» были не чёрными ящиками, а понятным набором инструментов, мы запускаем курс DLOps. За 4 месяца проходим всю цепочку: от сериализации модели и небольшого сервиса на FastAPI до Nvidia Triton, k8s и мониторинга. Учим создавать полноценные сервисы и доводить их до пользователя.
В этом потоке добавили лекцию про LLM observability. Наш DLOps построен вокруг «обычных» DL-моделей. Но чем дальше, тем меньше сервисов не ходит в LLM хотя бы просто по API. А за ними нужен глаз да глаз 😉
Обучение начинается 4 июня, а до 24 мая действует скидка 20% 🔥
Переходите на сайт, изучайте подробности и оставляйте заявку на курс!
Если возникают вопросы, пишите нам в поддержку в Телеграм!
Please open Telegram to view this post
VIEW IN TELEGRAM
deepschool.ru
Научитесь создавать и деплоить DL-сервисы за 4 месяца — DeepSchool
🔥12❤7👍6
Спроси DeepSchool
Мы запускаем новую рубрику, в которой будем отвечать на вопросы не только наших студентов, но и всех подписчиков канала.
Начинаем с вопроса, который нам задали на QA-сессии курса DLOps.
❓«Сделали модель — как её задеплоить?»
💬 Отвечает Константин Носорев — Senior Backend-разработчик в Яндекс, спикер курса DLOps.
На самом деле в этом вопросе скрывается несколько разных вопросов. Разберём каждый.
1. Как запустить модель?
2. Как обеспечить доступность?
3. Как выстроить архитектуру сервиса?
✍️ Будем продолжать этот формат — на ваши вопросы будут отвечать такие же опытные практикующие инженеры, как Константин: наши спикеры, авторы статей и друзья школы.
Задавайте вопросы на ask.deepschool.ru, а мы ответим на них в канале!
Мы запускаем новую рубрику, в которой будем отвечать на вопросы не только наших студентов, но и всех подписчиков канала.
Начинаем с вопроса, который нам задали на QA-сессии курса DLOps.
❓«Сделали модель — как её задеплоить?»
💬 Отвечает Константин Носорев — Senior Backend-разработчик в Яндекс, спикер курса DLOps.
На самом деле в этом вопросе скрывается несколько разных вопросов. Разберём каждый.
1. Как запустить модель?
Есть два основных подхода:
а) FastAPI / Flask (и др.) обёртка. Файл модели загружается в HTTP / gRPC-сервис. Минимальные накладные расходы на старте, но проблемы с масштабированием / батчингом придётся решать самостоятельно.
б) Специализированные inference-серверы. Например,Triton Inference Server, TorchServe, vLLM. Поддерживают батчинг, управление памятью и обслуживание нескольких моделей одновременно. Оправданы при высоких требованиях к latency и throughput.
2. Как обеспечить доступность?
Если у вас большие требования к доступности — нужно несколько реплик на разных серверах (а лучше — ДЦ). Иначе сбой на одном сервере — и к вашей модели
«
не достучаться
»
. В случае с несколькими репликами важно, чтобы при падении одной из них трафик перераспределялся между остальными. Здесь тоже есть несколько вариантов, например:
а) Kubernetes. Автоматически поддерживает заданное число реплик, проверяет доступность / работоспособность и перераспределяет трафик.
б) Bare Metal. Прямой запуск на серверах. Максимальный контроль над ресурсами, логику перезапуска и балансировки нужно делать самостоятельно. Например, через systemd и nginx / HAProxy.
3. Как выстроить архитектуру сервиса?
Есть несколько подходов:
а) Бизнес-логика и модель в одном сервисе. Минимальная сложность при запуске, но при росте нагрузки возникают проблемы. Бизнес-логика и инференс потребляют ресурсы совместно и разделить их невозможно: если модель перегружена, масштабируется весь сервис целиком, включая логику, которая в этом не нуждается. Обратная ситуация аналогична. Это приводит к избыточному расходу памяти и GPU, а также к сложностям при горизонтальном масштабировании.
б) Отдельно микросервис с моделью и отдельно сервис с бизнес-логикой. Например, Triton или vLLM обслуживают модель, а «основной» сервис обращается к ним по HTTP/gRPC. Компоненты обновляются и масштабируются независимо: можно добавить реплики только на сторону модели или логики.
✍️ Будем продолжать этот формат — на ваши вопросы будут отвечать такие же опытные практикующие инженеры, как Константин: наши спикеры, авторы статей и друзья школы.
Задавайте вопросы на ask.deepschool.ru, а мы ответим на них в канале!
deepschool.ru
Научитесь создавать и деплоить DL-сервисы за 4 месяца — DeepSchool
❤17🔥13👍8