HighLoad++
6.25K subscribers
2.38K photos
166 videos
16 files
2.27K links
Официальный канал профессиональной конференции разработчиков высоконагруженных систем

Saint HighLoad++ 2026 пройдёт 22 и 23 июня в Санкт-Петербурге: https://highload.ru/spb/2026

Общаемся в чатике https://t.me/HighLoadTalks
Download Telegram
Стартуем анонсы программы Saint HighLoad++ 2026.

Сначала напомним, что чем ближе конференция, тем дороже будут билеты. Следующее повышение цены — 1 мая. Успейте забронировать билет заранее по текущей стоимости.

Реверс-инжиниринг — важный аспект индустрии разработки. Сейчас проблема с реверс-инжинирингом стоит особенно остро. Производители защищают прошивки: они либо недоступны для скачивания из устройства, либо зашифрованы. Получить прошивку или ключ к ней — первый шаг в реверс-инжиниринге. Часто получить доступ к защищенной памяти устройства проще, чем может показаться. Если знаешь, что делаешь.

На Saint HighLoad++ 2026 вас ждет мастер-класс «Глитчим микроконтроллеры пока не сольем прошивку» от Даниила Соболя (ООО ЗООПТ). Спикер покажет простые техники, которые позволяют обойти защиту некоторых микроконтроллеров и получить доступ к защищенной памяти. Участники мастер-класса получат базу в глитчинге и смогут в дальнейшем сами развивать свои навыки.

Если вы интересуетесь реверс-инжинирингом, сохраняйте мастер-класс в свое расписание

➡️ Пройдите на сайт, чтобы посмотреть другие принятые на данный момент доклады и забронировать билет до повышения цены.
👍3
🔥 Кеш, баги и ядра: 5 свежих материалов об архитектуре и перформансе.

🔴Netflix: Interval-Aware Caching for Druid at Netflix Scale
Netflix разработал систему интервально-зависимого кэширования для Apache Druid, которая разбивает аналитические запросы на сегменты по временным интервалам и кэширует каждый отдельно. Неизменяемые исторические данные кэшируются агрессивно, а свежие данные всегда запрашиваются из источника. Это позволило сократить нагрузку на кластер Druid на 35% и значительно снизить P99 латентность запросов без потери актуальности данных.
Читать статью

🔴Figma: Next-Generation Data Caching Platform
Figma перестроила платформу кэширования, перейдя от прямых запросов к PostgreSQL к многоуровневой системе с Redis и in-memory кэшами. Новая архитектура использует паттерн cache-aside с инвалидацией через CDC (Change Data Capture) из PostgreSQL WAL. Это снизило нагрузку на базу данных на 90% и обеспечило масштабирование для поддержки миллионов одновременных пользователей в реальном времени.

Читать статью

🔴Монолит с отчётами на 30 секунд: как я переписал архитектуру
Практический кейс оптимизации Django/PostgreSQL монолита для розничной сети. Автор сократил время генерации отчётов с 30 секунд до приемлемых значений через устранение N+1 запросов, добавление индексов на основе EXPLAIN ANALYZE, рефакторинг бизнес-логики с разделением на слои по DDD и материализацию тяжёлых агрегаций. Статья содержит реальные примеры SQL-запросов до и после оптимизации

Читать статью

🔴PostgreSQL Performance Halved by Linux 7.0 Kernel Changes
Удаление PREEMPT_NONE из ядра Linux 7.0 привело к двукратному падению производительности PostgreSQL на многоядерных серверах (тестировалось на 96-core CPU). PostgreSQL использует spinlock-модель для синхронизации, которая конфликтует с новым режимом PREEMPT_LAZY. Решение для PostgreSQL — переход на restartable sequences (rseq). Проблема известна с 2011 года; Linus Torvalds неоднократно предупреждал о недопустимости spinlock в user space. Частичная митигация — включение huge_pages=on

Читать обсуждение

🔴Kubernetes v1.36 Sneak Peek: что нового
Kubernetes v1.36 (релиз — конец апреля 2026) включает ряд значимых изменений: GA для быстрой SELinux-маркировки томов через mount -o context (ускорение старта подов на SELinux-системах), бета для внешней подписи ServiceAccount токенов через KMS/HSM, бета для DRA device taints and tolerations (гранулярное управление GPU), поддержка партиционируемых устройств в DRA для разделения GPU между workloads.

Deprecation externalIPs в Service (CVE-2020-8554) и окончательное удаление gitRepo volume driver.
Читать статью

Продуктивного чтения и отличных выходных 🙌
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Представьте: банк не просто взыскивает просроченную задолженность, а превращает этот процесс в источник прибыли, сохраняя лояльность клиентов. Звучит как фантастика? На самом деле это реальность, достижимая через персонализацию коммуникаций и оптимизацию процессов.

В традиционном подходе взыскание часто воспринимается как неизбежная потеря или затратный процесс. Но что, если взглянуть на него под другим углом? Правильно выстроенная система Next Best Action позволяет не только минимизировать издержки, но и улучшить качество кредитного портфеля, снизить резервы и даже укрепить отношения с клиентами. Это не только про «вернуть деньги», но и про «сохранить клиента», предлагая ему оптимальные решения.

Ольга Кравченко, техдиректор Газпромбанк.Тех, поделилась опытом, как команда из 11 человек построила такую систему. От архитектуры платформы данных до ML-пайплайнов и витрин Hadoop — это глубокий кейс о том, как технологии меняют банковские процессы.

➡️ Узнайте в статье, как можно совместить скорость, эффективность и минимальные затраты, избегая при этом потери лояльности.
😢51😱1
Баги в проде — неизбежность, но кто за них отвечает? Часто списывается все на тестирование, но реальные причины гораздо глубже.

В Okko столкнулись с тем, что «взвешивание» багов помогло сократить их количество, но этого оказалось недостаточно. В компании поняли, что для системного улучшения нужно не просто фиксировать дефекты, а классифицировать их по категориям причин. Это позволяет не только выявить слабые места в процессах, но и целенаправленно на них влиять. Ведь одно дело — баг, который пропустил QA, и совсем другое — дефект из-за неполной документации или решения релизить с известной проблемой.

Понимание истинных корней проблем помогает командам корректировать поведение и повышать качество продукта.

➡️ Узнайте подробности о том, как категоризация багов помогла снизить их количество и улучшить процессы — в статье.
Мы запускаем закрытый клуб для тех, кто внедряет ИИ. Не изучает, не обсуждает, а делает.

📍Первая встреча: 28 апреля, 19:00 (МСК), онлайн.

Большинство AI-инициатив гибнет на этапе «продать команде». Первую встречу посвящаем именно этой проблеме:

🟣Почему AI-powered development не покупают и что с этим делать. Даниил Подольский, Yadro.

🟣Spec Driven Development: как это работает на практике.
Максим Куляев, Game Hunters Inc.

🟣С чего начать трансформацию, чтобы не застрять в пилоте. Татьяна Сеземина, ИТ-холдинг Т1

Формат камерный: доклады по 15–30 минут и живая дискуссия после каждого.

Клуб закрытый, попасть на встречу можно через заявку на вступление по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥2🗿2
This media is not supported in your browser
VIEW IN TELEGRAM
Система масштабируется, а вместе с ней растет и груз ответственности за каждое архитектурное решение. Знакомо вам чувство, когда выбор между «быстро» и «правильно» давит, а цена ошибки измеряется не часами, а неделями переделок?

Высоконагруженные системы не прощают поверхностных подходов. Но и вариться в собственном контексте — путь к застою. Иногда для прорыва нужно выйти за пределы своей команды и увидеть, как аналогичные вызовы решают другие.

Традиционно на предстоящей Saint HighLoad++ соберутся инженеры, которые ежедневно сталкиваются с теми же задачами. Здесь поделятся реальным опытом — включая разбор неудач и неочевидных решений.

Используйте возможность получить обратную связь на свои гипотезы, увидеть типовые решения, которые работают в рабочей среде, и сократить путь к надежной архитектуре. Без абстракций — только практика и диалог с теми, кто понимает контекст.

Ваше участие — это инвестиция в экспертизу, которая окупается качеством следующих релизов

Также напоминаем, что 1 мая повысится цена на билеты. Забронируйте участие заранее, чтобы зафиксировать текущую стоимость.

Встречаемся 22 и 23 июня в Санкт-Петербурге, присоединяйтесь 🖐️

➡️ Программа пока в стадии формирования, но часть уже готова — посмотреть можно сайте.
👍2
Пятничная подборка технических кейсов из мира highload, observability и инфраструктуры.

Коротко о главном в карточках.

Детали по ссылкам:
🔴Netflix: Mount Mayhem — Scaling Containers on Modern CPUs.
Запуск 100+ контейнеров на узле приводил к 30-секундным задержкам health-check из-за проблем с VFS mounting в Linux ядре.

🔴Cloudflare: 500 Tbps of Network Capacity.
В статье архитектурные решения, стоящие за этим масштабом.

🔴Adobe: OpenTelemetry Pipeline — Simplicity at Scale.
Трёхуровневая архитектура коллекторов: sidecar + deployment + managed namespace. Главный фикс — изоляция метрик, логов и трейсов друг от друга, чтобы сбой в одном бэкенде не ломал остальные.

🔴KubeCon EU 2026: AI, Observability и Fast Feedback Loops.
Новые SLI для LLM (time to first token, decode speed), сшивка frontend/backend трейсов через <meta />, риски AI-генерации телеметрии и проблема cardinality capping.

Продуктивного чтения и отличных выходных 🙌
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Использовать инструменты, в которых у нас наибольшая экспертиза, — весьма эффективная стратегия. Но в какой момент наступит та самая грань, после чего инструмент все же стоит сменить?

На Saint HighLoad++ 2026 выступит Игорь Анохин (K2 Cloud) с докладом «MongoDB как единственное хранилище. Использование, проблемы, боль и последствия». Рекомендуем послушать инженерам, отвечающим за архитектуру, хранение данных и эксплуатацию высоконагруженных сервисов.

Из доклада слушатели:
🟣Узнают, как MongoDB работает в реальной продакшн-среде: как хранилище, кеш, брокер сообщений, time-series и распределенная база данных.
🟣Увидят, где она действительно справляется и позволяет упростить стек, а где на практике пришлось перейти на специализированные решения: Redis, Kafka, VictoriaMetrics.
🟣Получат архитектурные компромиссы, эксплуатационные нюансы и выводы, которые помогут трезво выбирать инструменты.

➡️ Программа конференции в стадии формирования, принятую часть можно посмотреть на сайте.

До повышения цены на билеты осталось 4 дня. Успейте забронировать участие по текущей стоимости до 1 мая.
Please open Telegram to view this post
VIEW IN TELEGRAM
22👍1
Можно ли развернуть ASR-модель на CPU без потери качества и производительности?

Этот вопрос часто встает перед разработчиками, когда GPU недоступны или нужно оптимизировать ресурсы. Кажется, что компромиссы неизбежны, но так ли это на самом деле?

➡️ В этой статье подробно разбирается, как MWS AI удалось продуктивизировать нейросетевые решения для распознавания речи на CPU, сохраняя при этом высокое качество и сопоставимую с GPU-кластерами точность.

Различные бэкенды, особенности настройки Triton Inference Server и подводные камни, с которыми столкнулись инженеры. Если вы работаете с ASR, оптимизацией инференса или просто ищете способы эффективного использования ресурсов, этот материал даст вам конкретные ответы и практические кейсы.

Узнайте, как избежать ловушки усреднения метрик и добиться впечатляющих результатов.
Уже сегодня пройдет первая встреча закрытого клуба для тех, кто внедряет ИИ. Не изучает, не обсуждает, а делает.

📍28 апреля, 19:00 (мск), онлайн.

Сегодняшнюю встречу посвящаем распространенной проблеме провала AI-инициатив на этапе «продать команде»:

🔴Почему AI-powered development не покупают и что с этим делать. Даниил Подольский, Yadro.

🔴Spec Driven Development: как это работает на практике. Максим Куляев, Game Hunters Inc.

🔴С чего начать трансформацию, чтобы не застрять в пилоте. Татьяна Сеземина, ИТ-холдинг Т1

Формат камерный: доклады по 15–30 минут и живая дискуссия после каждого.

Клуб закрытый, попасть на встречу можно через заявку на вступление по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
Вы когда-нибудь задумывались, почему многопоточный код иногда выдает неожиданные результаты?

Причина часто кроется в тонкостях модели памяти языка. В Go это особенно актуально. Без понимания Go Memory Model можно наткнуться на «пустую строку» вместо ожидаемого значения. Понимание happens before позволяет формально доказать корректность программы.

Хотите писать многопоточный код без скрытых багов? Эта статья👇— ваш проводник в мир синхронизации в Go.

Статья в двух частях:
В первой вы разберетесь с отношением happens before, формализмом, посмотрите практические примеры.
Во второй речь пойдет про линеаризуемость, барьеры памяти, гонки и использование различных нетривиальных техник.

Углубите свои знания в одной из самых сложных тем Go 🙌
Please open Telegram to view this post
VIEW IN TELEGRAM
Онтико традиционно выступает информационным партнёром исследования облачно-ориентированных технологий в России.

Команда АОТ проводит одно из первых детальных исследований того, как российские компании применяют Cloud Native-технологии и ИИ в разработке и DevOps.

Новое исследование — расширенная версия State of DevOps Russia, в котором вы могли принимать участие ранее. В опросе — вопросы про инструменты и практики Cloud Native, использование ИИ на разных этапах разработки и подходы к безопасности при работе с нейросетями.

Если вы связаны с DevOps и разработкой — пройдите опрос и расскажите, как используете облачные технологии в связке с ИИ.

На основе ответов будет подготовлен подробный отчёт, в котором поделимся ключевыми трендами этого года и выводами экспертов.
🚀 Мультибилет на две ключевые конференции июня в Санкт-Петербурге — возможность увидеть картину целиком.

Saint HighLoad++ 2026 (22–23 июня) — для тех, кто строит системы, которые держат нагрузку. Глубокие технические доклады, разборы инцидентов, интерактивные форматы и фокус на практические решения.

Saint TeamLead Conf 2026 (25–26 июня) — для тех, кто развивает команды. Управление людьми, процессы, коммуникации и стратегии роста в условиях неопределённости.

Мультибилет объединяет оба события с выгодой до 30%. Это выбор для тех, кто:
•хочет синхронизировать техническое видение с управленческим;
•планирует прокачать экспертизу в обоих направлениях;
•ценит время и предпочитает решать вопросы комплексно.

Четыре дня в Санкт-Петербурге, две сильные программы, одно логичное решение. Участие в обеих конференциях поможет не просто реагировать на вызовы, а формировать подход к ним.

Билеты постепенно дорожают — чем раньше примите решение, тем выгоднее будут условия. Завтра (1 мая) очередное повышение — успейте забронировать билет сегодня по текущей стоимости, оплатить сможете в течение нескольких дней.

Мультибилет — это инвестиция в развитие, которая окупается качеством архитектуры и зрелостью команды.

➡️ Подробности о конференциях и возможность забронировать билет на сайте

До встречи в Санкт-Петербурге 🖐️
🔥2
Пятничная подборка из 6 свежих материалов апреля для SRE, DevOps, backend-разработчиков и архитекторов высоконагруженных систем.

🔴GitHub ограничивает Copilot: агентные AI-воркфлоу перегружают инфраструктуру.
GitHub был вынужден приостановить регистрацию новых пользователей Copilot Pro из-за критической перегрузки инфраструктуры агентными AI-воркфлоу. Параллельные сессии агентов, выполняющих многошаговые задачи, генерируют экспоненциально растущие затраты на токены, которые превышают стоимость месячной подписки. В ответ GitHub внедряет лимиты сессий (аналог circuit breaker) и жесткие недельные квоты на потребление токенов.


🔴PlanetScale: как работает Database Traffic Control под капотом.
Инженерный блог PlanetScale опубликовал глубокий разбор механизма защиты баз данных PostgreSQL от перегрузки «тяжелыми» запросами. Система использует Postgres-хуки (в частности ExecutorRun) для перехвата запросов до их выполнения. Для предсказания стоимости запроса применяется адаптивный коэффициент, связывающий оценку планировщика с реальным CPU-временем, а также алгоритм leaky bucket для лимитирования по бюджетам.


🔴Релиз Kubernetes v1.36 «Haru»: 70 новых улучшений.
Вышел весенний релиз Kubernetes 1.36, включающий 18 стабильных фич. Среди главных нововведений: переход в GA гранулярной авторизации kubelet API (заменяет избыточные права nodes/proxy), стабильная поддержка User Namespaces и Volume Group Snapshots. В альфа-версии представлен Workload Aware Scheduling с атомарным gang scheduling через новый PodGroup API.


🔴Unit 42: Эволюция атак на npm и червь Shai-Hulud.
Аналитики Palo Alto Networks опубликовали исследование ландшафта угроз в экосистеме npm. Зафиксирована новая волна атак (группировка TeamPCP) с использованием пакета @bitwarden/cli. Вредонос использует многоступенчатую обфускацию, крадет токены доступа из CI/CD пайплайнов и облачных провайдеров, а затем использует их для самораспространения (wormable propagation) по всем доступным репозиториям.


🔴Datadog: Платформа оценки для автономных SRE-агентов.
Команда инженеров Datadog поделилась опытом создания платформы тестирования Bits AI SRE. Главной проблемой разработки AI-агентов стала «проблема регрессии»: улучшение навыков агента в одной области ломало его логику в другой. Для решения была создана система офлайн-эвалюации, использующая «снимки мира» (world snapshots) реальных инцидентов для воспроизводимого тестирования агентов перед деплоем.


🔴 Cloudflare: Внутренний AI-инженерный стек на базе собственных продуктов.
Cloudflare рассказала об архитектуре своей внутренней платформы для AI-разработки, которой пользуются 93% инженеров компании. Стек построен на собственных решениях: AI Gateway используется для маршрутизации запросов к LLM и контроля бюджетов, Workers AI — для инференса, а новый Sandbox SDK обеспечивает безопасное изолированное выполнение кода, сгенерированного агентами.


Если у вас есть новости по теме — делитесь в комментариях. Давайте вместе строить уютное профессиональное сообщество 🙌
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Вы уверены, что ваша система выживет при отказе? Большинство отвечают «да» — пока не случится первый инцидент.

На Saint HighLoad++ 2026 вас ждет воркшоп «Рождённый устойчивым», в программе которого практика по HA-архитектуре:
✔️ развернете приложение в Yandex Cloud, намеренно сломаете — и почините. Рядом будут инженеры Yandex Cloud, которые видели, как это ломается в реальных системах. Сможете задать вопрос и получить ответ от человека с production-опытом, а не от документации;
✔️ уйдете с Recovery Plan, который сможете адаптировать под свой прод.

🎤 Ведущие:
•Татьяна Сердинова — активный лидер команд,
•Антон Воронцов — Customer Reliability Engineer,
•Антон Егорушков — DevOps 7 лет, спикер, ментор.

👥 Для кого воркшоп: Backend-разработчики, SRE и DevOps-инженеры, которые хотят прокачать навыки обеспечения надежности.

🖐️ Присоединяйтесь к нам на Saint HighLoad++ 2026 и приходите на воркшоп, чтобы обрести уверенность, что ваш сервис выдержит следующий пик нагрузки.
👍1