HighLoad++

Чанкинг — это один из методов, который позволяет представить текст в виде смысловых отрезков, с которыми далее будет работать LLM.

Правильное деление на эти отрезки на входе и определяет в большей мере скорость, качество и цену работы всей системы поиска.

Андрей Носов, AI-архитектор в компании Raft, рассказал в статье о вызовах, которые он с командой преодолевает каждый день, создавая такие системы. Подробнее всего остановился на чанкинге.

Хабр

Архитектура высоконагруженных RAG-систем: 10 стратегий оптимизации чанкинга и интеграция с Weaviate, Qwen / Llama /Gemma

Привет, Хабр! Это Андрей Носов, AI-архитектор в компании Raft, проектирую и внедряю высоконагруженные RAG-системы на предприятиях. Сегодня я расскажу о вызовах, которые мы преодолеваем каждый день,...

🔥4❤3👍2

2.49K views11:07

HighLoad++

⭐️ Топ-10 докладов HighLoad++ 2025

6 и 7 ноября в Москве собрались более 2700 участников со всей страны и 150+ спикеров, которые представили свои доклады по 14 тематическим трекам.

Два дня мы обсуждали базы данных и системы хранения, GenAI, LLM и ML в продакшене, архитектуру и масштабируемость, безопасность и надежность, FinOps, SRE, Platform Engineering и другие направления, связанные с большими и высоконагруженными IT-системами.

Все для того, чтобы получить концентрат самых актуальных решений 🔥

Пришло время подвести итоги прошедшей конференции и объявить доклады, которые получили самые высокие оценки от участников за содержание и подачу!

Начнем в обратном порядке:

1️⃣0️⃣ Как масштабировать не только IT-системы, но и IT-команды. Александр Апазиди (независимый эксперт, ментор CTO (Apazidi IT)).
Доклад исследует вызовы масштабирования IT-команд через призму системного подхода. Сравнительный анализ организационных моделей, кейсы успехов и провалов. Фреймворк для эволюции структуры команд с использованием Team Topologies и data-driven-подходов.

9️⃣ CокрAIти.It. Марина Кубанина (Технологии Доверия (ex PWC)).
Многие IT-компании на Западе, да и у нас, объявили об оптимизациях. Чего нам ждать от этого? Какими реальными метриками руководствуются IT-боссы и причем тут AI? Узнайте из доклада Марины.

8️⃣ SLA на максималках. Дмитрий Химион (X5 Digital).
Доклад содержит не только ценнейший опыт подходов к SLA, но и пример того, как можно собрать инструменты в работающий процесс.

7️⃣ Как устроена система восприятия робота-доставщика Яндекса. Сергей Голованов (Яндекс).
Как робот Яндекса «видит» город и избегает препятствий? Доклад раскроет систему восприятия: от hardware (лидар, камеры, парктроники) и подсистем (локализация, планировщик) до ML-моделей (3D-детекция, трекинг, светофоры). Узнайте production-истории, об оптимизации latency и тестировании релизов.

6️⃣ Двигательные установки космических аппаратов. Александр Токарев (Voxys).
Как спутники по пять тонн держатся на орбите, зачем им паровые и ионные двигатели, и можно ли собрать движок для спутника в гараже. Разговор о технологиях, инженерии и мечте покорять космос — просто, с юмором и фактами.

🖐️ Продолжение ждет вас в следующем посте. Если вы не смогли присутствовать офлайн или смотреть онлайн — вы можете приобрести записи всех докладов уже сейчас.

✅ Полная программа прошедшей конференции и кнопка для покупки записей на сайте

🔥6❤4

1.97K views13:41

HighLoad++

В сегодняшней статье вы узнаете, как из хаоса родился порядок: как вместо десятков разрозненных девайсов появилась стойка, где каждый винт, кабель и IP на своем месте. И как одна инженерная идея может превратиться в систему, которая экономит часы, нервы и делает работу с тестами наконец-то предсказуемой.

Инженер по тестированию АО «ИнфоТеКС» Евгений Деркач — с историей о том, как обуздать привычный рутинный хаос, всего лишь изменив к нему подход. Рекомендуется к прочтению всем, кто скучает по порядку на рабочем месте.

Хабр

Лего-стенд. История сборки универсальной тестовой лаборатории из 30+ устройств

Когда твой тестовый стенд разбросан по этажам, IP-адреса живут своей жизнью, а нужное устройство стабильно «гуляет» между кабинетами — это не инфраструктура, это квест. Три года назад я подключался к...

👍3❤2

1.91K views11:43

HighLoad++

⭐ Топ-10 докладов HighLoad++ 2025

Сегодня делимся с вами пятеркой лидеров. Если вы пропустили первую часть, то она здесь ✔️

5️⃣ Сетевые нереплицируемые диски в облаке: почему, как, а главное — зачем? Александр Руденко (K2 Cloud).
На что только не придется пойти, желая отмасштабироваться! В крупной инфраструктуре все чаще приходится решать задачу эффективной утилизации. В докладе вы увидите историю выноса дисков на отдельные ноды и как при этом не потерять лишние микросекунды задержек на доступе к данным.

4️⃣ ИИ расшифровывает код мозга: от реального синапса до цифрового двойника нейрона (и при чем тут мыши с микроскопами на голове?). Екатерина Пчицкая (СПб политехнический университет Петра Великого).
В докладе – путешествие в мир, где биты и байты помогают расшифровывать биологический код, а данные и метаданные учат нас не только науке, но и порядку!

3️⃣ Восстание машин, или Как хранилища Sage на новое железо заезжали. Руслан Боярский (T-Банк).
Принято считать железо надежным и готовым к использованию из коробки, но это не так. В докладе интересный путь команды Sage, которая умудрилась наступить на массу граблей и столкнуться с «черными лебедями». Полезно будет сравнить их чек-лист проверки железа с вашим списком, если он у вас есть.

2️⃣ Как понимание работы RAM ускорило на 30% пакетный шлюз 4G/5G-сетей и позволило обрабатывать 4M пакетов в секунду на одном ядре и 100 Gbps на NUMA node. Максим Шахметов (Протей-Лаб).
С одной стороны, работа с памятью кажется очевидной задачей со стандартными решениями, однако всегда найдутся хитрости. В докладе вы посмотрите на эффективную работу с ОЗУ в применении к телекому, а также оцените современные возможности программной обработки сетевых пакетов.

1️⃣ Perforator: всеядный распределенный профилировщик. Сергей Скворцов (Яндекс)
Из первых уст узнаете о том, что из себя представляет open-source-инструмент для профилирования, какие подводные камни вас ждут, если решите самостоятельно сделать похожий инструмент.

Программа HighLoad++ 2025 — концентрат решений, технологий и новинок в одном месте 🙌

✅ Посмотреть полную программу прошедшей конференции и приобрести записи всех докладов вы можете на сайте

🔥6✍2🤔2

1.98K views14:16

HighLoad++

ИИ-агенты успешно пишут код, но проваливают безопасность.

Ученые из Carnegie Mellon University, Columbia и Johns Hopkins провели исследование, в котором оценили, насколько безопасен код, создаваемый ИИ-агентами. В ходе тестирования трех популярных ИИ-агентов на 200 реальных задачах с GitHub выяснилось, что 61% предложенных решений работоспособны, однако лишь 10,5% из них можно назвать защищенными. Таким образом, почти 90% функционально правильного кода содержат серьезные уязвимости.

Среди распространенных ошибок в сгенерированном коде — уязвимости, позволяющие проводить атаки на время отклика для подбора паролей, внедрение вредоносных скриптов через неотфильтрованные ссылки и некорректная обработка данных сессий. ИИ корректно реализует основную логику, но систематически упускает важные проверки.

Это ставит под сомнение готовность технологии к использованию в продакшене, особенно в чувствительных к безопасности областях. Простые напоминания о безопасности в запросе не помогают. Необходимы или принципиально новые подходы к обучению моделей, или признание того, что итоговый код всегда будет требовать экспертной проверки.

👍6😱1

2.17K views13:44

HighLoad++

Istio Sidecars: как сэкономить гигабайты памяти?

Максим Чудновский, владелец продукта Platform V Synapse Service Mesh, СберТех, рассказал в статье о том, как в проде команды СберТеха с 20K+ подов «урезали аппетит» сайдкаров на гигабайты.

Вы узнаете:
🟣где работает жесткое ограничение видимости,
🟣когда спасает Ambient Mesh,
🟣зачем нужен ленивый XDS и почему «волшебной кнопки» нет — но есть комбинации, дающие двузначную экономию.

Please open Telegram to view this post

VIEW IN TELEGRAM

Хабр

Как сэкономить гигабайты памяти в Istio Sidecars

В Istio всё начинается с маленькой «удобной» идеи — прокси рядом с каждым подом. А заканчивается тем, что XDS разносит по кластеру тонны Listener’ов, Route’ов и Cluster’ов, дублируя конфиги для...

👍3❤1

1.81K views09:33

HighLoad++

«Я устал слушать доклады, где всё идеально»
«Я уже ничего не внедряю после конференций»
«Я не могу услышать опыт компаний, похожих на мою»
«Бигтехи говорят на своём языке, а мне это бесполезно»
«У меня нет инсайтов — только слайды»

Знакомые мысли?

Мы это изменим, для этого наша команда придумала новый формат конференций — конференции развития.

Конференция развития — инструмент решения задач, а не потребления контента. Конференция становится больше практикумом, чем лекциями, а ты — действительно участником, а не просто слушателем (послушать можно и YouTube). Больше интерактивных форматов и нетворкинга:

🔴ты получишь решение своих задач в брейнштормах;
🔴прокачаешь нужные тебе навыки на мастер-классах;
🔴получишь ответы на свои вопросы в экспертных зонах;
🔴прожаришь свой кейс на прожарке;
🔴обсудишь важную для тебя тему в world cafe;
🔴найдешь решение для своего кейса в case clinic;
🔴вступишь в интересное тебе сообщество в community lab;
🔴зафиксируешь опыт, полученный на конференции и спланируешь дальнейшие шаги на ретро-сессии.

Доклады, конечно, останутся. Но среди них будет больше докладов с нестандартными ходами и нестандартными решениями. Ведь именно на таких лекциях и рождаются инсайты о себе и своей деятельности.

Все подробности о том, как мы планируем пересобрать конференции можно узнать по ссылке. Мы открыты к новому: новая механика, идея, формат — давайте обсуждать!

⚡️ Подать заявку на выступление Saint HighLoad++ 2026

⚡️ Регистрация на встречу с Программным комитетом, где можно будет предложить свою тему, провалидировать свою идею, задать любой вопрос членам ПК и организаторам:
✔️офлайн
✔️онлайн

Встреча с Программным комитетом пройдет:

✅ 14.01.2026 года
⏰ начало в 19.00
📍Адрес: Санкт-Петербург, 2-я Советская улица, дом 18, Failover (помещение бара Tara Brooch)

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6👍3❤2🤩1

1.72K views13:21

HighLoad++

Новый выпуск Podcast++, где мы погружаемся в важнейшую тему жизнестойкости — метанавыка, который помогает преодолевать сложности и неопределенность как в жизни, так и в работе!

🎤 Ведущая: Ольга Ортега —директор по данным и аналитике в Ви.Tech.
🖐 В гостях: Иван Лукьянов — программист, директор и панк-коуч.

Ольга и Иван обсуждают ключевые аспекты этого навыка и делятся личными историями, которые вдохновляют на развитие устойчивости.

Узнайте, как позитивное мышление, реалистичный взгляд на вещи и дисциплина помогают справляться с трудностями, а также какие техники могут помочь вам укрепить жизнестойкость.

Если вы хотите улучшить свою способность преодолевать препятствия и находить смысл в сложных жизненных ситуациях, этот выпуск для вас 🙌

Слушайте подкаст:
ВКонтакте
Яндекс Музыка
mave

🔥3👍2😁1

1.8K views12:13

HighLoad++

В X5 Digital работают в режиме highload с RPS в 7500 и отвечают за всю онлайн-доставку в 73 региона. Этот канал постоянно растет. В компании создают собственную in-house WMS для дарксторов, приложения для сборщиков и курьеров, CRM, каталоги товаров и другие онлайн-продукты.

Задачей было сопоставить одинаковые или похожие товары, которые есть и в X5, и у конкурента — то есть метчи. В свою очередь, основная цель метчинга — обеспечить конкурентоспособность, позволяя быстро реагировать на изменения цен и предложений конкурентов.

Однако при работе с подрядчиками могут возникать проблемы. Например, длительное исправление ошибок тормозит процессы ценообразования и обновления информации о товарах. А это может привести к упущенным возможностям на рынке. Кроме того, необходимость ручных привязок для взаимодействия с собственными торговыми марками и готовой едой, создает дополнительные сложности и увеличивает вероятность ошибок. Исходя из этого в компании решили заменить решение подрядчика на собственную разработку.

🖐️ Узнайте подробности от Данилы Федюкина, тимлида в X5 Digital, в новой статье

Хабр

Как мы сделали альтернативную систему метчинга товаров в X5 Digital: опыт, грабли и результат

Привет, Хабр! Меня всё ещё зовут Данила Федюкин, и я продолжаю быть тимлидом в X5 Digital. Руковожу командой, которая занимается метчингом. В прошлый раз я рассказывал , как мы перешли на собственную...

👍1

1.99K views13:25

HighLoad++

В CDEK за 25 лет работы накопился богатый арсенал архитектурных решений — удачных, спорных и по-своему эффективных.

✅ На связи Наталья Макарова, техлид внутригородской логистики и глава Гильдии Java.

Как выяснилось, идеальных архитектурных паттернов не бывает. Один и тот же подход в разных условиях может стать и спасением, и катастрофой. Все решает контекст.

Чтобы показать это на практике, Наталья собрала три инженерных кейса. Каждый оформлен в формате детективного квиза: роль, фабула, вопросы на размышление, разбор и выводы. Попробуйте разобраться в проблеме, пройти тест и определить: где костыль, где инженерный компромисс, а где — настоящая best practice.

Хабр

Архитектурный квиз: костыль или элегантное решение?

Отказоустойчивый и масштабируемый энтерпрайз невозможно спроектировать по книжкам. Одно и то же решение может фигурировать и в best, и в bad practice — и, что забавно, иногда переходит из одного...

😁8❤1👍11

1.59K views10:56

HighLoad++

Создан суперкомпьютер, который помещается в кармане.

Компания Tiiny AI Inc., занимающаяся разработкой передовых технологий в области искусственного интеллекта, представила самый маленький в мире персональный суперкомпьютер с искусственным интеллектом — Tiiny AI Pocket Lab. Разработка официально занесена в Книгу рекордов Гиннесса в категории «Самый маленький мини-ПК (100B LLM в локальной сети)»

Это карманное устройство способно полностью локально, без облака и серверов, запускать LLM-модели до 120 миллиардов параметров (уровень GPT-4o), потребляя всего 65Вт. Прорыв стал возможен благодаря технологиям TurboSparse и PowerInfer, которые обеспечивают профессиональную производительность на компактном устройстве.

Ключевой сдвиг: полный отказ от облачной зависимости в пользу приватного, безопасного и энергоэффективного интеллекта прямо на устройстве. Поддерживает мгновенное развертывание десятков open-source моделей и фреймворков.

ИИ будущего теперь работает без интернета, с PhD-уровнем рассуждений и банковским уровнем шифрования ваших данных.

👍6🔥4❤2

1.55K viewsedited 11:37

HighLoad++

Не прячьте свой опыт в коде — поделитесь им с сообществом!

Друзья, у нас открыт прием заявок на доклады на Saint HighLoad++ 2026, которая пройдет в июне в Санкт-Петербурге. Приглашаем вас стать спикером!

Ознакомиться с темами, форматами выступлений и подать заявку можно на сайте

А также приглашаем вас на офлайн-встречу с Программным комитетом конференции:
✅ 14 января, начало в 19:00.
📍Санкт-Петербург, ул. 2-я Советская, д. 18, Failover

Если вы не сможете быть офлайн — подключайтесь и задавайте вопросы онлайн, мы обязательно ответим! Хотите стать спикером или у вас есть идеи и предложения для создания программы? Приходите/подключайтесь на встречу — все обсудим!

Регистрация на встречу обязательна:

🟣

офлайн

🟣

онлайн

И, конечно, обсудим нововведения, ведь наши конференции становятся конференциями развития! Подробнее об изменениях можно прочитать в манифесте.

Для спикеров это значит, что:

🔴мы готовы работать с заявками на уровне идеи и помогать с переупаковкой или созданием новых форматов. Мы привлечем методологов, фасилитаторов, специалистов по проведению групповых активностей и создадим ваше выступление вместе: с вас — экспертиза, с нас — всесторонняя поддержка во время подготовки;

🔴мы снимаем обязательное требование к докладам быть представленными в продакшн. Если ранее отношение Программного комитета к докладу можно было выразить как «ПК верифицировал», то сейчас возможно также отношение «ПК предлагает обсудить» / «ПК считает, что это интересная точка зрения».

Мы открыты новому: новая механика, идея, формат — давайте обсуждать!

Ждем ваши заявки и вас на встрече с Программным комитетом 🙌

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍1

1.01K views13:27

HighLoad++

// файл: cmd/new_year_greetings.go
package main

import (
"успех"
"стабильность"
"отпуск"
)

func main() {
wish := Wish{
Производительность: "высокая",
Нагрузка: "сбалансированная",
Инциденты: nil,
Настроение: "праздничное",
}

for _, engineer := range heroesOfHighLoad { // всем причастным!
engineer.Отправить(wish)
engineer.Уведомить("Годовой деплой завершён. Можно делать git checkout holiday_mode.")
}
}

// Пусть в 2026 году ваши логи будут чисты, а графики — зелены!

🎉7🔥4👍1

927 views12:11

About

Blog

Apps

Platform