Библиотека девопса | DevOps, SRE, Sysadmin
10.4K subscribers
1.8K photos
76 videos
4 files
3.15K links
Все самое полезное для девопсера в одном канале.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/25874ec4

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/6798b4e4509aba56522d1787
Download Telegram
🔌 Связь пропала сама по себе

Классическая ситуация: всё работало, потом в какой-то момент — тишина. Никаких изменений, никаких предупреждений.

Спойлер: кое-что всё-таки поменялось.

Первым делом ищем момент X:
# Когда система последний раз перезагружалась?
uptime
last reboot

# Что происходило в последний час?
journalctl --since "1 hour ago" | grep -i "error\|fail\|panic"

# Не убил ли OOM killer что-нибудь важное?
dmesg | grep -i "out of memory"


Задача — найти точное время потери связи и посмотреть, что случилось рядом с этим моментом.

Частые виновники

• Kernel panic — система тихо перезагрузилась, вы не заметили

• OOM killer — памяти не хватило, и он прибил NetworkManager или другой критичный процесс

• Maintenance провайдера — AWS, GCP, Azure иногда делают работы без громкого анонса. Проверьте status page

• Физика — коммутатор перезагрузили, кабель отошёл, что-то щёлкнуло в серверной

• Автоматизация — cron job или Ansible отработал по расписанию и сломал конфигурацию

Главный принцип: «само по себе» не бывает. Всегда есть триггер — нужно просто найти его в правильном месте.

📍 Навигация: ВакансииЗадачиСобесы

🐸 Библиотека devops'a

#root_prompt
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
⚙️ Оконная система для микроконтроллера

FRANK OS — операционная система на базе FreeRTOS для микроконтроллера RP2350. Это не Linux, не текстовая консоль, а именно рабочий стол с окнами, файловым менеджером и терминалом.

Заточена под собственную плату FRANK M2 на базе RP2350B, но работает и на стандартном Raspberry Pi Pico 2.

Любопытный эксперимент: насколько далеко можно зайти с рабочим столом на микроконтроллере без MMU и гигабайтов RAM.

➡️ Репозиторий

📍 Навигация: ВакансииЗадачиСобесы

🐸 Библиотека devops'a

#арсенал_инженера
Please open Telegram to view this post
VIEW IN TELEGRAM
1
⚠️ Linux случайно заблокирован

Разработчики отечественных ОС — Astra Linux, РЕД ОС и Alt Linux — не могут получить обновления ядра с официальных репозиториев. Трассировка показала: пакеты умирают на узлах ТСПУ — оборудования Роскомнадзора, установленного у всех операторов связи.

Применяя «ковровые блокировки» по диапазонам IP, ведомство задело CDN-сети, на которых хостятся зеркала Linux Kernel Archives.

➡️ Источник

📍 Навигация: ВакансииЗадачиСобесы

🐸 Библиотека devops'a

#пульс_индустрии
Please open Telegram to view this post
VIEW IN TELEGRAM
😁19😢6👏2🤔2
AI-агент в проде — это кошмар для Ops?

Неконтролируемый расход токенов, непредсказуемая нагрузка, отсутствие логов. Знакомо? Мы обновили курс «Разработка AI-агентов», добавив мощный блок по эксплуатации и SRE-практикам для AI.

DevOps-специфика в курсе:

🔹 Observability. Как настроить логирование и трассировку (`Tracing`) для цепочек LLM. Выявление и устранение регрессий.

🔹 Управление ресурсами. Ограничение времени исполнения, кэширование запросов, роутинг (выбор дешёвой/дорогой модели) и контроль бюджета.

🔹 Стабильность. Runbook для устранения отказов, механизмы восстановления промежуточных состояний и time-travel для дебага.

🔹 Безопасность. Изоляция доменов и действий агента.
Стартуй сейчас!
Получи материалы для подготовки сразу после покупки.

🎟 Промокод Agent — скидка 10 000 ₽ (до 28 февраля).

👉 Инженерный подход к AI
🧣 Топ-вакансий для девопсов за неделю

Senior devops engineer — гибрид в Москве

DevOps инженер — до 400 000 ₽, удалёнка

DevOps engineer — удалёнка

➡️ Еще больше топовых вакансий — в нашем канале Devops Jobs

🐸Библиотека devops'a

#вакансия_недели
Please open Telegram to view this post
VIEW IN TELEGRAM
1
⭐️ Быстрый поиск по файлам

krep — это консольная утилита для поиска строк, написанная на C. Альтернатива grep и ripgrep, заточенная под максимальную скорость через SIMD-инструкции и многопоточность.

Вышла версия 2.0.0. Что изменилось:

• Переработан путь выполнения в search_file: добавлен быстрый однопоточный режим для небольших файлов и снижены накладные расходы при использовании пула потоков. Меньше оверхеда — выше скорость на реальных данных.

• Добавлен воспроизводимый скрипт сравнения с ripgrep — test/benchmark_krep_vs_rg.sh. Теперь можно самостоятельно проверить, кто быстрее, на стандартном датасете субтитров весом ~1 ГБ.

• Расширено покрытие: добавлены тесты консистентности при многопоточном поиске и интеграционные тесты рекурсивного обхода директорий.

• Сборка и тесты теперь проходят на Ubuntu и macOS. Включены юнит-тесты и директорийные интеграционные тесты.

• Исправлена ошибка рекурсивного обхода — теперь корректно пропускаются минифицированные файлы (*.min.*).

Проверить на собственном железе:
curl -LO 'https://burntsushi.net/stuff/subtitles2016-sample.en.gz'
gzip -dk subtitles2016-sample.en.gz
make bench-rg


➡️ Release Notes

📍 Навигация: ВакансииЗадачиСобесы

🐸 Библиотека devops'a

#пульс_индустрии
Please open Telegram to view this post
VIEW IN TELEGRAM
👾2
💿 Живучие данные

Компания списывала старые диски. IT-специалист просверлил одно отверстие в центре корпуса — стандартная практика для физического уничтожения данных перед утилизацией.

Диск оказался на вторичном рынке. Новый владелец обнаружил, что он прекрасно работает — и данные компании никуда не делись.

Что не так?

Сотрудник просверлил корпус SSD, но современные диски могут использовать короткие платы, а пластик остаётся для сохранения формата диска. В итоге сотрудник промахнулся.

Одной дырки недостаточно. Нужно либо вскрыть корпус и убедиться, что попал в чипы NAND, либо сделать несколько отверстий в разных местах. Tom's Hardware Ещё надёжнее — сначала сделать secure erase, и только потом физически уничтожать. Для крупных компаний с сотнями дисков существуют специализированные сервисы и устройства — шредеры для накопителей.

📍 Навигация: ВакансииЗадачиСобесы

🐸 Библиотека devops'a

#разбор_полётов
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32🤔1
🔄 KDE Plasma 6.6

Вышла новая версия рабочего окружения KDE Plasma.

Из заметного: сохранение оформления как глобальной темы с ночным режимом, подключение к Wi-Fi по QR-коду через камеру, регулировка громкости колёсиком из панели задач.

Новый фильтр для дальтоников, лупа теперь держит курсор в центре экрана, поддержка «медленных клавиш» в Wayland. Spectacle теперь распознаёт текст на скриншотах.

➡️ Источник

📍 Навигация: ВакансииЗадачиСобесы

🐸 Библиотека devops'a

#пульс_индустрии
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42
🧑‍💻 Управление сессиями в systemd

loginctl — утилита из состава systemd-logind для управления пользовательскими сессиями, пользователями и физическими рабочими местами прямо из терминала.

Просмотр сессий:
loginctl list-sessions

Показывает все активные сессии: ID, UID, пользователь, seat, TTY. Если в TTY видите pts/0 — это SSH, tty2 — виртуальный терминал.

Детали конкретной сессии:
loginctl show-session 3
loginctl session-status 3

show-session — машиночитаемый вывод свойств. session-status — читаемый статус + cgroup-дерево процессов.

Работа с пользователями
loginctl list-users
loginctl user-status alice
loginctl show-user alice


Завершение сессий
# Завершить одну сессию
loginctl terminate-session 5

# Завершить все сессии пользователя
loginctl terminate-user bob

# Жёстко убить все процессы сессии
loginctl kill-session 5 -s SIGKILL

# Заблокировать / разблокировать экран
loginctl lock-session 3
loginctl unlock-session 3


terminate завершает корректно через logind. kill -s SIGKILL — крайняя мера, убивает всё без разбора.

По умолчанию пользовательские systemd --user сервисы умирают, когда пользователь выходит из системы. Linger это отключает:
loginctl enable-linger alice
loginctl disable-linger alice

# Проверить
loginctl show-user alice | grep Linger


Это для ботов, воркеров и сервисов на серверах, где пользователь заходит редко, но процесс должен жить постоянно. Небольшой, но ёмкий инструмент.

📍 Навигация: ВакансииЗадачиСобесы

🐸 Библиотека devops'a

#арсенал_инженера
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42👏1
Тройной вопрос на собеседовании

На собеседовании могут поймать на мелочах, а ещё спрашивать эти мелочи друг за другом. Предлагаем подготовиться сразу по трём вопросам:

1. COPY vs ADD — вроде просто
2. ARG vs ENV — где грань между билдом и рантаймом
3. Как реально уменьшить размер образа

Выдохните и дайте ответ, а затем сверяйтесь с нашим.

➡️ Ответы: в канале с ответами за собесы

📍 Навигация: ВакансииЗадачиСобесы

🐸 Библиотека devops'a

#задача_со_звёздочкой
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
LLMOps: как деплоить ИИ-агентов и не сойти с ума от метрик

Разработчики выкатывают ИИ-агента в прод, а потом начинается: токены улетают в трубу, система зацикливается, логи превращаются в кашу, а как откатывать стейты — никто не знает.

Мы обновили курс по AI-агентам, добавив мощный блок по управляемому инжинирингу. Теперь фокус не на написании промптов, а на метриках, трассировке ошибок, тестировании и предотвращении неконтролируемого роста нагрузки.

Что в программе для Ops-инженеров:

— управление ресурсами: детальный контроль кэша, роутинга и переключение режимов обработки;
— мониторинг: логирование, трассировка LLM-вызовов и выявление регрессий;
— архитектура LangGraph: контрольные точки, time-travel и runbooks для устранения отказов;
— продвинутый RAG: подготовка разнородных данных к production-нагрузкам;
— безопасность: изоляция доменов и развёртывание строго по 152-ФЗ.

До 28 февраля дарим скидку 10 000 рублей по промокоду Agent.

Успейте забрать ещё два курса бесплатно под акцию «3 курса по цене 1».

Освоить LLMOps и деплой агентов
🙂 Гендерный разрыв в зарплате

Женщины в IT получают 99 тыс. руб., мужчины — 156 тыс. Разрыв в 40% выглядит как приговор системы. Но всё сложнее.

Декрет, синдром самозванца, выбор специализации — или всё-таки предвзятость и стеклянный потолок?

➡️ Разбираем весь путь от студенчества до кресла CTO

📍 Навигация: ВакансииЗадачиСобесы

🐸 Библиотека devops'a
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3🤔3👍1
🪟 Утилита для прокачки системного трея Windows

Вышла третья версия Trayy — небольшого приложения для Windows, которое превращает системный трей в полноценный инструмент управления рабочим пространством.

Главная идея проекта — убрать лишнее с рабочего стола: приложения, ярлыки и PWA-сервисы сворачиваются в трей и запускаются одним кликом. Поддерживаются уведомления, настройка иконок и управление многооконными процессами.

В обновлении 3.0 логика захвата окон полностью перенесена в фоновый процесс.Добавлено кэширование, ускоряющее запуск, и улучшена автоматическая настройка кнопок управления в графическом режиме.

Ещё одно заметное нововведение — поддержка регулярных выражений в списке приложений: теперь заголовки окон можно сопоставлять точнее с помощью префикса regex: и синтаксиса ECMAScript.

➡️ Репозиторий

📍 Навигация: ВакансииЗадачиСобесы

🐸 Библиотека devops'a

#арсенал_инженера
Please open Telegram to view this post
VIEW IN TELEGRAM
🥱1
🚀 AI-агенты в проде: от хаоса к управляемой инфраструктуре в 2026 году

Главный кошмар DevOps-инженера — бесконтрольно плодящиеся агенты, которые «сжирают» бюджет на токены и нарушают 152-ФЗ. Мы обновили наш курс, сместив фокус на мониторинг, трассировку и «экономику агентов».

📚 В обновлённой программе:

— управляемый инжиниринг: логирование, трассировка ошибок и оценка измеримости;
— экономика ресурсов: управление затратами на токены, роутинг и кэширование;
— юридические аспекты: полное руководство по развёртыванию систем в рамках законодательства РФ;
— изоляция и контроль: отдельный модуль про управление доменами и действиями.

Начните выстраивать правильную архитектуру уже сейчас — вводные материалы доступны сразу.

Специальные условия до 28 февраля:

— введите промокод Agent для получения скидки 10 000 рублей**;
— участвуйте в **акции «3 курса по цене 1» — получите два любых курса в подарок.

👉 Получить доступ к курсу и подаркам
😎 Обновления и новости недели

Собрали все релизы за неделю и щепотку материалов.

man-pages 6.17

Vim 9.2

Linux заблокировали

krep 2.0.0

KDE Plasma 6.6

Гендерный разрыв в зарплате

Trayy 3.0

📍 Навигация: ВакансииЗадачиСобесы

🐸 Библиотека devops'a

#дайджест_недели
Please open Telegram to view this post
VIEW IN TELEGRAM
💳 1000+ проверок безопасности IaC до того, как код ушёл в прод

Checkov — статический анализатор IaC и SCA-инструмент. Он читает файлы конфигурации и проверяет их по базе из более 1000 встроенных политик безопасности для AWS, Azure и GCP.

Checkov проверяет это на этапе сборки, до того как что-то уедет куда не надо.

SCA-сканирование: ищет CVE в open source пакетах и образах контейнеров.

Обнаружение секретов: находит AWS credentials, API-ключи и другие секреты в Userdata, переменных окружения и конфигах — через регулярки, ключевые слова и анализ энтропии.

Граф-based сканирование: понимает зависимости между ресурсами, не только отдельные блоки.

Вывод результатов: CLI, JSON, JUnit XML, SARIF, CSV, CycloneDX — выбирайте под свой CI.

➡️ Репозиторий

📍 Навигация: ВакансииЗадачиСобесы

🐸 Библиотека devops'a

#арсенал_инженера
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
📎 Мониторинг Kubernetes прямо из Python

Когда кластер растёт, следить за состоянием подов вручную через kubectl становится неудобно.

Минимальный скрипт для получения статуса всех подов во всех неймспейсах выглядит так:
from kubernetes import client, config

def check_kubernetes_status():
config.load_kube_config() # Загружаем конфиг из ~/.kube/config
v1 = client.CoreV1Api()
pods = v1.list_pod_for_all_namespaces(watch=False)

for pod in pods.items:
print(f"Pod: {pod.metadata.name}, Status: {pod.status.phase}")

if __name__ == "__main__":
check_kubernetes_status()


config.load_kube_config() подхватывает конфиг из ~/.kube/config — тот же, что использует kubectl. Если скрипт запускается внутри кластера, замените на config.load_incluster_config().
list_pod_for_all_namespaces() возвращает все поды сразу. Хотите фильтровать по неймспейсу — используйте list_namespaced_pod(namespace="your-namespace").

Хорошая отправная точка для собственного инструмента мониторинга без лишних зависимостей.

📍 Навигация: ВакансииЗадачиСобесы

🐸 Библиотека devops'a

#арсенал_инженера
Please open Telegram to view this post
VIEW IN TELEGRAM
2
⚠️ Почему сервер тормозит под нагрузкой

Если во время бэкапа или тяжёлых запросов к БД сервер резко замедляется — скорее всего, дело в I/O wait. Процессы простаивают в ожидании диска, пока ресурс занят.

Как диагностировать:

iostat -x 1 5 — смотрим колонку %wa. Значение выше 20% — тревожный сигнал.

iotop — покажет конкретные процессы, которые грузят диск прямо сейчас.

strace -p PID — поможет выявить зацикленные системные вызовы у подозрительного процесса.

Как лечить:

Снизить агрессивность записи грязных страниц в памяти:
echo 1000 > /proc/sys/vm/dirty_expire_centisecs


Расставить приоритеты для процессов через ionice — например, понизить приоритет бэкапа, чтобы не мешал продакшну.

Если проблема системная — переход на SSD кардинально меняет ситуацию.

Оптимизировать сами приложения: лишние запросы к диску, неиндексированные таблицы, запись без буферизации — всё это бьёт по I/O.

Главное правило: сначала измерить, потом лечить. iostat и iotop дадут полную картину за пару минут.

📍 Навигация: ВакансииЗадачиСобесы

🐸 Библиотека devops'a

#арсенал_инженера
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6