DevOps | Вопросы собесов

🤔

Как посмотреть размер папки на диске?

Команда du -sh <путь к папке> показывает размер папки в человеко-читаемом формате.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍12🔥3

1.46K views16:10

DevOps | Вопросы собесов

🤔

Как сделать так чтобы докер при сборке образа получил динамический атрибут от CI не env а например id проекта?

🟠

Podman
Без демона: Не требует отдельного демона, контейнеры работают как процессы.
Совместимость с Docker: Поддерживает Docker CLI.
rootless режим: Запуск без привилегий суперпользователя.

podman run -d --name my-container nginx

🟠

CRI-O
Интеграция с Kubernetes: Оптимизирован для Kubernetes.
Легковесность: Минимальные зависимости.
Поддержка OCI: Соответствует стандартам Open Container Initiative.

criSocket: /var/run/crio/crio.sock

🟠

containerd
Высокая производительность: Эффективное управление контейнерами.
Интеграция с Kubernetes: Используется напрямую через CRI.
Поддержка OCI: Полная совместимость с OCI.

ctr run -d --name my-container docker.io/library/nginx:latest

🟠

LXC/LXD
Полная виртуализация ОС: Изоляция процессов, сети и файловой системы.
Управление контейнерами: Удобные инструменты для управления.
Гибкость: Поддержка различных дистрибутивов Linux.

lxc launch ubuntu:20.04 my-container

🟠

Rkt
Без демона: Запуск контейнеров без постоянного демона.
Безопасность: Изолированные окружения и аутентификация.
Интеграция с Kubernetes: Альтернатива Docker в Kubernetes.

rkt run --insecure-options=image docker://nginx

🟠

OpenVZ
Виртуализация на уровне ОС: Запуск изолированных виртуальных окружений.
Производительность: Минимальная изоляция для высокой производительности.
Управление ресурсами: Контроль ресурсов для каждого окружения.

vzctl create 101 --ostemplate centos-7

🟠

Singularity
Фокус на HPC: Оптимизирован для научных вычислений.
rootless контейнеры: Запуск без прав суперпользователя.
Совместимость: Поддержка Docker контейнеров и OCI форматов.

singularity pull docker://nginx

Ставь 👍 и забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

1.64K views09:10

DevOps | Вопросы собесов

🤔 При попытке создания файла на диске на Linux ошибка, что места нет, проверяете, место есть — с чем это может быть связано?

Ошибка может быть связана с исчерпанием inodes, ограничением прав доступа, превышением лимита пользователя или монтированием диска только для чтения.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤1

1.42K views16:10

DevOps | Вопросы собесов

🤔

Какой опыт использования хендлеров и шаблонов для ролей?

В Ansible хэндлеры и шаблоны являются важными инструментами для управления конфигурацией и автоматизации задач. Они позволяют эффективно управлять изменениями конфигурации и генерировать файлы конфигураций динамически. Вот описание моего опыта использования хэндлеров и шаблонов в ролях Ansible.

🚩

Хэндлеры

Это задачи, которые выполняются только при вызове. Они используются для выполнения действий после изменения состояния системы, например, перезагрузки службы после обновления конфигурационного файла.

Определение хэндлеров в роли

# roles/my_role/handlers/main.yml
- name: restart nginx
  service:
    name: nginx
    state: restarted

Вызов хэндлера в задаче

# roles/my_role/tasks/main.yml
- name: Copy nginx configuration file
  template:
    src: nginx.conf.j2
    dest: /etc/nginx/nginx.conf
  notify:
    - restart nginx

🚩

Шаблоны в Ansible

Используют движок Jinja2 для динамического создания файлов на основе переменных. Это позволяет генерировать конфигурационные файлы, которые могут адаптироваться к различным средам и параметрам.

Определение шаблона

# roles/my_role/templates/nginx.conf.j2
server {
    listen 80;
    server_name {{ server_name }};
    location / {
        proxy_pass http://{{ proxy_pass }};
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
    }
}

Использование шаблона в задаче

# roles/my_role/tasks/main.yml
- name: Generate nginx configuration from template
  template:
    src: nginx.conf.j2
    dest: /etc/nginx/nginx.conf
  vars:
    server_name: "example.com"
    proxy_pass: "127.0.0.1:8080"
  notify:
    - restart nginx

🚩

Опыт использования

1⃣

Автоматизация развертывания веб-серверов
В проектах автоматизации развертывания веб-серверов я использовал хэндлеры для перезапуска служб после обновления конфигурационных файлов. Шаблоны позволяли гибко настраивать конфигурации для различных окружений (development, staging, production).

2⃣

Управление конфигурацией баз данных
Для управления конфигурацией баз данных я использовал шаблоны для генерации файлов конфигураций на основе переменных, которые определяют параметры подключения и настройки базы данных.

3⃣

Обновление систем и пакетов
Использование хэндлеров для перезагрузки служб после установки или обновления пакетов. Например, перезапуск Apache после установки новых модулей или обновления конфигурации.

Ставь 👍 и забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍2

1.55K views09:10

DevOps | Вопросы собесов

🤔 Когда используется UDP?

UDP используется, когда важна скорость и допустима потеря данных, например, в стриминге, видеозвонках, DNS-запросах и онлайн-играх.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍14

1.4K views16:10

DevOps | Вопросы собесов

🤔

Через что запускаете плейбуки или роли?

В Ansible плейбуки и роли могут быть запущены различными способами в зависимости от контекста и требований. Основные методы включают использование командной строки, автоматизацию через CI/CD системы и запуск через API. Вот описание основных способов запуска плейбуков и ролей:

🚩

Запуск через командную строку

Самый распространенный и прямолинейный способ запуска плейбуков и ролей — это использование командной строки с командой ansible-playbook.

Запуск плейбука

ansible-playbook site.yml

Запуск плейбука с указанием инвентарного файла

ansible-playbook -i inventory/hosts site.yml

Запуск плейбука с переменными

ansible-playbook -i inventory/hosts site.yml -e "variable1=value1 variable2=value2"

Запуск определенной роли в плейбуке
Плейбук

# site.yml
- hosts: all
  roles:
    - role: my_role

Команда

ansible-playbook -i inventory/hosts site.yml

🚩

Запуск через CI/CD системы

Многие современные проекты используют CI/CD системы, такие как Jenkins, GitLab CI, GitHub Actions и другие для автоматизации процесса развертывания и тестирования. Ansible легко интегрируется с такими системами.
Jenkins Pipeline

pipeline {
    agent any
    stages {
        stage('Deploy') {
            steps {
                sh 'ansible-playbook -i inventory/hosts site.yml'
            }
        }
    }
}

🟠

Пример запуска через GitLab CI

.gitlab-ci.yml

stages:
  - deploy

deploy:
  stage: deploy
  script:
    - ansible-playbook -i inventory/hosts site.yml

🟠

Запуск через Ansible Tower или AWX
Ansible Tower (коммерческий продукт) и AWX (open-source версия Ansible Tower) предоставляют веб-интерфейс и API для управления и автоматизации Ansible задач.

🚩

Пример запуска через Ansible Tower/AWX

🟠

Создание Job Template
В веб-интерфейсе Ansible Tower или AWX создайте новый шаблон задания (Job Template), укажите плейбук и инвентарь.

🟠

Запуск задания:
Запустите задание через веб-интерфейс или API.

Запуск через API

curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer YOUR_API_TOKEN" \
-d '{"inventory": "1", "job_template": "1"}' \
http://tower.example.com/api/v2/job_templates/1/launch/

Пример плейбука site.yml

# site.yml
- hosts: all
  roles:
    - role: my_role

Запуск через командную строку

ansible-playbook -i inventory/hosts site.yml

Ставь 👍 и забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍13

1.56K views09:10

DevOps | Вопросы собесов

🤔 Как уменьшить размер Docker image?

Чтобы уменьшить размер Docker image, используйте минимальные базовые образы (например, alpine), удаляйте временные файлы после сборки, объединяйте команды в Dockerfile и избегайте ненужных зависимостей.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8

1.44K views16:10

DevOps | Вопросы собесов

🤔

Если у вас много машин и нет ansible и питона как будете устанавливать?

Если у вас много машин и нет Ansible и Python, можно использовать несколько подходов для автоматической установки этих инструментов.

🚩Методы

🟠

Использование SSH и скриптов
Вы можете написать скрипт, который будет подключаться к каждой машине по SSH и устанавливать необходимые пакеты. Шаги:

1⃣Создайте скрипт для установки Python и Ansible

#!/bin/bash

# Установка Python
sudo apt update
sudo apt install -y python3 python3-pip

# Установка Ansible
pip3 install ansible

2⃣Создайте скрипт для выполнения установки на удалённых машинах

#!/bin/bash

# Список IP-адресов или хостнеймов машин
HOSTS=("host1" "host2" "host3")

# Путь к скрипту установки
INSTALL_SCRIPT="install_ansible.sh"

# Копирование скрипта и выполнение на удалённых машинах
for HOST in "${HOSTS[@]}"; do
    scp $INSTALL_SCRIPT $HOST:/tmp/
    ssh $HOST "bash /tmp/$INSTALL_SCRIPT"
done

🟠

Использование `cloud-init` (для облачных машин)
Если вы используете облачные машины, такие как AWS, Azure или Google Cloud, можно использовать cloud-init для автоматической установки Python и Ansible при создании машин.
Пример cloud-init конфигурации

#cloud-config
packages:
  - python3
  - python3-pip

runcmd:
  - pip3 install ansible

🟠

Использование Fabric
Это инструмент для выполнения команд на удалённых серверах по SSH, который можно использовать для автоматизации установки Python и Ansible.
Установка Fabric

pip install fabric

Пример использования Fabric

from fabric import Connection

# Список хостов
hosts = ["host1", "host2", "host3"]

# Команды для выполнения
commands = [
    "sudo apt update",
    "sudo apt install -y python3 python3-pip",
    "pip3 install ansible"
]

# Выполнение команд на каждом хосте
for host in hosts:
    conn = Connection(host)
    for command in commands:
        conn.run(command)

Запустите скрипт:

python deploy.py

🟠

Использование pdsh (Parallel Distributed Shell)
Это утилита для параллельного выполнения команд на нескольких хостах.
Установка pdsh

sudo apt install pdsh

Пример использования pdsh

# Список хостов
HOSTS="host1,host2,host3"

# Команды для выполнения
pdsh -w $HOSTS "sudo apt update && sudo apt install -y python3 python3-pip"
pdsh -w $HOSTS "pip3 install ansible"

Ставь 👍 и забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍17😁1

1.53K views09:10

DevOps | Вопросы собесов

🤔 На каких технологиях базируется контейнеризация, Docker в том числе?

Контейнеризация базируется на технологиях виртуализации на уровне ОС, таких как cgroups и namespaces, предоставляемых ядром Linux. cgroups управляют ресурсами (CPU, память), а namespaces изолируют процессы. Docker также использует OverlayFS для управления файловыми системами контейнеров. Вместе эти технологии обеспечивают лёгкую изоляцию и портативность.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9🔥5

1.39K views16:10

DevOps | Вопросы собесов

🤔

Какой прикручиваете мониторинг к своим приложениям чем мониторите?

Это важная часть управления инфраструктурой и обеспечения стабильной работы сервисов. Различные инструменты позволяют отслеживать состояние приложений, ресурсов системы и выявлять проблемы до того, как они повлияют на пользователей.

🚩Prometheus

Это мощный инструмент для мониторинга и алертинга, который собирает метрики с приложений и систем. Prometheus использует язык запросов PromQL для анализа и генерации алертов.

🚩

Установка и настройка Prometheus

1⃣Установка Prometheus

wget https://github.com/prometheus/prometheus/releases/download/v2.26.0/prometheus-2.26.0.linux-amd64.tar.gz
tar xvf prometheus-2.26.0.linux-amd64.tar.gz
cd prometheus-2.26.0.linux-amd64
./prometheus --config.file=prometheus.ym

2⃣Конфигурация prometheus.yml

global:
  scrape_interval: 15s

scrape_configs:
   - job_name: 'my_application'
    static_configs:
      - targets: ['localhost:9090']

3⃣

Экспортеры для сбора метрик
Node Exporter для системных метрик Приложения могут использовать библиотеки клиента для передачи метрик (например, prometheus_client для Python)

🚩

Grafana

Это инструмент для визуализации данных, который отлично интегрируется с Prometheus. Он позволяет создавать красивые и информативные дашборды.

🚩

Установка и настройка Grafana

1⃣Установка Grafana

wget https://dl.grafana.com/oss/release/grafana-7.4.3.linux-amd64.tar.gz
tar -zxvf grafana-7.4.3.linux-amd64.tar.gz
cd grafana-7.4.3/bin
./grafana-server

2⃣

Добавление источника данных
В веб-интерфейсе Grafana добавьте Prometheus как источник данных.
Создайте дашборды и панели для визуализации метрик.

3⃣

Alertmanager
Alertmanager управляет алертами, отправляемыми Prometheus, и позволяет настраивать правила алертинга и маршрутизации.

🚩

Конфигурация Alertmanager

1⃣Конфигурация alertmanager.yml

global:
  smtp_smarthost: 'smtp.example.com:587'
  smtp_from: 'alertmanager@example.com'

route:
  receiver: 'email-alert'

receivers:
- name: 'email-alert'
  email_configs:
  - to: 'team@example.com'

ELK Stack используется для сбора, анализа и визуализации логов.

🚩

Основные компоненты

🟠

Elasticsearch
Хранение и поиск логов.

🟠

Logstash
Сбор, обработка и преобразование логов.

🚩

Установка и настройка ELK Stack

1⃣Установка Elasticsearch

wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.11.2-linux-x86_64.tar.gz
tar -xzf elasticsearch-7.11.2-linux-x86_64.tar.gz
cd elasticsearch-7.11.2
./bin/elasticsearch

2⃣Установка Logstash

wget https://artifacts.elastic.co/downloads/logstash/logstash-7.11.2-linux-x86_64.tar.gz
tar -xzf logstash-7.11.2-linux-x86_64.tar.gz
cd logstash-7.11.2
./bin/logstash -f logstash.conf

3⃣Установка Kibana

wget https://artifacts.elastic.co/downloads/kibana/kibana-7.11.2-linux-x86_64.tar.gz
tar -xzf kibana-7.11.2-linux-x86_64.tar.gz
cd kibana-7.11.2
./bin/kibana

Ставь 👍 и забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8

1.45K views09:10

DevOps | Вопросы собесов

🤔

Что такое service monitor в Kubernetes?

ServiceMonitor — это объект в Kubernetes, используемый в связке с Prometheus для мониторинга сервисов. Он определяет, какие эндпоинты и метрики должны собираться Prometheus. Это часть системы мониторинга, которая позволяет автоматизировать сбор данных о состоянии сервисов.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7🔥4

1.38K views16:10

DevOps | Вопросы собесов

🤔

Какая файловая система бывает с динамическими inode?

Это файловая система, которая может увеличивать количество inode по мере необходимости, вместо того чтобы фиксировать их количество при создании. Такой подход позволяет более эффективно использовать дисковое пространство и избегать ситуаций, когда inode заканчиваются, хотя на диске еще достаточно свободного места.

🚩

XFS

🟠

Динамическое управление inode
XFS не фиксирует количество inode при создании файловой системы. Inode выделяются по мере необходимости из свободного дискового пространства, что позволяет более гибко и эффективно использовать ресурсы.

🟠

Высокая производительность
XFS разработана для высокопроизводительных операций ввода-вывода и хорошо подходит для больших файлов и файловых систем.

🟠

Журналирование
XFS использует журналирование для повышения надежности и быстрого восстановления после сбоев.

🟠

Поддержка больших файлов и файловых систем
XFS может управлять очень большими файлами и файловыми системами (до нескольких петабайт).

🟠

Дефрагментация и оптимизация
Встроенные средства для дефрагментации и оптимизации файловой системы позволяют поддерживать высокую производительность.

🟠

Пример создания XFS файловой системы
Для создания файловой системы XFS на разделе /dev/sdX1, можно использовать команду mkfs.xfs

mkfs.xfs /dev/sdX1

🟠

Пример монтирования XFS файловой системы
После создания файловой системы ее можно смонтировать

mount /dev/sdX1 /mnt/myxfs

Ставь 👍 и забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4❤1

1.66K views09:10

DevOps | Вопросы собесов

🤔 Что такое squash в Docker?

squash — это процесс объединения всех слоёв Docker-образа в один. Это уменьшает количество слоёв, упрощает образ и может ускорить развертывание. Однако использование squash делает процесс сборки менее гибким из-за потери промежуточных слоёв.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥14👍6

1.52K views16:10

DevOps | Вопросы собесов

🤔

Что такое OOM?

OOM расшифровывается как "Out Of Memory" (недостаток памяти). Это состояние, при котором система или процесс исчерпывает все доступные ресурсы памяти, что приводит к невозможности выделения дополнительной памяти для выполнения текущих задач или запуска новых процессов.

🚩

Почему возникает

🟠

Неэффективное управление памятью
Приложение может не освобождать память после использования (утечки памяти), что со временем приводит к её исчерпанию.

🟠

Недостаток ресурсов
На устройстве или сервере физически недостаточно оперативной памяти для поддержки всех запущенных процессов.

🟠

Пиковые нагрузки
Внезапное увеличение нагрузки на систему, требующее больше памяти, чем обычно.

🚩

Как используется

1⃣

Уведомление процессов
Некоторые ОС уведомляют процессы о нехватке памяти, чтобы они могли освободить часть ресурсов.

2⃣

Прекращение процессов
В крайнем случае ОС может принудительно завершить процессы для освобождения памяти. В Linux, например, существует OOM Killer, который завершает наиболее "прожорливые" процессы.

3⃣

Журналирование
Запись в журнал, чтобы администраторы могли позже проанализировать и устранить причину проблемы.

data = []
while True:
    data.append(' ' * 10**6)  # Добавляем строки по 1 МБ в список бесконечно

🚩

Как предотвратить

🟠Мониторинг
Постоянно отслеживайте использование памяти вашими приложениями и системами.

🟠

Оптимизация кода
Пишите код, который эффективно использует и освобождает память.

🟠

Настройка лимитов
Устанавливайте ограничения на использование памяти для процессов.

🟠

Масштабирование ресурсов
При необходимости увеличивайте объем доступной памяти или используйте распределенные системы.

Ставь 👍 и забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8

1.68K views09:10

DevOps | Вопросы собесов

🤔 Что даёт load balancer?

Load Balancer распределяет входящий трафик между несколькими серверами или контейнерами, обеспечивая высокую доступность и отказоустойчивость. Он также помогает избежать перегрузки отдельных узлов и улучшает производительность системы.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11🔥1

1.48K views16:10

DevOps | Вопросы собесов

🤔

Сколько времени храните логи по мониторингу?

Зависит от нескольких факторов, включая требования бизнеса, нормативные требования и технические ограничения. Обычно логи по мониторингу хранятся от нескольких недель до нескольких лет.

🚩

Факторы

🟠

Требования бизнеса
Для анализа и отчетности могут требоваться логи за длительные периоды. Для отладки и решения инцидентов могут быть достаточно короткие периоды хранения.

🟠

Нормативные требования
В некоторых отраслях существуют законодательные требования к срокам хранения данных (например, финансовый сектор или здравоохранение).

🟠

Технические ограничения
Доступное дисковое пространство и производительность системы могут ограничивать срок хранения логов.

🟠

Тип логов
Разные типы логов могут иметь разные сроки хранения. Например, критические системные логи могут храниться дольше, чем логи отладки.

🚩

Практические рекомендации

🟠

Краткосрочное хранение
Хранение логов за последние 7-30 дней для оперативного мониторинга и анализа.

🟠

Среднесрочное хранение
Хранение логов за последние 3-6 месяцев для анализа тенденций и расследования инцидентов.

🟠

Долгосрочное хранение
Хранение логов за последние 1-2 года для соответствия нормативным требованиям и долгосрочного анализа.

🚩

Примеры настройки сроков хранения логов

🟠

Elasticsearch (ILM - Index Lifecycle Management)
ILM позволяет управлять жизненным циклом индексов, автоматически перемещая данные между горячими, теплыми и холодными индексами и удаляя старые данные.

1⃣Создание политики ILM

{
  "policy": {
    "phases": {
      "hot": {
        "actions": {
          "rollover": {
            "max_age": "30d",
            "max_size": "50gb"
          }
        }
      },
      "warm": {
        "min_age": "30d",
        "actions": {
          "shrink": {
            "number_of_shards": 1
          },
          "set_priority": {
            "priority": 50
          }
        }
      },
      "cold": {
        "min_age": "90d",
        "actions": {
          "freeze": {},
          "set_priority": {
            "priority": 0
          }
        }
      },
      "delete": {
        "min_age": "180d",
        "actions": {
          "delete": {}
        }
      }
    }
  }
}

2⃣Применение политики к индексу

PUT /myapp-logs/_settings
{
  "index.lifecycle.name": "my_policy"
}

🟠

Logrotate
Используется для управления файлами логов и их архивирования.

1⃣

Конфигурация logrotate
Создайте файл конфигурации /etc/logrotate.d/myapp

/var/log/myapp/*.log {
    daily
    rotate 30
    compress
    delaycompress
    missingok
    notifempty
    create 0640 myuser mygroup
    sharedscripts
    postrotate
        /usr/bin/systemctl reload myapp.service > /dev/null
    endscript
}

Ставь 👍 и забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤2

1.56K views09:10

DevOps | Вопросы собесов

🤔 Что такое firewall?

Firewall — это сетевой фильтр, который контролирует входящий и исходящий трафик на основе заданных правил безопасности. Он используется для защиты систем от несанкционированного доступа и обеспечения фильтрации вредоносного трафика.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍16🔥1

1.39K views16:10

DevOps | Вопросы собесов

🤔

От чего зависит время хранения метрик?

Зависит от нескольких ключевых факторов, включая требования бизнеса, технические ограничения, нормативные требования и тип метрик.

🚩

Основные факторы

🟠

Требования бизнеса
Анализ производительности: Для анализа производительности системы за длительные периоды может потребоваться хранение метрик за несколько месяцев или лет. Исторические данные: В некоторых случаях необходимо хранить исторические данные для сравнения и анализа долгосрочных тенденций.

🟠

Технические ограничения
Дисковое пространство: Доступное дисковое пространство напрямую влияет на количество данных, которые можно хранить. Производительность системы: Увеличение объема данных может снижать производительность системы мониторинга.

🟠

Нормативные требования
Соблюдение законов и регламентов: В некоторых отраслях существуют требования к хранению данных, включая метрики, за определенные периоды.

🟠

Тип метрик
Критические метрики: Метрики, важные для безопасности и стабильности системы, могут храниться дольше. Метрики производительности: Метрики производительности могут храниться короткий период для оперативного анализа и устранения проблем.

🚩

Практические рекомендации

🟠

Краткосрочное хранение
1-2 месяца: Для оперативного мониторинга и анализа текущих событий и инцидентов.

🟠

Среднесрочное хранение
3-6 месяцев: Для анализа тенденций и выявления закономерностей.

🟠

Долгосрочное хранение
1-2 года: Для соответствия нормативным требованиям и долгосрочного анализа производительности.

🚩

Примеры настройки сроков хранения метрик

🟠

Prometheus (Retention Policy)
Позволяет настроить срок хранения данных с помощью параметра --storage.tsdb.retention.time.
Настройка срока хранения метрик

prometheus --storage.tsdb.retention.time=90d

🟠

InfluxDB (Retention Policy)
Позволяет управлять временем хранения данных с помощью политики хранения (Retention Policy).

1⃣Создание политики хранения

CREATE RETENTION POLICY "three_months" ON "mydb" DURATION 90d REPLICATION 1 DEFAULT

2⃣Применение политики хранения

ALTER RETENTION POLICY "three_months" ON "mydb" DURATION 90d REPLICATION 1

Ставь 👍 и забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6🔥1

1.65K views09:10

DevOps | Вопросы собесов

🤔 Когда ты разворачиваешь стандартный кластер Kubernetes, что делает твой namespace?

При развёртывании кластера создаются стандартные namespaces: default для объектов по умолчанию, kube-system для компонентов Kubernetes, kube-public для общедоступных ресурсов и kube-node-lease для управления состоянием узлов. Они помогают разделить ресурсы и организовать кластер.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8🔥7

1.51K views16:10

DevOps | Вопросы собесов

🤔

Какие золотые принципы мониторинга вы используете ваши лучшие практики?

Эффективный мониторинг является критически важным для поддержания стабильности, производительности и безопасности систем.

🟠

Проактивный мониторинг
Настройка алертинга для проактивного выявления проблем до их воздействия на пользователей. Использование пороговых значений и трендов для настройки алертов. Регулярная проверка и обновление алертов на основе опыта и изменяющихся условий.

🟠

Централизованный сбор данных
Консолидация логов, метрик и событий в одной системе для удобного анализа. Использование инструментов, таких как ELK Stack, Prometheus, и Grafana для сбора и анализа данных. Централизация данных для упрощения корреляции и анализа.

🟠

Покрытие всех уровней системы
Мониторинг всех уровней системы: инфраструктуры, приложений, сетей и пользовательского опыта. Инструменты мониторинга инфраструктуры: Prometheus, Nagios. Мониторинг приложений: APM (Application Performance Monitoring) инструменты, такие как New Relic, Datadog. Мониторинг пользовательского опыта: Real User Monitoring (RUM) и Synthetic Monitoring.

🟠

Метрики производительности и доступности
Отслеживание ключевых метрик производительности и доступности. CPU, память, диск, сеть: сбор и анализ системных метрик. Время отклика и количество ошибок: метрики приложений. Среднее время безотказной работы (MTTF) и среднее время восстановления (MTTR).

🟠

Анализ и визуализация данных
Создание информативных и понятных дашбордов для анализа данных. Использование Grafana для визуализации метрик и создания дашбордов. Настройка дашбордов для различных аудиторий: разработчики, операционные команды, менеджмент.

🟠

Аутентификация и авторизация
Обеспечение безопасности данных мониторинга через аутентификацию и авторизацию. Настройка ролевой модели доступа к данным мониторинга. Использование защищенных каналов связи (TLS/SSL).

🟠

Документация и обучение
Поддержка актуальной документации по настройкам мониторинга и обучение команды. Документация конфигураций, схем и процессов мониторинга. Регулярное обучение команды по инструментам и методам мониторинга.

🟠

Автоматизация и интеграция
Использование автоматизации для настройки и поддержания мониторинга. Автоматизация развертывания агентов мониторинга с помощью Ansible, Terraform и других инструментов. Интеграция с CI/CD для мониторинга развертываний и выпуска новых версий.

🟠

Регулярный аудит и улучшение
Регулярная оценка и улучшение системы мониторинга. Проведение регулярных аудитов конфигураций и эффективности мониторинга. Внедрение новых инструментов и методов на основе обратной связи и новых технологий.

Ставь 👍 и забирай 📚 Базу знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍1

1.6K views09:10

About

Blog

Apps

Platform