Девопс в огне
104 subscribers
1.24K photos
12 videos
208 links
Download Telegram
DNS

При покупке домена нам нужно им как то управлять. Для этого нам нужен dns сервер.
Обычно, регистраторы предоставляют эту услугу за отдельную плату. Но чаще всего это не удобно, ведь разные наши домены могут быть у разных регистраторов, и тут либо мигрировать все в один либо менеджить несколько днс на разыных сервисах.
Для решения этой боли обычно использую cloudflare. Он прендоставляет бесплатный днс, который можно указать для всех доменов на всех регистраторов. По итогу получается единое место где мы можем добавлять запись и они будут супер быстро обновляться. Плюс cloudflare предоставляет довольно много фичей по защите и фильтрации трафика.
👍1
K8S

Уже покритиковал кубер за то что он слишком настраиваемый и у всех разный. Время похвалить.
С одной из сторон эта настраиваемость позволяет положить куб на любую инфру. В каждой компании и облаке может быть своя система виртуализации, хранения данных, балансировки нагрузки и тд. И куб встанет почти куда угодно.
Это дает нам важное приемущество - верхнеуровнево у всех будет один интерфейс работы с инфрой, это сам куб. Будут различия в настройки pvc, ингрессов, сетевого взаимодействия и тд, но это мелочи по сравнению с тем что все остальное будет идентичным.
При переходе между проектами с разным кубом нужно сильно меньше времени на погружение в инфру, чем без куба)
Ну и как писал раньше, это иногда вызвает и сложности)
👍1
SEC

В контексте безопасности нужно донастраивать наши фреймворки.
Например - спринг по дефоту запускает актуатор на том же порту что и приложение, и можно снаружи обратится на него. Самое невинное что грозит - раскрытие информации про инфру.
И вот таких моментов может быть много. Лучший вариант тут это закрыть все и открывать по мере необходимости. Ну и использовать специализированные DAST сканеры которые протыкают все возможные открытые эндпоинты.
👍1
NET

В плане сети логика должна быть такой: все что не разрешено должно быть запрещено.
Внешний балансер по дефолту не прокидывает ничего, и мы явно должно прописать проксирование, открытые порты и внутренние локейшены.
Сейчас просто сталкиваюсь с тем что в открытом доступе многих проектов валяется минио, нексус, кейклок и так далее. Где то с дефолтными кредами, где то с анонимным доступом и прочими косяками.
Чаще проблема тут в том что люди забывают и забивают на это, главное что бы основной сервис работал)
👍1
MOBILE

Последнии дни тыкал мобильные приложения на безопасность.
И хочется сказать, приложения под IOS сильно безопаснее. Даже же что бы влететь в него и проверить базовые вещи нужно постараться куда сильнее чем на андроиде.
Условно декомпилить apk сборку занимает минут 5, и еще 5 минут что бы просканить на самые очевидные проблемы с хардкодом. На ios сборках это займет сильно больше времени, и бесплатными решениями тут не обойтись.
НО, это все не спасает от ошибок разработчиков в хардкоде и ошибках в логике. Условно декомпилить в асемблер и сделать поиск сигнатур не очень сложно.
👍1
P.S. в работе с мобилкой я пока новичек, не так много опыта. Но даже так андроид легче поддается)
SCALE

Инфра подходящая для больших проектов с нагрузкой нужна только для больших проектов с нагрузкой.
Если мы делаем сайт с несколькими микросервисами на бекенде и небольшой нагрузкой в 500-600 rps то супер масштабируемая инфра с кубом, кластерами баз и прочеми замарочками только усложнит жизнь. По опыту для большенства небольших проектов хват 5-6 серверов и docker-compose. Такая связка может работать годами и не создавать проблем.
Но почему то многие сразу поднимают их на серьезной инфре и потом страдают из за поддержки)
👍1
REALTIME

Операционные системы реального времени.
Обычно применяются в машинах или IOT. В чем отличие от обычных систем?
Там хорошая система приоритезации процессов и в целом работы с ними. Например если в систему пришел сигнал с определенного датчика важного то отработка это сигнала может выместить все остальные процессы и выполнится в первую очередь. Либо сразу после текущего выполнения, либо текущий поставится на паузу.
Это сильно отличается от классических систем, где все процессы по дефолту равноправны и выполняются паралельно либо последовательно. Там конечно можно настроить приоритет, но по дефолту система на это не заточена.
Разработка софта под такие системы требует определенного скила, но зато можно получить максимальную отзывчивость и надежность, плюс можно гарантировать срок выполнения задачи)
👍1
ROLE

Есть системы с перегруженной ролевой моделью. Тот же самый яндекс клауд.
Да, понятно, это дает гибкую систему доступов. Можно дать только те доступы которые точно нужны.
Но когда вас в команде 5 человек и всем нужно плюс минус одно и тоже, с небольшими отличиями, то такая ролевая модель становится очень проблематичной. Иногда поиск и доьавление нужных ролей может занять больше времени чем задача для которой нужны эти доступы.
Поэтому мне нравятся облака типа селектела, где минимум сложностей что бы получить доступ.
👍1
VERSION

Даже идемпотентность настроенный сервер через декларативный манифест может отличатся от другого сервера настроенного точно так же.
Что бы получить два идентичных сервера нужно поднять их на одном и том же образе ОС и прогнать настройку прям в одновременно. Иначе мы не можем гарантировать что все версии зависимостей будут идентичны.
В конечном итоге может придти к тому что на одном из серверов начнуться ошибки которых нет на другом. Как сегодня у меня случилось, выкатили микросервис на стенд с более старой версией докера и получили ошибку, пришлось обновлять то той же версии что и на тесте)

Вывод наверно тут один, нельзя гарантировать что два сервера будут одинаковые если мы настраиваем их в разное время и на более свежем образе той же ОС)
👍1
RELEASE

Есть асинхронные модели релизов.
Как это может выглядить:
Создается тег и проходят сборки. А система сама приходит к целевому состоянию. Там могут быть сложные схемы, например последовательность деплоя и сложные миграции.
То есть джоба деплоя просто тригерит старт релиза, и со временем система сама придет к актуальной версии. Для реализации таких схем часто используются gitops операторы, с описанной схемой деплоя в хельм чартах.
Иногда такие схемы удобнее, можно более прозрачно проводить сложные схемы и делать это более безопасно.
Я все еще не принимаю GitOps
👍1
Впервые решился на тест батареи мака на М процессоре
Сегодня весь день без подзарядки и в активной работе, осталось 35 процентов)
REVERT

Основная проблема откатов релизов - миграции.
Дело в том что после накатывания релизом сначала выполняются миграции которые меняют схему базы.
Но в дальнейшем, если релиз проблемный то просто откатом кода может не обойтись, так как старая версия может быть несовместимой с новой схемой. Основное решение тут - писать не ломающии миграции и тестировать откат релиза на тест стенде.
Ну и сами миграции, в момент исполнения, должны быть транзакционными. Что бы в момент их исполнения можно было быстро откатить при ошибке.
👍1
LOCK

Для того что бы более менее застраховать себя от ломающих обновлений транзитивных зависимостей глубокого уровня есть lock файлы.
Обычно все эти вложенные зависимости скачиваются из соответствующих репозиториев языка. Мы можем разово все собрать, проверить что все работает как надо, и зафиксировать вообще все в lock файле. И тогда при следующей установке мы точно получим все те же версии зависимостей что и при рабочей сборке.
В чем отличие от обычного файлы с списком зависимостей? Например requirements.txt в питоне. В том что в нем описываются верхнеуровневые пакеты, которые под собой могут тянуть другие пакеты не явным образом. А вот lock файл как раз фиксирует версии всех этих не явных пакетов.
👍1
REINSTALL

Иногда легче собрать новую инфру чем переделывать текущую.
Стратегия тут может быть такой:
- Поднимаем нормальную дев инфру
- Настраиваем релизный процесс туда
- Тестируем
- Если все окей поднимаем такую же прод инфру, но с старой бд
- Релизимся
- Тестируем
- Переключаем домен на новый прод

Получится максимально бесшовный процесс, когда пользователи даже не заметят изменений. По необходимости можем настроить миграцию бд на новый сервер, в релизное окно или бесшовно)
👍1
OBSERVABILITY

Прозрачность должна быть настроена без мусора.
С бизнесовой точки зрения мы должны видеть как запрос пользователя проходит весь процесс, что происходит на каждом шаге.
С технической должны собираться базовые метрики по времени выполнения шага, как изменяются данные и куда делаются запросы.
Это позволит нам оценивать все проблемные места и заниматься реальной оптимизацией там где это правда нужно.
А вот мусорные данные, типа огромных трейсов ошибок или цепочка вызовов методов могут только мешать и засорять информацией при поиске проблем.
👍1
STATELESS

Stateless инструменты чаще просчитывают данные на лету. Тот же самый ansible при запуске обходит сервера, собирает актуальное состояние и потом выполняет только то что нужно.
Мне этот подход нравится куда больше чем statefull, типа тераформа и пулуми. Там где мы обязаны поддерживать сервер таким же, как сохраненный стейт. Ведь если мы изменим сервер сами, или потеряем стейт, то может возникнуть много проблем.
А вот расчет стейта на лету не подводит)
👍1
LINUX

Даже сейчас, с кубером и облакам, без знаний линукса не обойтись.
Есть специфичные задачи которые до сих пор сложно положить на кубер. Например если у нас большая БД на сотни гигов то работать с ней легче всего с обычного сервера. Например сделать систему бекапирования и тестирования самих бекапов. Ведь это последнее место где мы хотим что бы кубер внезапно решил перенести поду на другой сервер и убил его.
Поэтому настроить безопасность сервера и все нужное окружение нужно уметь)
👍1
VARS

Иногда удобнее делать комбинаторные переменки при релизах.
Как пример - бывает необходимость указать в переменках кучу доменов, которые по факту являются поддоменами одного домена. И проделать тоже самое для нескольких стендов.
В таких случаях куда легче сделать набор переменных в таком формате:
MAIN_DOMAIN = some-prod.com (prod env)
MAIN_DOMAIN = some-dev.com (dev env)
APP_1 = app-one.$MAIN_DOMAIN (all env)
APP_2 = app-two.$MAIN_DOMAIN (all env)

и так далее
Это позволит нам добавлять новые стенды просто добавлением одной переменки с нужным енвом, а все остальное сгенерится на лету.
👍1
BALANCE

Конфигурация сервера должна быть сбалансированна.
Нет смысла брать огромное количество ядер в ущерб скорости диска, сети и ram. По сути почти любой запрос к системе это не только вычисления малого обьема данных на чипе. Чаще нужно сходить в какую то интеграцию, считать что с диска, подержать промежуточный итог в оперативке и тд. А делаю упор только на проц он будет в простое и постоянно ожидать IO. По сути мы просто заплатим за проц который не будет выполнять полезную нагрузку.
Чаще сервер на 4 ядра будет справляться лучше чем сервер на 8, если все остальное у него лучше)
👍1
SPLIT BRAIN

Чаще это относится к базам данных. Ситуация когда нарушается кворум при сетевых сбоях и в системе может появится два мастера.
Проблема в том куда именно будет писать приложение, при нарушении балансировки может случится ситуация когда запись данных пойдет в два разных места. Опасно это тем что потом будет очень сложно смержить все эти изменения.
Как избежать? Ну для начала сделать нормальную сеть. А так, смотреть на балансировку, в момент времени должен быть только один мастер. При развале кластера по сети старый мастер желательно прям прибить, некоторые физически убивают питание сервера.
Но мне нравится другой вариант. В принципе не включать автопереключение мастера, при сбоях переводить сбор кластера в ручное управление. Тогда можно гарантировать что не случится два мастера.
👍1