Cloud4Y - облачный провайдер
660 subscribers
1.06K photos
173 videos
1 file
680 links
Облачная платформа для бизнеса 🏢

• IaaS/SaaS инфраструктура
• Kubernetes, S3, GPU-кластеры
• 152-ФЗ, аттестация ФСТЭК

Кейсы, аналитика, новости рынка облаков
Работаем с 2009 года.
https://www.cloud4y.ru
Download Telegram
Резервирование внутри одного дата-центра не закрывает целые классы инцидентов.

Сбой питающей подстанции, обесточивающий зону на полтора-два часа, кладёт всю инфраструктуру в этой зоне целиком - независимо от того, сколько внутри неё стоек, источников бесперебойного питания и резервных линий.

Распределение между двумя географически разнесёнными площадками - закрывает.

Четыре класса инцидентов, которые снимает распределение между регионами:

1️⃣ Региональный сетевой сбой - обрыв магистральной ВОЛС, авария на узле обмена трафиком.

2️⃣ Энергоавария на питающей инфраструктуре одной площадки.

3️⃣ Авария у магистрального провайдера в одном регионе.

4️⃣ Региональные регуляторные или административные изменения, затрагивающие доступ к одной площадке.


Два класса, которые распределение не закрывает:

1️⃣ Логические сбои приложения - баг и ошибочный релиз оркестратор распространит на обе площадки одинаково.

2️⃣ Действия привилегированного пользователя в общей плоскости управления одинаково затрагивают оба региона.


По данным отраслевой статистики, на проблемы с электропитанием приходится около 45% значимых отказов ЦОД. Распределение по двум регионам стоит дороже, но снижает именно эту доминирующую категорию рисков.

Cloud4Y разворачивает инфраструктуру на двух площадках в Москве и Новосибирске с независимыми магистральными маршрутами. Для критичных систем - MetroCluster с синхронной репликацией, RPO=0.
Кластер Kubernetes с манифестами по умолчанию выдерживает рабочие нагрузки ровно до первого нештатного события - пика трафика, обновления версии, отказа узла, планового обслуживания.

Семь параметров манифеста, превращающих демо-стенд в промышленный кластер.

1️⃣ Запросы и лимиты ресурсов.

Без запросов планировщик ставит поды наугад, без лимитов один контейнер с утечкой памяти кладёт узел и соседние поды.


2️⃣ Проверка живости (livenessProbe).

Перезапускает под, в котором процесс жив, но перестал отвечать на запросы.


3️⃣ Проверка готовности (readinessProbe).

Добавляет под в Service только после реальной готовности обрабатывать запросы.


4️⃣ PodDisruptionBudget.

Ограничивает выселение реплик при drain узла или обновлении кластера.


5️⃣ topologySpreadConstraints.

Раскладывает реплики по разным узлам и зонам отказа.


6️⃣ securityContext с профилем «restricted» Pod Security Standards.

Запрет root, read-only корневая ФС, отключение привилегий и опасных capabilities.


7️⃣ NetworkPolicy.

Заменяет режим «всё со всем» по умолчанию явными правилами трафика между подами.


В управляемых Кластерах Kubernetes Cloud4Y контрольная плоскость, обновления и инфраструктура мониторинга - на стороне провайдера.

Команда сосредоточена на манифестах рабочих нагрузок и применении этих параметров.
152-ФЗ часто читают как «закон требует держать всё на собственной инфраструктуре».

Это прочтение неверно: закон требует, чтобы первичный сбор, систематизация, накопление и хранение ПДн граждан РФ шли в базах данных на территории России - где именно физически стоит сервер, закон не диктует.

Сертифицированное облако оператора связи это требование закрывает.

Три легальных архитектурных варианта:

1️⃣ Полностью в сертифицированном облаке провайдера.
Минимальный CAPEX, договор присоединения и аттестат до УЗ-1, ответственность за инфраструктурный слой - на провайдере. Срок развёртывания - недели.


2️⃣ Гибрид.
Метаданные и приложение в облаке, чувствительные ПДн - на собственной площадке через ГОСТ VPN. CAPEX средний, эксплуатация делится между двумя командами.


3️⃣ Полностью на собственной инфраструктуре.
Максимальный CAPEX, аттестация ИСПДн собственными силами, штатные ИБ-инженеры. Срок - месяцы.


Какой вариант оптимален - зависит от категории ПДн, объёма обработки, отраслевых требований.

Без специфических отраслевых ограничений первый вариант обычно даёт более низкую совокупную стоимость владения и более быстрый выход в эксплуатацию.

Cloud4Y закрывает все три сценария - от аттестованных Облачных серверов ФЗ-152 до S3-хранилища и подключения к ГИС.
Коммерческие ЦОД в Москве заполнены на 95% (TAdviser, февраль 2026), ввод новых стоек в 2025 году упал втрое - с 14 000 до 5335 (CNews Analytics).

Часть компаний уходит в собственные площадки.

Модульный (контейнерный) ЦОД закрывает разрыв между потребностью в мощности сейчас и капитальным строительством на 1,5–3 года вперёд.

Готовые блоки (силовые модули, охлаждение, ИТ-зоны) собираются за 3–9 месяцев против 1,5–3 лет на капитальное строительство.

Капитальные затраты при сопоставимой мощности - на 20–40% ниже за счёт типизации (ОБИТ).

Пять сценариев, в которых модульный формат выигрывает у стационарного:

1️⃣ Временное расширение мощностей. Сезонные пики или пилотный проект с горизонтом 1–3 года.

2️⃣ Удалённая площадка. Промышленный объект, нефтегазовая или добывающая отрасль, где капитальное строительство дорого или невозможно по согласованиям.

3️⃣ Edge-узел. Распределённая обработка ближе к источнику данных - производство, ритейл, видеоаналитика.

4️⃣ Резервная площадка на период модернизации основной инфраструктуры.

5️⃣ Специальные условия эксплуатации. Сейсмоактивные регионы, экстремальный климат, ограничения по согласованию капитального строительства.


Стационарный ЦОД оправдан, когда нагрузка превышает 15–30 кВт на стойку при 2N+1 резервировании, горизонт планирования - 10–15 лет, или требуется минимальный PUE и широкий сервис-портфель.

Рассчитать формат под свою задачу.
По данным К2Тех, около 70% российских компаний продолжают использовать Jira, Confluence и Trello, причём в основном неподдерживаемые версии.

С 30 марта 2026 Atlassian прекращает продажу новых лицензий Data Center; к 28 марта 2029 - переход в режим только для чтения. Российские команды дополнительно отключены от Atlassian Cloud с сентября 2024 года.

Открытое ПО становится инфраструктурным ответом на закрытие платформы.

1️⃣ Git-платформа.

▪️ GitVerse - российская бесплатная платформа с импортом из GitHub в один клик и встроенным ИИ-ассистентом.

▪️ Из открытых решений - Gitea (MIT, Go) или её форк Forgejo под Codeberg e.V., оба совместимы с GitHub Actions.

▪️ Полная DevSecOps-платформа - GitLab CE.


2️⃣ Трекер задач.

▪️ OpenProject (GPL, Ruby) - открытое решение для PM и Agile: Gantt, учёт времени, доски Scrum/Kanban.

▪️ Redmine (GPL v2) - для команд с акцентом на заявки, поддерживается с 2006 года.

▪️ YouTrack от JetBrains - коммерческий продукт по условно-бесплатной модели, бесплатен до 10 пользователей, далее $5 за пользователя в месяц.


3️⃣ База знаний.

▪️ BookStack (MIT) удобен для нетехнических авторов: WYSIWYG-редактор и понятная иерархия «полка/книга/глава/страница».

▪️ Wiki.js (AGPL-v3) - если нужна интеграция с корпоративной аутентификацией: Markdown, поддержка SSO/LDAP/SAML.


Cloud4Y предоставляет облачные серверы и частное облако для любого из этих стеков.
28 мая, 14:00 МСК: вебинар об архитектуре отказоустойчивой RDS-фермы

RDS-ферму несложно собрать из RD Gateway, Connection Broker, Session Hosts, SQL Always On и FSLogix.

Сложнее сделать так, чтобы при отказе одного узла пользователи не теряли сессии, а ферма продолжала работать.

Отказоустойчивость держится на связях между ролями.

На вебинаре разберём:
1️⃣ Какие связи удерживают пользовательские сессии при отказе отдельного узла - на уровне конкретных компонентов, а не общей схемы.

2️⃣ Где чаще всего прячутся единые точки отказа и какие узлы дублировать в первую очередь.

3️⃣ Как развести клиентский трафик, репликацию и HA-связи между двумя ЦОД.

📢 Спикер: Алексей Ежков, системный администратор Cloud4Y.

📅🕑 Дата и время: 28 мая, 14:00 МСК.

Регистрация тут

Поставьте + в комментариях и мы пришлём, автономную интерактивную схему фермы, где показаны все ключевые компоненты и связи между ними: клиентский трафик, внутренние соединения, репликация, HA-связи, DNS и кросс-ЦОД маршруты.

Схему можно использовать для подготовки к проектированию или модернизации RDS, для разбора архитектуры с командой или для объяснения заказчику, как строится отказоустойчивая ферма.
Счёт за мониторинг растёт быстрее, чем сама инфраструктура.

Datadog тарифицируется по числу хостов - $15–34 за хост в месяц (≈ 1 070–2 425 ₽) для инфраструктурного мониторинга, плюс $0,10 за ГБ логов (≈ 7 ₽) и до $2,50 за миллион проиндексированных событий (≈ 180 ₽) - по курсу ЦБ на 20.05.2026.

На сотнях хостов с высокой кардинальностью метрик счёт за наблюдаемость превышает стоимость самой инфраструктуры.

Для российских команд добавляется ограниченный доступ к зарубежным SaaS.

Open-source стек снимает оплату за хосты и события, перенося затраты в инженерные часы и собственную инфраструктуру.

▪️ Метрики собирает VictoriaMetrics (Apache 2.0): совместима с Prometheus по протоколу и PromQL, на больших объёмах потребляет в 5–10 раз меньше памяти (DevOpsBoys, 2026).

▪️ Логи берёт на себя Loki (AGPLv3): индексирует метки, а не полный текст, поэтому хранение в объектном хранилище дешевле.

▪️ Визуализацию и оповещения закрывает Grafana (Apache 2.0) с Unified Alerting, распределённую трассировку - Tempo.


Стек оправдан при нагрузке с упором на метрики и наличии команды, которая возьмёт эксплуатацию на себя: «бесплатный» открытый стек требует 1–2 инженеров на поддержку.

Рассчитать инфраструктуру под стек мониторинга.