28 апреля, 14:00 МСК: вебинар об удалённых рабочих местах в облаке
Переход на удалённый формат - обычно не один вопрос, а три:
Облачные рабочие места закрывают все три вопроса одновременно - но правильная реализация зависит от того, какую модель выбрать.
На вебинаре разберём:
Плюс реальные кейсы - от колл-центров до архитектурных бюро.
Живой Q&A: свои вопросы можно задать прямо в эфире.
📢 Спикер: Диана Тусова, технический пресейл Cloud4Y.
📅🕑 Дата и время: 28 апреля, 14:00 МСК.
Регистрация по ссылке
Переход на удалённый формат - обычно не один вопрос, а три:
1️⃣ как обеспечить сотрудникам стабильные рабочие места,
2️⃣ как не переплатить за оборудование,
3️⃣ как не потерять контроль над доступом к данным.
Облачные рабочие места закрывают все три вопроса одновременно - но правильная реализация зависит от того, какую модель выбрать.
На вебинаре разберём:
▪️ В каких сценариях VDI выигрывает у RDS, а в каких - наоборот. Практические критерии выбора, а не общий обзор технологий.
▪️ Как обеспечить безопасность корпоративных данных, когда сотрудники работают из разных мест и с разных устройств.
▪️ Какие ошибки чаще всего возникают при внедрении и как их предотвратить заранее.
Плюс реальные кейсы - от колл-центров до архитектурных бюро.
Живой Q&A: свои вопросы можно задать прямо в эфире.
📢 Спикер: Диана Тусова, технический пресейл Cloud4Y.
📅🕑 Дата и время: 28 апреля, 14:00 МСК.
Регистрация по ссылке
👍2⚡1❤1
Своя LLM или чужой API: три сценария и цифры
Выбор инфраструктуры для большой языковой модели определяет два принципиально разных подхода: внешний API (чужая модель, оплата за часы) и локальная LLM (своя модель, два варианта размещения). У каждого свой профиль по стоимости, контролю и скорости.
◾️ API - оптимальный старт.
◾️ Собственный кластер - максимальный контроль.
◾️ Аренда GPU - баланс между ними.
GPU серверы Cloud4Y для задач ML и LLM-инференс.
Выбор инфраструктуры для большой языковой модели определяет два принципиально разных подхода: внешний API (чужая модель, оплата за часы) и локальная LLM (своя модель, два варианта размещения). У каждого свой профиль по стоимости, контролю и скорости.
1️⃣ API провайдера - старт за минуты. Стоимость: от ~30 ₽/час (Alice AI) до ~100 ₽/час (ChatGPT/GPT-4o) за час активной работы специалиста. Высокая зависимость от провайдера, ограниченные возможности дообучения.
2️⃣ Аренда GPU в облаке - данные в российском ЦОД, запуск за часы-дни. Средняя стоимость по рынку - около 150 000 ₽/мес для конфигураций уровня A100. Гибкая оплата по факту, возможность дообучения на собственных данных.
3️⃣ Собственный GPU-кластер - полный контроль, минимальная задержка. Высокий CapEx. GPU класса H100/A100 недоступны через официальные каналы в России из-за экспортных ограничений.
◾️ API - оптимальный старт.
◾️ Собственный кластер - максимальный контроль.
◾️ Аренда GPU - баланс между ними.
GPU серверы Cloud4Y для задач ML и LLM-инференс.
Пять вопросов провайдеру перед подписанием договора
Большинство компаний задают провайдеру одни и те же вопросы: «Какая у вас цена?» и «Есть ли SLA?». Вопросы, которые действительно разграничивают надёжных провайдеров от остальных, - другие.
1️⃣ SLA с компенсациями?
2️⃣ Где физически данные?
3️⃣ Какие сертификации?
4️⃣ Поддержка в нерабочее время?
5️⃣ Условия выхода из контракта?
Надёжный провайдер отвечает на все пять без паузы. Уклонение от любого - сигнал для проверки до подписания, а не после.
Cloud4Y - отвечаем на все пять.
Большинство компаний задают провайдеру одни и те же вопросы: «Какая у вас цена?» и «Есть ли SLA?». Вопросы, которые действительно разграничивают надёжных провайдеров от остальных, - другие.
1️⃣ SLA с компенсациями?
✔️ конкретный процент компенсации в договоре.
❌ «мы стараемся соблюдать» без финансовых последствий.
2️⃣ Где физически данные?
✔️ Конкретный адрес ЦОД в России, подтверждаемый документально. Важно для соблюдения 152-ФЗ.
❌ «В нашем облаке» - без уточнения геолокации.
3️⃣ Какие сертификации?
✔️ Актуальные ISO 27001, ФСТЭК, 152-ФЗ, PCI DSS - с датами.
❌ Просроченные или «в процессе»
4️⃣ Поддержка в нерабочее время?
✔️ Гарантированное время первого ответа 24/7, зафиксированное в SLA.
❌ «Есть дежурный» без метрик.
5️⃣ Условия выхода из контракта?
✔️ Чёткая процедура выгрузки данных.
❌ Ограничения или неустойки, делающие смену невыгодной.
Надёжный провайдер отвечает на все пять без паузы. Уклонение от любого - сигнал для проверки до подписания, а не после.
Cloud4Y - отвечаем на все пять.
5-летний TCO резервного ЦОД: почему счёт обычно в 3–4 раза выше ожидаемого
Сравнение «собственный резервный ЦОД vs DRaaS» для компании на 100 виртуальных машин чаще всего строится по капитальным затратам - стоимости серверов, СХД, сети, ИБП. Эта часть сравнительно прозрачна: ~15–30 млн ₽ начальных вложений для небольшой резервной площадки.
Проблема - в операционных расходах на горизонте 5 лет. Они обычно формируют 70–80% совокупной стоимости владения, и именно там скрыты статьи, которые не попадают в исходный расчёт.
Три главные статьи, которые пропускают:
1️⃣ Персонал для 24/7-дежурства на второй площадке.
2️⃣ Цикл обновления оборудования.
3️⃣ PUE (Power Usage Effectiveness - коэффициент эффективности использования электроэнергии) и счёт за электричество.
Собственный резервный ЦОД оправдан при устойчиво высокой регулярной нагрузке и специфических требованиях compliance.
В остальных сценариях DRaaS на инфраструктуре провайдера экономически выгоднее, особенно с учётом роста цен на colocation в Москве - по данным iKS-Consulting, +31,4% за первый квартал 2025 года.
DRaaS на инфраструктуре Cloud4Y.
Сравнение «собственный резервный ЦОД vs DRaaS» для компании на 100 виртуальных машин чаще всего строится по капитальным затратам - стоимости серверов, СХД, сети, ИБП. Эта часть сравнительно прозрачна: ~15–30 млн ₽ начальных вложений для небольшой резервной площадки.
Проблема - в операционных расходах на горизонте 5 лет. Они обычно формируют 70–80% совокупной стоимости владения, и именно там скрыты статьи, которые не попадают в исходный расчёт.
Три главные статьи, которые пропускают:
1️⃣ Персонал для 24/7-дежурства на второй площадке.
Это не один сисадмин - для непрерывного покрытия нужно 3–4 штатные единицы. По данным hh.ru (январь 2026), расходы работодателя на одного DevOps-специалиста - около 3,4 млн ₽/год. Четыре штатные единицы = ~13,5 млн ₽/год.
2️⃣ Цикл обновления оборудования.
Серверы и СХД требуют замены каждые 5–7 лет. В расчёте владения это повторные капитальные затраты, не разовые.
3️⃣ PUE (Power Usage Effectiveness - коэффициент эффективности использования электроэнергии) и счёт за электричество.
Корпоративный резервный ЦОД обычно работает на PUE 1,6–1,8. Специализированные площадки - на 1,1–1,2. Разница транслируется в счёт за электричество напрямую.
Собственный резервный ЦОД оправдан при устойчиво высокой регулярной нагрузке и специфических требованиях compliance.
В остальных сценариях DRaaS на инфраструктуре провайдера экономически выгоднее, особенно с учётом роста цен на colocation в Москве - по данным iKS-Consulting, +31,4% за первый квартал 2025 года.
DRaaS на инфраструктуре Cloud4Y.
Друзья, в 14:00 начинаем вебинар про Удаленные рабочие столы, подключайтесь: https://bbb.cloud4y.ru/rooms/cmv-rwd-i9b-iun/join
👍2❤1 1
Уходим на майские: 5 пунктов, которые стоит пройти перед длинными выходными
Инфраструктура не уходит в отпуск вместе с командой. Короткий чек-лист, который поможет уйти на праздники спокойнее и вернуться без сюрпризов.
Хороших выходных. Сервера работают - вы отдыхаете. Так и должно быть.
Инфраструктура не уходит в отпуск вместе с командой. Короткий чек-лист, который поможет уйти на праздники спокойнее и вернуться без сюрпризов.
1️⃣ Мониторинг и алерты.
Критичные метрики под наблюдением, пороги срабатывания адекватные, уведомления доходят до нужных каналов - не в общий чат, где их никто не увидит в выходной.
2️⃣ Бэкапы.
Последняя удачная резервная копия - сегодня. Проверить журнал выполнения, убедиться, что все задания завершились без ошибок.
3️⃣ On-call.
Дежурный инженер назначен и знает, что дежурит. Календарь, контакты, доступы - актуальные. Вторая линия эскалации - тоже.
4️⃣ Критичные задачи - завершены или отложены осознанно.
Рискованные релизы, миграции, обновления ОС стоит переносить на после праздников. Пятница перед длинными выходными - не то время, когда хочется откатывать изменения.
5️⃣ Контакты поддержки.
Телефон, чат, email провайдера сохранены там, куда дежурный быстро дотянется. Не только на рабочем ноутбуке.
Хороших выходных. Сервера работают - вы отдыхаете. Так и должно быть.
❤1😢1
С Днём Труда
Лучшая информационная безопасность - та, о которой никто не вспоминает. Потому что инцидента не случилось.
Удачный бэкап замечают тогда, когда он понадобился. Правильная миграция - та, которую пользователи не заметили. Кластер, который держит нагрузку, - тот, о котором не приходится говорить.
IT-работа, сделанная правильно, незаметна. В этом её особенность - и в этом её ценность.
С Днём Труда тех, чей труд становится заметен только когда что-то идёт не так.
Команда Cloud4Y - с вами в этой работе.
Лучшая информационная безопасность - та, о которой никто не вспоминает. Потому что инцидента не случилось.
Удачный бэкап замечают тогда, когда он понадобился. Правильная миграция - та, которую пользователи не заметили. Кластер, который держит нагрузку, - тот, о котором не приходится говорить.
IT-работа, сделанная правильно, незаметна. В этом её особенность - и в этом её ценность.
С Днём Труда тех, чей труд становится заметен только когда что-то идёт не так.
Команда Cloud4Y - с вами в этой работе.
CI/CD без GitHub: какой стек подходит под какую задачу.
Когда команда уходит с GitHub Actions, выбор Git-платформы определяет не «лучший продукт», а сценарий работы. Три ситуации - три решения.
1️⃣ Нужна облачная альтернатива GitHub.сom с хранением данных в РФ, без необходимости поднимать инфраструктуру самим.
2️⃣ Системы работают в изолированном контуре - аттестованная среда, объекты КИИ, отсутствие выхода в интернет.
3️⃣ Нужна on-premise установка с долгосрочной независимостью от коммерческих решений и полностью свободной лицензией.
Инфраструктура под любой из этих сценариев.
Когда команда уходит с GitHub Actions, выбор Git-платформы определяет не «лучший продукт», а сценарий работы. Три ситуации - три решения.
1️⃣ Нужна облачная альтернатива GitHub.сom с хранением данных в РФ, без необходимости поднимать инфраструктуру самим.
Имеет смысл присмотреться к GitVerse от СберТех: бесплатные репозитории, встроенный CI/CD, AI-ассистент GigaCode. Подойдёт стартапам и продуктовым командам, которым важны скорость старта и привычный workflow.
2️⃣ Системы работают в изолированном контуре - аттестованная среда, объекты КИИ, отсутствие выхода в интернет.
Разумным вариантом здесь будет Gitea: ставится на свои серверы, минимум зависимостей, около 52 000 звёзд на GitHub. Gitea Actions совместимы с GitHub Actions - переезд CI-сценариев проходит почти без переписывания.
3️⃣ Нужна on-premise установка с долгосрочной независимостью от коммерческих решений и полностью свободной лицензией.
Подойдёт Forgejo - независимый форк Gitea под управлением некоммерческой Codeberg e.V., GPL v3+ с v9.0, упор на сквозное тестирование. Цена выбора - меньшее сообщество и без поддержки Windows с 2024 года.
Инфраструктура под любой из этих сценариев.
😱1
С 1 марта 2026 года 325-ФЗ действует в штатном режиме: значимые объекты КИИ - на российском программно-аппаратном стеке (ПО из реестра, средства защиты у российских юрлиц).
Что это значит для инфраструктуры субъекта КИИ в 2026 году:
Аттестат соответствия больше не индульгенция.
Cloud4Y предоставляет защищённое облако соответствующее требованиям ФЗ-187 под значимые объекты: аттестованный контур, российский стек виртуализации, сертифицированные СЗИ.
Параллельно с 1 марта действует приказ ФСТЭК №117 - для государственных информационных систем (ГИС): меры защиты подбираются под конкретную архитектуру и модель угроз, а не выбираются из жёстких перечней мер по классам защищённости. Под него попадают и значимые ОКИИ, являющиеся ГИС.
Что это значит для инфраструктуры субъекта КИИ в 2026 году:
▪️ программно-аппаратный стек - из реестра отечественного ПО, с контролем юрисдикции вендора;
▪️ сведения об объектах в ФСТЭК поддерживаются в актуальном состоянии - по данным ФСТЭК (Инфофорум 2026), за 2025 год составлено 492 протокола об административных правонарушениях по ст. 19.7.15 КоАП за непредоставление сведений о значимых объектах КИИ;
▪️ подключение к сегменту НКЦКИ ГосСОПКА с фиксированным порядком информирования об инцидентах;
▪️ подрядчики со значимыми правами на инфраструктуре - под действием 187-ФЗ.
Аттестат соответствия больше не индульгенция.
Параллельно с 1 марта действует приказ ФСТЭК №117 - для государственных информационных систем (ГИС): меры защиты подбираются под конкретную архитектуру и модель угроз, а не выбираются из жёстких перечней мер по классам защищённости. Под него попадают и значимые ОКИИ, являющиеся ГИС.
Готовим практический гид по приказу №117. Соберём под ту ситуацию, в которой находится большинство - определим по опросу ниже.
GPU-линейка 2026 - это не лестница «новее = лучше», а сегментированный набор инструментов под разные классы задач.
Стоимость результата важнее цены за час.
Четыре класса под четыре сценария:
1️⃣ Потребительские (RTX 4090, RTX 5090).
2️⃣ Серверные «рабочие лошадки» (V100, A100).
3️⃣ Серверные, топ-класс (H100, H200).
4️⃣ Blackwell (B200, B300, RTX 6000 Blackwell).
H200 даёт 1,9× прирост к H100 при +25% к тарифу - себестоимость токена ниже на 30–40%.
Cloud4Y предоставляет весь диапазон с почасовым биллингом - от V100 до B300, включая RTX 6000 Blackwell 96 ГБ ECC для инференса 70B на одной карте.
Стоимость результата важнее цены за час.
Четыре класса под четыре сценария:
1️⃣ Потребительские (RTX 4090, RTX 5090).
Инференс моделей до 24B, Stable Diffusion, рендер. Без NVLink, GDDR-память. Хорошее соотношение цена/FP32, без масштабирования между картами.
2️⃣ Серверные «рабочие лошадки» (V100, A100).
Классический ML, дообучение и инференс моделей до 7B, MIG для совместного использования. Предсказуемое поведение под промышленной нагрузкой.
3️⃣ Серверные, топ-класс (H100, H200).
Обучение трансформеров, инференс LLM 13–70B, длинный контекст. NVLink + HBM3e - пропускная способность памяти, без которой большие модели простаивают.
4️⃣ Blackwell (B200, B300, RTX 6000 Blackwell).
Флагманский инференс на FP4/FP8, модели 100B+. До 11–15× прирост пропускной способности LLM на одну карту относительно Hopper.
H200 даёт 1,9× прирост к H100 при +25% к тарифу - себестоимость токена ниже на 30–40%.
Cloud4Y предоставляет весь диапазон с почасовым биллингом - от V100 до B300, включая RTX 6000 Blackwell 96 ГБ ECC для инференса 70B на одной карте.