Timeweb Cloud Alerts – Telegram

Timeweb Cloud Alerts

@timewebcloud_alerts

15.5K subscribers

1 photo

17 links

Краткие оповещения о работе сервисов Клауда в реалтайме ⚡️

Новости: @timewebru
Комьюнити: @twcloud_chat
Медиа: @twc_media
Ченжлог: @twc_changelog

Download Telegram

About

Blog

Apps

Platform

Timeweb Cloud Alerts

15.5K subscribers

Timeweb Cloud Alerts

Timeweb Cloud Alerts

🛑 Фиксируем волну DDoS. Возможны перебои в доступности сайта и отдельных сервисов.

Атака затрагивает локации Нидерланды и Казахстан.
Атакованные подсети заведены под защиту — из-за этого возможны временные просадки скорости и доступности сервисов.

~~Если сервисы недоступны — обращайтесь в поддержку.~~

Upd. Оптимизировали правила, доступность до сервисов должна восстановиться.

🎉34😱12👌10🔥3😢3❤2👍1🙏1

12.9K viewsedited 15:13

Timeweb Cloud Alerts

Timeweb Cloud Alerts

🛑 Фиксируем волну DDoS. Возможны перебои в доступности сайта и отдельных сервисов.

✅ Доступность большинства сетей восстановлена.

Атака полностью отражена в 22:21 мск.

❤44👍20😢9❤‍🔥8🔥5🎉1🙏1👌1

17.8K viewsedited 16:18

Timeweb Cloud Alerts

Timeweb Cloud Alerts

✅ Соединение стабильно, проблемы не наблюдаются. Ожидаем результаты официального расследования подрядчика. Итоги опубликуем в этом канале.

Разбор сетевого инцидента 10 февраля во Франкфурте

В дата-центре партнера сработала пожарная сигнализация из-за возгорания на одном из узлов — это привело к аварийному отключению электропитания всего здания. Доступ к оборудованию был закрыт примерно на 2 часа: партнер проводил расследование на своей стороне.

После восстановления доступа часть инфраструктуры запустили сразу, но некоторые критичные компоненты из-за длительного обесточивания вышли из строя и потребовали замены. После замены оборудования все сервисы заработали в штатном режиме.

Партнер обозначил меры со своей стороны. Мы тоже делаем выводы и прорабатываем дополнительные сценарии на случай подобных ситуаций.

😱66👍41❤16🔥10👌4😢2🎉1

8.97K views09:38

Timeweb Cloud Alerts

🛑 Недоступность части серверов в локации МСК

Во время плановых работ на одной стойке в дата-центре возникла аварийная ситуация. Часть серверов, расположенных в локации МСК, может работать с перебоями или быть недоступны с 14:55 мск.

Инженеры занимаются восстановлением работы серверов, ориентировочно потребуется до 30 минут.

😢54😱14❤‍🔥6🎉5🙏5👏4🔥2❤1👌1

10.3K viewsedited 12:45

Timeweb Cloud Alerts

Timeweb Cloud Alerts

🛑 Недоступность части серверов в локации МСК Во время плановых работ на одной стойке в дата-центре возникла аварийная ситуация. Часть серверов, расположенных в локации МСК, может работать с перебоями или быть недоступны с 14:55 мск. Инженеры занимаются…

В процессе восстановления доступности нод не удалось примонтировать систему хранения.

Инженеры проводят перенос виртуальных машин на другие ноды для восстановления доступности. На работы потребуется дополнительное время, от 30 до 60 минут.

😢56🙏15😱10🔥4❤‍🔥3🎉3👏1

10.7K views13:28

Timeweb Cloud Alerts

Timeweb Cloud Alerts

В процессе восстановления доступности нод не удалось примонтировать систему хранения. Инженеры проводят перенос виртуальных машин на другие ноды для восстановления доступности. На работы потребуется дополнительное время, от 30 до 60 минут.

Начали процесс восстановления виртуальных серверов в порядке очереди.

Миграция не потребовалась.

👍41😢23🎉14🙏7❤‍🔥4❤3😱2👏1

11.3K viewsedited 13:57

Timeweb Cloud Alerts

Timeweb Cloud Alerts

Начали процесс восстановления виртуальных серверов в порядке очереди. Миграция не потребовалась.

В процессе восстановления доступности серверов инженеры столкнулись с каскадом неполадок, восстановление происходит в ручном режиме, подключена вся команда инженеров.

Больше половины виртуальных машин с 17 затронутых нод уже запущены, работы на завершающей стадии.

😢54🙏19😱12👏6❤5🔥3🎉3❤‍🔥1

12.3K views16:08

Timeweb Cloud Alerts

Timeweb Cloud Alerts

🛑 Недоступность части серверов в локации МСК Во время плановых работ на одной стойке в дата-центре возникла аварийная ситуация. Часть серверов, расположенных в локации МСК, может работать с перебоями или быть недоступны с 14:55 мск. Инженеры занимаются…

✅ Работа серверов восстановлена.

👍46😢30🎉21❤17❤‍🔥8🔥3👌3

10.9K views17:28

Timeweb Cloud Alerts

Timeweb Cloud Alerts

✅ Работа серверов восстановлена.

Отчет об инциденте в инфраструктуре Timeweb Cloud 24.03.2026

Таймлайн (время московское):

14:45 — обнаружение проблем с доступностью виртуальных машин на узлах kvmnvm-867, kvmnvm-886.
14:55 — начало аварийно-восстановительных работ (АВР). Зафиксирована проблема еще на 15 нодах, ноды выведены из регистрации и балансировки.
15:30 — диагностика подтвердила сетевой сбой, в результате которого гипервизор не запускался из-за блокировки части дисков виртуальных машин на сетевом хранилище.
16:00–20:25 — поэтапное ручное восстановление ВМ силами дежурных инженеров и команды cloud-инфраструктуры.
21:26 — массовое снятие локов для сегмента VDS.
22:05 — восстановление штатной работы сервисов. Инцидент закрыт.

Технический анализ:

Первопричиной стал флап сети, который вызвал каскадную проблему на уровне гипервизоров. Специфика работы протоколов доступа к СХД такова, что при таком сбое сетевая сессия может не закрыться корректно. В результате СХД продолжает считать, что данные используются «старым» гипервизором, и блокирует доступ для «нового». Автоматика в данном случае оказалась бессильна, так как требовалось подтверждение целостности данных перед форсированным снятием блокировки.

Работа над ошибками:

1. Сейчас мы работаем над инструментом, который позволит автоматизировано сбрасывать локи на СХД при подтверждении падения гипервизора.

2. Настроены дополнительные алерты на аномальное количество ошибок I/O на уровне гипервизоров для более раннего обнаружения подобных проблем.

3. В планах — изменение композиции архитектуры с учетом вскрывшихся технических ограничений, направленное на стабилизацию работы гипервизоров и автоматизацию аварийного восстановления клиентских нагрузок в сценариях отказа.

❤80👏40👍26😱7🔥5🙏5❤‍🔥4

15.3K views12:16

Timeweb Cloud Alerts

🛑 Фиксируем периодические проблемы с доступностью по сети до части серверов

Инженеры подключены к диагностике неполадок. Влияет в том числе на отображение информации в панели управления.

Дадим апдейт после уточнения информации по проблеме.

😢97🙏13😱11🎉6👌5👏4❤‍🔥3❤1👍1🔥1

16.3K views10:27

Timeweb Cloud Alerts

Timeweb Cloud Alerts

🛑 Фиксируем периодические проблемы с доступностью по сети до части серверов Инженеры подключены к диагностике неполадок. Влияет в том числе на отображение информации в панели управления. Дадим апдейт после уточнения информации по проблеме.

Неполадки затронули сервисы в локации AMS. Временно аффект мог затронуть локацию SPB, а также работу AI-агентов.

Сейчас работа всех сервисов восстанавливается.

❤29😢20😱10👌5🎉4🙏4

15.8K views10:48

Timeweb Cloud Alerts

Timeweb Cloud Alerts

🛑 Фиксируем периодические проблемы с доступностью по сети до части серверов Инженеры подключены к диагностике неполадок. Влияет в том числе на отображение информации в панели управления. Дадим апдейт после уточнения информации по проблеме.

✅ Работа сервисов восстановлена, трафик вернулся в нормальным значениям.

Причиной стал программно-аппаратный сбой на маршрутизаторе, который привел к ошибке в работе сети. Сейчас сбой устранён.

🔥48❤15👍12😢8👏2😱2

16.1K views12:23

Timeweb Cloud Alerts

⚠️ Временные задержки в работе дисковой подсистемы

В данный момент часть виртуальных машин в Москве может работать с повышенными задержками (latency).

Причина: выявлены программные несоответствия в работе подсистемы хранения.

В настоящий момент инженеры проводят оптимизацию работы СХД.

😢151😱47👏8❤5👍5🎉5🙏3❤‍🔥1

13.3K views17:34

Timeweb Cloud Alerts

⚙️ Апдейт по работам в Москве

Продолжаем поэтапный ввод исправлений для подсистемы хранения.

Обновлено 4 из 8 сегментов инфраструктуры. На модернизированных сегментах фиксируем стабилизацию нагрузки и возвращение latency к нормативным значениям.

Ожидаемое время завершения всех работ — в течение 2-2.5 часов.

😢144👌21😱19👏10👍6❤5❤‍🔥1

15.8K views05:54

Timeweb Cloud Alerts

✅ Работа инфраструктуры в Москве полностью восстановлена

Мы завершили обновление программного обеспечения на всех узлах кластера хранения. Все системы работают в штатном режиме, показатели производительности и latency вернулись к целевым значениям.

В данный момент мы завершаем точечные настройки сетевых сессий. У части пользователей могут наблюдаться временные затруднения с подключением по SSH.

Наши специалисты уже занимаются этим вопросом, доступ будет восстановлен в ближайшее время.

Чуть позже будет детальный технический разбор.

😢166🎉34😱30👍13❤‍🔥5

13.7K views08:29

Timeweb Cloud Alerts

Timeweb Cloud Alerts

⚠️ Временные задержки в работе дисковой подсистемы В данный момент часть виртуальных машин в Москве может работать с повышенными задержками (latency). Причина: выявлены программные несоответствия в работе подсистемы хранения. В настоящий момент инженеры…

Мы локализовали проблему с частичным отсутствием доступа по SSH и зависанием части виртуальных машин. Для их возвращения в строй инженерам необходимо провести перезагрузку нескольких нод в Москве.

Суммарное время работ составит до 2 часов, и до 15-20 минут для конкретных виртуальных машин в рамках этого окна.

😱162😢81❤6🔥3🎉3🙏3👍2👏1

15.3K views10:17

Timeweb Cloud Alerts

Timeweb Cloud Alerts

⚠️ Временные задержки в работе дисковой подсистемы В данный момент часть виртуальных машин в Москве может работать с повышенными задержками (latency). Причина: выявлены программные несоответствия в работе подсистемы хранения. В настоящий момент инженеры…

✅ Массовые перезагрузки нод завершены. Сейчас работаем точечно — проверяем подключение и корректную работу виртуальных машин.

Параллельно исправляем зависшие статусы сервисов в панели управления. На доступность это не влияет.

Разбор инцидента опубликуем позднее.

👍47😢37🔥12😱11🙏8❤5👌2

15.1K viewsedited 14:17

Timeweb Cloud Alerts

Фиксируем массовые сообщения о недоступности сервисов Telegram (включая api.telegram.org).

Симптомы
• Ошибки подключения (timeout) при обращении к Bot API.
• Нестабильная работа интеграций и уведомлений через Telegram-ботов.
• Задержки в обновлении статусов в веб-версии мессенджера.

Данная проблема не связана с работами на стороне Timeweb Cloud и наблюдается у большинства провайдеров и дата-центров.

Рекомендуем временно использовать альтернативные каналы уведомлений, если ваши бизнес-процессы завязаны на Telegram API.

😢260😱87👌10👍9❤7👏7🎉5❤‍🔥2🔥2

25.1K viewsedited 15:29

Timeweb Cloud Alerts

Постмортем инцидента в зоне MSK-1 (09.04-10.04)

Подготовили подробный разбор инцидента с дисковой подсистемой. Детали, таймлайн и принятые меры по ссылке ниже.

Подробный технический разбор →

Коротко о причинах
• Ошибка СХД спровоцировала reboot loop узлов хранения. Рекурсивные перезагрузки вызвали оверлоад шины данных.
• Зависание процессов виртуальных машин на уровне гипервизоров, I/O wait и сетевая недоступность из-за блокировки системных процессов ОС.

Что сделано
• Внедрены сценарии каскадных отказов в протоколы тестирования.
• Запущен подбор альтернативных СХД для диверсификации рисков.
• Автоматизирован сброс сессий гипервизора при зависшем I/O.

🔥86😱27❤18😢10🙏7🎉6👍4❤‍🔥3👌2

17.5K views15:51

Timeweb Cloud Alerts

⚠️ Модернизация зарубежной инфраструктуры: локация Амстердам

Сегодня проведем срочную модернизацию сетевого сегмента в Европе. Обновление оборудования позволит повысить отказоустойчивость международных каналов и обеспечить стабильную работу при высоких нагрузках.

Старт работ: сегодня в 11:45 мск
Длительность: до 30 мин

Влияние на сервисы:

• Временная недоступность сервисов в Амстердаме на период перезагрузки
• В остальных локациях возможно снижение скорости из-за автоматического перестроения маршрутов

Инфраструктура в РФ работает в штатном режиме. О завершении работ тоже проинформируем.

😱109🙏63😢48👍12👌11❤5🔥3❤‍🔥2🎉2

21.7K views08:20

Timeweb Cloud Alerts

Timeweb Cloud Alerts

⚠️ Модернизация зарубежной инфраструктуры: локация Амстердам Сегодня проведем срочную модернизацию сетевого сегмента в Европе. Обновление оборудования позволит повысить отказоустойчивость международных каналов и обеспечить стабильную работу при высоких нагрузках.…

Работы полностью завершены. Работоспособность серверов в Амстердаме восстановлена в 12:00 мск.

На данный момент восстанавливается трафик: могут наблюдаться задержки в работе панели и сервисов.

😢141❤28🙏11😱5🎉5👍4👌2

20.2K viewsedited 10:18