Timeweb Cloud Alerts – Telegram

Timeweb Cloud Alerts

@timewebcloud_alerts

15.5K subscribers

1 photo

17 links

Краткие оповещения о работе сервисов Клауда в реалтайме ⚡️

Новости: @timewebru
Комьюнити: @twcloud_chat
Медиа: @twc_media
Ченжлог: @twc_changelog

Download Telegram

About

Blog

Apps

Platform

Timeweb Cloud Alerts

15.5K subscribers

Timeweb Cloud Alerts

Timeweb Cloud Alerts

Начали процесс восстановления виртуальных серверов в порядке очереди. Миграция не потребовалась.

В процессе восстановления доступности серверов инженеры столкнулись с каскадом неполадок, восстановление происходит в ручном режиме, подключена вся команда инженеров.

Больше половины виртуальных машин с 17 затронутых нод уже запущены, работы на завершающей стадии.

😢54🙏19😱12👏6❤5🔥3🎉3❤‍🔥1

12.3K views16:08

Timeweb Cloud Alerts

Timeweb Cloud Alerts

🛑 Недоступность части серверов в локации МСК Во время плановых работ на одной стойке в дата-центре возникла аварийная ситуация. Часть серверов, расположенных в локации МСК, может работать с перебоями или быть недоступны с 14:55 мск. Инженеры занимаются…

✅ Работа серверов восстановлена.

👍46😢30🎉21❤17❤‍🔥8🔥3👌3

10.9K views17:28

Timeweb Cloud Alerts

Timeweb Cloud Alerts

✅ Работа серверов восстановлена.

Отчет об инциденте в инфраструктуре Timeweb Cloud 24.03.2026

Таймлайн (время московское):

14:45 — обнаружение проблем с доступностью виртуальных машин на узлах kvmnvm-867, kvmnvm-886.
14:55 — начало аварийно-восстановительных работ (АВР). Зафиксирована проблема еще на 15 нодах, ноды выведены из регистрации и балансировки.
15:30 — диагностика подтвердила сетевой сбой, в результате которого гипервизор не запускался из-за блокировки части дисков виртуальных машин на сетевом хранилище.
16:00–20:25 — поэтапное ручное восстановление ВМ силами дежурных инженеров и команды cloud-инфраструктуры.
21:26 — массовое снятие локов для сегмента VDS.
22:05 — восстановление штатной работы сервисов. Инцидент закрыт.

Технический анализ:

Первопричиной стал флап сети, который вызвал каскадную проблему на уровне гипервизоров. Специфика работы протоколов доступа к СХД такова, что при таком сбое сетевая сессия может не закрыться корректно. В результате СХД продолжает считать, что данные используются «старым» гипервизором, и блокирует доступ для «нового». Автоматика в данном случае оказалась бессильна, так как требовалось подтверждение целостности данных перед форсированным снятием блокировки.

Работа над ошибками:

1. Сейчас мы работаем над инструментом, который позволит автоматизировано сбрасывать локи на СХД при подтверждении падения гипервизора.

2. Настроены дополнительные алерты на аномальное количество ошибок I/O на уровне гипервизоров для более раннего обнаружения подобных проблем.

3. В планах — изменение композиции архитектуры с учетом вскрывшихся технических ограничений, направленное на стабилизацию работы гипервизоров и автоматизацию аварийного восстановления клиентских нагрузок в сценариях отказа.

❤80👏40👍26😱7🔥5🙏5❤‍🔥4

15.3K views12:16

Timeweb Cloud Alerts

🛑 Фиксируем периодические проблемы с доступностью по сети до части серверов

Инженеры подключены к диагностике неполадок. Влияет в том числе на отображение информации в панели управления.

Дадим апдейт после уточнения информации по проблеме.

😢97🙏13😱11🎉6👌5👏4❤‍🔥3❤1👍1🔥1

16.3K views10:27

Timeweb Cloud Alerts

Timeweb Cloud Alerts

🛑 Фиксируем периодические проблемы с доступностью по сети до части серверов Инженеры подключены к диагностике неполадок. Влияет в том числе на отображение информации в панели управления. Дадим апдейт после уточнения информации по проблеме.

Неполадки затронули сервисы в локации AMS. Временно аффект мог затронуть локацию SPB, а также работу AI-агентов.

Сейчас работа всех сервисов восстанавливается.

❤29😢20😱10👌5🎉4🙏4

15.8K views10:48

Timeweb Cloud Alerts

Timeweb Cloud Alerts

🛑 Фиксируем периодические проблемы с доступностью по сети до части серверов Инженеры подключены к диагностике неполадок. Влияет в том числе на отображение информации в панели управления. Дадим апдейт после уточнения информации по проблеме.

✅ Работа сервисов восстановлена, трафик вернулся в нормальным значениям.

Причиной стал программно-аппаратный сбой на маршрутизаторе, который привел к ошибке в работе сети. Сейчас сбой устранён.

🔥48❤15👍12😢8👏2😱2

16.1K views12:23

Timeweb Cloud Alerts

⚠️ Временные задержки в работе дисковой подсистемы

В данный момент часть виртуальных машин в Москве может работать с повышенными задержками (latency).

Причина: выявлены программные несоответствия в работе подсистемы хранения.

В настоящий момент инженеры проводят оптимизацию работы СХД.

😢151😱47👏8❤5👍5🎉5🙏3❤‍🔥1

13.3K views17:34

Timeweb Cloud Alerts

⚙️ Апдейт по работам в Москве

Продолжаем поэтапный ввод исправлений для подсистемы хранения.

Обновлено 4 из 8 сегментов инфраструктуры. На модернизированных сегментах фиксируем стабилизацию нагрузки и возвращение latency к нормативным значениям.

Ожидаемое время завершения всех работ — в течение 2-2.5 часов.

😢144👌21😱19👏10👍6❤5❤‍🔥1

15.8K views05:54

Timeweb Cloud Alerts

✅ Работа инфраструктуры в Москве полностью восстановлена

Мы завершили обновление программного обеспечения на всех узлах кластера хранения. Все системы работают в штатном режиме, показатели производительности и latency вернулись к целевым значениям.

В данный момент мы завершаем точечные настройки сетевых сессий. У части пользователей могут наблюдаться временные затруднения с подключением по SSH.

Наши специалисты уже занимаются этим вопросом, доступ будет восстановлен в ближайшее время.

Чуть позже будет детальный технический разбор.

😢166🎉34😱30👍13❤‍🔥5

13.7K views08:29

Timeweb Cloud Alerts

Timeweb Cloud Alerts

⚠️ Временные задержки в работе дисковой подсистемы В данный момент часть виртуальных машин в Москве может работать с повышенными задержками (latency). Причина: выявлены программные несоответствия в работе подсистемы хранения. В настоящий момент инженеры…

Мы локализовали проблему с частичным отсутствием доступа по SSH и зависанием части виртуальных машин. Для их возвращения в строй инженерам необходимо провести перезагрузку нескольких нод в Москве.

Суммарное время работ составит до 2 часов, и до 15-20 минут для конкретных виртуальных машин в рамках этого окна.

😱162😢81❤6🔥3🎉3🙏3👍2👏1

15.3K views10:17

Timeweb Cloud Alerts

Timeweb Cloud Alerts

⚠️ Временные задержки в работе дисковой подсистемы В данный момент часть виртуальных машин в Москве может работать с повышенными задержками (latency). Причина: выявлены программные несоответствия в работе подсистемы хранения. В настоящий момент инженеры…

✅ Массовые перезагрузки нод завершены. Сейчас работаем точечно — проверяем подключение и корректную работу виртуальных машин.

Параллельно исправляем зависшие статусы сервисов в панели управления. На доступность это не влияет.

Разбор инцидента опубликуем позднее.

👍47😢37🔥12😱11🙏8❤5👌2

15.1K viewsedited 14:17

Timeweb Cloud Alerts

Фиксируем массовые сообщения о недоступности сервисов Telegram (включая api.telegram.org).

Симптомы
• Ошибки подключения (timeout) при обращении к Bot API.
• Нестабильная работа интеграций и уведомлений через Telegram-ботов.
• Задержки в обновлении статусов в веб-версии мессенджера.

Данная проблема не связана с работами на стороне Timeweb Cloud и наблюдается у большинства провайдеров и дата-центров.

Рекомендуем временно использовать альтернативные каналы уведомлений, если ваши бизнес-процессы завязаны на Telegram API.

😢260😱87👌10👍9❤7👏7🎉5❤‍🔥2🔥2

25.1K viewsedited 15:29

Timeweb Cloud Alerts

Постмортем инцидента в зоне MSK-1 (09.04-10.04)

Подготовили подробный разбор инцидента с дисковой подсистемой. Детали, таймлайн и принятые меры по ссылке ниже.

Подробный технический разбор →

Коротко о причинах
• Ошибка СХД спровоцировала reboot loop узлов хранения. Рекурсивные перезагрузки вызвали оверлоад шины данных.
• Зависание процессов виртуальных машин на уровне гипервизоров, I/O wait и сетевая недоступность из-за блокировки системных процессов ОС.

Что сделано
• Внедрены сценарии каскадных отказов в протоколы тестирования.
• Запущен подбор альтернативных СХД для диверсификации рисков.
• Автоматизирован сброс сессий гипервизора при зависшем I/O.

🔥86😱27❤18😢10🙏7🎉6👍4❤‍🔥3👌2

17.5K views15:51

Timeweb Cloud Alerts

⚠️ Модернизация зарубежной инфраструктуры: локация Амстердам

Сегодня проведем срочную модернизацию сетевого сегмента в Европе. Обновление оборудования позволит повысить отказоустойчивость международных каналов и обеспечить стабильную работу при высоких нагрузках.

Старт работ: сегодня в 11:45 мск
Длительность: до 30 мин

Влияние на сервисы:

• Временная недоступность сервисов в Амстердаме на период перезагрузки
• В остальных локациях возможно снижение скорости из-за автоматического перестроения маршрутов

Инфраструктура в РФ работает в штатном режиме. О завершении работ тоже проинформируем.

😱109🙏63😢48👍12👌11❤5🔥3❤‍🔥2🎉2

21.7K views08:20

Timeweb Cloud Alerts

Timeweb Cloud Alerts

⚠️ Модернизация зарубежной инфраструктуры: локация Амстердам Сегодня проведем срочную модернизацию сетевого сегмента в Европе. Обновление оборудования позволит повысить отказоустойчивость международных каналов и обеспечить стабильную работу при высоких нагрузках.…

Работы полностью завершены. Работоспособность серверов в Амстердаме восстановлена в 12:00 мск.

На данный момент восстанавливается трафик: могут наблюдаться задержки в работе панели и сервисов.

😢141❤28🙏11😱5🎉5👍4👌2

20.2K viewsedited 10:18

Timeweb Cloud Alerts

Timeweb Cloud Alerts

⚠️ Модернизация зарубежной инфраструктуры: локация Амстердам Сегодня проведем срочную модернизацию сетевого сегмента в Европе. Обновление оборудования позволит повысить отказоустойчивость международных каналов и обеспечить стабильную работу при высоких нагрузках.…

✅ Работы завершены, сетевой трафик восстановился. Сервисы и панель управления работают исправно.

🔥74👏31👍16😢7🙏7👌4❤2

20K views11:12

Timeweb Cloud Alerts

🛑 Аппаратная проблема на роутере в Амстердам.

Сетевые инженеры занимаются восстановлением.

😱166😢70🎉17🙏11🔥5👏5❤3👌3❤‍🔥2👍2

17.5K views17:24

Timeweb Cloud Alerts

Timeweb Cloud Alerts

🛑 Аппаратная проблема на роутере в Амстердам. Сетевые инженеры занимаются восстановлением.

✅ Работы завершены, сетевой трафик восстановился. Сервисы работают в штатном режиме.

👏65👍28❤21😢5😱4🙏1👌1

16.3K views18:35

Timeweb Cloud Alerts

🛑 Возникли технические неполадки во время проведения работ с базой данных.

В личных кабинетах может отображаться нулевой баланс. Также может не отображаться список сервисов. Инженеры уже занимаются решением проблемы.

😱87😢32👌9👏6❤5🔥3🎉2🙏2❤‍🔥1

12.2K views17:36

Timeweb Cloud Alerts

Timeweb Cloud Alerts

🛑 Возникли технические неполадки во время проведения работ с базой данных. В личных кабинетах может отображаться нулевой баланс. Также может не отображаться список сервисов. Инженеры уже занимаются решением проблемы.

В течение 10 минут ожидаем запуск остановленных сервисов.

Создание новых сервисов сейчас недоступно.

🙏41😢28😱10❤7🔥1

11.7K views17:47

Timeweb Cloud Alerts

Timeweb Cloud Alerts

В течение 10 минут ожидаем запуск остановленных сервисов. Создание новых сервисов сейчас недоступно.

Производим постепенный запуск остановленных сервисов. Планируемое время восстановления — 1 час.

Дополнительно уведомим о завершении.

🙏21😱11❤8😢5👍4🔥1

11.6K views19:32