Timeweb Cloud Alerts – Telegram
Timeweb Cloud Alerts
5.56K subscribers
1 photo
14 links
Краткие оповещения о работе сервисов Клауда в реалтайме ⚡️

Новости: @timewebru
Комьюнити: @twcloud
Медиа: @twc_media
Ченжлог: @twc_changelog
Download Telegram
🛑 Авария на трассе Амстердам - СПб

Могут быть задержки и замедления. Сетевые инженеры перераспределяют трафик до момента устранения аварии.
😱40😢64🔥4👏2👍1
Timeweb Cloud Alerts
С 19 августа у части клиентов возникает кратковременная недоступность при подключении к серверам — примерно на 10 минут. Сами серверы работают нормально: пинг проходит, трафик идет, другие пользователи заходят без проблем. Что помогает клиентам • Смена IP…
Решение сетевой проблемы

Разобрались в ситуации и делимся результатами. По последним данным — проблема обнаружена и устранена на стороне операторов связи.

Причина инцидента: технические ошибки в фильтрации на промежуточном оборудовании вне нашей сети и зоны ответственности.

Что выяснили:

• Наша сеть не подвергалась блокировкам или ограничениям
• Внутренняя инфраструктура работала стабильно — задержки и трафик не демонстрировали аномалий
• Корректировка системы фильтрации полностью решила проблему

Сейчас подключение стабилизировано, сбоев не наблюдается. Мы продолжаем усиливать координацию с операторами, чтобы быстрее выявлять подобные инциденты.
👏51🔥2713👍7🙏1
🛑 Наблюдаются проблемы в создании управляемых сервисов.

Наши инженеры уже занимаются устранением неполадок.
🎉5👏41👍1
🛑 Сбой в работе с образами в панели управления.

Создание образов недоступно. Наши инженеры уже занимаются восстановлением.

Остальные сервисы работают в штатном режиме.
😢19🙏6👏1
🛑 Наблюдаем проблемы в работе Frontend Apps в локации СПб.

Наши инженеры уже занимаются восстановлением.
😢12👌4😱3🎉2
🛑 Возник программный сбой в работе S3-хранилища.

Это влияет на доступность реестра контейнеров. Уже решаем проблему. Все данные на месте.
😱18🙏65😢2🎉2
🛑 Авария на трассе Франкфурт - Москва

Могут быть задержки и замедления. Сетевые инженеры перераспределяют трафик до момента устранения аварии.
😱23😢5🎉32🔥2
🛑 Наблюдаем проблемы в создании облачных серверов.

Наши инженеры уже занимаются устранением неполадок.
😢182😱2🎉2🔥1👏1
Timeweb Cloud Alerts
🛑 Наблюдаем проблемы в создании облачных серверов. Наши инженеры уже занимаются устранением неполадок.
Создание облачных серверов снова доступно, неполадки устранены.
🔥12🎉4👏3❤‍🔥1
🛑 Наблюдаются проблемы с сетевой доступностью виртуальных серверов во всех локациях.

Инженеры работают над решением проблемы.
😱33😢10🙏4🎉3🔥1
Timeweb Cloud Alerts
🛑 Наблюдаются проблемы с сетевой доступностью виртуальных серверов во всех локациях. Инженеры работают над решением проблемы.
Для большой части уже созданных серверов неполадки с доступностью устранены.

Проблема сохраняется для вновь запускаемых серверов, работаем над исправлением.
👍17😢6👏2🔥1
Timeweb Cloud Alerts
Для большой части уже созданных серверов неполадки с доступностью устранены. Проблема сохраняется для вновь запускаемых серверов, работаем над исправлением.
Фикс запущен, доступность большинства виртуальных серверов восстановлена. Для части клиентов исправление ожидается в течение 20 минут.
12👍8🔥5😢4
Timeweb Cloud Alerts
Фикс запущен, доступность большинства виртуальных серверов восстановлена. Для части клиентов исправление ожидается в течение 20 минут.
Финальное исправление для небольшой части серверов проходит дольше запланированного. ETA приблизительно 2 часа.

Проблему можно решить самостоятельно через рестарт сервера – для этого необходимо выключить и включить сервер в панели управления. Обычная перезагрузка не решит проблему.
11👍7🔥6😢1
Timeweb Cloud Alerts
🛑 Наблюдаются проблемы с сетевой доступностью виртуальных серверов во всех локациях. Инженеры работают над решением проблемы.
🟢 Работы завершены. Для затронутых серверов на обновленных нодах сеть поднимается автоматически. Позже опубликуем разбор инцидента.
15👍5🔥3❤‍🔥1👏1
Timeweb Cloud Alerts
🟢 Работы завершены. Для затронутых серверов на обновленных нодах сеть поднимается автоматически. Позже опубликуем разбор инцидента.
Разбор сетевой проблемы

29 октября с 11:00 мск зафиксировали проблемы с сетью на некоторых облачных серверах.

Причина — ошибка в новой конфигурации во время планового рефакторинга сетевых сервисов, отвечающих за старт сети при создании и миграции облачных серверов.

Это привело к тому, что стартовый скрипт, поднимающий сеть, некорректно обрабатывал события запуска и рестарта облачных серверов.

Хронология событий:

11:00 — заметили проблему с недоступностью части серверов, приступили к локализации.

11:57 — выпустили минорный фикс и для части серверов серверов восстановили доступность. Проблема сохранялась на вновь запускаемых облачных сервисах и части сервисов, которым фикс не помог.

12:32 — доставили финальный фикс в прод по всем нодам. По первичной оценке восстановление ожидалось в течение 20 минут.

13:36 — финальное исправление для небольшой части серверов заняло больше времени (ETA ~2 часа). Было рекомендовано временное решение — выключить и включить сервер в панели управления (простая перезагрузка не помогала).

14:28 — восстановили работу всех сервисов.

Что сделали:

Ввели дополнительные ручные проверки и алгоритм канареечного деплоя, чтобы в будущем уменьшить влияние на клиентские сервисы.
👍3025🎉14😢4