Kinescope - 🚨 Отмечаются проблемы с загрузкой интерфейса панели управления и видео плеера. – Детали инцидента

Все системы работают

🚨 Отмечаются проблемы с загрузкой интерфейса панели управления и видео плеера.

Решено
Полная недоступность
Началось около 1 месяца назаддлился около 5 часов

Затронутые

kinescope.io

Работает от 6:40 AM до 11:30 AM

Dashboard

Полная недоступность от 6:40 AM до 8:30 AM, Частичная недоступность от 8:30 AM до 11:30 AM

Uploading

Полная недоступность от 6:40 AM до 8:30 AM, Частичная недоступность от 8:30 AM до 11:30 AM

Player embeds

Полная недоступность от 6:40 AM до 8:30 AM, Частичная недоступность от 8:30 AM до 9:45 AM, Работает от 9:45 AM до 11:30 AM

API

Полная недоступность от 6:40 AM до 8:30 AM, Частичная недоступность от 8:30 AM до 11:30 AM

DNS

Работает от 6:40 AM до 11:30 AM

Обновления
  • Решено
    Решено

    ✅ Инцидент разрешен, работа сервисов полностью восстановлена. Приносим извинения за причиненные неудобства.

    В чем была проблема:
    Сетевые инженеры выявили перегрузку на линии ЦОД - ЦОД, которая привела к замедлению запросов в рамках как межсетевого взаимодействия сервисов и БД, так и ориджинации трафика в CDN.

    Что мы сделали:
    После устранения перегрузки скорость запросов внутри сети нормализовалась, работа сервисов полностью восстановлена. При работе с панелью управления рекомендует перелогиниться в личном кабинете, сбросить кэш.

    Что будем делать чтобы не повторилось:
    Для предотвращения повторения ситуации мы исследуем природу трафика и маршрут, который привел к перегрузке выделенного канала связи большой емкости, добавим внутренные алерты на этот канал и превентивное срабатывание автоматики.

  • Мониторинг
    Мониторинг

    Решили проблему с загрузкой видео плеера. Обнаружили проблему с отдельной группой запросов на редирект с ошибками к несуществующим ассетам. Временно реализовали отдельный сервис который обрабатывает их отдельно. Продолжаем изучение инцидента.

  • Определено
    Определено

    Удалось выяснить что резко выросло время работы с базой данных, при этом сама база данных не страдает, долгих запросов в ней не висит. Дополнительно изучаем внутреннюю сеть на предмет задержек. Просим прощения за причиненные неудобства, в решении проблемв участвуют специалисты всех профилей.

  • Изучается
    Обновление

    🚨 Точная причина сбоя сервиса пока выясняется, поэтому сроки решения назвать не можем. Инфраструктура и видео в безопасности, проблема программная, приводит к замедленному ответу на запросы сервиса который отвечает за загрузку плеера и панели управления .

  • Изучается
    Обновление

    Причина частичной недоступности связана с программным сбоем в одном из внутренних сервисов. Все видео в полной сохранности, инфраструктурных сбоев не наблюдается. Отмечается замедление загрузки контента в панели управления и встроенных плеерах, а также API

  • Изучается
    Изучается

    🚨 Отмечаются проблемы с загрузкой интерфейса панели управления и видео плеера.