Детальна інформація щодо аварійного відключення сервісів Мережі Ланет увечері 30 жовтня 2018 року

Деталі аварії та таймінг наших дій, що були спрямовані на якомога швидше відновлення роботи всієї мережі

Детальна інформація щодо аварійного відключення сервісів Мережі Ланет увечері 30 жовтня 2018 року

Шановні користувачі!

Учора, 30 жовтня 2018 року, відбулась аварійна ситуація на центральній ділянці мережі, внаслідок чого відбулося масове падіння сервісів Мережі Ланет. Ми проводили оперативне інформування про перебіг ситуації в тих каналах комунікації, які були доступні.

Сьогодні ми детально аналізуємо інцидент та плануємо подальші дії з метою попередження подібного в майбутньому. Ділимося з вами деталями аварії та таймінгом наших дій, які були спрямовані на якомога швидше відновлення роботи всієї мережі, адже для нас завжди важливо вести відверту та відкриту комунікацію.

Просимо звернути увагу, що кабельне телебачення продовжувало працювати без збоїв, а роботу з подолання наслідків аварії ми вели з огляду на першочергову потребу відновлення саме основної послуги: доступу до мережі Інтернет для найбільших сегментів користувачів.

Що ж сталося з інтернетом вчора?

О 21:16 відбулося масове падіння сервісів компанії.

21:17. Черговий інженер мережі потрапляє у приміщення серверної і розпочинає процедури з оцінки ситуації, виявлення причин збою та локалізації місця інциденту.

21:18. Встановлено, що аварія пов'язана з головними джерелами електроживлення та збоєм автоматики, що відповідає за перемикання на резервні джерела.

21:25. З огляду на масштаби проблеми, прибуває додатковий кваліфікований персонал для оперативного усунення наслідків та інтенсифікує роботу з подолання причин та забезпечення контраварійних дій.

21:38. Відновлено електроживлення центрального ядра мережі та запущено процедуру ініціалізації.

21:40. Розпочато комплекс дій з відновлення працездатності додаткового обладнання.

21:48. Зафіксовано збій під час запуску центрального ядра.

21:50. Розпочато роботу з проведення аналізу логів завантаження ядра, розбору статусів ключових ділянок та пошуку проблем збою.

22:00. Виконано ряд процедур для правильного перезапуску головного вузла.

22:13. Проведено ініціалізацію проблемної частини апаратної ділянки центрального ядра.22:16.Старт відновлення інтерфейсів центрального ядра.

22:22. Почав відновлюватись доступ абонентів до мережі Інтернет у місті Київ.

22:33. Завершено роботи на центральному ядрі. Продовжено роботи з відновлення допоміжної інфраструктури.

22:55. Відновлено основну частину інфраструктури, що відповідає за додаткові мережеві сервіси (DNS, DHCP та ін.).

23:03. Частково відновлено телефонію та автоматичне телефонне інформування про аварійну ситуацію.

23:09. Відновлено роботу сайту компанії lanet.ua та кластера віртуалізації, що обслуговує додаткові веб-сервіси.

23:24. Повністю відновлено телефонію та обслуговування телефонних ліній операторами call-центрів.

23:28. Відновлено роботу всіх веб-сервісів компанії.

На основі подій, що відбувались, та наслідків кожного кроку, зробленого при подоланні аварії, ми будуємо план робіт з модифікації процесів та інфраструктури і шукаємо шляхи позбавлення залежностей певних сервісів між собою.

Учора ми отримали дуже багато повідомлень, і для нас важливий зворотний зв'язок від кожного користувача для розуміння значення всіх кроків, які ми здійснюємо у своїй роботі. Ми надзвичайно вдячні за розуміння та підтримку від великої кількості користувачів.

На графіку ви можете побачити сумарний трафік абонентів Києва у період інциденту.