Cloudflare публикува необичайно откровено и детайлно обяснение за причините, поради

...
Cloudflare публикува необичайно откровено и детайлно обяснение за причините, поради
Коментари Харесай

След вчерашния срив на интернет Cloudflare призна за грешката си и се извини

Cloudflare разгласява извънредно искрено и детайлно пояснение за аргументите, заради които към 20% от интернет спря да работи за 5 часа на 18 ноември - в това число ChatGPT, X, Canva. Сред засегнатите бяха и уеб страниците на TrafficNews, GlasNews, PlovdivTime и PlovdivNow.
Прочетете още
В персонално писмо от основния изпълнителен шеф Матю Принс, се изяснява, че една привидно дребна смяна във вътрешна база данни е довела до щета в конфигурационен файл и многократното нарастване на размера му.

Проблемът не е обвързван с външна злонамерена интервенция и е трябвало да бъде отхвърлен доста по-бързо.

В Cloudflare обаче признават, че са се подвели по краткотрайните автоматизирани възобновявания на мрежата и неправилно са решили, че става дума за солидна DDoS-атака.

Забавянето е довело до това, че главният трафик беше възобновен чак 5 часа след първичния срив.

Матю Принс поема цялостна отговорност за срутва от името на Cloudflare, без ангажименти.
" Съжаляваме за последствията за нашите клиенти и за интернет като цяло. Като имаме поради значимостта на Cloudflare в екосистемата на интернет, всеки сходен срив в нашите системи е недопустим. " Фактът, че в избран интервал от време мрежата ни не беше способна да пренасочва трафика, е дълбоко мъчителен за всеки член на нашия екип. Знаем, че ви разочаровахме през днешния ден ", написа Прайс. " От името на целия екип в Cloudflare искам да се извиня за болката, която причинихме на интернет през днешния ден ".
Публикацията му изяснява в детайли и какво тъкмо е станало в Cloudflare и " какво планираме да създадем, с цел да подсигуряваме, че сривове като този няма да се повторят повече ".

Cloudflare е фундаментална инфраструктура на интернет, която стои сред потребителя и всеки уебсайт, който е неин клиент - да вземем за пример за отбрана от злонамерени офанзиви.

Проблемът стартира от системата за различаване на ботове в Cloudflare. Тя работи със специфичен файл с характерности, по които преценя дали трафикът към даден уебсайт се дължи на интерес от човек или на автоматизирани поръчки от ботове.

Файлът се обновява на всеки няколко минути през база данни. На 18 ноември обаче е направена смяна в правата за достъп до базата, която води до особеност в генерирането на файла - огромно повтаряне на данни, което внезапно удвоява размера му.

Повреденият файл се популяризира в цялата мрежа от машини, която поддържа Cloudflare. Софтуерът за пренасочване на трафика обаче отхвърля да отвори файла, тъй като засича необичайния му размер.

Така програмата блокира и трафикът стопира напълно.

Отначало Cloudflare вземат решение, че става дума за хакерска офанзива. Причината е, че въпросният файл се възобновява на всеки пет минути по поръчка, която от време на време го " връща " в естественото му положение.

Най-накрая системата се " стабилизира ", като стартира да генерира единствено неверен конфигурационен файл.

Едва към 16:30 ч. екипите на Cloudflare откриват същинския проблем и стартират да работят за отстраняването му - пълното възобновяване лишава по-малко от 40 минути.

Сега от Cloudflare дават обещание, че ще употребяват рецесията, с цел да вкарат доста по-сериозни вътрешни инспекции и ще прегледат всички модули в главния си модел за уязвимости.

Сривът в Cloudflare и последният сходен гаф на AWS показат какъв брой огромна част от интернет в действителност е подвластна от естествената работа на няколко основни компании

Големите инфраструктури разрешават интернет да е бърз, на ниска цена и относително сигурен, само че рухването на една от тях води до вреда за милиони клиенти по целия свят.
Източник: trafficnews.bg


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР