Нарочното „счупване“ прави ИТ системите по-устойчиви
Традиционното тестване едва-едва „ допира повърхността “ на проблемите в ИТ инфраструктурите, само че целенасочените тестови сривове оказват помощ за повече надеждност
(снимка: CC0 Public Domain)
За да предотвратя ват сривове и да се възстановят по-добре от тях в днешния комплициран, заоблачен ИТ свят, предприятията би трябвало самодейно и напълно целеустремено да „ инжектират “ повреди в своите системи посредством практики за така наречен хаос-инженеринг.
Целенасоченото внедряване на сривове в ИТ системите може да помогне за укрепването и подготовката им за възобновяване при спирания, твърди Саян Мондал, старши софтуерен инженер в платформата за доставка на програмен продукт Harness. Той насочи това обръщение по време на конференцията KubeCon + CloudNativeCon China 2025 в Хонконг.
Мондал, който е и управител по поддръжката и част от общността на инкубационния план LitmusChaos на Cloud Native Computing Foundation (CNCF), означи, че разработчиците, инженерите по надеждността на уеб страниците и екипите за ИТ интервенции би трябвало да се усещат удобно в наличието на хаоса.
Много взаимозависими повреди
„ В днешно време на всички места има облачни и разпределени системи – с доста взаимозависими повреди “, сподели специалистът. „ Доставчиците на облачни услуги не са в действителност 100% надеждни, тъй като може да се стигне до повреди на устройства, спирания на зареждането и сривове наизуст “.
Финансовите и репутационните вреди от сходни спирания могат да костват доста. Мондал уточни образци, при които финансова компания е изгубила над 55 милиона $ заради един-единствен инфраструктурен проблем, който е попречил на обработката на транзакции.
Традиционното тестване едва-едва „ допира повърхността “ на проблемите и нормално включва единствено приложния пласт, сподели Мондал. „ Рядко тестваме инфраструктурата или главните платформени услуги “, сподели Мондал. „ Хаос-инженерингът се концентрира особено върху засягането на долните пластове. “
„ Противопожарно “ обучение за приложени ята
Мондал разказва хаос-инженеринга като „ противопожарно обучение, което вършиме при започване на цикъла на доставка, тъй че когато се случи действителното събитие, да сте доста по-подготвени “. Това включва:
За DevOps и IT екипите, които се чудят от кое място да стартират, съгласно Мондал, не е нужно да потеглят с разрушение на индустриалните системи. Пътуването може да стартира безвредно в местна среда, преминавайки към среда за подготовка и предпроизводство и едвам по-късно към същинските продуктивни системи, когато екипът се почувства удобно.
Организация за хаоса
Що се отнася до това къде нормално се намират екипите за хаос-инженеринг в една организация, Мондал уточни, че това постоянно е „ споделена отговорност “, водена от тези, които са най-близо до надеждността на системата. Най-често това са оперативните и основните инженери.
Целта обаче е практиката да се разшири и да обхване и разработчиците. Те могат да вършат хаос-тестинг в границите на стадиите по доставка на програмен продукт. Това дава опция на разработчиците да тестват устойчивостта, до момента в който изготвят и доставят програмен код.
Тестването, ръководено от самите разработчици, се добавя от по-големи, по-структурирани събития. Това може да са от време на време разиграващи се събития, които да приготвят екипите да се оправят с по-сложни сюжети на сривове.
В последна сметка комбинирането на непрестанно хаос-тестване с периодически проигравания на сривове може да помогне за основаване на „ просвета на надеждността “.
Електрически скутер, като че ли изработен особено за България: F3 Е от Segway
Пъргаво и издръжливо возило за всички, препускащи през градската среда »»»
предишна обява: Сделка за $35 милиарда в чип промишлеността може да пропадне следваща обява:
графа: Корпоративни, Новини, Сигурност, Топ вести | етикети: ИТ системи, предварителна защита на ИТ сривове, хаос-инженеринг
Коментар
ИМЕ *
Източник: technews.bg
КОМЕНТАРИ




