Egyetlen embert hibáztat az Amazon a felhő üzemzavaráért

Ahogy az IT café is beszámolt róla, egy kereskedelmileg kritikus időszakban, karácsony estéjén történt egy üzemzavar az Amazon észak-virginiai adatközpontjában, és ennek többek között az lett a következménye, hogy az Amazon Web Servicest (AWS) használó népszerű videoszolgáltatás, a Netflix ügyfelei az ünnep idején közel egy napig nem tudtak filmeket kölcsönözni. Az Amazon már korábban jelezte, hogy ismerik a hiba forrását, de részletes tájékoztatást csak a megindított vizsgálat lezárulta után adnak.

Ez meg is történt, és az AWS honlapján közzétett tájékoztató szerint egy szakszerűtlenül elvégzett karbantartási művelet okozta a hibát december 24-én, és mindezért egyetlen szórakozottan dolgozó munkatársat tettek felelőssé. A közlemény szerint a terheléselosztásért felelős rendszerben (Elastic Load Balancing Service – ELB) zajlott egy helytelenül végrehajtott konfigurációs művelet, melynek következtében bizonyos, a működéshez szükséges adatok törlődtek, a beavatkozást végző szakember pedig nem vette észre időben a hibát, így történhetett meg a felhasználók egy részét érintő leállás. A központban dolgozó csapat még egy végzetes üzemzavar bekövetkezte előtt észlelte a gondot, ám teljes mértékben nem tudták leállítani a problémát okozó folyamatot. Ugyanakkor erőfeszítéseiknek köszönhető, hogy – ha lassan és igen kemény munkával is, de – vissza tudták állítani az elveszett adatokat, és a szolgáltatás kisvártatva újra működött.

A közlemény tanúsága szerint valójában nem szoftveres vagy hardveres rendszerszintű problémáról van szó, hanem emberi hibáról. Épp ezért az Amazon kitér arra, hogy mindent megtesznek a hasonló balesetek megelőzésére, és ennek legfontosabb része lesz, hogy változtatnak a hozzáférési és módosítási jogosultságokat előíró szabályzaton, illetve az ilyen esetek kivédésére újrakonfigurálással a védelmi automatizmusokat is megújítják.

Azóta történt

Előzmények