Unplugged ethernet cable hanging from dark server rack with scattered red warning indicator lights in data center
Foto: Ilustračné AI

Masívny výpadok Amazon Web Services ochromil tisícky služieb na celom svete

Masívny výpadok cloudových služieb Amazon Web Services ochromil dnes tisícky aplikácií a webových stránok na celom svete. Problémy postihli platformy ako Snapchat, Duolingo, Roblox, Zoom či bankové služby vrátane Lloyds, Bank of Scotland a Halifax. Niektoré aplikácie boli nedostupné viac ako šesť hodín, pričom výpadok zasiahol viac ako 1 000 spoločností.

Amazon Web Services neskôr oznámil, že opravil základnú príčinu problému a všetky služby sa vrátili k normálnej prevádzke. Ako informuje BBC, výpadok sa začal skoro ráno a jeho dopad pocítili používatelia po celom svete.

Príčina výpadku a postihnuté regióny

Výpadok vznikol v dátovom centre AWS v severnej Virgínii, známom ako US-EAST-1, ktoré je najväčším poskytovateľom cloudových služieb na svete. Je to už tretíkrát za posledných päť rokov, čo veľký internetový výpadok pochádza z tohto dátového centra v severnej Virgínii.

Pravdepodobnou príčinou poruchy bol Domain Name System (DNS), ktorý odborníci prirovnávajú k telefónnemu zoznamu internetu. Marek Szustak, bezpečnostný IT pracovník v spoločnosti eSky Group, vysvetlil, že DNS je základom sieťovej komunikácie. Keď prestane fungovať rozlišovanie doménových mien, celé aplikácie a služby sa môžu zastaviť bez ohľadu na to, ako dobre sú navrhnuté.

Hoci ide o zdanlivo malú časť infraštruktúry, DNS môže paralyzovať najväčšie cloudové prostredia. Ako hovoria inžinieri, vždy je to DNS, dodal Szustak.

Postihnuté služby a ich obnova

Aplikácie a platformy

Medzi postihnuté služby patrili populárne finančné aplikácie ako Venmo a Coinbase, ktorá je najväčšou americkou burzou kryptomien a zaznamenala problémy od 03:00 EST. Herné giganty ako Roblox a Fortnite boli tiež ovplyvnené, no neskôr sa vrátili do prevádzky. Dokonca aj samotný obchod Amazon zaznamenal prerušenia, pričom používatelia dostávali hlášku, že niečo sa pokazilo.

Vývojári hier na platforme Roblox, ako Charles Osita Odili, opisovali ťažkosti pri práci počas výpadku. Odili vysvetlil, že tak hra Roblox, ako aj vývojový nástroj Roblox Studio prestali fungovať pre mnohých vývojárov v Spojenom kráľovstve aj v USA. Keď všetko vypadlo, nemohli sme pracovať na našich hrách niekoľko hodín, povedal.

Bankové a finančné služby

Bankové aplikácie patrili medzi tie, ktoré zaznamenali tisíce hlásení o problémoch. Používatelia nemohli uskutočňovať platby, čo mohlo viesť k tomu, že zákazníci nedokončili nákupy a porušili vlastné zmluvy. Henna Elahi, senior associate v advokátskej kancelárii Grosvenor Law v Londýne, vysvetlila, že to môže viesť k sťažnostiam zákazníkov a pokusom o vymáhanie akýchkoľvek strát spôsobených výpadkom od firiem.

Mark z Essexu, dôchodca a bývalý bankár, sa pokúšal získať prístup k svojmu účtu so spoločnosťou Hargreaves Lansdown, kde má investované tisíce libier, no nemohol sa prihlásiť. Myslím si, že je smutné, že Hargreaves Lansdown nemá záložný systém. Zdá sa, že nemajú systém obnovy po katastrofe, povedal. Hargreaves Lansdown neskôr na svojej stránke uviedol, že problémy s prihlasovaním boli vyriešené a boli spôsobené široko hláseným problémom tretej strany.

Dopad na vzdelávanie a dopravu

Výpadok zasiahol aj vzdelávací sektor. Canvas, široko používaný vzdelávací softvér, ktorý umožňuje učiteľom prideľovať a kontrolovať prácu študentov, bol nedostupný. Kadri Brogi, manažér technickej podpory, ktorý tiež vyučuje na univerzitách v New Yorku a New Jersey, povedal, že to ovplyvňuje obrovské množstvo študentov a pedagógov. Spoločnosť Instructure, ktorá vlastní Canvas, upozornila používateľov na prerušenie služby.

V oblasti dopravy používatelia hlásili problémy s aplikáciou Lyft. Reportérka Sakshi Venkatraman z New Yorku opísala, ako ju aplikácia oneskorila takmer o hodinu, pričom zobrazovala prázdnu mapu bez obvyklých áut. Vodič Lyft jej povedal, že mal naplánovaných niekoľko jázd, ktoré boli nakoniec zrušené, hoci vstal o 04:00, aby ich stihl.

Varovania pred podvodmi a ďalšie dôsledky

Spotrebiteľský obhajca Matt Allwright varoval, že podvodníci by mohli využiť ľudí počas internetového výpadku. Ľudia budú mať problémy s prístupom k veciam, ktoré radi používajú alebo skutočne potrebujú používať, keď ide o veci ako bankovníctvo, povedal v programe Morning Live. Vyzval používateľov, aby neprepadali panike, ak uvidia chybové hlásenie pri pokuse o použitie bankových služieb.

Duolingo, aplikácia na výučbu jazykov, sľúbila, že ochráni série používateľov napriek výpadku. Série sú označením toho, koľko dní po sebe používateľ cvičil v aplikácii. Vaše série budú uložené, uviedla spoločnosť na sociálnych sieťach.

Aplikácia MyFitnessPal, ktorá umožňuje používateľom sledovať príjem potravy, cvičenie a hmotnosť, hlásila nárast chýb. Začali sme zaznamenávať nárast chýb, ktoré vedú k problémom s prihlásením, vytváraním účtov, oneskoreniam vo vyhľadávaní a používaním inteligentného zaznamenávania a plánovania jedál, uviedla spoločnosť.

Reakcia Amazon a výhľad do budúžstva

Amazon Web Services v aktualizáciách uvádzal, že naďalej vidí známky obnovy vo všetkých službách AWS, no problémy pretrvávali vrátane služby Lambda, ktorá pomáha zabezpečiť, aby mobilné telefóny, počítače alebo televízory mohli spúšťať aplikácie z cloudu. Amazon uviedol, že používatelia môžu vidieť chybové hlásenia pri pokuse o spustenie týchto externých služieb.

Mike Chapple, profesor informačných technológií na univerzite Notre Dame, uviedol, že počas posledných niekoľkých hodín sa zdá, že vznikla nová séria kaskádových zlyhaní. Je to ako pri veľkom výpadku elektriny, povedal Chapple. Posádky začnú pracovať na tom, aby ho znovu spustili. Elektrická energia môže niekoľkokrát zablikať, no je možné, že riešili len príznaky a nie základnú príčinu.

Amazon sľúbil, že neskôr poskytne úplný prehľad s podrobnosťami o príčine a rozsahu výpadku, hoci to môže trvať týždne alebo mesiace. Spoločnosť nakoniec oznámila, že programy Amazon Web Services sa vrátili k normálnej prevádzke, čím sa ukončil 15-hodinový výpadok.

Právne dôsledky a zodpovednosť

Teraz sa začína hra na obviňovanie za to, co sa stalo s Amazon Web Services, píše technologická korešpondentka pre Severnú Ameriku Lily Jamali. Jeden expert na počítačové vedy uviedol, že časť zodpovednosti nesú spoločnosti, ktoré používajú AWS. Ken Birman, profesor počítačových vied na Cornell University v New Yorku, povedal, že spoločnosti používajúce Amazon neprijímali dostatočné opatrenia na vytvorenie ochranných systémov do svojich aplikácií.

Výpadky ako ten v pondelok sa vyskytujú neustále, hoci nie vždy v tomto rozsahu. Birman povedal BBC, že vývojári aplikácií by mali dbať na investovanie do zálohovania kritických aplikácií, ktoré žijú v cloude. Vieme, ako urobiť tieto systémy silnejšími a vieme to urobiť bezpečne, uviedol Birman.

Otázka zodpovednosti by sa mohla dobre dostať na súdy. Viac ako rok po masívnom výpadku CrowdStrike sa Delta Airlines stále zaoberá so spoločnosťou o vymáhanie viac ako 500 miliónov dolárov strát. Aj po tom, čo CrowdStrike opravil problém, letecká spoločnosť uviedla, že musela manuálne reštartovať 40 000 serverov, čo viedlo k veľkým oneskoreniam letov počas niekoľkých dní. Vzhľadom na to, ako sú tieto systémy integrované, určenie viny nie je vždy jednoduché.

Vplyv na šport a médiá

Premier League potvrdila, že poloautomatická technológia ofsajdu nebola k dispozícii na začiatku pondelkového zápasu medzi West Ham United a Brentford kvôli dnešnému výpadku Amazon Web Services. Poloautomatická technológia ofsajdu je systém používaný na pomoc VAR pri rýchlejších a konzistentnejších rozhodnutiach o ofsajde. Schválili ju kluby koncom sezóny 2024-25. Premier League potvrdila, že ak sa technológia počas zápasu stane dostupnou, bude implementovaná, keď to bude vhodné.

V USA boli výpadkom zasiahnuté aj niekoľko mediálnych organizácií vrátane Wall Street Journal a New York Times. Monitor výpadkov Downdetector uviedol, že dostal 6,5 milióna hlásení a viac ako 1 000 spoločností čelilo problémom. Používatelia neskôr hlásili problémy s Grok, Lyft, Claude AI, Hulu a Reddit, hoci nebolo jasné, či nedávne problémy súvisia s výpadkom AWS.

Odborníci upozorňujú, že hoci výpadky ovplyvňujúce webové platformy a služby nie sú ničím novým, výpadky viacerých stránok naraz sú menej časté, no stávajú sa častejšími. S tým, že veľká časť našich životov je dnes online, tlak na cloudové služby sa neustále zvyšuje a udalosti ako tieto zdôrazňujú krehkosť týchto systémov.

Check Also

Modern unmanned fighter aircraft with angular design positioned in manufacturing hangar under industrial lighting

Nemecko vyvíja svoj prvý autonómny bojový stíhač CA-1 Europa

Významný prelom v oblasti vojenskej technológie sa črtá v Nemecku. Bavorská spoločnosť Helsing s hlavným …