„Google“ susieja didžiulį debesų nutraukimą su API valdymo problema

„Google“ sako, kad API valdymo problema yra už didžiulį ketvirtadienio „Google Cloud“ nutraukimą, kuris sutrikdė ar sumažino jos paslaugas ir daugelį kitų internetinių platformų.

„Google“ sako, kad debesų nutraukimas prasidėjo maždaug 10:49 ir ​​baigėsi 3:49 ET, po to, kai daugiau nei tris valandas sukėlė problemų milijonams vartotojų.

Be „Google Cloud“, incidentas taip pat paveikė „Gmail“, „Google“ kalendorių, „Google Chat“, „Google Cloud Search“, „Google Docs“, „Google Drive“, „Google Meet“, „Google“ užduotys, „Google Voice“, „Google“ objektyvas, „Discover“ ir „Discover“ ir „Voice Search“.

Tačiau tai taip pat sukėlė plačių problemų trečiųjų šalių platformoms, kurios priklauso nuo „Google Cloud“, įskaitant, bet tuo neapsiribojant, „Spotify“, „Discord“, „Snapchat“, „NPM“, „Firebase Studio“ ir ribotą skaičių debesų srautų paslaugų, remiantis darbuotojais „KV KV Key-Value Store“.

„Mes labai apgailestaujame dėl visų mūsų vartotojų ir jų klientų poveikio, kurį sukėlė šis paslaugų sutrikimas/nutraukimas. Verslo didelės ir mažos pasitikėjimo„ Google Cloud “pasitiki jūsų darbo krūviais ir mes padarysime geriau”, – teigė „Google“.

Nors ji vis dar dirba paskelbiant visą įvykio ataskaitą, „Google“ šiandien atskleidė pagrindinę priežastį, dėl kurios padidėjo 503 klaidų išorinių API užklausų klaidų metu per vakarykščią trijų valandų trukmės pertrauką.

Kaip šiandien paaiškino įmonė, jos „Google Cloud API“ valdymo platforma nepavyko dėl netinkamų duomenų-problema, kuri nebuvo greitai atrasta ir ištaisyta, nes jai trūko veiksmingų bandymų ir klaidų tvarkymo sistemų.

„Atlikus mūsų pradinę analizę, klausimas kilo dėl netinkamo automatinio kvotos atnaujinimo mūsų API valdymo sistemai, kuri buvo paskirstyta visame pasaulyje, todėl išorinės API užklausos buvo atmestos. Norėdami susigrąžinti, kad mes aplenkėme pažeidimo kvotų patikrinimą, kuris leido atsigauti daugelyje regionų per 2 valandas”, – pridūrė įmonė.

„Tačiau kvotų politikos duomenų bazė JAV ir Central1 tapo perkrauta, todėl tame regione buvo daug ilgiau atsigavę. Keli produktai turėjo vidutinį likutinį poveikį (pvz.

„CloudFlare“ paslaugos, panaudotos „Google“ nutraukimu

Sėkmingai atkūręs savo paveiktas paslaugas, „Cloudflare“ taip pat atskleidė pomirtiniu mirtimi, kad vakarykščio įvykio sukėlė ne dėl saugumo įvykio ir kad duomenų neprarado jokių duomenų.

Darbuotojai KV klaidų lygis nutraukimo metu
„CloudFlare“ darbuotojai KV klaidų lygis Nutraukimo metu („CloudFlare“)

„Šio nutraukimo priežastis atsirado dėl nesėkmės pagrindinėje saugojimo infrastruktūroje, kurią naudoja mūsų darbuotojų KV paslauga, kuri yra kritinė priklausomybė nuo daugelio„ CloudFlare “produktų ir kuria pasikliauta konfigūracija, autentifikavimu ir turto pristatymu visose paveiktose paslaugose“, – teigė „Cloudflare“.

„Dalį šios infrastruktūros palaiko trečiųjų šalių debesų tiekėjas, kuris šiandien patyrė nutrūkimą ir tiesiogiai paveikė mūsų KV paslaugų prieinamumą.”

Nepaisant to, kad jis nesidalino debesų tiekėjo pavadinimu dėl ketvirtadienio nutraukimo, „CloudFlare“ atstovas vakar „Bleepingcomputer“ sakė, kad „Google Cloud“ pasikliauja tik „Cloudflare“ paslaugos, kuriomis remiasi „Google Cloud“.

Reaguodamas į šį įvykį, „CloudFlare“ sako, kad ji perkels KV centrinę parduotuvę į savo R2 objektų saugyklą, kad sumažintų išorinę priklausomybę ir ateityje užkirstų kelią panašioms problemoms.

TINES adata

Pataisymas reiškė sudėtingus scenarijus, ilgas valandas ir nesibaigiančius gaisro grąžtus. Nebe.

Šiame naujame vadove „Tines“ suskaido, kaip modernūs IT orgai yra lygūs automatizavimui. Greičiau pataisykite, sumažinkite pridėtines išlaidas ir sutelkite dėmesį į strateginį darbą – nereikia jokių sudėtingų scenarijų.

Nuoroda į informacijos šaltinį

Draugai: - Marketingo paslaugos - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Karščiausios naujienos - Ultragarsinis tyrimas - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai -  Padelio treniruotės - Pranešimai spaudai -