Chociaż w ostatnich latach liczba awarii w centrach danych spadła, nie powinno to uśpić czujności operatorów i ich klientów. Specjalizujący się w certyfikowaniu data center Uptime Institute zbadał globalny rynek pod tym kątem. Ich liczba faktycznie spada, ale są one bardziej kosztowne. Są także obiekty, w których nie doszło nawet do pojedynczej awarii.
Na skróty:
Mniej problemów z kategorii „poważne”
Według raportu Uptime Institute, w 2020 roku 78% ankietowanych centrów danych mierzyło się z przestojami. W 2021 roku było to 69%, a w 2022 już tylko 60%. Wniosek? Cały czas bardzo dużo obiektów doświadcza awarii, ale stosunkowo niewielka część zakłóceń jest traktowana w kategoriach „poważna”. Zakłócenia krytyczne oceniano historycznie na około 20% wszystkich awarii, jednak w zeszłym roku ten odsetek znacząco spadł do 14%.
Czy jest się czego bać?
Wyniki ostatnich badań oznaczają, że prawdopodobieństwo wystąpienia problemów w zewnętrznym centrum danych jest mniejsze, ale jeśli się zdarzają, mogą być kosztowne i trudne do opanowania. To zła wiadomość, bo awaria infrastruktury data center może wywołać poważne konsekwencje dla organizacji świadczących usługi w oparciu o poprawnie działającą infrastrukturę centrum danych np. firm hostingowych, e-commerce, sektora produkcji, logistyki, finansów czy SaaS. To przekłada się na wymierne straty finansowe i wizerunkowe.
Awaria AWS, jednego z największych na świecie dostawców chmury publicznej, która miała miejsce w grudniu 2021 roku i trwała kilka godzin, wpłynęła na działalność wielu globalnych firm, takich jak Netflix, Disney czy Spotify. Pożar w siedzibie OVH we Francji sprzed dwóch lat spowodował równie poważne problemy. Polscy klienci nie mogli korzystać z usług największych e-sklepów czy dostawców poczty e-mail. Nie działały także serwisy TOPR informujące górskich turystów o pogodzie i lawinach.
Podobne problemy dotykają również firm w Polsce. Przykładem jest awaria z czerwca br.,
kiedy to m.in. komercyjne usługi największego dostawcy usług hostingowych w kraju nie były dostępne z uwagi na awarię w centrum danych utrzymującym infrastrukturę fizyczną spółki.
Co w przypadku problemów?
Przedstawiciele rynku data center deklarują stosowanie szeregu zabezpieczeń i praktyk zwiększających bezpieczeństwo i zapewniających dostęp do danych nawet w wypadku kryzysu, ale nawet oni zwracają uwagę, że diabeł tkwi w szczegółach.
– W interesie operatora centrum danych leży to, by zapewnić klientom jak najwyższy poziom bezpieczeństwa i ciągłości działania. Jednak po pierwsze, standardy oferowane przez ośrodki przetwarzania danych mocno się od siebie różnią, po drugie, nie zawsze można obiektywnie je ocenić, bo tylko część obiektów przechodzi niezależną certyfikację. Warto jednak zwrócić uwagę, że awaria nie zawsze musi oznaczać trwały brak dostępu do danych – jej usunięcie może być co prawda kosztowne, ale jeśli procedury i technologie na to pozwalają, klient może odzyskać dostęp do danych i usług . Inna sprawa, że wiele zależy od tego, na jaki poziom świadczonych usług oraz SLA klient się decyduje, nie wszyscy podejmują świadome decyzje co do zapewnienia ciągłości działania swoich usług, w szczególności jeżeli decyzje są kierowane elementem kosztowym – zauważa Wojciech Stramski, CEO Beyond.pl, dostawcy usług data center, chmury i Managed Services.
Bezpieczeństwo, głupcze!
Eksperci w zakresie technologii zwracają przede wszystkim uwagę na redundancję infrastruktury fizycznej w centrum danych, co oznacza zdublowanie wielu rozwiązań – od niezależnych źródeł zasilania podstawowego, zapasowego (w tych ich zdublowanych linii), czy wdrożonych technologii przeciwpożarowych.
Dlatego tak ważne są zapisy w umowach określające gwarantowaną dostępność usług, czyli SLA (Service Level Agreement).
– Zapisy w kontrakcie dotyczące poziomu usług SLA to kluczowy element każdej umowy z dostawcą technologii. Powinny one zawierać nie tylko dokładne określenie poziomu świadczonych usług wraz precyzyjnym określeniem stopnia ich ewentualnej niedostępności, ale także kary w przypadku nieosiągnięcia uzgodnionych świadczeń – podkreśla Łukasz Węgrzyn, Partner i Head of IT and Data w kancelarii Osborne Clarke.
Jak działa SLA? Przy SLA na poziomie 99,5% dostawca usług data center zobowiązuje się do tego, że przestój w działaniu obiektu w ciągu miesiąca nie może być dłuższy niż 3 godziny i 36 minut. Im poziom SLA jest niższy, tym ryzyko niedostępności usług dla klienta potencjalnie rośnie.
Bezpieczeństwo potwierdzone certyfikacją
Ważne by przedsiębiorstwa sprawdzały poziom bezpieczeństwa centrum danych, analizując certyfikaty i normy, których przyznanie poprzedzone jest dokładną weryfikacją. Idealnym scenariuszem jest, gdy przyznawane są one przez niezależne instytucje i wymagają cyklicznej recertyfikacji. Najbardziej zaawansowane audyty mogą zawierać nawet tysiące wymogów. Przykładowo, aby centrum danych mogło pochwalić się normą ANSI/TIA-942 na poziomie Rated 4, musi spełnić ponad 2600 różnych wymogów z obszaru architektury, mechaniki, zasilania i telekomunikacji. Dzięki temu taki obiekt można określić odpornym na awarie. Takich obiektów jest jednak tylko kilka w Europie i zaledwie jeden w Polsce.
– O bezpieczeństwie w obiekcie data center powinno myśleć się już na etapie planowania inwestycji. Wiele kwestii takich jak konstrukcja, oddzielenie stref w komorach serwerowych, wdrożone rozwiązania energetyczne czy chłodzenia, redundancja w zakresie łączności, ochrona przeciwpożarowa czy sama lokalizacja fizyczna oraz procedury operacyjne związane z codziennym prowadzeniem biznesu jest podyktowanych konkretnymi i bardzo wysokimi wymogami. Certyfikat potwierdzający, że obiekt należy do grona najbezpieczniejszych jest ukoronowaniem tego procesu. Przedstawiciele wielu branż, takich jak bankowa, logistyczna, medyczna, produkcyjna czy retail i e-commerce potrzebują nieprzerwanej ciągłości biznesowej. Zauważamy coraz większą świadomość po stronie klientów. Kto raz doświadczył awarii i konsekwencji z nią związanych – utraty zysków lub klientów i ich zaufania, nie podważa istotności bezpieczeństwa – reasumuje Wojciech Stramski.
Wieloletnie badania branży pokazują, że profesjonalne obiekty data center radzą sobie coraz lepiej, jeśli chodzi o zapewnienie odporności na awarie i ciągłość działania. Dodatkowo, zwiększa się wiedza
i świadomość klientów w zakresie bezpieczeństwa. Wybierając operatora data center firmy nie kierują się już tylko ceną, a decydują się na współpracę z pewnym, sprawdzonym partnerem, który zapewni im spokój, pozwalając skupić się na rozwoju ich podstawowej działalności.