Jak nie stracić cennych danych w chmurze? Oto, co musisz wiedzieć zanim klikniesz „przenieś”

1 dzień temu

Migracja danych do chmury stała się codziennością zarówno dla firm, jak i instytucji publicznych. Elastyczny model rozliczeń, brak konieczności inwestowania w serwerownię i możliwość zalogowania się do dokumentów z dowolnego urządzenia kuszą – nie ma co się oszukiwać. Tyle iż kiedy mówimy o archiwach, w grę wchodzą nie tylko koszty i wygoda, ale także delikatna materia: dziedzictwo, dane osobowe, tajemnice przedsiębiorstw. Pytanie brzmi zatem, czy chmura to miejsce, któremu można powierzyć przeszłość na kolejne pół wieku.

Archiwum w chmurze? Co musisz wiedzieć?

Cloud computing to model dostarczania usług IT – przechowywania danych, mocy obliczeniowej, aplikacji – przez internet. Innymi słowy, serwer stoi gdzieś daleko, a użytkownik po prostu korzysta. W przypadku archiwów chodzi o długoterminowe przetrzymywanie takich plików, które nie są już używane na co dzień, ale muszą pozostać nienaruszone choćby z powodów prawnych czy historycznych. Zamiast trzymać kartony z teczkami albo utrzymywać własne „żelbetowe” centrum danych, instytucja wynajmuje przestrzeń u Amazona, Microsoftu albo Google’a. To, co do niedawna było rewolucją w księgowości czy marketingu, dziś staje się poważnym tematem dla kustoszy pamięci.

Natomiast archiwizacja w chmurze polega na przeniesieniu długoterminowego przechowywania danych, które nie są już aktywnie używane, ale muszą być zachowane (np. ze względów prawnych, regulacyjnych, historycznych lub biznesowych), do infrastruktury chmurowej.

W praktyce mamy do czynienia z różnymi typami archiwizacji: od prostych repozytoriów dokumentów (np. dokumenty PDF) po systemy DMS (ang. Document Management System) zintegrowane z OCR, metadanymi i możliwością śledzenia wersji. Przenoszenie takich struktur do chmury wymaga dobrej strategii.

Zalety przenoszenia archiwów do chmury

Pierwszą korzyścią jest dostępność: archiwista w Szczecinie, badacz w Katowicach i urzędnik na delegacji w Brukseli widzą dokładnie te same dokumenty, logując się przez przeglądarkę. Drugi atut to skalowalność – płaci się wyłącznie za realnie zajęte gigabajty i chwilową moc obliczeniową, zamiast utrzymywać wielką szafę serwerów „na wszelki wypadek”. Trzeci plus, często niedoceniany, to fizyczne bezpieczeństwo i redundancja. Dane znajdują się w co najmniej dwóch niezależnych lokalizacjach, a dostawca gwarantuje, iż pożar w jednym data center nie zmiecie wyłącznie naszego dorobku. W skrócie, zalety to:

  • Dostępność i elastyczność w zarządzaniu dokumentacją: największą zaletą rozwiązań chmurowych jest możliwość dostępu do danych z dowolnego miejsca i urządzenia. Archiwiści, badacze czy pracownicy administracyjni mogą korzystać z zasobów bez konieczności fizycznego przebywania w archiwum.
  • Skalowalność i optymalizacja kosztów: chmura pozwala na skalowanie zasobów w zależności od potrzeb. Organizacja płaci jedynie za faktycznie wykorzystane miejsce czy moc obliczeniową, co jest bardziej ekonomiczne niż utrzymywanie fizycznej infrastruktury.
  • Bezpieczeństwo fizyczne i redundancja danych: redundantne kopie danych, backupy w czasie rzeczywistym czy ochrona przed pożarami i katastrofami naturalnymi — chmura dla archiwów stanowi dobrą ochronę.

Wyzwania i zagrożenia związane z chmurą dla archiwów

Żaden administrator nie lubi mówić o ryzyku, ale trzeba je nazwać. Zaczyna się od cyberataków i ransomware, bo archiwa – czy to państwowe, czy korporacyjne – bywają łakomym kąskiem. Dochodzi zgodność z prawem: polskie instytucje muszą dbać o to, by dane nie wylądowały poza Unią Europejską, a w razie wątpliwości dochodzi jeszcze RODO i ustawa o narodowym zasobie archiwalnym.Nie można też zapominać o czymś, co nazywamy vendor lock-in, czyli uzależnienie się od jednego usługodawcy. jeżeli zdecydujemy się na jednego dostawcę, po pięciu latach może się okazać, iż zmiana platformy będzie bardziej kosztowna niż zostanie przy starym rozwiązaniu – choćby jeżeli ono powoli trzeszczy.Najostrzejsze pytanie dotyczy przyszłości: czy ta sama firma w 2035 roku przez cały czas otworzy nasze pliki, gdy zmieni się format albo znikną wtyczki? Instytucje archiwalne planują dekady naprzód, a nie trzyletni okres rozliczeniowy.

Wyzwania i zagrożenia wyglądają więc następująco:

  • Bezpieczeństwo danych i ryzyko naruszeń: hakerzy, ransomware czy błędy konfiguracyjne mogą prowadzić do wycieków danych. W przypadku archiwów, które często zawierają dane osobowe, dokumenty historyczne czy informacje objęte tajemnicą jest to duże ryzyko.
  • Zgodność z przepisami prawa: Archiwa Państwowe i instytucje publiczne muszą działać zgodnie z polskim prawem, a to często oznacza konieczność przechowywania danych na terytorium Polski lub Unii Europejskiej. Korzystanie z zagranicznych dostawców chmury może rodzić problemy szczególnie w świetle przepisów RODO i ustawy o narodowym zasobie archiwalnym.
  • Dostępność danych w czasie: najważniejsze pytanie brzmi, czy dostawca chmury zagwarantuje dostęp do danych za 10, 20 czy 50 lat? Co się stanie w przypadku zmiany technologii, formatu plików?

Powyższe zagrożenia i wyzwania nie świadczą o tym, iż należy rezygnować z używania chmury dla archiwów, jednak świadomość istnienia problemów może ułatwić uniknięcie ich w przyszłości.

Krok po kroku – jak przygotować się do migracji danych?

Chmura dla archiwów jest rozwiązaniem, które warto rozważyć. Proces zawsze zaczyna się od audytu. Trzeba policzyć, jakie dane posiadamy, które z nich zawierają wrażliwe informacje i w jakiej formie są przechowywane. Potem przychodzi wybór dostawcy – liczy się lokalizacja serwerów, certyfikaty bezpieczeństwa pokroju ISO 27001 i przejrzysta polityka prywatności.Sama migracja wymaga testów wydajności, a personel – dodatkowego przeszkolenia. Kropką nad „i” jest polityka backupu: to, iż coś leży „w chmurze”, nie zwalnia z robienia kopii zapasowej. Poniżej check-lista, dzięki której skutecznie możemy przygotować się do przeniesienia danych:

  • audyt zasobów: określenie rodzaju, ilości i wrażliwości danych;
  • wybór dostawcy: analizując lokalizację serwerów, certyfikaty (np. ISO 27001) oraz politykę prywatności;
  • migracja danych i testy: przeniesienie danych i ocena wydajności;
  • szkolenie personelu: z obsługi systemu, ale również z bezpieczeństwa danych;
  • ustalenie polityki backupu: dane w chmurze również wymagają kopii zapasowych.

Nie przegap najważniejszych trendów w technologiach!
Zarejestruj się, by otrzymywać nasz newsletter!

Najlepsze praktyki i standardy

Jednym z najważniejszych i powszechnie uznanych standardów w tym obszarze jest Model Referencyjny Open Archival Information System (OAIS). Stanowi on fundament dla budowy i funkcjonowania nowoczesnych archiwów cyfrowych, zarówno w instytucjach publicznych, jak i komercyjnych.

Model OAIS został opracowany przez Consultative Committee for Space Data Systems (CCSDS) i przyjęty jako międzynarodowa norma ISO 14721:2012. Został zaprojektowany z myślą o zapewnieniu długotrwałego przechowywania oraz niezawodnego dostępu do zasobów cyfrowych w taki sposób, aby pozostały one użyteczne i możliwe do zinterpretowania w przyszłości – niezależnie od zmian technologicznych i upływu czasu.

Model OAIS określa ramy koncepcyjne, procesowe oraz funkcjonalne, które definiują:

  • struktury organizacyjne archiwum cyfrowego,
  • rola poszczególnych uczestników systemu (producentów danych, administratorów, użytkowników końcowych),
  • cykl życia informacji archiwalnej – od jej pozyskania, przez zarządzanie, aż po udostępnienie.

Kluczowe znaczenie w tym modelu ma rozróżnienie między obiektem danych (ang. Data Object) a obiektem informacji (ang. Information Object):

  • Data Object to zestaw danych binarnych – np. pliki, obrazy, dokumenty – które są fizycznym nośnikiem treści.
  • Information Object to pojęcie szersze – obejmuje ono nie tylko same dane, ale również metadane i kontekst, niezbędne do prawidłowego zrozumienia, interpretacji i ponownego wykorzystania tych danych w przyszłości.

Model OAIS i jego skuteczność w archiwizacji danych

W świecie archiwistyki króluje Model Referencyjny Open Archival Information System, zapisany w normie ISO 14721:2012. OAIS zakłada, iż dane to nie tylko zero-jedynkowy plik, ale także zestaw metadanych i kontekst, które pozwolą za sto lat zrozumieć, co autor miał na myśli.Model wyróżnia sześć funkcji: przyjęcie danych, magazynowanie, zarządzanie metadanymi, administrację, planowanie ochrony oraz udostępnianie. To schemat, który stosują biblioteki narodowe, instytucje naukowe i światowe agencje rządowe. jeżeli dostawca chmury wspiera OAIS – to sygnał, iż myśli o długim horyzoncie czasowym, a nie szybkim zysku.

Skuteczność OASIS opiera się na 6 wymionych (również wyżej) filarach:

  1. Przyjęcie danych (ang. Ingest) – proces wprowadzania danych do archiwum i przygotowania ich do długoterminowego przechowywania.
  2. Przechowywanie (ang. Archival Storage) – zapewnienie bezpiecznego, trwałego i redundatnego zapisu danych.
  3. Zarządzanie danymi (ang. Data Management) – kontrola metadanych, indeksowanie, aktualizacje i monitorowanie.
  4. Zarządzanie systemem (ang. Administration) – działania zarządcze, operacyjne i polityki archiwum.
  5. Planowanie ochrony danych (ang. Preservation Planning) – identyfikacja i wdrażanie strategii zapewniających długowieczność zasobów cyfrowych.
  6. Dostęp (ang. Access) – umożliwienie użytkownikom wyszukiwania i pobierania danych z archiwum.

Dzięki swojej uniwersalności i elastyczności OAIS jest modelem wykorzystywanym przez biblioteki cyfrowe, archiwa narodowe, instytucje naukowe, agencje rządowe oraz organizacje międzynarodowe. Jego wdrożenie stanowi gwarancję profesjonalnego i zgodnego z najlepszymi praktykami podejścia do archiwizacji zasobów cyfrowych.

Przykłady z sektora publicznego i kultury i… krótkie podsumowanie

W Polsce coraz więcej bibliotek i muzeów decyduje się na digitalizację zbiorów i przechowywanie ich w chmurze — m.in. Biblioteka Narodowa (POLONA w Chmurze dla bibliotek). Takie wdrożenia udowadniają, iż chmura może być bezpieczną i efektywną przestrzenią dla danych archiwalnych — pod warunkiem zachowania odpowiednich standardów.

Rynek dojrzewa. Dostawcy oferują już rozwiązania szyte pod archiwa – z długoterminowym przechowywaniem, pełnym wersjonowaniem i zgodnością z OAIS. Nadchodzi też era automatycznego indeksowania przez sztuczną inteligencję i pieczętowania integralności blokami blockchain. Kluczem wciąż pozostaje strategia: chmura to narzędzie, nie cel sam w sobie. Dobrze wdrożona pozwala realizować misję archiwów – przechować dziedzictwo dla kolejnych pokoleń – ale robi to wyłącznie wtedy, gdy instytucja nad nią panuje, a nie odwrotnie.

Przechowywanie archiwów w chmurze oznacza ogromne możliwości. Wymaga jednak opracowanie i stosowania dobrze przemyślanej strategii. Sama chmura nie rozwiąże problemów z zarządzaniem dokumentacją. Jednak odpowiednio wdrożona może stanowić potężne narzędzie wspierające misję archiwów: zachowanie dziedzictwa dla przyszłych pokoleń. Ostatecznie nie chodzi o to, by „być w chmurze”, ale by nad nią panować.

Zdjęcie autorstwa: Valter z Pixabay oraz Anna z Pixabay

Idź do oryginalnego materiału