Open Data – czym jest i czy jest bezpieczne?

1 rok temu
Zdjęcie: Open Data – czym jest i czy jest bezpieczne?


Open-Data-–-czym-jest-i-czy-jest-bezpieczne

W dobie społeczeństwa informacyjnego dążymy do zdobywania jak najszerszej wiedzy, uważamy ją za cenny zasób sprzyjający ciągłemu rozwojowi. Dzielimy się nią i wynikającymi z niej możliwościami, a nowoczesne technologie dają nam narzędzia, by zrobić to maksymalnie efektywnie. W ramach trendu szerokiego, nieznającego granic dzielenia się informacjami powstało wiele inicjatyw, w tym Open Data (Otwarte Dane), które umożliwiają powszechny dostęp do informacji publicznych. W tym artykule omówimy, czym są Otwarte Dane i w ich kontekście zastanowimy się nad zagadnieniem bezpieczeństwa.

Czym jest Open Data?

Otwarte Dane to dane udostępniane publicznie i bezpłatnie w formatach, które umożliwiają ich łatwą analizę i przetwarzanie. Nie ma ograniczeń co do sposobu ich wykorzystania, reprodukcji czy udostępniania. Takie dane są zwykle dostępne w standardowych formatach, takich jak CSV, JSON lub XML, i zawierają dokładne metadane. Praktykę Otwartych Danych najczęściej spotyka się w sektorze publicznym i organizacjach pozarządowych. Sektor publiczny jest zróżnicowany i obejmuje wiele instytucji, od ministerstw po lokalne urzędy gminne i jednostki im podległe – jak biblioteki czy ośrodki kultury. W związku z tym są udostępniane różne rodzaje danych, obejmujące różnorodne poziomy szczegółowości i obszary tematyczne. Przykładowe dane publiczne mogą obejmować rozkłady jazdy autobusów miejskich, informacje o lokalizacjach przystanków czy rejestry wydatków publicznych. Chociaż niektóre z tych informacji wydają się nieistotne, mogą posłużyć do opracowania systemów optymalizujących koszty na poziomie państwa, miasta czy pojedynczej jednostki. Inicjatywa Otwarte Dane jest podobna do innych inicjatyw otwartych, takich jak Otwarty Dostęp (Open Access), Otwarte Specyfikacje (Open Specifications) czy Otwarta Wiedza (Open Knowledge). Wszystkie promują łatwy dostęp do wiedzy i informacji. W Polsce definicja Otwartych Danych została zawarta w Ustawie z dnia 11 sierpnia 2021 r. o otwartych danych i ponownym wykorzystywaniu informacji sektora publicznego. Ta ustawa ma związek z przepisami o dostępie do informacji publicznej z dnia 6 września 2001 r. i reguluje sprawy związane z udostępnianiem informacji sektora publicznego w celu ponownego wykorzystywania. W kompleksowym akcie prawnym określono szereg zagadnień: rozumienie pojęć, zasady udostępniania i przekazywania informacji sektora publicznego w celu ponownego wykorzystywania, warunki ponownego wykorzystywania czy program otwierania danych. Open Data klasyfikowane są zgodnie z pięciostopniową skalą otwartości, co zależy od typu bazy, w których agregowane są informacje. Z poniższego zestawienia warto zapamiętać, iż bazą danych może być choćby prosty plik programu Excel! Klasyfikacja poziomu otwartości danych w skali od 1 do 5:

  • brak dostępu lub dostęp w formacie niemożliwym do wykorzystania, np. PDF;
  • dostęp w formacie umożliwiającym przeglądanie (przy jednocześnie trudnym przetwarzaniu), np. XLS;
  • dostęp w formacie umożliwiającym łatwe przetwarzanie przez komputer, np. CSV, JSON lub XML;
  • dostęp dzięki identyfikatorów URI (Uniform Resource Identifier);
  • dane połączone, co oznacza, iż można łączyć je z innymi danymi.

Polskie przykłady stosowania Otwartych Danych

W Polsce istnieją liczne inicjatywy Otwartych Danych zasługujące na uwagę. Otwarte Dane Górnośląsko-Zagłębiowskiej Metropolii (otwartedane.metropoliagzm.pl) to przykład inicjatywy obszaru Górnośląsko- -Zagłębiowskiego, na który składa się wiele miast zlokalizowanych na terenie województwa śląskiego. Ta inicjatywa udostępnia dane publiczne dotyczące tego obszaru. Główny Urząd Statystyczny (dane.gov.pl) to kolejna ważna platforma udostępniająca dane statystyczne na szczeblu krajowym. Inne polskie miasta, np. Kraków, również angażują się w Otwarte Dane. Jak zostało wskazane we wcześniejszej części niniejszego artykułu, Otwarte Dane mogą obejmować różnorodne kategorie, takie jak dane ogólne, kulturalne, transportowe, środowiskowe, zdrowotne, finansowe i wiele innych. Udostępniane informacje mogą również dotyczyć np. danych demograficznych, geoprzestrzennych, ekonomicznych lub zdrowotnych. W ramach Open Data w Polsce udostępniane są różnorodne kategorie danych, w tym:

  • Dane ogólne: tworzone lub gromadzone przez instytucje rządowe i organy publiczne, takie jak dane demograficzne, dane finansowe, dane geoprzestrzenne (mapy, lokalizacje), dane o transakcjach i wydatkach publicznych, informacje o polityce publicznej i prawie, dane edukacyjne i zdrowotne;
  • Dane kulturalne i artystyczne: zbiory muzealne, archiwa, dzieła sztuki, literatura i inne materiały kulturalne;
  • Dane transportowe: informacje o transporcie publicznym, mapy dróg, dane o ruchu drogowym, dane o rozkładach jazdy, a także dane z systemów GPS i nawigacyjnych;
  • Dane środowiskowe: dane z monitoringu środowiska, takie jak jakość powietrza, poziom opadów, dane dotyczące ekosystemów, przyrody i zasobów naturalnych;
  • Dane zdrowotne: informacje o zdrowiu publicznym, dane medyczne (z uwzględnieniem przepisów odnoszących się do ochrony prywatności pacjentów), statystyki dotyczące epidemiologii i innych dziedzin medycyny;
  • Dane finansowe: dane giełdowe, notowania akcji, informacje o finansach publicznych, dane makroekonomiczne.
  • Inne specjalistyczne dane: dane o energii, przemyśle, naukach społecznych itp., mogą być dostępne w zależności od potrzeb i inicjatyw. 6 Co ważne, otwartość danych nie oznacza, iż wszystkie dane są ogólnodostępne. Istnieją przepisy i regulacje określające, które dane mogą być otwarte, a które muszą pozostać prywatne ze względów bezpieczeństwa i prywatności. Udostępnianie danych publicznie ma na celu wspieranie przejrzystości i innowacji w zakresie udostępniania wiedzy, z jednoczesną dbałością o ochronę prywatności i bezpieczeństwo.

Strategia udostępniania danych

Badacze, którzy zgłębiają temat otwierania danych publicznych, wymieniają sześć istotnych elementów związanych ze strategią udostępniania danych, która może lepiej wspierać ich otwartość w firmach i instytucjach badawczych. Ta strategia uwzględnia kilka kluczowych rozwiązań mających na celu usprawnienie procesu udostępniania i wykorzystywania danych:

  • Ustalenie stałych i trwałych numerów identyfikacyjnych cyfrowych: każdy zbiór danych otrzymuje unikalny numer identyfikacyjny, który pozostaje stały i niezmieniony. To ułatwia kontrolę dostępu do danych i śledzenie ich historii.
  • Zawarcie trwałych i łatwo dostępnych metadanych: każdy zbiór danych jest opatrzony trwałymi metadanymi, czyli informacjami opisującymi jego zawartość, źródło, autorów i inne istotne informacje. Te metadane są łatwo dostępne i przypisane do każdego identyfikatora danych, co ułatwia zrozumienie, co one zawierają i jak można je wykorzystać.
  • Stworzenie interfejsu programowania aplikacji (API): tworzy się specjalny interfejs programowania aplikacji, zintegrowany z mechanizmem uwierzytelniania i autoryzacji. To oznacza, iż dostęp do danych jest kontrolowany i ograniczony tylko do uprawnionych użytkowników, co zwiększa bezpieczeństwo.
  • Zapewnienie przenośności danych: dane można łatwo przenosić między różnymi systemami i platformami. To oznacza, iż nie są one zamknięte w jednym miejscu i można je używać w różnych kontekstach.
  • Umożliwienie bezpłatnego udostępniania i pobierania danych między różnymi źródłami, zwane „peeringiem” danych: działa to na zasadzie wolnego dostępu do danych i zachęca do wspólnego wykorzystywania zasobów.
  • Przyjęcie rozsądnego podejścia do użytkowników przetwarzających dane w ramach wspólnych zasobów danych: użytkownicy, którzy przetwarzają te dane, powinni działać w sposób odpowiedzialny i efektywny. Chodzi o zapewnienie, iż dane są wykorzystywane w sposób przynoszący korzyści społeczeństwu i gospodarce. Te koncepcje mają na celu usprawnienie otwartości danych przy jednoczesnym za[1]chowaniu odpowiedniego poziomu kontroli i bezpieczeństwa.

Zidentyfikowane zalety i wady stosowania rozwiązania Open Data

Open Data ma wiele dobrych stron, jednak wiąże się także z określonymi wyzwaniami. Poniżej syntetycznie przeanalizujemy zalety i wady stosowania rozwiązania Open Data, aby lepiej zrozumieć wpływ tego podejścia na społeczeństwo, gospodarkę i naukę. Zalety Otwartych Danych:

  • Zwiększona przejrzystość: jednym z głównych atutów Otwartych Danych jest zwiększenie przejrzystości działań instytucji publicznych i organizacji. Dzięki dostępowi do tych danych obywatele mogą monitorować działania rządowe, co przyczynia się do wzrostu poziomu demokracji i lepszego kontrolowania władzy.
  • Wsparcie innowacji: Otwarte Dane stanowią bogate źródło informacji dla przedsiębiorców, badaczy i deweloperów oprogramowania. To zachęca do tworzenia nowych usług, aplikacji i rozwiązań, co wspiera innowacje i rozwój technologiczny.
  • Efektywność instytucji publicznych: dostęp do danych publicznych pomaga instytucjom publicznym podejmować bardziej uzasadnione decyzje i doskonalić swoją działalność, co przekłada się na efektywność i oszczędności.
  • Współpraca i rozwiązywanie problemów społecznych: Otwarte Dane umożliwiają współpracę różnych interesariuszy w rozwiązywaniu problemów społecznych, takich jak ochrona środowiska, opieka zdrowotna czy transport publiczny.

Wady Otwartych Danych:

  • Prywatność i bezpieczeństwo: udostępnianie danych publicznie może stanowić zagrożenie dla prywatności osób i podmiotów, zwłaszcza jeżeli dane zawierają informacje osobowe lub wrażliwe.
  • Jakość i niekompletność danych: dostępność danych nie gwarantuje ich jakości i kompletności. Nieprawidłowe lub nieaktualne dane mogą prowadzić do błędnych wniosków i decyzji.
  • Kwestie prawne i regulacyjne: udostępnianie danych publicznych wiąże się z koniecznością przestrzegania przepisów prawnych, np. dotyczących ochrony danych osobowych, co stanowi wyzwanie dla instytucji publicznych i organizacji.
  • Koszty implementacji i utrzymania: przygotowanie i utrzymanie infrastruktury do udostępniania danych może być kosztowne, zwłaszcza dla mniejszych organizacji lub samorządów.

Jakie zagrożenia niesie ze sobą proces otwierania danych?

Czy pracownicy instytucji publicznych, które postanawiają udostępniać dane publicznie, powinni się obawiać o bezpieczeństwo? W zasadzie nie, ponieważ istnieje obowiązek zabezpieczania prywatności danych osobowych, wynikający z ustawy. Zgodnie z nią anonimizacja oznacza „proces zmiany informacji sektora publicznego w informacje anonimowe, które nie odnoszą się do zidentyfikowanej lub możliwej do zidentyfikowania osoby fizycznej, lub proces zmiany danych osobowych w dane anonimowe w taki sposób, iż identyfikacja osoby, której dane dotyczą, nie jest lub już nie jest możliwa”. Oznacza to, iż można udostępniać informacje, np. dotyczące używanego sprzętu, ale bez ujawniania danych osobowych pracowników. Ponadto przed publikacją dane są starannie analizowane pod kątem ich przydatności dla różnych interesariuszy i dopiero potem przypisywane do odpowiednich poziomów dostępności (jeśli to możliwe) i udostępniane. Niemniej jednak, z uwagi na skomplikowany proces udostępniania danych istnieje ryzyko wycieku informacji, w tym w wyniku ataków hakerów na same instytucje udostępniające dane. Fakt, iż pewne podmioty dokonują kompleksowej agregacji danych cyfrowych, może stanowić pretekst dla cyberprzestępców. Mogą oni uzyskać dostęp do informacji, które dotychczas nie były przekształcone w postać cyfrową przed procesem anonimizacji. Dlatego ważne jest, aby zachować odpowiednie środki ostrożności w celu ochrony danych publicznych. Otwieranie danych wiąże się z także kilkoma potencjalnymi zagrożeniami. Oto niektóre z nich.

  • Jakość danych: istnieje ryzyko, iż udostępnione dane mogą być nieaktualne, niekompletne lub zawierać błędy. To może prowadzić do fałszywych informacji i błędnych decyzji podejmowanych na ich podstawie.
  • Nadużycie informacji: Otwarte Dane mogą być wykorzystywane do rozpowszechniania dezinformacji lub manipulacji opinią publiczną. Nieuczciwe osoby lub organizacje mogą w nieetyczny sposób wykorzystać dostęp do danych.
  • Niewłaściwe wykorzystanie danych: Dostęp do otwartych danych może skłonić nieuczciwe osoby do ich nielegalnego wykorzystania w działaniach przestępczych.

Podsumowanie

Inicjatywa Open Data jest obiektywnie dobrym rozwiązaniem, umożliwiającym ekspresową wymianę wiedzy, tworzenie rozwiązań optymalizujących działania – zarówno po stronie jednostek udostępniających dane, jak i odbiorców poszukujących informacji. Jednostki udostępniające dane, czy to organy publiczne, organizacje pozarządowe czy przedsiębiorstwa, mogą dzięki temu dzielić się z innymi swoimi zasobami informacyjnymi. Możliwe staje się wówczas efektywne wykorzystanie już istniejących zasobów wiedzy i danych. To z kolei sprzyja tworzeniu innowacyjnych rozwiązań, które mogą optymalizować działania w wielu dziedzinach życia. Otwarte dane wspierają również rozwój społeczeństwa poprzez tworzenie nowych możliwości biznesowych i zapewnianie miejsc pracy. Przedsiębiorcy i deweloperzy systemu mogą korzystać z otwartych danych do tworzenia nowych produktów, usług i aplikacji zaspokajających potrzeby rynku. To sprzyja rozwojowi sektora technologicznego i gospodarki jako całości. Inicjatywa Open Data ma także duże znaczenie dla instytucji publicznych. Dostęp do danych publicznych pomaga im podejmować bardziej uzasadnione decyzje, doskonalić swoją działalność i zwiększyć efektywność. Dzięki dostępowi do informacji organy publiczne lepiej rozumieją potrzeby społeczeństwa i dostosowują do nich swoje działania. To przyczynia się do zwiększenia przejrzystości działań rządowych i budowania zaufania społecznego. Odbiorcy danych, czy to badacze, dziennikarze, aktywiści społeczni czy zwykli obywatele, również czerpią korzyści z inicjatywy Open Data. Dostęp do otwartych danych umożliwia im prowadzenie analiz, badania i działania na rzecz społeczeństwa. Inicjatywa może pomóc w rozwiązywaniu problemów społecznych, podejmowaniu aktywności związanej z ochroną środowiska czy zdrowiem publicznym, a także w zrozumieniu postępowania instytucji publicznych i monitorowaniu władzy. Warto podkreślić, iż Otwarte Dane nie tylko zwiększają dostępność informacji, ale także promują współpracę i wymianę wiedzy między różnymi podmiotami. To wspiera ducha otwartości i innowacji, co przekłada się na postęp społeczny, gospodarczy i technologiczny. Wartością docenianą w inicjatywie Open Data jest równowaga między dostępem do informacji a ochroną prywatności i bezpieczeństwa danych. Otwarte dane są zatem niezwykle istotnym narzędziem w budowaniu społeczeństwa przyszłości.

Idź do oryginalnego materiału