Witamy na stronie Klubu Jagiellońskiego. Jesteśmy republikańskim i niepartyjnym stowarzyszeniem, które próbuje oddziaływać na politykę w duchu troski o dobro wspólne. Piszemy pogłębione artykuły o polityce, gospodarce, historii i kulturze. Formułujemy obywatelskie postulaty zmian i wysyłamy petycje do władz. Publikujemy komentarze ekspertów i tematyczne raporty. Działamy w całej Polsce.

Zachęcamy do regularnych odwiedzin naszej strony. Informujemy, że korzystamy z cookies.
dr Krzysztof Mazur  29 kwietnia 2018

Polskie państwo w erze Big Data. Rejestry publiczne kluczem do lepszej polityki?

dr Krzysztof Mazur  29 kwietnia 2018
przeczytanie zajmie 7 min
Polskie państwo w erze Big Data. Rejestry publiczne kluczem do lepszej polityki? KamiPhuc/flickr.com

Dzięki Big data i rozwojowi technologii programistycznych jesteśmy w stanie posiąść bardzo precyzyjną wiedzę na temat realnego stanu państwa oraz codziennych bolączek obywateli. Zintegrowanie informacji na temat rynku pracy, zdrowia, migracji ludności czy edukacji jest w zasięgu nawet naszego słabego państwa. Dałoby to ogromną wiedzę decydentom i naukowcom. Długofalowo zmieniłoby być może kształt debaty publicznej, która cierpi na brak dostępu do rzetelnej wiedzy oraz pogłębionych analiz. Co nie bez znaczenia: mogłoby oznaczać zmniejszenie obciążeń administracyjnych obywatela czy przedsiębiorcy.

Przekroczyć „fasadową jaźń”

Jedną z charakterystycznych cech Polaków jest mitologizowanie państwa. Utrata niepodległości w XVIII wieku, po której nastąpiło ponad 200 lat zmagań o odzyskanie i zachowanie państwowości ‒ wszystko to odcisnęło na nas niewątpliwie piętno. Takie okoliczności sprzyjają ucieczkom w nierzeczywisty świat marzeń, gdzie mity i legendy zastępują rzetelną analizę faktów. Operowanie w sferze symboli z kolei zastępuje politykę opartą na jasnym wyznaczaniu mierzalnych celów. Adam Podgórecki w Społeczeństwie polskim stwierdził wręcz, że od czasu rozbiorów żyjemy w „fasadowej jaźni”, gdzie „gest stał się ważniejszy od sensu i efektów podejmowanych działań”. W takiej kulturze „działanie racjonalne jest bezużyteczne”. Jeśli tak jest, to wszelkie myślenie „o naprawie Rzeczpospolitej” musi tym samym rozpocząć się od próby przebicia się przez ową„fasadową jaźń”, by odnaleźć faktyczny obraz rzeczywistości. Nim zabierzemy się za wielkie projekty modernizacyjne, najpierw odzyskajmy grunt pod nogami.

Naprzeciw temu cywilizacyjnemu wyzwaniu wychodzi dziś technologia. Dzięki rozbudowanym metodom analitycznym pozwalającym agregować coraz większe i coraz bardziej złożone zbiory danych (Big data), którym w sukurs przychodzą coraz bardziej precyzyjne programy pozwalające integrować ze sobą odmienne klasy obiektów (API, Application Programming Interface), jesteśmy w stanie posiąść bardzo precyzyjną wiedzę na temat realnego stanu państwa oraz codziennych bolączek obywateli. Wiedzę niemającą precedensu w historii. W tym celu wystarczy „jedynie” dokonać cyfryzacji i integracji rejestrów administracyjnych prowadzonych przez poszczególne instytucje państwowe przy jednoczesnym zapewnieniu bezpieczeństwa tych danych i zachowaniu ich anonimowości. Integrując w ten sposób np. dane o zarobkach i zatrudnieniu zgromadzone w rejestrach Zakładu Ubezpieczeń Społecznych (ZUS), Kasach Rolniczego Ubezpieczenia Społecznego (KRUS) oraz Urzędów Skarbowych otrzymamy unikatową wiedzę na temat rynku pracy.

Zestawiając z kolei informacje o przebytych chorobach, zastosowanych terapiach i wydatkach poniesionych na leki gromadzone przez Narodowy Fundusz Zdrowia z informacjami na temat wypłaconych rent oraz świadczeń chorobowych gromadzonymi przez ZUS i KRUS będziemy w stanie bardzo precyzyjnie scharakteryzować sytuację zdrowotną Polaków.

Wiedza i zaufanie, a nie totalna inwigilacja

Trzeba od razu zaznaczyć, że idea wykorzystania w ten sposób rejestrów publicznych nie ma nic wspólnego ze śledzeniem każdego naszego ruchu w Internecie przez globalne koncerny technologiczne. Po pierwsze, gromadzone w ten sposób informacje mają na celu diagnozę zależności o charakterze makrospołecznym, podczas gdy koncerny technologiczne tworzą indywidualne profile użytkowników, by na ich podstawie sprzedawać spersonalizowane reklamy. Po drugie, powstała w ten sposób wiedza powinna być publiczna, co uniemożliwi jej wykorzystanie w celu zwiększania dominacji jednych podmiotów nad drugimi. Tymczasem istotą tworzenia indywidualnych profili użytkowników jest właśnie komercjalizacja tych danych, co w naturalny sposób zwiększa dominację tych, których stać na zakup tego typu wiedzy. Po trzecie, upublicznienie informacji na temat realnego stanu państwa i życia obywateli zwiększy samoświadomość społeczną, co powinno się przyczynić do pomnożenia zaufania. Tymczasem praktyka koncernów technologicznych komercjalizujących naszą prywatność przynosi dokładnie odwrotny skutek.

Integracja, anonimizacja i upublicznienie informacji zgromadzonych w rejestrach państwowych nie jest zatem kolejną odsłoną opowieści o totalitarnych zakusach Wielkiego Brata. Przeciwnie ‒ to raczej sposób, by obywatele mogli zmniejszać dominację prywatnych koncernów technologicznych, które gromadzą coraz większą wiedzę na ich temat.

Nie powinno nas zatem dziwić, że w najnowszym raporcie wydanym przez OECD „Embracing Innovation in Government: Global Trends 2018” kładzie się silny nacisk na popularyzację tego typu myślenia. Wśród opisanych inspirujących przykładów z całego świata znalazła się singapurska platforma APEX. Jej siła polega właśnie na skutecznym integrowaniu danych gromadzonych przez agencje publiczne oraz tworzeniu otwartych standardów umożliwiających wykorzystanie tych danych przez administrację, podmioty prywatne oraz obywateli. W ten sposób poszczególne agencje mogą skutecznie komunikować się ze sobą. Z udostępnionych danych korzystają również innowatorzy społeczni, tworząc nowe usługi dla mieszkańców. Dzięki danym „uwolnionym” przez platformę APEX powstają aplikacje, które mają ułatwić życie mieszkańcom Singapuru.

ELA zrobiła pierwszy krok

Poszukując inspiracji, nie musimy jednak podróżować aż na Daleki Wschód, by uświadomić sobie wagę tego typu rozwiązań. Wystarczy rozejrzeć się wokół, by dostrzec zapowiedź tej zmiany również w Polsce. Od lat istnieje w naszym kraju ustawowy obowiązek monitorowania przez uczelnie wyższe losów swoich absolwentów. Dotychczas odbywało się to przez tradycyjne badania ankietowe, które nie tylko generowały po stronie uczelni ogromne koszty, ale również pozostawiały wiele do życzenia co do obiektywności wyników badań prowadzonych metodą tego typu. Dlatego od 2017 roku Ministerstwo Nauki i Szkolnictwa Wyższego wdrożyło system monitoringu Ekonomicznych Losów Absolwentów (ELA). Głównym źródłem informacji są tu dane pochodzące z ZUS (informacje o zarobkach) oraz z systemu informacji o szkolnictwie wyższym o nazwie POL-on (informacje o ukończonym kierunku studiów). Łącząc te dwa rejestry przez numer PESEL można porównywać sytuację ekonomiczną absolwentów szkół wyższych, uwzględniając zarówno kierunek, uczelnie, jak i miejsce zamieszkania.

Nakładając te informacje na dane udostępnione przez Główny Urząd Statystyczny, można odnieść wyniki do kondycji lokalnego rynku pracy. Ze względu na to, że w rejestrach ZUS-u składki ubezpieczonych aktualizowane są co miesiąc, system pozwala właściwie na bieżąco analizować dynamikę procesów zachodzących na rynku pracy. Zachowano przy tym pełną anonimowość badanych. W wypadku zbyt małych zbiorowości, ze względu na typ studiów czy charakter uczelni ‒ gdy istnieje prawdopodobieństwo „rozpoznania” konkretnych osób ‒ raporty nie są generowane.

System ELA nie tylko zatem dostarcza rzetelnych informacji o losach absolwentów, ale także okazał się… nieproporcjonalnie tańszy od dotychczasowego modelu opartego na ankietach. Dzięki niej władze uczelni, kandydaci na studia, decydenci polityczni oraz opinia publiczna uzyskały bardzo rzetelną wiedzę. System okazał się na tyle nowatorskim rozwiązaniem w skali Europy, że spotkał się z dużym uznaniem ze strony naukowców z innych krajów.

Jeden z twórców ELI, profesor Mikołaj Jasiński, socjolog z Uniwersytetu Warszawskiego, wraz z grupą współpracowników trzy lata temu opublikował w „Studiach Socjologicznych” artykuł pod znamiennym tytułem: Dokładniej, rzetelniej, taniej. Badania oparte na rejestrach publicznych jako szansa dla badań społecznych w Polsce. Artykuł stanowi swoiste credo środowiska badaczy z nadzieją podchodzących do danych gromadzonych przez państwo.

Plusów jest więcej niż wad

Zwracają oni uwagę na przynajmniej sześć pozytywów prowadzenia badań dzięki wykorzystaniu tej metody.

Po pierwsze, badania bazujące na informacjach pobranych z rejestrów administracyjnych znacznie redukują koszty zbierania danych, gdyż zostały one już zgromadzone przez odpowiednie instytucje dla celów administracyjnych, niezależnie od prowadzonych badań.

Po drugie, tego typu badania umożliwiają prowadzenie obliczeń dla całej populacji, podczas gdy badania reprezentacyjne prowadzi się na wylosowanej próbie, co zawsze umożliwia kwestionowanie jej reprezentacyjności.

Po trzecie, bazowanie na rejestrach pozwala poznać prawdziwe i dokładne wartości wybranych parametrów. Podanie kompletnych i prawdziwych informacji do rejestru publicznego jest bowiem z zasady w interesie obywatela, ponieważ albo wiąże się z uzyskaniem określonego pożytku (np. ulga), albo jest wymuszone przez określoną sankcję. Z kolei badania sondażowe zawsze obarczone są ryzykiem związanym z intencjonalnym (np. wstyd przed ankieterem) lub nieintencjonalnym (np. luki w pamięci) wprowadzaniem ankietera w błąd.

Po czwarte, wskaźniki konstruowane na podstawie definicji administracyjnych są precyzyjnie interpretowalne i odporne na spekulatywne interpretacje. Tradycyjne badania ankietowe zawsze mierzą się z brakiem precyzji odpowiedzi respondentów, co stanowi ogromne pole do sporów interpretacyjnych.

Po piąte, korzystanie z rejestrów pozwala łatwiej prowadzić analizę dynamiki badanych zjawisk. Taki sam efekt w wypadku badań sondażowych można otrzymać jedynie za pomocą regularnego powtarzania badań, co generuje ogromne koszty.

Po szóste, w odróżnieniu od badań sondażowych analiza rejestrów nie musi mierzyć się z problemem odmów udziału w badaniu, co często motywowane jest drażliwością pytań, niechęcią do udzielania odpowiedzi, niedokładnością pamięci czy znudzeniem związanym z długością kwestionariusza.

Autorzy artykułu, powodowani dbałością o rzetelność swojego wywodu, podają również kilka mankamentów tej metody. Należą do nich przede wszystkim: ograniczenie źródeł wyłącznie do istniejących rejestrów, co uniemożliwia badanie zjawisk niepodlegających monitorowaniu przez administrację państwa; niekompletność niektórych rejestrów; możliwość występowania błędów pomiarów na skutek podawania nieprawdziwych informacji (np. oszustwa podatkowe). Autorzy nie mają jednak wątpliwości, że pomimo tych mankamentów badania oparte na rejestrach publicznych są niezwykłą szansą dla nauk społecznych. Dlatego postulują odważne czerpanie przede wszystkim z doświadczeń krajów skandynawskich, które od wielu lat na szeroką skalę wykorzystują tę metodę do prowadzonych badań. Zwracają również uwagę, że w rodzimych warunkach integrowanie baz ogromnie ułatwia system PESEL, który w łatwy sposób pozwala łączyć ze sobą informacje rozproszone w rozmaitych rejestrach.

Zintegrowanie informacji na temat rynku pracy, zdrowia, migracji ludności czy edukacji jest zatem w zasięgu ręki. Nie tylko dałoby to ogromną wiedzę decydentom i naukowcom, ale również mogłoby doprowadzić do zmniejszenia obciążeń administracyjnych każdego obywatela.

Wiarygodność zespołu profesora Jasińskiego buduje przede wszystkim system ELA. Dowiódł on, że tego typu myślenie nie jest wyłącznie pięknoduchostwem oderwanych od realiów akademików, ale że także w realiach słabości polskiego państwa może się dokonać prawdziwa rewolucja na miarę ery Big data.

 ***

Zintegrowanie i upublicznienie informacji zgromadzonych w rejestrach państwowych daje nam szansę na zdobycie unikatowej wiedzy na temat stanu państwa i życia obywateli. Dzięki odwołaniu się do danych źródłowych decydenci wreszcie będą mogli bazować nie na własnych intuicjach, ale na zobiektywizowanych faktach. W naturalny sposób doprowadzi to do rozkwitu badań społecznych, a powszechne „uwolnienie” danych może uczynić nasz kraj atrakcyjnym miejscem badań także dla naukowców z innych krajów. Bez wątpienia zmieni to również kształt debaty publicznej, która cierpi na brak dostępu do rzetelnej wiedzy oraz pogłębionych analiz. Wreszcie, obywatele otrzymają bardziej stabilny punkt odniesienia, zarówno dla swoich wyborów politycznych, jak i decyzji życiowych (wybór studiów czy miejsca zamieszkania).

Na pierwszy rzut oka kwestia zestawiania ze sobą danych wydaje się zatem marginalna, mało atrakcyjna. W rzeczywistości jednak może doprowadzić do głębokiej zmiany naszego życia publicznego i pozwolić nam przebić się przez „fasadową jaźń”, by odzyskać faktyczny obraz rzeczywistości. Czekamy na to już ponad 200 lat.

Tekst powstał na zamówienie Kongresu Obywatelskiego prof. Jana Szomburga i ukazał się na łamach publikacji podsumowującej XII edycję Kongresu, z którą w całości można zapoznać się tutaj.