Michał Rogalski: Trzeba uświadomić ludziom, że dostęp do danych daje im większą wolność [Wywiad]
O tym, dlaczego dane są ważne, co na ich podstawie można powiedzieć o pandemii koronawirusa w Polsce i co należałoby zmienić w dostępie do informacji publicznej rozmawiamy z Michałem Rogalskim, laureatem Nagrody RPO im. Pawła Włodkowica.
Jędrzej Dudkiewicz: – W ciągu kilku miesięcy stało się o tobie bardzo głośno, bywasz nazywany analitykiem epidemii, dostałeś nagrodę RPO im. Pawła Włodkowica. Jak sobie radzisz z tym wszystkim, bo to przecież też wielka odpowiedzialność?
Michał Rogalski: – Podchodzę do tego spokojnie. Nie ukrywam, że miało to wpływ na moje życie i w sumie zmieniło trochę plany. Początkowo był to projekt poboczny, dodatkowy do tego, czym się zajmuję zawodowo. Potem okazało się, że to jednak coś więcej, że można o wiele więcej zrobić. Nadal czuję więc odpowiedzialność, mimo że kurz już trochę opadł i zainteresowanie jest mniejsze. Niezmiennie kontynuuję pracę, a mój projekt jest cały czas tak samo wykorzystywany. Z jednej strony przez obywatelki i obywateli, którzy nadal interesują się pandemią. Z drugiej strony statystyk używają naukowcy, więc także dla nich kontynuuję pracę.
Wiemy w ogóle, jak wygląda faktyczny stan pandemii w Polsce, ktokolwiek nad tym panuje? Możemy ufać danym podawanym przez rząd?
– Wydaje mi się, że tak naprawdę nigdy nie wiedzieliśmy i w sumie żaden kraj nie wie, jaka jest rzeczywista skala pandemii. To, co widzimy w danych, które podają rządy, to tylko wierzchołek góry lodowej. Pytanie brzmi, ile on nam mówi, bo zwykle na jego podstawie jesteśmy w stanie wyobrazić sobie lub przeanalizować, jak wygląda reszta. Przy czym wiadomo, że liczba stwierdzonych przypadków zależna jest od liczby testów. Jak robimy ich więcej, to obraz jest klarowniejszy. W Polsce problem polegał nie tylko na dość niewielkiej liczbie testów, co powodowało, że mało wniosków można było wyciągać, ale także na podejściu rządu do danych. Było ono dość nonszalanckie.
Rząd w ogóle dość późno zaczął doceniać wartość danych, dopiero z czasem zaczął brać je pod uwagę przy chociażby wprowadzaniu nowych obostrzeń. Decydenci zaczęli korzystać ze statystyk dopiero wtedy, kiedy ludzie je zobaczyli i uznali, że są cenne.
Wcześniej, przez tę nonszalancję, pojawiało się mnóstwo nieprawidłowości. Trudno mi oceniać, na ile wynikały one z bałaganu, a na ile były one wykorzystywane do manipulacji. Są różne, uzasadnione, wątpliwości, czy niektóre działania nie były po prostu celowe. Dane w Polsce nadal pozostawiają wiele do życzenia. Najlepszym tego przykładem jest to, że kiedy zaczęły pojawiać się nieprawidłowości, to państwo, zamiast sprawdzić, gdzie się one pojawiły i naprawić, co trzeba, zaczęło odcinać społeczeństwo od danych. To „rozwiązanie” problemu polegające na zamieceniu go pod dywan.
Rozwińmy to trochę – patrząc wstecz, jak oceniasz poszczególne działania rządu związane z informowaniem społeczeństwa o pandemii? Co się zmieniło na lepsze, na gorsze?
– Była to trochę krzywa, która na początku pandemii wzrastała. Na początku pandemii dostępność danych na poziomie lokalnym była żadna, a i te, które dostawaliśmy były bardzo cząstkowe, okrojone. Z czasem liczba danych czy podmiotów, które je zbierały zwiększała się. Powodowało to jednak też, że mając dane, po kilku miesiącach, na różnych poziomach administracyjnych, mogliśmy je porównywać.
W pewnym momencie liczby te przestały się ze sobą zgadzać. Błędy wynikały m.in. z zupełnego nieprzygotowania naszego kraju do codziennego, kompleksowego informowania obywateli – nie było systemów informatycznych, infrastruktury, wyszkolenia, czasami dane powiatowe przygotowywały osoby kompletnie do tego nieprzygotowane. Poza tymi problemami okazywało się, że dane się rozjeżdżają. I gdy zaczęliśmy to sygnalizować, krzywa poszła w drugą stronę. Dane z poziomu lokalnego zniknęły, wszystko się rozmyło i zrobił się jeszcze większy bałagan.
Tak jak początkowo danych było coraz więcej, po nieprawidłowościach, które zgłosiliśmy było ich coraz mniej.
Znikały więc też możliwości ich zbierania i analizy, przez co obecnie o wiele trudniej jest oceniać rzeczywistą skalę pandemii w Polsce.
Czyli pandemia to kolejny dowód na to, że nasze państwo jest z kartonu i istnieje tylko teoretycznie, bo poszczególne instytucje się wzajemnie nie widzą i nie współpracują?
– Nic dodać, nic ująć.
Da się na podstawie danych stwierdzać, czy działania rządu związane z obostrzeniami przynoszą efekty, albo czy na podstawie statystyk można mówić coś o tym, jak na liczbę pozytywnych przypadków koronawirusa wpływają uliczne protesty? Czy też jest to niemożliwe ze względu na ogólny chaos oraz ciągle zmieniającą się liczbę wykonywanych testów?
– W pierwszej kolejności trzeba powiedzieć, że zmierzenie tego, czy jakieś wydarzenie miało wpływ na statystyki jest bardzo trudne. Interdyscyplinarne Centrum Modelowania Matematycznego i Komputerowego UW robi prognozy związane z pandemią, ale oni też nie są w stanie zmierzyć dokładnego wpływu jesiennych protestów na liczbę zachorowań. Zwiększone kontakty międzyludzkie na pewno przełożyły się na większą liczbę zakażeń, ale na pewno nie były ich główną przyczyną. Znaczące jest zachowanie całej populacji. Jeśli obserwujemy wzrost pozytywnych testów, to nie jest to efekt tego, że jakiś procent społeczeństwa wyszedł na ulice. Ludzie spotykają się w wielu miejscach – szkołach, sklepach, pracy, transporcie publicznym. Więcej można powiedzieć na poziomie obostrzeń, bo dotyczą one wszystkich ludzi w Polsce. Zamknięcie galerii, czy nawet szkół już da się przełożyć na dane i można przewidywać, jaki będzie to miało dalszy wpływ na rozwój pandemii. Było to zresztą widać w zeszłym roku.
Wakacje były czasem odpoczynku nie tylko dla społeczeństwa, ale niestety też dla instytucji rządowych. Od samego początku pandemii wszyscy mówili, że to dopiero pierwsza fala, że kolejna nadejdzie jesienią. Przygotowanie jednak do tego było co najwyżej średnie, a jakieś konkretniejsze działania zaczęły się, kiedy była już panika. Nie uratowało nas to jednak przed ogromną falą i przypadków, które udało się wykryć i zgonów, które obserwujemy w ostatnich miesiącach. W pierwszym tygodniu listopada nastąpił wzrost liczby śmierci o 120%. I to nadal się utrzymuje, chociaż na nieco niższym poziomie – liczba zgonów jest o około 40% wyższa od wieloletniej średniej.
Tak samo teraz widzimy, że utrzymujące się zamknięcie, powierzchowny lockdown, w którym egzystujemy od jakiegoś czasu, powoduje – przynajmniej ja tak sądzę – że w połączeniu z uodpornieniem dużej części populacji, liczba nowych przypadków jest na o wiele niższym poziomie niż kilka miesięcy temu. Moim zdaniem nie znaczy to jednak, że powinniśmy znosić obostrzenia, bo możemy ponownie stracić nad nią jakąkolwiek kontrolę.
Nieco już o tym powiedziałeś, ale na jakie największe absurdy natrafiłeś podczas zbierania danych o pandemii?
– Absurdów było mnóstwo. Największym chyba było to, że gdy w momencie, kiedy pojawiły się nieprawidłowości i zwróciłem na nie uwagę, usłyszałem, że nie mam kompetencji do tego, żeby je interpretować i dlatego tylko wydaje mi się, że coś jest nie w porządku z danymi. Ta sama osoba, która to stwierdziła, niedługo potem informowała o zwolnieniu pracowników Głównego Inspektoratu Sanitarnego. Czyli za moją złą interpretację ktoś musiał zostać odwołany. No i jak już wspomniałem, z tej mojej złej interpretacji wynikł zakaz publikowania danych przez urzędy sanitarne. Śmiech przez łzy.
Dużo mówisz o zakazie publikowania danych. Czemu to tak ważne, żeby ludzie mieli do nich dostęp? I jak budować w nich zaufanie do nich, skoro żyjemy w czasach fake newsów, często nie umiemy zgodzić się, co jest faktem, a do tego jest on zwykle zastępowany przez emocje?
Głęboko wierzę, że informacje są podstawą demokracji. I nie chodzi tylko o dane epidemiczne, ale o wszystkie, które dostają obywatelki i obywatele.
Rozmawiamy jednak o statystykach epidemicznych i w ich kontekście ludzie są w stanie oceniać, jak pracuje rząd. I mają do tego prawo. Poza tym dane mają realny wpływ na życie i zdrowie ludzi. Kiedy mają dostęp do rzetelnych informacji, nie muszą polegać na politykach, mogą sami interpretować sytuację i podejmować decyzje – czy odwiedzać znajomych, jak często chodzić na zakupy, czy pojechać na wakacje. Dane dają więc większą wolność i chyba właśnie to byłoby najlepiej ludziom uświadamiać.
Ale sam powiedziałeś, że trochę minęło już największe zainteresowanie tym, co robisz i do zbieranych przez ciebie danych zagląda coraz mniej osób. Czy myślisz, że ludzie rzeczywiście chcą znać prawdę, która zwykle jest bardzo skomplikowana i długa, czy tylko tak deklarują, a tak naprawdę wolą krótkie komunikaty, które nie wymagają od nich za wiele wysiłku?
– Jest i tak i tak. Na początku mojego projektu pojawiało się bardzo dużo pasjonatów, którzy chcieli analizować zbierane przeze mnie dane we własnym zakresie. Nie każdy jednak chce i umie to robić, więc elementem mojej działalności była i jest również edukacja, tłumaczenie wielu trudnych zagadnień. Można to nawet nazwać pokazywaniem palcem ludziom, jak wygląda sytuacja, bez konieczności robienia wielkich wykresów, czy prognoz. W społeczeństwie są jednostki, które chcą same się czymś zająć, ale większość albo nie chce, albo nie ma czasu, albo nie umie tego robić. Co nie znaczy, że nie chce wiedzieć, jaka jest sytuacja epidemiczna.
Da się jakoś przekonać ludzi, że analiza danych jest nie tylko ważna, ale może być ciekawa?
– Może trzeba położyć większy nacisk na zwrócenie uwagi, że dane otaczają nas wszędzie dookoła. Nie mamy bowiem świadomości, jaki wpływ mają one na nasze życie. Nie wiemy, co znaczy liczba, która jest pozbawiona emocji. Trochę zmieniło się to w pandemii, od której nie da się uciec, mamy z nią do czynienia ze względu na zamknięcie gospodarki, utratę pracy, ale przede wszystkim chorobę, a często niestety śmierć bliskich osób. Liczby zaczynają mieć podłoże, zaczynamy rozumieć, że coś za nimi stoi, coś pokazują. A gdy jeszcze zbierzemy je do kupy i pokażemy kontekst, to ludzie zobaczą, że kryzys społeczny, który rozgrywa się na naszych oczach można monitorować.
Chociaż wirus jest czymś niewidzialnym, co wymyka się poznaniu – to pewnie zresztą powód, dla którego tyle osób nie wierzy w pandemię – to jednak liczby są czymś, co może w jakimś stopniu pokazać przyszłość, co będzie działo się dalej. Wydaje mi się, że ludzie zaczęli doceniać dane, ale też po prostu dostęp do informacji.
Czy to jest twój największy sukces, czy jednak coś innego? I co ci się nie udało lub czego żałujesz?
– Na pewno sukcesem jest to, że w żadnym momencie, niezależnie od tego, ile osób mnie śledziło, niezależnie od rozpoznawalności, nie zrezygnowałem. Cały czas przyświecała i nadal przyświeca mi ta sama idea. Nie chodziło o zrobienie czegoś na chwilę, pokazanie się w mediach i zakończenie projektu. On działa dalej i jestem z siebie dumny, że wciąż jest w mnie determinacja, by robić to, co robię wierząc, że jest to ważne. Nawet jak tych danych będzie potrzebował jeden projekt naukowy, albo i jedna osoba, to nie zrezygnuję.
A czego żałuję? Kiedy zaczynałem działania, moje pojęcie o zbieraniu i analizie danych było na niskim poziomie. Dlatego też wszystko opiera się na arkuszu Google’a, bo to bardzo proste w obsłudze i niezawodne narzędzie. Trochę szkoda, że w którymś momencie nie pokusiłem się, by pójść w bardziej profesjonalną stronę. Obecna forma projektu cały czas jest akceptowalna, ale wydaje mi się, że trochę zmarnowałem potencjał i wciąż jeszcze wiele się muszę nauczyć. Mogłem zrobić więcej.
Może jeszcze się uda? Planujesz iść dalej w tym kierunku zbierania i analizowania danych?
– Bardzo lubię to robić i jestem chyba na to trochę skazany. Zwłaszcza że wiele swoich życiowych decyzji opieram na danych, nawet tych podstawowych, które zbiera zegarek na ręku. Zawodowo zajmuję się grafiką i marketingiem, ale dane cały czas mi towarzyszą. Na pewno zwiększyłem moje kompetencje i dalej chcę się rozwijać w tym kierunku.
To załóżmy na chwilę, że udaje ci się to osiągnąć i masz na coś wpływ. Co byś zmienił w dostępie do informacji publicznej, nawet niekoniecznie musi to być związane z pandemią?
– Czas. Mówiąc w dużym uproszczeniu, żeby wszystko działo się szybciej. Pandemia pokazała nam, że nie możemy czekać przez miesiąc albo i dwa na dane, które urząd łaskawie udostępni. Epidemia ma miejsce tu i teraz. Same dane o pozytywnych przypadkach zachorowań pojawiają się z pewnym opóźnieniem, bo przecież wpierw ktoś musi się zakazić, po kilku dniach pojawiają się objawy, potem trzeba się zgłosić do lekarza, zrobić test, dostać wynik. Wiadomo więc, że statystyki są przesunięte w czasie i wynika to częściowo z naturalnych czynników. Tym bardziej nie można tego przedłużać biurokracją urzędową. Bo może być tak, że dostaniemy dane, które nie mają już wpływu na życie ludzi i mogą być co najwyżej wykorzystane w przyszłości do analizy, jak to wszystko przebiegało. To, na co mamy wpływ, musi dziać się szybciej. Dzięki temu obywatele będą lepiej poinformowani.
I muszą się też tego domagać, bo często bez ich presji dane zwyczajnie nie będą zbierane. A bez nich będzie nam wszystkim o wiele trudniej.
Michał Rogalski – analiza danych to jego pasja. Od początku pandemii prowadzi największą publicznie dostępną bazę danych o epidemii. Z jego pracy korzystają nie tylko tysiące obywateli dziennie, ale też dziennikarze, zespoły badawcze, czy uniwersytety. Zawodowo zajmuje się grafiką komputerową i marketingiem politycznym.
Źródło: informacja własna ngo.pl
Redakcja www.ngo.pl nie ponosi odpowiedzialności za treść komentarzy.