Projekt „Jak są wydawane nasze podatki?”, realizowany przez Instytut Badań Strukturalnych i Fundację ePaństwo to jeden z przykładów wspólnej, często żmudnej pracy nad udostępnieniem danych, które… przynajmniej w teorii są dostępne. Realizatorzy przedsięwzięcia obok postulatu jawności podkreślają wagę tego, jak dane są prezentowane. I dochodzą do jasnego wniosku: jawność bez przejrzystości jest niemal bezwartościowa. Pokazują, jak można to zmienić.
Projekt „Jak są wydawane nasze podatki?”, realizowany przez Instytut Badań Strukturalnych i Fundację ePaństwo to jeden z przykładów wspólnej, często żmudnej pracy nad udostępnieniem danych, które… przynajmniej w teorii są dostępne.
Realizatorzy przedsięwzięcia obok postulatu jawności podkreślają wagę tego, jak dane są prezentowane. I dochodzą do jasnego wniosku: jawność bez przejrzystości jest niemal bezwartościowa. Pokazują, jak można to zmienić.
Jawność bez przejrzystości
Co z tego, że ogromną ilość danych można znaleźć w sieci, bez konieczności pisania specjalnych wniosków o ich udostępnienie, gdy mają one formę skanów bądź PDF-ów? A takie właśnie metody prezentacji wszelkich dokumentów upodobały sobie instytucje publiczne. Jak takie dane czytać, porównywać, wyciągać wnioski?
Informatyzacja do prezentacji różnorodnych statystyk wciąż wchodzi jak gdyby kuchennymi drzwiami. Najwyższy czas to zmienić. Jak to zrobić pokazały dwie fundacje: Instytut Badań Strukturalnych (IBS) oraz ePaństwo na przykładzie danych dotyczących tego, co dotyka nas wszystkich – finansów.
Beata Kwiatkowska, specjalistka ds. komunikacji, IBS, tłumaczy: „Sytuacja wyjściowa jest taka, że dane o finansach publicznych w Polsce są rozproszone i nieczytelne; w praktyce ani pojedynczy obywatel, ani organizacje pozarządowe nie mają dostępu do informacji, jakie środki państwo przeznacza na poszczególne cele społeczne. Nasze organizacje postanowiły więc, że zbierzemy, uporządkujemy, omówimy oraz w prosty, atrakcyjny wizualnie sposób przedstawimy dane statystyczne na temat finansów publicznych w Polsce, w latach 2004-2014. Projekt „Jak wydawane są moje podatki” prowadziliśmy od 30 października 2014 roku w ramach programu Obywatele dla Demokracji, finansowanego z Funduszy EOG”.
A zatem… na co wydawane są nasze podatki?
Joanna Przybylska, koordynatorka ds. komunikacji w Fundacji ePaństwo opowiada o aplikacji „Jak są wydawane moje podatki?”: „Wystarczy, że wpiszemy kwotę, jaką zarabiamy na umowie o pracę bądź cywilno-prawnej, bądź też w wyniku prowadzenia działalności gospodarczej, a zobaczymy, na co i w jakiej wielkości wydawane są od tej kwoty podatki. Zapewniam, że wiele nas może tu zaskoczyć. Zachęcam każdego, aby się sam przekonał, tutaj uchylę tylko rąbka tajemnicy. Zaskakująco niewielka kwota, bo 2 zł miesięcznie (przy medianie zarobków w Polsce w kwocie 3200 zł brutto) przeznaczana jest na administrację państwową”.
Beata Kwiatkowska podaje inny, także mogący być zaskoczeniem przykład: „Na biblioteki, teatry, muzea i filharmonie przeznaczana jest prawie taka sama kwota z wypracowanych przeze mnie podatków, co na CBA, ABW, Agencję Wywiadu, BOR i straż graniczną”.
Co zaś „zjada” o wiele większe pieniądze? Ubezpieczenia społeczne. Twórcy aplikacji zachęcają użytkowników do swoistej „zabawy”. – Budowania własnych wykresów, w których sami możemy decydować, na co przeznaczylibyśmy nasze podatki – wyjaśnia Joanna Przybylska. I nie jest to tylko zabawa, jako że na podstawie tych danych IBS opracuje raport, w którym przedstawi preferencje obywateli w tej kwestii.
Postulat: CSV zamiast PDF
W wyniku realizacji projektu powstała także tzw. hurtownia danych, w której zebrano informacje z kluczowych sprawozdań o sytuacji finansowej państwa, głównie publikowanych przez Ministerstwo Finansów.
Jan Baran, ekonomista IBS-u opisuje, jak prace te wyglądały od kuchni: „Najpierw wytypowaliśmy dokumenty i tabele z danymi, które uznaliśmy za najważniejsze z punktu widzenia oceny sytuacji finansowej państwa. Po uwzględnieniu faktu, że interesował nas okres od 2006 r., otrzymaliśmy około stu zestawień do wyekstrahowania z PDF-ów. Kolejnym etapem była właśnie ekstrakcja danych z tych plików. Okazało się, że jest to zadanie trudniejsze niż myśleliśmy, gdyż żadne narzędzie nie radziło sobie z konwersją tych dokumentów PDF. Problemem było eksportowanie tabel. Dlatego programiści Fundacji ePaństwo przygotowali własne narzędzie, które „crackowało”* te PDF-y. Nie był to proces automatyczny, nieodzowna była przy tym czujność człowieka. Niemniej narzędzie znacząco ułatwiło eksport danych z PDF-ów. Chciałbym podkreślić, że narzędzie zostanie niedługo udostępnione przez Fundację ePaństwo. Tak więc kolejnym efektem projektu, oprócz hurtowni, aplikacji „Jak są wydawane moje podatki”, raportów analitycznych, będzie również to narzędzie pomagające radzić sobie z wydobywaniem danych z tabel zapisanych w pliku PDF.
Dla kogo hurtownia?
Ekonomista IBS-u daje jasną odpowiedź: „Myślę, że hurtownia będzie pomocna dla wszystkich osób, które szukają informacji o finansach publicznych w Polsce, a jednocześnie nie posiadają żelaznych nerwów, by przedzierać się przez gąszcz stron i nieprzystępnych dokumentów publikowanych przez Ministerstwo Finansów”.
Beata Kwiatkowska uzupełnia: „Jestem przekonana, że organizacje pozarządowe mogą korzystać z przygotowanych przez nas aplikacji do prowadzenia własnych działań strażniczych. Do tego zachęcamy”.
Przy tym wszystkim nie sposób jednak zapomnieć, że mówimy przecież o informacji publicznej, nie powinno być tak, że potrzeba tu pracy programisty. Czy aby na pewno? Innymi słowy:
Czy „crackowanie” PDF-ów udostępnianych przez władze publiczne jest legalne?
Daniel Macyszyn, Prezes Fundacji ePaństwo: „Władze publiczne, prowadząc Biuletyny Informacji Publicznej lub inne strony internetowe, często umieszczają w nich rozmaite informacje w formacie PDF. Ten format plików jest formatem otwartym, w znaczeniu dostępności jego specyfikacji, ale dalsze przetwarzanie zawartych w nim danych jest dosyć trudne. Sprawa komplikuje się jeszcze bardziej, gdy pliki PDF zawierają restrykcje, które uniemożliwiają wydruk dokumentów lub kopiowanie fragmentów ich treści. Tego typu restrykcje uniemożliwiają również przetwarzanie maszynowe plików PDF, np. w celu przedstawienia ich zawartości w bardziej przyjaznej formie, co często jest celem działań organizacji pozarządowych.
Sprowadzając ten przepis do kontekstu „crackowania” (usuwania restrykcji dostępu) plików PDF, możemy powiedzieć: zabronione jest usuwanie restrykcji z plików PDF, które zawierają dane dla nas nieprzeznaczone. W naszym przypadku mówimy jednak o informacjach pochodzących od organów publicznych, a zatem o informacjach publicznych. Konstytucja w artykule 61, stwierdza przy tym, iż dostęp do informacji publicznych przysługuje „każdemu”. Można byłoby zatem powiedzieć, że crackowanie PDF-ów z danymi publicznymi jest omijaniem zabezpieczeń elektronicznych, ale nie w celu uzyskania danych dla nas nieprzeznaczonych.
Sprawa nie jest jednak aż tak prosta. Konstytucja oraz ustawy przewidują bowiem ograniczenia w dostępie do informacji publicznych. Prawo chroni dostęp do informacji publicznych, które zawierają tajemnice osób prywatnych, przedsiębiorców oraz państwowe. Decyzja zaś, czy dana informacja publiczna zawiera takie tajemnice należy do jej dysponenta, czyli do organu administracji publicznej. Usuwając zatem restrykcje z plików PDF, poniekąd wchodzimy w kompetencje organu administracji, samodzielnie uznając, że dany plik takich danych nie zawiera.
Bezpieczne wydaje się zatem przyjęcie następującej interpretacji: Jeśli na stronach urzędowych znajdujemy pliki PDF, do których dostęp jest zabezpieczony hasłem, w taki sposób, że w ogóle nie możemy przeczytać ich treści – w takim wypadku ich „crackowanie“ może rodzić wątpliwości co do możliwości zapoznania się z ich treścią. Zanim będziemy zatem otwierać taki plik, należy zwrócić się do organu o stosowane wyjaśnienia i powstrzymać się od działań. Jeśli na stronach urzędowych znajdujemy pliki PDF, które jesteśmy w stanie wyświetlić, ale już ich wydrukowanie, przekonwertowanie na inny format, czy skopiowanie treści jest niemożliwe lub zabezpieczone hasłem – w takim wypadku możemy śmiało stosować rozwiązania techniczne, które przełamią te restrykcje, łącznie z odszyfrowaniem hasła i wyprodukowaniem wersji plików, które nie zawierają żadnych restrykcji dostępu.
Administracjo publiczna – posłuchaj!
Cele w projekcie określono bardzo ambitnie. Założono, że realizacja przedsięwzięcia przyczyni się do wzrostu wiedzy wśród obywateli oraz organizacji pozarządowych o strukturze wydatków publicznych w Polsce.
Walor edukacyjny dotyczyć ma również Ministerstwa Finansów oraz innych organów administracji publicznej. Realizatorzy projektu chcą uwrażliwić te instytucje na temat wagi otwartego i przejrzystego dostępu do danych o gospodarce finansowej państwa.
Na pytanie, czy to się może udać, Beata Kwiatkowska odpowiada: „To, co najważniejsze w tej chwili i to na czym się teraz koncentrujemy, to przekonywanie administracji publicznej, że warto, aby lepiej udostępniała dane publiczne (przedstawienie ustawy budżetowej i sprawozdania z jej wykonania w 290 plikach PDF, to nie jest dobre udostępnianie). Cieszy zainteresowanie efektami naszych prac ze strony decydentów różnych opcji politycznych. W czasie seminarium 19 kwietnia 2016 „Finanse publiczne – dokąd zmierzamy” rozmawialiśmy m.in. o obszarach wymagających działań zwiększających przejrzystość informacji. Pokazaliśmy też, w jaki sposób instytucje mogą publikować dane o sytuacji finansowej państwa, tak aby dane te były czytelne dla obywateli. W naszym serwisie udostępniliśmy już prezentacje z seminarium, w ciągu kilku dni upublicznimy nagrania filmowe i publikację "Jak udostępniać dane o finansach publicznych?" – tak więc wszyscy zainteresowani tematem dostępu do danych publicznych będą mogli zapoznać się z tym, co zrobiliśmy”.
Dodajmy w tym miejscu także, że dobra praktyka prezentowania danych publicznych nie powinna ograniczać się tylko do finansów. Fundacja ePaństwo zainteresowana jest współpracą z organizacjami chcącymi przedstawić dane statystyczne z różnych obszarów. Jak to podsumowała Joanna Przybylska: „Nie chcemy być lekarstwem na stan polskiej informatyzacji, a witaminą wskazującą, w jakim kierunku warto iść, aby inni z poszczególnych danych rzeczywiście mogli skorzystać. Nikogo nie traktujemy jako konkurencji, chętnie podejmujemy współpracę z różnymi organizacjami mającymi stosowne zaplecze merytoryczne”.
Linki do aplikacji „Jak są wydawane nasze podatki?” oraz do informacji nt. prezentacji danych z zakresu finansów publicznych: